{首页主词},&

阿里巴巴發布新一代端到端多模態旗艦模型Qwen2.5-Omni

來源：證券時報網作者：李志強2025-03-27 08:44

阿里巴巴發布了新一代端到端多模態旗艦模型Qwen2.5-Omni，號稱具備全方位多模態感知能力，看聽說寫樣樣精通。

采用全新的Thinker-Talker雙核架構，Thinker模塊負責處理多模態輸入并生成語義表征和文本內容，Talker模塊則負責將這些信息轉化為流暢的語音輸出。這種架構實現了端到端的統一，支持實時音視頻交互和流暢的語音生成。

能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式，并同時生成文本和語音輸出。支持分塊輸入和即時輸出，實現真正的實時交互。

已在Hugging Face、ModelScope、DashScope和GitHub等平臺開源，方便開發者體驗和使用。

相比現有方案，語音生成的自然度和穩定性更高。在音頻能力上優于同等規模的Qwen2-Audio，與Qwen2.5-VL-7B保持同等水平。在語音指令理解方面表現出色，效果可媲美文本輸入。

校對：蘇煥文

責任編輯：孫孝熙

阿里巴巴

Qwen2.5-Omni

多模態模型

聲明：證券時報力求信息真實、準確，文章提及內容僅供參考，不構成實質性投資建議，據此操作風險自擔

下載“證券時報”官方APP，或關注官方微信公眾號，即可隨時了解股市動態，洞察政策信息，把握財富機會。

網友評論

登錄后可以發言

發送

網友評論僅供其表達個人看法，并不表明證券時報立場

暫無評論

為你推薦

時報熱榜

換一換

熱點視頻

換一換