阿里巴巴發布新一代端到端多模態旗艦模型Qwen2.5-Omni
來源:證券時報網作者:李志強2025-03-27 08:44

阿里巴巴發布了新一代端到端多模態旗艦模型Qwen2.5-Omni,號稱具備全方位多模態感知能力,看聽說寫樣樣精通。

采用全新的Thinker-Talker雙核架構,Thinker模塊負責處理多模態輸入并生成語義表征和文本內容,Talker模塊則負責將這些信息轉化為流暢的語音輸出。這種架構實現了端到端的統一,支持實時音視頻交互和流暢的語音生成。

能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并同時生成文本和語音輸出。支持分塊輸入和即時輸出,實現真正的實時交互。

已在Hugging Face、ModelScope、DashScope和GitHub等平臺開源,方便開發者體驗和使用。

相比現有方案,語音生成的自然度和穩定性更高。在音頻能力上優于同等規模的Qwen2-Audio,與Qwen2.5-VL-7B保持同等水平。在語音指令理解方面表現出色,效果可媲美文本輸入。


校對:蘇煥文

責任編輯: 孫孝熙
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    国产肥熟女视频一区二区三区,97在线精品视频无码,久久中文字幕无码不卡浪潮,久久tv免费国产精品美女
    中文不卡AV在线播放 | 婷婷综合久久中文字幕 | 自拍偷拍视频一区二区 | 日本精品欧美中文字幕 | 最新国产国语对白 | 最新国产免费AV片在线观看 |