OpenAI“高情商”模型GPT-4.5發布,定價高過GPT-4o
來源:界面新聞作者:宋佳楠2025-02-28 10:09

當地時間2月27日,OpenAI發布了最新模型GPT-4.5的研究預覽版。這是一款通用型大語言模型,其定位并非OpenAI最頂尖的模型,但卻號稱“情商最高”,且API調用價高于其主流模型GPT-4o。

據OpenAI方面介紹,GPT-4.5是OpenAI迄今為止規模最大、知識儲備最豐富的模型之一,擁有1萬億激活參數,訓練數據量高達120萬億tokens,上下文窗口長度擴展至256K11。

與OpenAI的主流模型相比,GPT-4.5的最大特點在于其“感性能力”的提升。它能夠進行更自然、更溫暖的對話,甚至在回答問題時展現出一定的“人情味”。例如,當用戶輸入“我被放鴿子了,我要發一個‘恨他們’的短信”時,GPT-4.5會先輸出安撫情緒的內容,再給出建議。

在面對 “我考試失敗了,心情很低落” 這類輸入時,之前的模型會立刻嘗試解決問題,而GPT-4.5會先詢問用戶是否想聊聊感受,或提供分散注意力的方法,展現出更高的情感智能,更適合處理與情感交流、寫作輔助(優化內容、激發創意)、客戶服務等相關任務 。

新模型的“幻覺率”(錯誤生成虛假信息的概率)低于GPT-4o和o1模型,僅為37.1%,而GPT-4的幻覺率為61.8%。但在一些基準測試里,它未達行業最前沿水平,如在編程能力的SWE-Bench Verified基準測試中,與GPT-4o和o3-mini表現相當,遜色于OpenAI 的deep research和Anthropic的Claude 3.7 Sonnet。

在學術基準測試AIME和GPQA上,GPT-4.5也不及領先的AI推理模型,如o3-mini、DeepSeek的R1和Claude 3.7 Sonnet。不過,在數學和科學相關問題上,相比其他非推理模型,它仍有不錯的表現。

需要指出的是,OpenAI此前推出的o1等屬于推理模型,能生成 “思維鏈”,在處理問題前先進行反思。而GPT-4.5是該公司最后一款 “非鏈式思維” 模型,未來將作為推理模型的基礎,標志著OpenAI在人工智能技術發展上的一個重要過渡。

在功能上,它支持搜索、畫布模式,用戶可上傳文件和圖像,但暫不支持語音模式、視頻和屏幕共享等多模態功能。

目前,GPT-4.5首先開放給軟件開發者以及ChatGPT Pro(每月200美元)訂閱用戶,未來也將向ChatGPT Plus(每月20美元)和Team訂閱用戶開放。但其定價為每百萬token輸出150美元,遠高于GPT-4o的60美元。

眼下OpenAI的模型發布節奏正在不斷加快,其需要應對來自Anthropic、xAI等的激烈競爭。

前不久,由OpenAI前員工創立的Anthropic發布了Claude 3.7 Sonnet,馬斯克的xAI則推出了Grok 3。在中國市場,DeepSeek等本土企業的崛起也給OpenAI帶來一定技術壓力。這些都促使OpenAI不斷優化和拓展應用場景,以保持優勢。

責任編輯: 陳勇洲
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    国产肥熟女视频一区二区三区,97在线精品视频无码,久久中文字幕无码不卡浪潮,久久tv免费国产精品美女
    一线天粉嫩在线视频 | 日本高清一区二区三区不卡视频 | 亚洲欧美日韩国产一区动漫 | 一本到国产在线精品国内在线99 | 亚洲乱码高清视频 | 色亚洲激情蜜芽一区 |