在騰訊元寶接入DeepSeek之前,業內可能還沒想到互聯網公司可以這么操作,騰訊這么規模的互聯網大廠,有自己的大模型,但是還愿意將一個當紅產品納入,給用戶更多選項,彰顯了騰訊的用戶思維。
在互聯網大廠中,騰訊推出混元大模型的時間是2023年9月份,相比百度、阿里已晚了一些。記者參加了新聞發布會,印象深刻的有兩個點,一個是技術先進,比如騰訊混元大模型從第一個token開始從零訓練,掌握了從模型算法到機器學習框架,再到AI基礎設施的全鏈路自研技術。為了解決大模型幻覺問題,騰訊優化了預訓練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了30%至50%;通過強化學習的方法,讓模型學會識別陷阱問題,提出思維鏈的新策略,讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。另外,就是混元大模型價格便宜。
今年5月份,騰訊進一步下降了混元大模型價格,混元-lite免費。
當時外界認為,騰訊降價是為了和主要對手阿里以及字節競爭。去年5月15日,字節跳動發布豆包大模型,在大廠中率先打響了價格戰。其主力模型的定價為輸入0.0008元/千tokens,當時稱較行業便宜99.3%。5月21日上午,阿里云宣布通義千問對標ChatGPT-4的主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。百度在幾個小時后公告,文心大模型的兩款入門級主力模型ENIRE Speed、ENIRE Lite全面免費。
這些是大模型傳統主力選手,這是外界一直關注的重點,特別是豆包聲勢浩大,奪人耳目,顯示字節在技術能力出色。另外還有一些選手也很優秀,比如月之暗面推出的KIMI,獲得很多用戶認可。
這時候主要玩家,還希望將大模型當做可以謀利的工具,對其他行業進行賦能,就像賣自來水一樣進行收費。另外是用大模型增強公司自身實力,增加用戶吸引力,比如騰訊將騰訊會議、騰訊文檔、騰訊廣告等多個業務接入混元大模型。這跟微軟有點相似,微軟使用ChatGPT大模型,為自身業務增色。
但在DeepSeek出現后,這兩種做法都受到威脅,DeepSeek聲勢更為浩大,一出現就受到用戶追捧,在很多能力上領先國內同行一截,另外還宣布開源而且免費,這讓DeepSeek迅速爭取到to b用戶,不用推銷,就有很多用戶主動接入DeepSeek。如果再不采取行動,主流廠家將全面被動。
騰訊元寶的方案值得借鑒,騰訊元寶直接宣布接入DeepSeek,在混元之外增加用戶選項。騰訊有兩個優勢,一個是內容優勢,大模型需要搜索到優質內容,才能給用戶提供足夠好的回答,而騰訊有目前市面上質量最好的內容生產,騰訊公眾號在內容生產方面積累良多。另外,騰訊善于將產品做大,騰訊是用戶思維,一個產品只有積累夠足夠多用戶才有價值,死守自家產品不如推出更有吸引力的選項,將用戶吸引過來。騰訊在互聯網基建等方面有優勢,相同的產品,移植到騰訊平臺上,運行更流暢,更有運算保障。這就讓優秀技術和自身優勢結合在了一起。