證券時報記者 阮潤生
國產開源大模型DeepSeek憑借出色性價比,成為全球增速最快的AI應用,引發全球科技圈熱切討論和算力信仰震蕩,也進一步增強對構建開放型人工智能生態的信心。目前,不僅英偉達、AMD、英特爾等國際芯片巨頭宣布集成DeepSeek模型、提供算力支持等,國產GPU廠商、云計算廠商和應用廠商等AI產業鏈伙伴也火速支持調用DeepSeek,升級各自產品和技術。
引發算力巨震
作為幻方量化旗下的AI公司深度求索研發的國產開源大模型,DeepSeek近期連續發布的DeepSeek V3、DeepSeek-R1等AI模型展示了驚艷效果和低廉的訓練成本。移動應用分析機構SensorTower的數據顯示,其應用軟件在18天內的下載量達到1600萬次,截至2025年2月4日,DeepSeek日活用戶數超越了2000萬,成為全球增速最快的AI應用。
人工智能業內人士向證券時報記者表示,DeepSeek證明了不用堆疊算力也可以搞好大模型。
綜合來看,DeepSeek提供了一種高效的模型蒸餾技術,能夠將大規模模型的能力遷移至更小、更高效的版本,并且通過Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術,顯著降低顯存占用,優化模型性能。
TrendForce集邦咨詢研究指出,DeepSeek采用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推理速度并降低硬件需求,同時充分發揮英偉達Hopper降規版芯片的效益,最大化運算資源利用。其成本優勢來自高效能硬件選擇、新型蒸餾技術及API開源策略,不僅優化技術與商業應用的平衡,也展現AI產業向高效發展的趨勢。
DeepSeek成為現象級AI應用,也引發了對算力信仰的質疑。全球算力巨頭英偉達股價1月27日一度下跌近17%,之后逐步企穩;A股光通信模塊龍頭中際旭創1月27日下跌約10%,2月5日進一步放量下跌,工業富聯下跌6.76%,寒武紀-U下跌12.46%。
對此,英偉達此前發表聲明,表示DeepSeek所取得的進展顯示出其芯片在中國市場的實用價值,且未來為滿足DeepSeek的服務,還將需要更多英偉達芯片。
TrendForce集邦咨詢最新指出,DeepSeek模型雖降低AI訓練成本,但AI模型的低成本化可望擴大應用場景,進而增加全球數據中心建設量。光收發模塊作為數據中心互連的關鍵組件,將受惠于高速數據傳輸的需求,預測2023年400Gbps以上的光收發模塊全球出貨量為640萬個,2024年約2040萬個,預估至2025年將超過3190萬個,年增長率達56.5%。
AI芯片積極適配
對DeepSeek的認可不僅體現在排行榜和用戶下載量上,也反映在國際AI芯片巨頭的兼容和本土廠商的積極適配。
1月31日,英偉達發布搭載DeepSeek-R1 671b的“英偉達NIM微服務”預覽版,顯著提升AI模型的運行效率,簡化企業部署流程,降低AI落地的技術門檻。
另外,AMD已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上;英特爾也表示其開發的AI芯片/GPU芯片可以支持DeepSeek,有意與中國芯片合作打破英偉達打造的生態壟斷。
據業內分析,DeepSeek使用了英偉達的PTX(Parallel Thread Execution)語言,實現在接近匯編語言的層級運行,通過允許進行細粒度的優化,能夠對GPU硬件進行更底層、更精準的控制。
前述業內人士向記者表示,能夠使用PTX證明DeepSeek有能力做到更底層的技術,本質上對國產GPU也是好事。有分析指出,通過精通運用PTX語言,有望幫助國產GPU進行針對性算子優化,提升模型在國產GPU上的運行效率。
除了國際巨頭,海光信息作為國產AI芯片企業,2月4日晚宣布成功完成DeepSeekV3和R1模型與海光AI加速卡DCU的適配并正式上線,有望推動AI技術在更多行業的落地與普及。2月5日,該公司股價上漲11.19%。
另外,潞晨科技攜手華為昇騰,聯合發布基于昇騰算力的DeepSeek-R1系列推理API及云鏡像服務,實現了昇騰算力與DeepSeek-R1系列模型的推理適配優化,性能表現與使用高端GPU持平。另外,DeepSeek系列模型正式上線昇騰社區,支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署。
國產GPU廠商沐曦宣布與DeepSeek的合作,摩爾線程宣布部署DeepSeek蒸餾模型推理服務,提升了DeepSeek模型的計算效率和資源利用率;天數智芯宣布適配DeepSeek-R1千問蒸餾模型,提供更高效、更穩定的推理服務,滿足了不同規模和需求的應用場景。
2月5日,壁仞科技宣布自主研發的壁礪TM系列產品完成對DeepSeek-R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級參數版本,包括LLaMA蒸餾模型和千問蒸餾模型,為開發者提供高性能、低成本的大模型部署與開發解決方案。
云廠商及應用端接入
除了AI硬件端廠商,不少云計算巨頭也紛紛入圍DeepSeek“朋友圈”,華為云、騰訊云、阿里云、百度云等已經宣布支持部署DeepSeek模型。另外,聯通云宣布已基于星羅平臺實現國產及主流算力適配多規格DeepSeek-R1模型,兼顧私有化和公有化場景,提供全方位運行服務保障,為客戶帶來開箱即用的使用體驗;實現多產品場景調用,可在全國270多個骨干云池預部署,全面接入聯通云桌面、編程助手等多產品場景;提供全方位安全服務保障,實時提供抗DDoS等三大安全服務并具備元景安全大模型加持。
除了云廠商,應用端廠商也在積極探索和部署DeepSeek模型。
2月4日,萬興科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入適配,旗下視頻創意、繪圖創意及文檔創意軟件業務產品,諸如萬興喵影、億圖圖示、億圖腦圖MindMaster、萬興PDF等均已融合DeepSeek-R1大模型相關能力,用戶可搶鮮體驗。接入DeepSeek-R1后,用戶使用產品的門檻降低,大模型應用的成本也進一步降低。
另外,北信源公眾號顯示,其自主研發的“密信AI能力平臺”第一時間完成了與DeepSeek的技術對接,這一舉措將為信源密信和第三方應用提供DeepSeek大模型AI能力;奇安信宣布已完成與DeepSeek全面深度接入,自研的QAX—GPT安全大模型通過DeepSeek-R1優化和蒸餾后,運營成本大幅降低,在威脅研判等多場景下的性能顯著提升,安全專業問答整體性能分數提升約16%。
當虹科技官微顯示,公司BlackEye多模態視聽大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成視聽傳媒、工業與衛星、車載智能座艙等多行業垂類場景的數據調優訓練,可為視聽傳媒、工業與衛星、車載智能座艙等行業客戶提供更低成本的大模型部署及全新的大模型體驗。
易點天下宣布,旗下KreadoAI、數眼智能、zMaticooADX等多款核心產品將融合DeepSeek-R1大模型相關能力,提升用戶智能營銷體驗。
就“公司AI產品有沒有與DeepSeek模型合作或使用”等問題,盛天網絡2月5日在互動平臺回復,公司目前已有相關合作,正在進行對接使用DeepSeek模型。公司通過在線API接口以及對開源模型進行私有化部署的方式開展工作,目前已部署完成進入測試階段。公司預計DeepSeek模型后續可應用于公司社交產品帶帶和給麥,以探索更優質的產品與服務,并進一步提高公司各項業務生產力,結合公司彈性算力池有效降低算力成本。目前公司一款底層對接DeepSeek的社交小游戲已完成了一輪內部測試。
據中文在線消息,基于DeepSeek V3與R1提出的技術路線,中文在線正著力研發并訓練升級版“中文逍遙”,以進一步提升該大模型的創作能力。
2月5日,閱文集團宣布旗下作家輔助創作產品——作家助手已集成獨立部署的DeepSeek-R1大模型。閱文邀請全行業網文作家參與,用戶下載作家助手至最新版本即可試用并參與內測。
此外,2月5日,華為終端BG首席執行官何剛在微博發文透露,華為小藝助手已接入DeepSeek,小藝App的智能體廣場已上線DeepSeek-R1的Beta版,升級至原生鴻蒙系統可以體驗。