1月20日,中國人工智能公司深度求索(DeepSeek)發布開源模型DeepSeek-R1,一舉成為全球科技行業的焦點。
DeepSeek的這一突破引起了眾多風險投資人和科技創業者的關注。硅谷創投大佬、提出“軟件吞噬世界”的馬克·安德森(Marc Andreessen)稱這一發布為“AI領域的史普尼克時刻”。這一說法源自1957年蘇聯發射史普尼克一號衛星的標志性事件,徹底改變了全球太空競賽的格局,震撼了美國及整個世界。
引發熱議的原因之一是,DeepSeek的R1模型不僅是技術創新的成果,還標志著中國在AGI(通用人工智能)領域的崛起,挑戰了由硅谷科技巨頭主導的全球AI格局。憑借其創新的架構設計、低成本高效能的技術路線,DeepSeek不僅在中國市場取得突破,更引起了硅谷的廣泛關注。
清源創投(Foothill Ventures)創始合伙人王金林的團隊曾投出了文遠知行WeRide、Otter.ai、OmniML等公司。他接受21世紀經濟報道記者采訪時表示,在ToC領域,大模型產品的競爭會呈現“贏家通吃”的格局,因為某個產品占領了消費者心智將難以被替代。但在ToB領域,由于應用的多樣性和各行業不同的需求,市場格局將呈“百花齊放”的態勢,創業公司可以基于不同的需求和場景創造出獨特的應用解決方案。
全球AI競爭日益激烈的背景下,DeepSeek通過突破性創新在全球科技圈脫穎而出。
特別是在美國對中國科技公司實行出口管制的背景下,DeepSeek在傳統的算力和數據需求上進行創新,通過減少對高算力硬件的依賴,降低成本并提升了模型的性能和應用效率。這一創新在全球科技圈引起廣泛關注,并引發了對中國科技企業角色的重新評估。
DeepSeek的創新首先體現在其獨特的技術架構設計上。在人工智能領域,很多模型依賴海量數據和強大的算力進行訓練,而DeepSeek提出了全新的MLA機制(多頭潛在注意力),在低算力環境下實現了高效的訓練和推理過程。這一突破使得DeepSeek的AI模型不僅在性能上接近OpenAI和Google等科技巨頭的同類產品,且在成本上大幅降低,成為了全球AI產業中最具性價比的解決方案之一。
在海外科技圈和投資人眼中,DeepSeek的技術路線令人眼前一亮。他們的熱烈討論在一定程度上也源于后者“來自中國”的身份。不同于很多中國公司在技術路線上的“追隨者”地位,DeepSeek展現了中國科技公司在全球AI競爭中的獨立研發能力與技術創新。
“我不會僅僅將DeepSeek作為中國公司看。”王金林并不將DeepSeek看作中國原始創新的特例。全球大模型企業處在你追我趕的進程中,新的技術方案層出不窮。DeepSeek通過極致的優化降低了單位計算成本和用戶使用成本,“這樣的團隊可以在任何地方出現。這一次,它出現在了中國。”
DeepSeek-R1的發布也引發了關于資本與創新關系的深刻思考。在硅谷,科技公司通常依賴于大量融資來推動技術創新,但DeepSeek證明了新的可能,即通過組織頂尖人才、優化工程設計來取得革命性的技術成果。
在全球AI競爭日益激烈的背景下,DeepSeek通過突破性創新在全球科技圈脫穎而出。
特別是在美國出口管制措施的背景下,DeepSeek在傳統的算力和數據需求上進行了前所未有的創新,通過減少對高算力硬件的依賴,降低成本并提升了模型的性能和應用效率。
出口管制對中國科技企業的影響無疑巨大,但也成為初創企業創新的催化劑。比如,在DeepSeek的創新旅程中,資源的限制在一定程度上激發出更多的創新思維。
正如英特爾前首席執行官帕特·基辛格 (Pat Gelsinger)所言:“工程就是關于限制的。中國工程師們的資源有限,他們不得不尋找創造性的解決方案。”這正是DeepSeek的做法。通過在計算流程和硬件需求上的優化,DeepSeek突破壁壘并推動著AI技術的進一步發展。
具體來說,這家中國初創企業展示了如何利用不同的技術,基于符合美國出口管制法規的廣泛可用模型和芯片來開發新的模型。這種創新性設計不僅解決了中國AI公司面臨的資源問題,也為全球AI產業提供了新的發展思路。
王金林認為,中國開發者和研究人員對大模型性能的極致追求,是DeepSeek團隊打造出DeepSeek-R1卓越表現最重要的原因。換句話說,“推動全球AI發展的最主要力量,包括在大語言模型創新領域,是包括研究人員和開發者在內的人才。”
隨著AGI技術的不斷進步,應用層的創業機會有望持續增加。
DeepSeek創始人梁文鋒決心將重心放在研究和探索。他在接受36氪采訪時也作出分析,“從長期看,大模型應用門檻會越來越低,初創公司在未來20年任何時候下場,也都有機會。”
這一觀點為AGI創業者們點燃了希望的火種,也預示著AGI技術將從理論層面走向實際應用,成為重塑全球產業格局的重要力量。
來自微軟的賈里德·斯帕塔羅(Jared Spataro)也表達了類似的觀點。在他看來,AI的價值最終將遷移到應用層。隨著AI技術的不斷發展,企業將更加注重如何將技術應用到實際的商業場景中,人們會看到將一項偉大的技術應用于商業問題的價值。
“大模型本身的最終價值將歸為零,換句話說,大模型本身創造巨大的價值,但不能捕獲價值。”王金林提出了這樣的觀點。他接受采訪時對比了閉源模型和開源模型的價值捕獲方式,認為前者的剩余價值(residual value)可能隨著時間推移而減少,但后者通過開放和協作,能夠在應用層面持續創造和捕獲價值。
他強調,AI的競爭不僅僅是模型本身的競爭,更是應用層(含工具類應用)的競爭。開發者和研究人員在應用層的創新和開發中,將可以有效地捕獲價值,持續推動AI技術的發展和應用。
中美科技博弈持續的背景下,DeepSeek通過創新推動了全球AI產業的邊界擴展,這一現象也為更多初創企業提供了借鑒和啟示。
開源模型通過共享技術,鼓勵全球開發者在其基礎上進行二次開發和創新,從而形成一個活躍的生態系統。這種開放的策略使得DeepSeek能夠在全球范圍內吸引更多的開發者和研究人員,共同推動技術的進步和應用的多樣化。
隨著AGI技術的不斷演進,我們或許已站在新的科技革命前沿。DeepSeek這家來自中國的初創企業,正在為全球AI創業企業掀開新的技術范式,也重塑著未來人工智能競爭的版圖。