第一財經
2025-03-12 16:47
DeepSeek突傳大動作。
2月18日,DeepSeek在社交平臺X上發布了一篇關于NSA的純技術論文報告。DeepSeek稱,NSA是一種與硬件高度適配并可原生訓練的稀疏注意力機制,實現超高速長上下文訓練與推理。通過針對現代硬件的優化設計,NSA加快了推理速度,同時降低了預訓練成本,而不會影響性能。
與此同時,人工智能初創公司月之暗面也有大動作。2月18日,其宣布推出一款新模型Kimi Latest,它將對標Kimi智能助手當前使用的模型,隨智能助手產品更新而同步升級(模型名稱始終不變),用戶現已可在Kimi開放平臺體驗。
市場層面,2月18日,港股DeepSeek概念股延續強勢,截至收盤,出門問問大漲超16%,創夢天地大漲超12%、美圖公司大漲超10%、快手漲超9%。高盛最新研報指出,DeepSeek-R1及中國本土AI模型的突破性進展,正在重塑科技產業敘事邏輯。
DeepSeek發布
2月18日,DeepSeek官方在海外社交平臺X上發布了一篇純技術論文報告,論文主要內容是關于NSA(Natively Sparse Attention,原生稀疏注意力),官方介紹這是一種用于超快速長文本訓練與推理的、硬件對齊且可原生訓練的稀疏注意力機制,用于超快速的長上下文訓練和推理。
校對:趙燕