華泰證券:DeepSeek有望加速模型訓練與CUDA解耦
來源:人民財訊作者:王煥城2025-02-21 07:57

人民財訊2月21日電,華泰證券研究認為,DeepSeek在V3中使用了相比CUDA更底層的PTX 來優化硬件算法,PTX是CUDA編譯的中間代碼,在CUDA和最終機器碼之間起到橋梁作用。而NSA則使用了OpenAl提出的Triton編程語言高效編寫GPU代碼,Triton的底層可調用CUDA,也可調用其他GPU語言,包括AMD的rocm以及國產算力芯片語言,如寒武紀的思元590芯片和海光信息的深算一號(DCU)內置的HYGON ISA指令集。LLM的訓練短期內雖未完全脫離CUDA 生態,但DeepSeek NSA的推出使其初步呈現出與CUDA解耦的趨勢,并為后續適配更多類型的算力芯片奠定基礎。以異騰為代表的國產算力已經很好的適配了DeepSeek-R1 等國產模型,并取得了高效推理的效果,華泰證券認為,伴隨海外算力的受限,針對國產算力的優化或將有持續進展,值得重視。

責任編輯: 賴小風
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    国产肥熟女视频一区二区三区,97在线精品视频无码,久久中文字幕无码不卡浪潮,久久tv免费国产精品美女
    亚欧洲日本在线观看 | 日韩艳情国产在线观看 | 日本嫩草影院久久久精品 | 亚洲午夜福利在线视频 | 日韩精品一区二区三区影院 | 亚洲天堂电影午夜在线 |