DeepSeek之后,金融大模型將迎哪些變化?
來源:界面新聞作者:何柳穎2025-02-11 13:33

DeepSeek熱潮正快速蔓延。

金融機構中,券商動作最為迅速。目前國泰君安、 國金證券、 廣發證券、華安證券等多家券商均表示已完成本地化部署。

銀行方面,江蘇銀行率先宣布已部署Deepseek,該行稱,依托“智慧小蘇”大語言模型服務平臺,成功本地化部署微調DeepSeek-VL2多模態模型、輕量DeepSeek-R1推理模型,分別運用于智能合同質檢和自動化估值對賬場景中。

蘇商銀行方面表示,2024年,在國產大模型興起之初,蘇商銀行積極關注并先后引入DeepSeek系列技術,結合原有大模型技術能力,在模型輕量化與高效推理方面取得顯著突破,并大幅降低了算力消耗。

整體而言,目前正式官宣接入、應用Deepseek的銀行不算多,不過有銀行人士告訴界面新聞記者,“已在行內部署DeepSeek大模型”。

無論快慢,Deepseek帶來的“低成本、高性能”路線顯然已為金融機構的大模型布局帶來了新的思考。另一方面,這一路線是否有望縮小金融機構之間的大模型技術鴻溝?

大大降低深度思考模型的應用門檻

桂林銀行方面告訴界面新聞記者,該行已在行內部署Deepseek大模型,計劃結合各業務條線將其用于業務知識問答助手、客服助手、培訓助手、培訓對練、智能出題等場景,拓展大模型技術在金融服務場景的應用,賦能金融服務高質量發展。

另有股份行人士告訴界面新聞記者,“目前還在研究中,沒那么快落地”。

“DeepSeek-R1的優勢可以用‘更聰明、更便宜、更開放’來概括。更聰明在于自主學習能力更強,能夠通過自動推理得出正確的結果;更便宜在于借助算法優勢,可以占用更少的算力資源,以更低的成本完成同樣的任務;更開放在于其選擇了開源,允許任何人免費試用和改進算法。”中國科學院科技戰略咨詢研究院研究中心副主任周城雄向界面新聞記者表示。

“2023年OpenAI推出O1系列模型時,強大的推理思考能力為很多復雜場景的深入應用帶來了可能;而此次DeepSeek-R1系列模型開源,不僅帶來了完整好用的COT(思維鏈推理)能力,同時其通過大模型蒸餾小模型的實踐方式也大大降低了深度思考模型的應用門檻。”招聯消費首席信息官王耀南告訴界面新聞記者。

王耀南表示,DeepSeek-R1模型的開源帶來了更多應用機會,對于招聯消費的大模型應用策略來說,強化的深度思考能力可以大大拓寬智能體的應用范圍。

比如,“在風險管理領域,深度思考能力可以讓智能體應用完全結合宏觀、微觀經濟運行情況,詳細、完整地評估客戶的風險水平;在服務與營銷領域,通過對客戶信息及過往服務交互記錄的深入分析,我們可以通過AI技術為每個客戶打造專屬客戶經理。”王耀南介紹。

幫助搭建金融大模型

根據周城雄的觀察,目前金融機構大模型研發路徑主要有以下三類:一是利用已經開源的模型進行處理,二是聚焦金融場景針對性地開發小模型,三是直接采購服務商的AI服務。

從受訪金融機構的情況看,第一種方式更為普遍。王耀南介紹,招聯主要基于一系列開源的基座大模型(包括llama、qwen等),結合招聯對于業務的深入洞察和數據積累,通過強化學習、SFT微調等方式打造并開源了兩代智鹿大模型,在此基礎上構建了包括消保智能體、審批智能體、運營智能體等一系列智能體應用。

桂林銀行方面亦告訴界面新聞記者,該行大模型研發與應用主要通過引入開源的通義千問大模型結合采購行業垂直領域大模型,構建大模型中臺,集中統一管理大模型資源,目前已上線30余個大模型應用。

目前DeepSeek-R1已開源,這不僅意味著各大金融機構多了一個成本更低的開源模型選擇,更重要的是,DeepSeek正攪動起一輪閉源開源之爭,這實際上有助于推動人工智能的整體開發和應用進程。

從應用層面劃分,大模型大致可以分為兩類,一類是通用大模型,另一類是垂類大模型。在知識門檻技術較高的金融領域,業內普遍認為垂類大模型的性能匹配度會更高。

BloombergGPT是垂類大模型的典型之一。2023年3月30日,Bloomberg(彭博)正式發布金融行業大模型BloombergGPT,該機構彼時表示,基于LLM(Large language Model,大型語言模型)的人工智能最新進展已經為許多領域展示了令人興奮的新應用,然而,金融領域的復雜性和獨特術語需要特定領域的模型。

據官方介紹,彭博的數據分析師在四十年時間里收集并維護了金融語言文件,該團隊從龐大的金融數據檔案中提取數據,創建了一個由英文金融文檔組成的全面的3630億個token數據集。然后使用3450億個token的公共數據進行擴充,從而創建了一個包含超過7000億個token的大型訓練語料庫。

該模型將幫助彭博改進現有的金融NLP(Natural Language Processing,自然語言處理)任務,例如情緒分析、實體識別、新聞分類和問答等。

招商銀行信息技術部副總經理俞吳杰亦曾表示,招行重點不在搭建通用模型,而是搭建金融行業的領域模型。

俞吳杰表示,招商銀行不會在通用大語言模型上花費更多精力,因為通用大語言模型在銀行業的運用有其弱點——對專業知識理解有限,在專業領域數據處理能力較弱。囿于此,招行會在比較好的通用模型基礎之上,將足夠的專業領域知識給到大模型,“最起碼是銀行業,未來還可能擴展到證券、保險等與銀行關聯性大的行業”。

如何“喂料”是其中的關鍵問題之一,而Deepseek-R1有望在這方面幫助銀行“提質增效”。

“Deepseek-R1是通用大模型,知識量很廣,包括信貸業務等金融領域的知識,這可以作為語料支持。將金融內部數據與外部數據結合優化,亦可以降低訓練成本。”周城雄表示。

“大模型對于業務模式的重構是一個循序漸進的過程,R1深度思考模式的引入,不僅有利于復雜推理場景下的AI技術應用;同時也可以作為招聯自研模型‘自構建數據’的引擎,結合足夠多且高質量的數據,帶來更優異的推理效果。”王耀南亦強調。

縮小大模型技術鴻溝?

金融領域是AI應用最具潛力的領域之一。

“因為金融領域的數據結構化程度比較高,并且金融機構對數據的管理相對合規完善,這對于生成式AI訓練而言是比較好的數據基礎。但是因為金融數據涉及到用戶隱私以及跨地域、跨部門的監管問題,如果要對這些數據進行訓練,其實也存在一定的壁壘。”周城雄表示。

而在金融機構之間,實際上存在著明顯的技術鴻溝。

此前有業內人士表示,從行業角度看,大語言模型是一項持續的、規模大的投資,包括建集群、招聘人才等,且資源都比較稀缺,并非所有銀行都適合大規模投入其中。銀行業之間的交流非常多,中小銀行機構可以復用一些業內經驗。對于中小銀行,并不建議盲目跟風,尤其是一次性的大投入,目前大模型的發展還有很多變數,包括通用大模型哪個更優,怎么部署等,都還在變化過程當中。建議中小銀行機構更多地做好行業交流學習,針對自身實際情況量力而為才是更合適的。

Deepseek-R1有望帶來新的競爭路徑。

桂林銀行方面告訴記者,Deepseek-R1是一款優秀的國產大模型,對該行大模型策略產生了比較重要的影響。尤其是Deepseek-R1顯著降低了研發成本,使得中小型城商行能夠以更低的成本投入大模型的研發與應用。

“以往研發金融大模型需要購買大量的GPU卡來搭建高算力的基礎設施,成本高昂。而Deepseek-R1低操作成本特點,讓我行在金融大模型應用研發方面的投入產出比有望進一步上升。Deepseek-R1在基礎設施方面帶來的降本增效,有助于我們投入更多資源到大模型應用方面,能夠更好地專注于自身業務特點,開發有針對性的垂直應用。”該負責人稱。

桂林銀行方面認為,Deepseek-R1的出現有望縮小中小型城商行與大型銀行在大模型應用研發方面的差距。中小型城商行由于資源有限,在大模型研發上的投入相對較少,而Deepseek-R1的低數據訓練成本和高性能,為中小型城商行提供了一個新的突破口。

“原來各機構的技術差異可能比較大,有的土壤肥沃,有的貧瘠,投入產出比差異明顯;如今Deepseek-R1實現了通過較低的成本來獲得比較好的產出,相當于大家在同一片肥沃的土壤上種植,整體拉高了投入產出比,技術差異有望縮小。”周城雄亦表示。

但對于中小型機構而言,困難依然重重。“包括數據量相對有限,能承擔多少算力,人才問題,等等。”周城雄補充稱。

另一方面,技術門檻的降低也并不意味著消弭差距,甚至可能拉大差距。“如果機構懂得如何借力低成本的技術平臺,相信能產生更好的效益,而對于不會利用的機構而言,則會帶來負面影響。”周城雄談及。

在周城雄看來,中小金融機構需要在自主開發和外部力量之間尋找一個平衡:如果完全用外部的大模型,可能不是那么好用,并不適合自身業務;如果完全自主開發,成本也會太高。

展望未來,周城雄認為競爭格局將取決于AI與業務的深度融合能力,而非僅僅成本的高低問題。“就像信息化浪潮的時候,信息化與業務的融合水平也拉開了機構之間的競爭差距。”

但無論如何,在各個領域,大模型成本降低都是喜聞樂見的事情。

王耀南談及,以消費金融為例,作為與人們日常消費聯系緊密的金融業態,消費金融具有量大、小額、分散等鮮明特點,業務風險和運營成本較高,實現“普”與“惠”的平衡存在公認難度。大模型技術的發展將進一步推動金融服務的顛覆式創新,在高效解決風控、運營、服務等領域存在巨大應用空間和顯著優勢。

著眼生態發展,“DeepSeek在Nvidia CUDA技術體系之外,以其良好的原生生態支撐了包括華為昇騰在內的一系列國產GPU技術棧,DeepSeek的‘破圈’及優異的性能讓更多人認識到國內人工智能信創生態將會快速完善。未來,充分的市場競爭一定會帶來投入產出比的上升。”王耀南表示。

責任編輯: 陳勇洲
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    国产肥熟女视频一区二区三区,97在线精品视频无码,久久中文字幕无码不卡浪潮,久久tv免费国产精品美女
    日本有码中文字幕第二页 | 亚洲国产综合精品中久 | 日韩精品一区二区三区影院 | 伊人精品在线观看 | 亚洲一区二区三区四 | 一本一本久久A久久综合精品 |