證券時報記者 王小芊
近年來,隨著人工智能(AI)技術的飛速發展,量化投資領域正迎來新一輪深刻變革。
以生成式AI為代表的新一代模型興起,顛覆了傳統數據處理方式,促使基金公司加速探索AI的深度應用。面對海量且復雜的金融市場數據,算力資源分配與穩定性也逐漸成為AI量化模型的制勝關鍵。
不過,盡管AI技術在量化投資領域展現出強大潛力,模型的“黑盒”特征(指的是那些內部工作原理對用戶不可見的系統或模型特征)以及相應的可解釋性不足依然困擾著業界。多家機構指出,AI模型要真正發揮作用,還需要提升模型的透明度與可解釋性。
公募量化投資不斷優化
近年來,AI技術的快速發展使得數據應用場景發生深刻變化,傳統的因子模式也面臨巨大的沖擊,中大型基金公司開始紛紛探索AI的深度應用。
在接受證券時報記者采訪時,路博邁基金副總經理、CIO兼基金經理魏曉雪詳細闡述了人工智能技術在量化投資中的關鍵作用。在梳理量化策略模型的發展史時,魏曉雪介紹,量化1.0是簡單選股策略階段,以基本統計方法為主,使用簡單數學模型進行投資分析,主要依賴于人工挖掘因子,波動控制具有一定的局限性。量化2.0是多因子模型階段,使用多因子模型捕捉線性信息,通過更多樣的數據集提高準確性與穩定性,缺點是人工依賴度高。量化3.0則是AI加高頻交易,使用AI機器學習算法識別和捕捉非線性的股票高頻特征,預測短期股票價格波動。不過,這一模型也有缺點,即因子衰減快,預測周期較短。
隨著DeepSeek正式落地,路博邁的量化3.5模型也在此基礎上應運而生。其選股頻率為周度調整,這一高頻更新特征也是AI量化效率的重要體現。
路博邁基金認為,相較于傳統模型通常采用的月度調整機制,量化3.5通過更高頻次的動態調整,能夠更有效地捕捉短期市場機會,展現出更強的靈活性和適應性。
浙商基金也表示,LLM模型(大語言模型)被不斷優化,極大地降低了文本數據的應用難度,量化可以利用的文本數據呈指數級增加,量變引發質變。日常實踐中,多模態、生成式大模型對于日常工作的輔助,對于認知的重構已經非常顯著。未來,AI量化投資方法會不會有天翻地覆的變化,也值得期待。
算力仍是基石
AI技術在量化投資中的運用,與金融市場數據的爆炸式增長息息相關。在魏曉雪看來,在傳統的數據處理中,投資者主要依賴價格、成交量等結構化數據,而隨著信息技術的飛速發展,新聞、社交媒體、財報文本等非結構化數據的涌現,給投資分析帶來了巨大挑戰。AI技術,特別是自然語言處理和圖像識別等技術,能夠高效地處理和分析這些海量的多維度數據,挖掘出傳統方法難以捕捉的信息。
目前,路博邁集團量化策略的管理規模已接近百億美元,覆蓋發達市場和新興市場的股票與債券。因此,算力成為了支持策略運行的關鍵。魏曉雪透露,路博邁總部每天處理的數據量已達太字節(1024GB)級別,相關的數據處理經驗能夠支持模型高效處理海量數據,并進行持續優化。
銀河基金對DeepSeek-R1的觀察同樣證明了算力的重要性。1月20日,DeepSeek-R1正式發布并同步開源模型權重。然而,由于短期內用戶需求的大量爆發,造成了自有算力緊張,2月6日,該模型暫停了API服務充值。這也從側面說明,面對大規模用戶需求時,算力資源的分配與系統穩定性成為制約AI模型發展的關鍵因素。
模型“黑盒”難題尚待解決
雖然當前AI技術為量化投資帶來了諸多突破,但在多家機構看來,現階段模型仍是偏“黑盒”的特征,可解釋性較弱,制約了其在金融領域的進一步深入應用。
浙商基金指出,當下端到端賦能投資的AI模型、機器學習模型仍是通過堆砌大量數據和構造比較復雜的模型去輸出結果。這樣,一方面可解釋性不高,可能不適應金融場景,另一方面可能存在模型過擬合的問題。
尤其在生成式模型爆發后,模型在研報閱讀、財報梳理、簡單的代碼生成等方面具有強大優勢,但生成式模型的發散思考能力又與傳統量化的偏確定性投資建議存在沖突。這意味著,雖然生成式模型的應用顯著提高了可解釋性,但也帶來了可追溯性降低的問題。
對此,浙商基金認為,未來AI量化投資的發展方向應當還是以多模態的生成式模型為主,為了追求可驗證的投資能力,需要部分約束生成式模型的發散能力,提升更為準確的歷史先驗知識的占比,加強與人類智慧的合作,讓AI模型真正讀懂人類的需求,特別是投資領域的需求。
滬上一位公募研究人士向證券時報記者表示,盡管AI技術在量化投資中的應用為市場預測、風險控制和策略優化提供了許多創新途徑,但也存在不少局限性。首先,金融市場數據通常存在噪音較多、非平穩性強的問題。AI模型容易過度擬合歷史數據中的異常情況,降低了預測的可靠性。此外,歷史數據中的隨機因素和特定時期的極端事件也可能被模型誤讀,導致實際市場表現不及預期。
與此同時,模型所假設的理想市場條件與現實交易環境存在較大差距,頻繁的交易可能帶來顯著的交易成本、滑點及流動性風險,進一步影響策略的實際效果。此外,由于金融市場易受政治、經濟以及心理因素的多重干擾,突發的“黑天鵝”事件通常超出模型的預測能力,這也意味著純粹依靠歷史數據訓練的模型在面對極端市場狀況時可能表現欠佳。