>> 信達證券-深度學習揭秘系列之三:用DeepSeek優(yōu)化價量因子-250321
| 上傳日期: |
2025/3/21 |
大?。?/td>
| 3548KB |
| 格式: |
pdf 共38頁 |
來源: |
信達證券 |
| 評級: |
-- |
作者: |
于明明,周金銘 |
| 下載權限: |
無限制-登錄即可下載 |
|
|
本文是深度學習揭秘系列之三。聚焦于借助DeepSeek模型對選股因子進行生成與改進,在量化投資領域展開深入探索。研究以Qlib集成的Alpha158量價因子為基礎,該因子集涵蓋日內、波動、價、量及量價相關性五類因子。通過設定統(tǒng)一測算口徑,運用特定的Prompt Engineering和AI交互流程,借助DeepSeek對原始因子進行優(yōu)化,以及生成相關性較低的新因子,取得顯著成果。 在因子優(yōu)化方面,多數因子經DeepSeek優(yōu)化后預測能力提升顯著。測試的Alpha158因子集中,75%的因子RankIC均值提升,50%的因子RankIC均值達1.2倍提升,35%的因子RankIC均值有1.5倍提升;ICIR指標同樣向好,眾多因子ICIR提升且多倍提升的因子數量可觀。從不同窗口期數據看,優(yōu)化后的因子表達式普適性強。以波動率因子std20為例,多次改進中引入平均真實波幅ATR概念、成交量加權機制、EMA雙重平滑及四維波動極值捕捉等,雖部分改進使RankIC均值有波動,但整體提升了因子選股效果。不過,部分因子如Beta20、min20等受限于原始計算邏輯,在優(yōu)化過程中未呈現顯著提升,揭示傳統(tǒng)因子改進存在理論天花板。 在因子生成上,從零生成因子較難達到理想效果,然而,站在成功案例基礎上生成因子,效果顯著。若從零開始,20次迭代生成的因子具備一定邏輯,但預測效果一般,ICIR未達預期。若給予DeepSeek部分預測效果尚佳的因子表達式作為參考,例如Alpha158原始及優(yōu)化因子表達式與對應的IC統(tǒng)計量,則能夠在較少的迭代次數內,生成5個ICIR在0.8以上且與樣例因子相關性低的新因子。其中第一個有效因子通過捕捉量價協(xié)同增強效應,第二個聚焦量價共振強度維度,展現出較好的選股能力。 組合維度對比發(fā)現,將優(yōu)化后的Alpha158因子及新生成因子線性結合,使用Lasso模型合成因子,能提升選股能力。全A數據中,原始因子、增強因子、原始+生成因子及最終合成因子的RankIC均值和多頭超額收益逐次提升。落地到中證800指增組合,原始因子疊加優(yōu)化與新生成因子得到的復合因子,月頻RankIC均值從9.01%提升至10%,ICIR從0.93提升至1.01,多頭超額年化收益從7.05%提升至7.92%,年化信息比從1.63增強至1.89。 綜上,本文引入DeepSeek模型,通過構建“優(yōu)化-驗證-再迭代”框架,貢獻了因子優(yōu)化與因子生成的新思路,實現了大語言AI模型對量化研究的賦能。 風險因素:結論基于歷史數據,在市場環(huán)境轉變時模型存在失效的風險。
|
|