>> 方正證券-專題報告:基于可微RankIC損失函數(shù)的深度學(xué)習(xí)選股策略——機(jī)器學(xué)習(xí)選股系列研究之一-251208
| 上傳日期: |
2025/12/8 |
大?。?/td>
| 2539KB |
| 格式: |
pdf 共23頁 |
來源: |
方正證券 |
| 評級: |
-- |
作者: |
曹春曉 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個分支,它通過模擬人腦神經(jīng)網(wǎng)絡(luò)的復(fù)雜結(jié)構(gòu),讓機(jī)器能從海量數(shù)據(jù)中自動學(xué)習(xí)和提取高層次的規(guī)律特征。金融時間序列,尤其是股票市場數(shù)據(jù),以其高噪聲、非平穩(wěn)、非線性的復(fù)雜特性而著稱,這恰好對傳統(tǒng)量化模型的預(yù)測能力構(gòu)成了嚴(yán)峻挑戰(zhàn)。深度學(xué)習(xí)憑借深層神經(jīng)網(wǎng)絡(luò)對高噪聲、非平穩(wěn)、非線性金融時序數(shù)據(jù)的強(qiáng)大擬合能力,實現(xiàn)了從海量原始數(shù)據(jù)中進(jìn)行端到端的特征提取與模式識別,為超越傳統(tǒng)策略的績效邊界提供了可能。 傳統(tǒng)量化將Rank IC作為因子的主要評價指標(biāo)。在量化選股中,最終的決策是橫截面上的排序,而非對個股收益的精確預(yù)測。傳統(tǒng)的MSE或交叉熵?fù)p失是代理損失,它們優(yōu)化了一個與最終排序目標(biāo)并不完全一致的中介目標(biāo)。直接使用Rank IC(即Spearman相關(guān)系數(shù))作為損失函數(shù),遵循了決策一致性原則,使模型的優(yōu)化方向與我們的投資目標(biāo)直接對齊,從而避免了代理損失可能帶來的目標(biāo)偏離。然而,在TensorFlow框架中,構(gòu)建損失函數(shù)時,Spearman相關(guān)系數(shù)由于其中排序函數(shù)不可導(dǎo),實現(xiàn)起來較為困難。 為實現(xiàn)以Rank IC為損失函數(shù)的深度學(xué)習(xí)訓(xùn)練,本文提出了一種直接以Spearman相關(guān)系數(shù)為損失函數(shù)配合按交易日切割mini-batch的端到端訓(xùn)練范式。第一章提出了以交易日為單位的批數(shù)據(jù)切割方法,介紹了TensorFlow框架下的迭代邏輯以及后續(xù)會用到的關(guān)鍵組件,包括TensorFlow訓(xùn)練循環(huán)邏輯以及代碼、小批量梯度下降、大規(guī)模數(shù)據(jù)集專用存儲格式TFRecord、以交易日切割股票批數(shù)據(jù)集的合理性、以及數(shù)據(jù)洗牌Reshuffle。第二章介紹了基于Sigmoid的軟排序(Sigmoid Ranking)與神經(jīng)排序(Neural Sort)兩種可微排序法,作為構(gòu)建Rank IC損失函數(shù)的關(guān)鍵組件。 基于以上邏輯基礎(chǔ)與理論基礎(chǔ),本文第三章提出了一個用于優(yōu)化線性組合的深度網(wǎng)絡(luò)結(jié)構(gòu),基于方正金工團(tuán)隊前期研究所構(gòu)建的特色高頻量價因子進(jìn)行因子聚合。訓(xùn)練結(jié)果在20日收益率的測度下取得了12.48%的Rank IC與5.41的Rank ICIR,驗證了本方法在提升現(xiàn)有模型性能方面的實用價值。 風(fēng)險提示: 本報告基于歷史數(shù)據(jù)分析,歷史規(guī)律未來可能存在失效的風(fēng)險;市場可能發(fā)生超預(yù)期變化;各驅(qū)動因子受環(huán)境影響可能存在階段性失效的風(fēng)險。
|
|