>> 東方證券-因子選股系列之九十一:基于循環(huán)神經(jīng)網(wǎng)絡(luò)的多頻率因子挖掘-230606
| 上傳日期: |
2023/6/6 |
大小: |
1474KB |
| 格式: |
pdf 共26頁 |
來源: |
東方證券 |
| 評級: |
-- |
作者: |
楊怡玲 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
前期報告《周頻量價指增策略》利用RNN為主體模型搭建了AI量價模型框架,并將其應(yīng)用于選股策略。本報告主要對該報告中數(shù)據(jù)預(yù)處理和RNN模型提取因子這兩部分進行了復(fù)現(xiàn)和一些細(xì)節(jié)方面改進,包括最后一層增加Batch-Norm層、使用的標(biāo)簽經(jīng)過中性化和截面標(biāo)準(zhǔn)化等預(yù)處理。 通過討論模型中一些參數(shù)的設(shè)置,我們認(rèn)為:1)適當(dāng)降低模型的學(xué)習(xí)率有助于梯度下降時尋找到驗證集上表現(xiàn)更優(yōu)的模型參數(shù),但會大大增加模型訓(xùn)練時間;2)增加RNN中丟棄率大小有助于增強模型的泛化能力,但會降低模型在驗證集上的表現(xiàn);3)驗證集上模型性能隨正交懲罰參數(shù)增大呈現(xiàn)先上升后下降的趨勢;4)適當(dāng)增加因子單元個數(shù)有利于控制生成各單因子間的低相關(guān)性,但會增加過擬合風(fēng)險。 2017年以來,一元和多元RNN等權(quán)合成因子在中證全指、滬深300、中證500、中證1000四個指數(shù)成分股上雙周頻RankIC均值分別為14.47%、10.05%、11.03%、14.45%和14.63%、10.24%、11.15%、14.91%,數(shù)值均超過了10%。這說明RNN生成因子市值偏向性較低 RNN在各數(shù)據(jù)集生成因子等權(quán)合成之后打分可直接應(yīng)用于指數(shù)增強策略,成分股不低于80%限制、周單邊換手率約束為20%約束下,一元模型打分在滬深300、中證500和中證1000增強策略上年化對沖收益率分別為12.22%、13.79%和23.63%,多元模型打分在滬深300、中證500和中證1000增強策略上年化對沖收益率分別為12.52%、14.85%和22.15%。 根據(jù)各數(shù)據(jù)集上生成因子回測結(jié)果,我們認(rèn)為1)多元RNN生成因子單元中各單因子仍然有較好的選股能力且各單因子之間相關(guān)性較低,說明多元RNN挖掘因子能力較高;2)我們分鐘特征數(shù)據(jù)集并沒有完全表示分鐘k線數(shù)據(jù)包含信息,分鐘線特征有待進一步挖掘;3)我們level2特征數(shù)據(jù)集所包含的信息與日頻及分鐘特征數(shù)據(jù)集重疊度更低,進一步研究level2特征將會給整個模型帶來更多增量。 風(fēng)險提示 量化模型基于歷史數(shù)據(jù)分析,未來存在失效風(fēng)險,建議投資者緊密跟蹤模型表現(xiàn)。 極端市場環(huán)境可能對模型效果造成劇烈沖擊,導(dǎo)致收益虧損。
|
|