>> 華泰證券-金工深度研究:多任務(wù)學(xué)習(xí)選股模型的改進(jìn)-240506
| 上傳日期: |
2024/5/6 |
大?。?/td>
| 1951KB |
| 格式: |
pdf 共20頁 |
來源: |
華泰證券 |
| 評級: |
-- |
作者: |
林曉明,何康 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
人工智能78:從預(yù)測目標(biāo)、網(wǎng)絡(luò)結(jié)構(gòu)、組合優(yōu)化角度改進(jìn)多任務(wù)學(xué)習(xí) 本文從預(yù)測目標(biāo)、網(wǎng)絡(luò)結(jié)構(gòu)、組合優(yōu)化角度探討多任務(wù)學(xué)習(xí)選股模型的改進(jìn)。在多期限收益預(yù)測基礎(chǔ)上,引入夏普比率作為預(yù)測目標(biāo);參考騰訊2020年發(fā)表的PLE模型,在GRU內(nèi)部引入多層專家和門控網(wǎng)絡(luò);采用多周期優(yōu)化融合不同期限收益預(yù)測。結(jié)果表明,改進(jìn)模型相比基線均有提升,引入PLE總體優(yōu)于引入夏普比率,PLE結(jié)合多周期優(yōu)化模型在指數(shù)增強(qiáng)組合的超額收益上優(yōu)于大部分對照模型。回測期2016-12-30至2024-04-30內(nèi),周單邊換手20%條件下,中證500增強(qiáng)組合年化超額收益18.1%,信息比率3.05,中證1000增強(qiáng)組合年化超額收益28.7%,信息比率4.24。 改進(jìn)方向之一:引入夏普比率,預(yù)測目標(biāo)考慮風(fēng)險信息 本研究的多任務(wù)學(xué)習(xí)基線模型架構(gòu)為:針對日K線和周K線,分別采用多任務(wù)GRU網(wǎng)絡(luò),同時預(yù)測未來10日和20日收益率,預(yù)測值求均值視作單因子;針對分鐘K線,人工構(gòu)建50個因子,采用最大化10日ICIR法合成;最后將日K線、周K線和分鐘K線因子等權(quán)合成?;€模型的預(yù)測目標(biāo)僅考慮收益,未考慮風(fēng)險。改進(jìn)方向之一采用包含收益和風(fēng)險信息的夏普比率作為目標(biāo),在10日和20日收益預(yù)測基礎(chǔ)上,引入20日夏普比率預(yù)測任務(wù)。 改進(jìn)方向之二:引入PLE架構(gòu),采用多層專家和門控網(wǎng)絡(luò)提升表征能力 騰訊PCG團(tuán)隊2020年提出PLE(Progressive Layered Extraction)架構(gòu),采用多層專家和門控網(wǎng)絡(luò)設(shè)計,提升特征表征能力。改進(jìn)方向之二將PLE引入基線模型的雙層GRU網(wǎng)絡(luò)。其中,第一層的任務(wù)共享專家網(wǎng)絡(luò)和任務(wù)特定專家網(wǎng)絡(luò)接受相同的原始K線輸入信息,采用單層GRU提取淺層特征表征后,通過第一層門控單元進(jìn)行融合;第二層的任務(wù)共享專家網(wǎng)絡(luò)和任務(wù)特定專家網(wǎng)絡(luò)接受特異的輸入信息,采用單層GRU提取深層特征表征后,通過第二層門控單元進(jìn)行融合。門控單元均采用單層GRU網(wǎng)絡(luò)與Softmax激活。后續(xù)的任務(wù)特異層與基線模型一致。 改進(jìn)方向之三:引入多周期優(yōu)化,最大化多期收益并限制遠(yuǎn)期換手 多任務(wù)學(xué)習(xí)同時預(yù)測不同期限收益率,基線模型直接求均值作為最終預(yù)測,缺點是投資意義不明確。改進(jìn)方向之三采用多周期優(yōu)化技術(shù),將10日和20日收益預(yù)測同時輸入組合優(yōu)化器。單周期優(yōu)化中,每期組合優(yōu)化的目標(biāo)函數(shù)為最大化預(yù)期收益。多周期優(yōu)化中,目標(biāo)函數(shù)除了最大化預(yù)期收益項外,還加入了換手率懲罰項。在最大化組合短期收益和長期收益的同時,限制組合當(dāng)期換手以及下期可能的換手。 測試結(jié)果:三項改進(jìn)均有效,PLE+多周期優(yōu)化模型表現(xiàn)出色 測試結(jié)果表明,三項改進(jìn)相比基線均有提升。從GRU單因子看,引入夏普比率和引入PLE均優(yōu)于對應(yīng)的基線。從指數(shù)增強(qiáng)組合看,引入PLE總體優(yōu)于引入夏普比率。將“多任務(wù)學(xué)習(xí)+PLE取10日預(yù)測”與“多任務(wù)學(xué)習(xí)+PLE取20日預(yù)測”的預(yù)測值作為多周期優(yōu)化的輸入變量,構(gòu)建中證500和中證1000指數(shù)增強(qiáng)組合,超額收益優(yōu)于大部分對照模型,同時在回撤控制上體現(xiàn)出優(yōu)勢?;販y期2016-12-30至2024-04-30內(nèi),周單邊換手20%條件下,中證500增強(qiáng)年化超額收益18.1%,信息比率3.05,Calmar比率3.22;中證1000增強(qiáng)年化超額收益28.7%,信息比率4.24,Calmar比率6.93。 風(fēng)險提示:人工智能挖掘市場規(guī)律是對歷史的總結(jié),市場規(guī)律在未來可能失效。人工智能技術(shù)存在過擬合風(fēng)險。深度學(xué)習(xí)模型受隨機(jī)數(shù)影響較大。本文測試的選股模型調(diào)倉頻率較高,假定以vwap價格成交,忽略其他交易層面因素影響。
|
|