>> 華泰證券-金工深度研究:如何捕捉長時間序列量價數(shù)據(jù)的規(guī)律-240314
| 上傳日期: |
2024/3/14 |
大?。?/td>
| 1859KB |
| 格式: |
pdf 共21頁 |
來源: |
華泰證券 |
| 評級: |
-- |
作者: |
林曉明,何康 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
人工智能系列之75:patch思想用于長時間序列量價選股模型 隨著高頻數(shù)據(jù)的普及和算力的發(fā)展,量化投資中使用的時間序列數(shù)據(jù)長度正逐漸擴展。傳統(tǒng)GRU模型在處理長序列數(shù)據(jù)時可能存在信息遺忘、難以捕捉周期性和異質(zhì)性規(guī)律等問題。本研究引入patch的思想,按照交易日將股票的長時間序列量價數(shù)據(jù)劃分為多個patch,設(shè)計PatchModel1和PatchModel2兩個模型,并在兩個選股場景下進(jìn)行測試。結(jié)果表明,patch模型具有增量信息,模型融合后相比GRU均有提升。使用兩個場景下的合成因子對前期報告的全頻段融合因子加以改進(jìn),回測表現(xiàn)有所提高。 傳統(tǒng)GRU模型在處理長序列數(shù)據(jù)時可能存在一些“盲區(qū)” 作為一種經(jīng)典的時間序列深度學(xué)習(xí)模型,GRU在量化投資中有著廣泛應(yīng)用。然而,GRU在處理長時間序列量價數(shù)據(jù)存在一些缺陷。首先,當(dāng)序列非常長的時候,GRU會遇到梯度消失、信息遺忘的問題。其次,高頻量價數(shù)據(jù)具有一定的周期性,GRU難以捕捉這種周期性的規(guī)律。此外,長時間序列量價數(shù)據(jù)的日內(nèi)和日間信息傳遞具有異質(zhì)性,但參數(shù)共享的設(shè)計造成GRU只能一視同仁地處理所有時間點的數(shù)據(jù)。 模型引入patch設(shè)計能夠有效緩解GRU的不足 Patch的思想可概括為對數(shù)據(jù)進(jìn)行分塊處理,并將每一塊作為一個整體傳入模型,在時間序列預(yù)測和計算機視覺等領(lǐng)域均有應(yīng)用。本研究按照交易日將股票的長時間序列量價數(shù)據(jù)劃分為多個patch,使模型可以有效緩解信息遺忘的問題,并引入以日為周期的先驗知識,差異化地分析日內(nèi)和日間信息傳遞。本文設(shè)計了PatchModel1和PatchModel2兩個模型。PatchModel1使用GRU處理日內(nèi)的時序數(shù)據(jù),再通過注意力機制構(gòu)建日間的聯(lián)系;PatchModel2將日內(nèi)時點信息拆解為不同的特征,再使用GRU來挖掘日間的時序規(guī)律。 Patch模型相較于基準(zhǔn)GRU模型具有增量信息 本研究在兩個場景下測試patch模型的表現(xiàn)。在15分鐘頻量價數(shù)據(jù)序列中,patch模型回測表現(xiàn)優(yōu)于GRU,且模型間預(yù)測值相關(guān)性不高,等權(quán)合成因子的表現(xiàn)進(jìn)一步提升。樣本空間為全A股,GRU與patch模型合成后,2017/1/4~2024/2/29的回測期內(nèi)周度RankIC均值從8.86%提升到9.58%,分10層TOP組合年化超額收益率從21.15%提升到24.65%。在30分鐘頻量價特征序列中,patch模型回測表現(xiàn)略弱于GRU,但仍能提供增量信息。GRU與patch模型合成后,周度RankIC均值從8.27%提升到8.62%,分10層TOP組合年化超額收益率從20.42%提升到21.64%。 改進(jìn)全頻段融合因子,回測表現(xiàn)有所增強 使用上述兩個實驗場景中的合成因子,對前期報告的全頻段融合因子加以改進(jìn)。全頻段融合因子在2017/1/4~2024/2/29的回測期內(nèi)周度RankIC均值從10.42%提升到11.33%,分10層TOP組合年化超額收益率從32.61%提升到34.40%。基于全頻段融合因子2.0版本構(gòu)建指數(shù)增強組合。在周雙邊換手率分別控制為30%、40%和50%的情況下,2017/1/4~2024/2/29回測期內(nèi)中證500增強組合年化超額收益率為18.93%、18.57%和18.43%,信息比率為3.27、3.12和3.00;中證1000增強組合年化超額收益率為29.25%、30.92%和28.94%,信息比率為4.35、4.48和4.12。 風(fēng)險提示:借助高頻因子、人工智能構(gòu)建的選股策略是歷史經(jīng)驗的總結(jié),存在失效的可能。深度學(xué)習(xí)的可解釋性較弱,使用需謹(jǐn)慎。
|
|