>> 東方證券-因子選股系列之九十三:集成模型在量價特征中的應(yīng)用-230630
| 上傳日期: |
2023/7/1 |
大?。?/td>
| 1109KB |
| 格式: |
pdf 共19頁 |
來源: |
東方證券 |
| 評級: |
-- |
作者: |
楊怡玲 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
研究結(jié)論 本研究旨在揭示量價特征與未來收益率之間的內(nèi)在聯(lián)系。我們運用了三個量價數(shù)據(jù)集,借助三種不同邏輯的模型進行訓(xùn)練,預(yù)測標(biāo)簽為未來收益率的五分類。為了處理標(biāo)簽噪音并尋找普適性的邏輯,我們采用了五分類作為標(biāo)簽,借助各類預(yù)測概率加權(quán)得到最終的量價合成因子。此研究嘗試尋找更精細(xì)、全面的量價特征以預(yù)測未來收益,強調(diào)了使用多種時間維度數(shù)據(jù)和模型預(yù)測邏輯的重要性。 在本研究中,我們對日頻、日內(nèi)和Level-2三個特征集以及SVM、XGBoost和Transformer三個模型進行了兩兩組合。對于每種特征,我們將三個模型的預(yù)測得分取平均以得到集成得分,最后我們將這三種特征的集成得分再次取平均,形成了所有量價特征的最終集成得分。這種集成方法深度挖掘了不同特征和模型的獨特信息,提升了預(yù)測的準(zhǔn)確性和穩(wěn)健性。 測試采用滾動訓(xùn)練法,選用中證800為樣本空間,以過去三年的數(shù)據(jù)作訓(xùn)練集,接下來一年的數(shù)據(jù)作測試集,預(yù)測目標(biāo)是未來一周收益率的五分類標(biāo)簽,每類對應(yīng)的權(quán)重分別是-2,-1,0,1,2。模型訓(xùn)練后,對每個測試樣本的五類可能性進行加權(quán)求和,得出因子值。如某類可能性大,則加權(quán)結(jié)果將偏向該類對應(yīng)的值。若五類可能性相似,則結(jié)果將接近0。 所用到的三個數(shù)據(jù)集:日頻特征集合了包括收益率、動量、波動率、換手率、特異度,漲跌幅榜單因子和買賣壓力指標(biāo)等61個多維度市場行為指標(biāo)。日內(nèi)特征融合了常見的日內(nèi)特征及基于基于前期報告的日內(nèi)特征,共81個,覆蓋廣泛的市場行為。Level-2特征集基于委托訂單數(shù)據(jù)和大單數(shù)據(jù),包含15個日度特征,部分早期數(shù)據(jù)存在缺失,進行了零填充處理。 日頻特征集,三者的信息系數(shù)相差不大,XGBoost稍優(yōu)于其他兩個模型,XGBoost的RankIC高達8.7%,ICIR為5.5,其在15年牛市結(jié)束后的調(diào)整階段仍保持穩(wěn)定且較高的超額收益。因子均值合并后,IC均值提升至9.7%,年化超額收益為24%。相關(guān)性分析中,三種模型的因子值相關(guān)性在53%-65%,IC相關(guān)性在65%-80%。 日內(nèi)特征集中,XGBoost顯示出最佳的預(yù)測能力和風(fēng)險調(diào)整收益率,具有最高的ICIR5.5和夏普比率2.4。SVM有最高的IC達到8.9%,其在2015年超額收益表現(xiàn)突出,可能是因為牛市數(shù)據(jù)存在明顯線性邊界。使用集成模型,即各模型輸出平均后,RankIC、ICIR最高,達到9.3%和5.6,夏普比率2.3和年化超額收益18.6%也表現(xiàn)良好。三種模型的因子值相關(guān)性在58%-65%,IC相關(guān)性在77%-82%。 Level-2特征集中,同樣也是XGBoost表現(xiàn)出色,RankIC6.2%、ICIR5.1、年化超額收益17%、夏普比率2.5,均超過其他兩個模型,預(yù)測穩(wěn)定性較高。整合各模型預(yù)測結(jié)果的集成模型表現(xiàn)穩(wěn)健,RankIC7.2%,再次說明多模型整合的重要性。三種模型的因子值相關(guān)性在31%-63%,IC相關(guān)性在51%-78%。 總體集成模型的RankIC 10.8%,ICIR 6.0,夏普比率2.8,年化超額收益24.3%,超過三個成分模型,揭示了利用多源數(shù)據(jù)預(yù)測結(jié)果集成可以增強預(yù)測的全面性,穩(wěn)定性和準(zhǔn)確性,印證了我們的想法。日頻數(shù)據(jù)有最高的RankIC 9.7%,日內(nèi)數(shù)據(jù)表現(xiàn)和日頻類似,Level-2數(shù)據(jù)的集成模型雖在部分指標(biāo)上略遜,但與其他兩個模型的相關(guān)性較低,且在某些年份取得不錯超額收益,對其他兩個模型形成強有力的互補。 風(fēng)險提示 量化模型失效風(fēng)險、市場極端環(huán)境沖擊
|
|