>> 華泰證券-金工深度研究:基于逐筆成交的深度學習選股模型-250714
| 上傳日期: |
2025/7/15 |
大?。?/td>
| 1509KB |
| 格式: |
pdf 共18頁 |
來源: |
華泰證券 |
| 評級: |
-- |
作者: |
林曉明,何康 |
| 下載權限: |
此報告為加密報告,僅限高級會員查看 |
|
|
人工智能93:挖掘逐筆成交數(shù)據(jù)中的alpha 高頻量價數(shù)據(jù)在量化投資中的重要性毋庸置疑。本文聚焦于逐筆成交數(shù)據(jù)的信息挖掘。由于數(shù)據(jù)量龐大,逐筆成交數(shù)據(jù)難以直接作為深度學習等選股模型的輸入,需依賴特征工程提取有效信號。本文從資金流和事件驅動兩個角度開展特征工程,采用深度學習模型捕捉數(shù)據(jù)規(guī)律,并提出模型優(yōu)化方法,最后形成選股因子。 資金流模型:tick線、成交量線等具有時間線外的增量信息 本研究基于逐筆成交數(shù)據(jù),構造大小單、主動買賣等資金流特征?;€模型以個股過去40日的30分鐘頻資金流數(shù)據(jù)作為輸入,采用transformer模型學習時序注意力,最終輸出未來10日超額收益的預測。然而,傳統(tǒng)時間線存在不匹配市場交易頻率、時間序列統(tǒng)計特性差等缺陷。改進模型在時間線基礎上,拓展出tick線、成交量線等增量數(shù)據(jù),并利用transformer模型學習跨時間和跨k線的規(guī)律。實證結果表明,改進模型訓練的選股因子在多項指標上均優(yōu)于基線模型。樣本空間為全A股,在2017年初至2025年6月底的回測期內(周頻調倉),因子周度RankIC從10.17%提升至10.64%,多頭年化超額收益率由20.43%提升為22.56%。 事件驅動模型:引入跨事件注意力可提升模型性能 逐筆成交數(shù)據(jù)中的重要成交事件(如大單、價格底部、價格頂部等)可能蘊含較為豐富的信息。本研究通過識別這些特殊事件,構造相應的事件特征?;€模型以個股過去40日的所有事件特征作為輸入,采用transformer模型學習時序注意力,最終輸出未來10日超額收益的預測。改進模型則采用分層注意力機制設計,第一層transformer仍學習時序注意力,第二層transformer捕捉跨事件的交叉注意力。回測結果顯示,改進模型訓練得到的因子在多項指標上均優(yōu)于基線模型,周度RankIC從9.94%提升至10.01%,多頭年化超額收益率由20.06%提升為22.38%。 改進資金流和事件驅動因子合成的融合因子表現(xiàn)更佳 將改進后的資金流和事件驅動選股因子等權合成,得到逐筆成交融合因子。在2017年初至2025年6月底的回測期內(周頻調倉),該融合因子周度RankIC達10.96%,多頭年化超額收益率為24.52%,表現(xiàn)優(yōu)于單一因子?;谫Y金流因子、事件驅動因子和融合因子構建的中證1000增強組合,在相同回測期內年化超額收益率分別為18.98%、17.24%和19.92%,信息比率分別為3.91、3.59和4.04。2025年上半年,三者的超額收益分別為5.57%、12.58%和10.77%。 風險提示:基于逐筆成交數(shù)據(jù)的選股模型對市場微觀結構的依賴較強,未來市場變化可能導致模型失效。Transformer架構的復雜性可能增加訓練和推理時間,并帶來過擬合風險。本報告不涉及標的推薦。
|
|