>> 華創(chuàng)證券-【專題報告】基于價量數(shù)據(jù)的排序?qū)W習選股模型-230928
| 上傳日期: |
2023/9/28 |
大?。?/td>
| 2436KB |
| 格式: |
pdf 共23頁 |
來源: |
華創(chuàng)證券 |
| 評級: |
-- |
作者: |
楊宸祎 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
排序?qū)W習的定義 排序?qū)W習(Learning to Rank,LTR)又名“機器排序?qū)W習”(Machine-learnedRanking)是一種監(jiān)督學習方法,此機器學習算法通過在數(shù)據(jù)集上對大量特征進行訓(xùn)練,從而學習生成排序模型,以用于解決實際中的排序問題。排序?qū)W習在文檔檢索、過濾和推薦系統(tǒng)等領(lǐng)域,已得到廣泛應(yīng)用。 LTR算法演變 本文逐步介紹排序?qū)W習具體的算法演變,其中包括了,基于配對文檔相對排序的概率損失函數(shù),用數(shù)據(jù)對來訓(xùn)練模型的pairwise排序?qū)W習方法RankNet、對RankNet的配對思想進行了擴展,將RankNet中損失函數(shù)相對得分函數(shù)的梯度定義為lambda,與整體排序的評分標準(如NDCG)進行結(jié)合的LambdaRank、以及我們模型中所用到的在LambdaRank的基礎(chǔ)上將Mart與現(xiàn)有模型相結(jié)合的LambdaMart算法。 模型設(shè)計 在構(gòu)建股票池的時候,選擇了滬深300、中證500、中證1000的歷史成份股分別作為A股市場大盤股、中盤股、小盤股的代表構(gòu)建了1800只股票的備選股票池,取數(shù)時間范圍為2014年11月至2023年8月底。選股策略選取了價量數(shù)據(jù)作為模型特征的主要組成部分,其中包括了每日個股上大單、中單、小單的流入流出數(shù)據(jù),并在此基礎(chǔ)上添加了一致預(yù)期數(shù)據(jù)。在進行數(shù)據(jù)處理之后,我們對以上數(shù)據(jù)使用了不同的算子進行特征工程。 LGBMRanker選股輪動模型回測結(jié)果 本文通過使用LGBMRanker對滬深300、中證500、中證1000的成份股進行排序?qū)W習,構(gòu)建出基于價量數(shù)據(jù)的選股模型,經(jīng)回測該策略從2015年11月至2023年8月底的累計絕對收益率為167.31%,相較于等權(quán)基準,累計超額收益率為160.16%,年化收益率為13.28%,超額年化為12.40%,夏普比率為0.48,最大回撤為34.58%。從回測結(jié)果來看,策略相較于等權(quán)基準的年勝率為88.89%,月勝率為65.96%,相較于滬深300的年勝率為77.78%,月勝率為58.51%,相較于中證500的年勝率為100%,月勝率為67.02%,相較于中證1000的年勝率為100%,月勝率為76.60%。策略2023年年初至8月底的絕對收益率為18.10%,相較于等權(quán)基準,超額收益率為13.14%,表現(xiàn)出色。 風險提示: 本報告中所有統(tǒng)計結(jié)果和模型方法均基于歷史數(shù)據(jù),不代表未來趨勢。
|
|