>> 華泰證券-金工專題研究:華泰人工智能研究6周年回顧-230522
| 上傳日期: |
2023/5/22 |
大?。?/td>
| 1832KB |
| 格式: |
pdf 共11頁 |
來源: |
華泰證券 |
| 評級: |
-- |
作者: |
林曉明,李子鈺,陳燁 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
華泰人工智能研究6周年回顧 近年來,人工智能在量化投資領(lǐng)域已取得令人矚目的成績,同時也伴隨諸多爭議,機遇與挑戰(zhàn)并存。2023年3月,ChatGPT的火爆出圈再一次將投資人的目光吸引到AI這一領(lǐng)域,大模型“涌現(xiàn)”所帶來的驚喜令人充滿期待。作為人工智能量化研究的先行者,華泰金工團隊2017年6月1日以來陸續(xù)發(fā)布深度報告68篇,涵蓋模型測試、因子挖掘、另類數(shù)據(jù)、對抗過擬合、生成對抗網(wǎng)絡(luò)、綜合六大主題。正值首篇研報發(fā)布6周年之際,我們對系列研究進行回顧,述往事,思來者。 模型測試主題 模型測試是系列早期側(cè)重的主題。2017年我們測試廣義線性模型、支持向量機、決策樹、神經(jīng)網(wǎng)絡(luò)等模型的選股效果,發(fā)現(xiàn)隨機森林、XGBoost這兩類決策樹集成模型較為適合多因子選股場景,兼具擬合能力強、穩(wěn)定性好、訓(xùn)練效率高等優(yōu)點。近期我們關(guān)注多任務(wù)學(xué)習(xí)在AI量化策略中的應(yīng)用,測試多目標損失函數(shù)的不同融合方式對超額收益的影響,挖掘不同預(yù)測目標下的增量信息。 因子挖掘、另類數(shù)據(jù)主題 持續(xù)迭代的因子庫是多因子模型長期運作的基石。2019年6月,我們展示遺傳規(guī)劃在量價選股因子挖掘中的詳細流程,并且持續(xù)探索改進方案,近期將算法拓展至一致預(yù)期因子挖掘。2020年6月,我們構(gòu)建全新的因子挖掘神經(jīng)網(wǎng)絡(luò)AlphaNet,實現(xiàn)端到端的因子自動挖掘和合成。2023年5月,我們關(guān)注GRU網(wǎng)絡(luò)在端到端因子挖掘中的應(yīng)用,對個股日間和日內(nèi)不同頻率的數(shù)據(jù)進行混頻合成,挖掘出的因子在不同的股票池中都展現(xiàn)出優(yōu)秀的選股能力。2020年起,我們借助NLP中的技術(shù)對新聞輿情、分析師研報等另類數(shù)據(jù),挖掘增量Alpha。 對抗過擬合、生成對抗網(wǎng)絡(luò)、綜合主題 投資者對人工智能的質(zhì)疑集中于過擬合和黑箱,我們提供豐富的工具加以應(yīng)對。金融市場數(shù)據(jù)量有限,過擬合難以避免,生成對抗網(wǎng)絡(luò)(GAN)可以生成以假亂真的“偽造”數(shù)據(jù),有助于我們訓(xùn)練模型和理解市場。我們還探索特征選擇、另類標簽、因果推斷、無監(jiān)督學(xué)習(xí)在投資中的應(yīng)用。近期我們學(xué)習(xí)九坤在Kaggle舉辦的量化投資大賽中的成功經(jīng)驗,總結(jié)量化A“煉丹” I中的技巧,提升模型收益。跟進GPT大語言模型對量化投資可能帶來的影響,通過四則實例分析GPT對投研工作帶來的效率提升。 華泰人工智能系列的初心 人工智能并不神秘。其本質(zhì)是以數(shù)理模型為核心工具,結(jié)合控制論、認知心理學(xué)等學(xué)科的研究成果,最終由計算機模擬人類的感知、推理、學(xué)習(xí)、決策過程。人工智能并非萬能?,F(xiàn)實世界高度復(fù)雜,任何模型相對于整個世界都太過簡單。世界時刻處于演化中,沒有任何模型能長期有效,必須同步保持更新。華泰人工智能系列的愿景,是通過切實的研究與實踐,澄清人們對人工智能的誤解和偏見,幫助人們更清晰地認識人工智能的長處和局限,從而更合理、高效地將人工智能運用于投資?;仡欉^往68篇研究,我們秉持了這一份初心,也希望為讀者帶來了啟發(fā)。 風(fēng)險提示:人工智能挖掘市場規(guī)律是對歷史的總結(jié),市場規(guī)律在未來可能失效。人工智能技術(shù)存在過擬合風(fēng)險。
|
|