>> 華泰證券-金工深度研究:GPT+量化投資=?-230324
| 上傳日期: |
2023/3/24 |
大?。?/td>
| 3386KB |
| 格式: |
pdf 共31頁(yè) |
來源: |
華泰證券 |
| 評(píng)級(jí): |
-- |
作者: |
林曉明,何康,李子鈺 |
| 下載權(quán)限: |
此報(bào)告為加密報(bào)告,僅限高級(jí)會(huì)員查看 |
|
|
人工智能系列之65:解析GPT對(duì)量化投資的影響,顧短也兼長(zhǎng) 相比ChatGPT和GPT-4在全社會(huì)范圍引發(fā)的熱議,量化投資領(lǐng)域?qū)τ贕PT的態(tài)度顯得相對(duì)冷靜。ChatGPT和GPT-4展現(xiàn)出的強(qiáng)大語言生成能力和部分推理能力不可謂不驚艷,但和量化投資主流方法論——低信噪比場(chǎng)景下的預(yù)測(cè)模型有鮮明區(qū)別。這種因立場(chǎng)不同帶來的感知差異,就如股指期貨松綁無法令非量化從業(yè)者感到興奮一樣。我們認(rèn)為在短期現(xiàn)實(shí)層面,量化投資行業(yè)可能難以直接受益于GPT模型。但長(zhǎng)期看,如同人腦各區(qū)域分工明確但相互聯(lián)系,現(xiàn)有量化投資預(yù)測(cè)模型可與各類大模型耦合擴(kuò)展功能;算法升級(jí)和規(guī)模擴(kuò)大后,量化模型可能涌現(xiàn)出預(yù)期外的能力,值得量化從業(yè)者期待。 兩點(diǎn)展望:大模型的耦合,大模型的涌現(xiàn) 類比人腦,CNN、AlphaGo、GPT的強(qiáng)大能力分別對(duì)應(yīng)視覺區(qū)、高級(jí)認(rèn)知區(qū)、語言區(qū)。詬病ChatGPT不懂推理計(jì)算,就像指責(zé)耳朵不會(huì)說話一樣,忽略了AI模型可以耦合,就如人腦各區(qū)域存在相互聯(lián)接。將現(xiàn)有量化投資預(yù)測(cè)模型和大語言、圖像模型耦合,能否處理更大體量的文本信息?能否模擬“看盤高手”的決策?能否實(shí)現(xiàn)更擬真的多模態(tài)金融數(shù)據(jù)生成?涌現(xiàn)是指模型規(guī)模擴(kuò)大后,自發(fā)產(chǎn)生預(yù)期之外的能力,量變產(chǎn)生質(zhì)變。目前量化投資預(yù)測(cè)模型無法解決低信噪比、時(shí)變規(guī)律、小樣本學(xué)習(xí)、數(shù)據(jù)非結(jié)構(gòu)化等問題,在算法升級(jí)和模型規(guī)模擴(kuò)大后,是否可能涌現(xiàn)出預(yù)期外的能力? 深度解析ChatGPT的原理,力求幫助讀者全面了解其背后的機(jī)制 ChatGPT是OpenAI的GPT模型在人機(jī)對(duì)話方面的應(yīng)用延伸,使用基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)進(jìn)行訓(xùn)練。我們認(rèn)為RLHF的一大優(yōu)勢(shì)在于可以充分利用數(shù)量有限的標(biāo)注數(shù)據(jù)構(gòu)建獎(jiǎng)勵(lì)機(jī)制,并在不斷迭代中實(shí)時(shí)獲得環(huán)境反饋,逐漸微調(diào)模型,使得回答盡可能接近人類的邏輯和意圖。GPT系列模型是大規(guī)模預(yù)訓(xùn)練語言模型的代表,為ChatGPT奠定了堅(jiān)實(shí)基礎(chǔ)。其中GPT-3具有1750億個(gè)參數(shù),使用了Few-shot等先進(jìn)技術(shù),相比于預(yù)訓(xùn)練+微調(diào)模型的方式,F(xiàn)ew-shot更接近人類在面對(duì)各類語言問題時(shí)的思考模式,即人類只需要提示和少量示例就能回答各類語言問題。 哪些生成模型適用于金融數(shù)據(jù)生成?如何應(yīng)用于量化投資? ChatGPT作為自然語言生成模型,在聊天對(duì)話場(chǎng)景取得了令人矚目的成就。而在量化投資場(chǎng)景中,數(shù)值類型數(shù)據(jù)使用更為普遍,GAN、VAE、流模型、擴(kuò)散模型是四類主流的數(shù)值類型數(shù)據(jù)生成模型。其核心是學(xué)習(xí)隨機(jī)變量z到生成數(shù)據(jù)x’的映射,隨后對(duì)z進(jìn)行采樣,即可得到生成數(shù)據(jù)。量化投資學(xué)界和業(yè)界實(shí)踐中,生成的金融數(shù)據(jù)包含時(shí)間序列、K線圖像數(shù)據(jù)、截面特征標(biāo)簽數(shù)據(jù)、訂單簿數(shù)據(jù),生成得到的數(shù)據(jù)可以用于訓(xùn)練模型、檢驗(yàn)?zāi)P?、預(yù)測(cè)收益、預(yù)測(cè)風(fēng)險(xiǎn)、期權(quán)定價(jià)等。 ChatGPT或?qū)⒃诙喾矫鎸?duì)量化投資帶來影響 我們認(rèn)為ChatGPT對(duì)量化投資的影響可能是多方面的。其一,ChatGPT或?qū)⒈挥糜谏韶?cái)經(jīng)新聞、論壇評(píng)論、研究報(bào)告等文本數(shù)據(jù),極大提高文本數(shù)據(jù)的數(shù)量和噪音,對(duì)文本挖掘相關(guān)的量化交易策略有利有弊;其二,ChatGPT或?qū)⒈贿\(yùn)用于量化策略代碼編寫,接入數(shù)據(jù)平臺(tái)后可以實(shí)現(xiàn)交易策略的批量調(diào)參與樣本外跟蹤;其三,ChatGPT還將降低量化研究的門檻,例如替代本地預(yù)訓(xùn)練-微調(diào)大模型,降低NLP策略研究的難度、憑借強(qiáng)大的資源整合能力成為第三代搜索引擎后可以助力量化資訊的搜集效率等。 風(fēng)險(xiǎn)提示:人工智能挖掘市場(chǎng)規(guī)律是對(duì)歷史的總結(jié),市場(chǎng)規(guī)律在未來可能失效。人工智能技術(shù)存在過擬合風(fēng)險(xiǎn)。深度學(xué)習(xí)模型受隨機(jī)數(shù)影響較大。
|
|