久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频

研報(bào)下載就選股票報(bào)告網(wǎng)
您好,歡迎來到股票分析報(bào)告網(wǎng)!登錄   忘記密碼   注冊(cè)
>> 華安證券-“學(xué)海拾珠”系列之二百三十:“知識(shí)”嵌入型深度強(qiáng)化學(xué)習(xí)在多元資產(chǎn)配置中的應(yīng)用-250402
上傳日期:   2025/4/3 大?。?/td>   2242KB
格式:   pdf  共21頁(yè) 來源:   華安證券
評(píng)級(jí):   -- 作者:   嚴(yán)佳煒,錢靜閑
下載權(quán)限:   無限制-登錄即可下載
主要觀點(diǎn):
  本篇是“學(xué)海拾珠”系列第二百三十篇,過往強(qiáng)化學(xué)習(xí)模型通常從隨機(jī)初始化的權(quán)重開始訓(xùn)練,并且對(duì)其生成的輸出缺乏直觀的可解釋性。文獻(xiàn)提出了一種新穎的方法,旨在最大化長(zhǎng)期風(fēng)險(xiǎn)調(diào)整后的投資回報(bào),同時(shí)保持模型輸出的可解釋性。采用成熟的基于規(guī)則的策略,通過模仿學(xué)習(xí)生成神經(jīng)網(wǎng)絡(luò)模擬模型,從而傳遞專家知識(shí)。這些“導(dǎo)師”模型隨后通過結(jié)合執(zhí)行-評(píng)估模型(Soft Actor-Critic, SAC)和深度確定性策略梯度(Deep Deterministic Policy Gradient, DDPG)的混合強(qiáng)化學(xué)習(xí)算法進(jìn)行增強(qiáng),目標(biāo)是創(chuàng)建出表現(xiàn)優(yōu)于其導(dǎo)師的“學(xué)生”模型?;氐絿?guó)內(nèi)市場(chǎng),該類基于規(guī)則的強(qiáng)化學(xué)習(xí)方法可解釋性更強(qiáng),在資產(chǎn)配置領(lǐng)域或能發(fā)揮較大的作用。
  導(dǎo)師-學(xué)生模型
  “導(dǎo)師”模型基于Keller和Keuning提出的動(dòng)態(tài)資產(chǎn)配置模型,其核心思想倡導(dǎo)一種更穩(wěn)健且潛在收益更高的投資方法:采取與資產(chǎn)動(dòng)量方向相反的交易策略。具體而言,當(dāng)作為診斷工具的指示性資產(chǎn)顯示出動(dòng)量減弱跡象時(shí),該策略建議從高風(fēng)險(xiǎn)資產(chǎn)(主要是股票類ETF)中撤資,轉(zhuǎn)而增持安全資產(chǎn)(以債券/國(guó)債類ETF為主)。
  “學(xué)生”模型繼承自上述基于規(guī)則(rule-based)的資產(chǎn)配置模型,同時(shí)引入深度強(qiáng)化學(xué)習(xí)(RL)算法進(jìn)行精細(xì)化調(diào)優(yōu),在DDPG框架基礎(chǔ)上引入SAC特性(如雙評(píng)估減少偏差、靈活調(diào)整決策-評(píng)估模型更新頻率),形成混合擴(kuò)展模型。
  實(shí)證結(jié)果
  在一個(gè)近40年的價(jià)格數(shù)據(jù)集上,對(duì)美國(guó)股票、債券、美國(guó)國(guó)債、大宗商品及其杠桿等價(jià)物等廣泛的資產(chǎn)類別進(jìn)行模擬,實(shí)證驗(yàn)證了這一策略的有效性。新模型的測(cè)試集中,夏普比率提升了高達(dá)39.70%,索提諾比率提升了高達(dá)47.07%。這表明,將成熟策略與先進(jìn)強(qiáng)化學(xué)習(xí)相結(jié)合,在資產(chǎn)管理領(lǐng)域的潛力。
  風(fēng)險(xiǎn)提示
  文獻(xiàn)結(jié)論基于歷史數(shù)據(jù)與海外文獻(xiàn)進(jìn)行總結(jié);不構(gòu)成任何投資建議。
  
 
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號(hào):蜀ICP備15031742號(hào)-1