久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频
研報(bào)下載就選股票報(bào)告網(wǎng)
您好,歡迎來到股票分析報(bào)告網(wǎng)!
登錄
忘記密碼
注冊
最近三天
最近一周
最近一月
最近一季
最近半年
最近一年
最近兩年
2022年至今
2021年全年
2020年全年
2019年全年
2018年全年
2017年全年
2016年全年
2015年全年
2014年全年
2013年全年
2012年全年
2011年全年
2010年全年
2009年全年
2009年以前
所有類型
機(jī)構(gòu)評論
個股資料
宏觀策略
行業(yè)資料
外文報(bào)告
港股報(bào)告
基金報(bào)告
期貨債券
期貨研究
其它報(bào)告
金融工程
新三板
外匯研究
黃金評論
融資融券
投資組合
搜索報(bào)告標(biāo)題
搜索研報(bào)作者
搜索研報(bào)出處
搜索研報(bào)評級
高級會員
熱門搜索:
鈣鈦礦
chatgpt
碳中和
碳交易
儲能
疫苗
新基建
充電樁
疫情
IDC
2020
豬價(jià)
科創(chuàng)板
特斯拉
區(qū)塊鏈
出口
首頁
晨會紀(jì)要
個股調(diào)研
行業(yè)研究
宏觀策略
債券研究
港股報(bào)告
更多欄目
下載軟件
買入評級
強(qiáng)烈推薦
推薦評級
增持評級
謹(jǐn)慎推薦
持有評級
中性評級
金融工程
期貨研究
融資融券
基金報(bào)告
外文報(bào)告
外匯研究
黃金評論
美股研究
新股分析
其它報(bào)告
>>
財(cái)通證券-計(jì)算機(jī)行業(yè)投資策略周報(bào):Kimi發(fā)布多模態(tài)思考模型k1.5,對標(biāo)OpenAI o1-250125
上傳日期:
2025/1/26
大?。?/td>
640KB
格式:
pdf 共8頁
來源:
財(cái)通證券
評級:
--
作者:
楊燁
,
王妍丹
行業(yè)名稱:
計(jì)算機(jī)
下載權(quán)限:
此報(bào)告為加密報(bào)告
核心觀點(diǎn)
Kimi發(fā)布多模態(tài)思考模型k1.5。2025年1月20日,Kimi發(fā)布了多模態(tài)思考模型k1.5,并且模型性能直接對標(biāo)OpenAI滿血版o1,在數(shù)學(xué)、代碼、多模態(tài)推理能力等方面全方面追平,是OpenAI之外首個多模態(tài)o1模型。這是繼去年11月他們發(fā)布k0-math數(shù)學(xué)模型,12月發(fā)布k1視覺思考模型之后,連續(xù)第三個月帶來k系列強(qiáng)化學(xué)習(xí)模型的升級。根據(jù)Kimi發(fā)布的技術(shù)報(bào)告,在LongCoT模式下,Kimik1.5的數(shù)學(xué)、代碼、多模態(tài)推理能力,達(dá)到了長思考SOTA模型OpenAIo1滿血版的水平。這也是全球范圍內(nèi),首次有OpenAI之外的公司達(dá)到。而在ShortCoT模式下,Kimik1.5大幅領(lǐng)先GPT-4o和Claude3.5的水平。
通過強(qiáng)化學(xué)習(xí),實(shí)現(xiàn)高效長上下文RL訓(xùn)練。傳統(tǒng)語言模型的預(yù)訓(xùn)練依賴“下一個詞預(yù)測”范式,其性能受限于高質(zhì)量靜態(tài)數(shù)據(jù)的規(guī)模。盡管計(jì)算資源的擴(kuò)展遵循Scaling Law,但數(shù)據(jù)瓶頸日益顯著。為此,Kimi提出通過強(qiáng)化學(xué)習(xí)(Reinforment Learning,后文簡稱RL)解鎖新維度:模型通過探索生成數(shù)據(jù)并基于獎勵信號優(yōu)化,突破靜態(tài)數(shù)據(jù)限制。Kimi k1.5的核心目標(biāo)是通過RL和多模態(tài)訓(xùn)練,構(gòu)建一個兼具長上下文推理能力與高效部署潛力的模型。
引入Partial rollout技術(shù),優(yōu)化復(fù)雜推理能力。Kimi團(tuán)隊(duì)在模型訓(xùn)練中引入了“部分展開(Partial Rollout)”技術(shù),該技術(shù)有效地提高了訓(xùn)練效率,通過復(fù)用訓(xùn)練軌跡(存儲在replay buffer中),減少了計(jì)算資源的浪費(fèi)。每一次訓(xùn)練迭代不僅包括模型的展開和儲存,還能在下次迭代中繼續(xù)利用之前的計(jì)算結(jié)果,確保效率的同時降低了資源消耗。這樣的設(shè)計(jì)在需要處理長序列任務(wù)時,表現(xiàn)尤其突出。特別地,Kimi團(tuán)隊(duì)還在獎勵模型中單獨(dú)加入了代碼執(zhí)行服務(wù),以提升編碼領(lǐng)域的任務(wù)能力。
投資建議:建議重點(diǎn)關(guān)注基礎(chǔ)設(shè)施領(lǐng)域的公司,如英偉達(dá)、海光信息、寒武紀(jì)、協(xié)創(chuàng)數(shù)據(jù)、英維克、中科曙光、浪潮信息、潤澤科技、歐陸通、曙光數(shù)創(chuàng)、申菱環(huán)境、東陽光等,同時持續(xù)關(guān)注全球各大模型廠商、學(xué)界的創(chuàng)新進(jìn)展。
風(fēng)險(xiǎn)提示:技術(shù)迭代不及預(yù)期的風(fēng)險(xiǎn);商業(yè)化落地不及預(yù)期的風(fēng)險(xiǎn);政策支持不及預(yù)期風(fēng)險(xiǎn);全球宏觀經(jīng)濟(jì)風(fēng)險(xiǎn)。
相關(guān)行業(yè)報(bào)告
長江證券-計(jì)算機(jī)行業(yè)2024Q4基金持倉分析:持倉延續(xù)回升,內(nèi)部分化加劇-250126
海通證券-信息服務(wù)行業(yè)專題報(bào)告:計(jì)算機(jī)行業(yè)2024Q4機(jī)構(gòu)持倉維持2.4%的歷史低位,AI與自主可控關(guān)注度提升-250126
海通證券-計(jì)算機(jī)行業(yè)跟蹤周報(bào)367期:國產(chǎn)推理模型已達(dá)頂尖水平,OpenAI Operator發(fā)布-250126
申萬宏源-計(jì)算機(jī)行業(yè)周報(bào):Agent+持倉,均有樂觀信號!-250125
德邦證券-計(jì)算機(jī)行業(yè)周報(bào):AI Agent,從API到GUI交互,Operator重塑流程化-250125
財(cái)通證券-計(jì)算機(jī)行業(yè)專題報(bào)告:豆包大模型更新至1.5-pro,更真實(shí)、更懂你-250124
甬興證券-計(jì)算機(jī)行業(yè)全球AI產(chǎn)業(yè)跟蹤:微軟2025財(cái)年擬投資800億美元建設(shè)AI數(shù)據(jù)中心-250123
甬興證券-計(jì)算機(jī)行業(yè)周報(bào):武漢率先確認(rèn)無人駕駛交通事故責(zé)任劃分-250124
國海證券-計(jì)算機(jī)行業(yè)AI算力“賣水人”系列(4):美國對華AI限制加劇,自主可控大勢所趨-250124
浙商證券-計(jì)算機(jī)人工智能行業(yè)點(diǎn)評報(bào)告:OpenAI發(fā)布Operator,AI智能體實(shí)現(xiàn)跨越式進(jìn)步-250124
關(guān)于我們
|
聯(lián)系方式
|
問題反饋
|
網(wǎng)站地圖
|
友情鏈接
|
常見問題
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號:
蜀ICP備15031742號-1