>> 華鑫證券-計算機(jī)行業(yè)點評報告-Kimi:Researcher、K2雙線突破,強(qiáng)化學(xué)習(xí)革新與開源智能的雙擎驅(qū)動-250721
| 上傳日期: |
2025/7/22 |
大?。?/td>
| 332KB |
| 格式: |
pdf 共4頁 |
來源: |
華鑫證券 |
| 評級: |
推薦 |
作者: |
寶幼琛 |
| 行業(yè)名稱: |
計算機(jī) |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
事件 2025年6月,Moonshot AI推出Kimi-Researcher,通過端到端強(qiáng)化學(xué)習(xí)實現(xiàn)多輪搜索推理,在Humanity's Last Exam基準(zhǔn)以26.9% Pass@1刷新記錄。7月發(fā)布Kimi K2模型,開源基礎(chǔ)版與指令調(diào)優(yōu)版,在SWE-bench Verified基準(zhǔn)以65.8% Pass@1領(lǐng)先,LiveCodeBench v6達(dá)53.7% Pass@1,強(qiáng)化代理智能與工具協(xié)同能力。 投資要點 ▌ Kimi-Researcher:端到端強(qiáng)化學(xué)習(xí)代理的突破性飛躍 2025年6月20日,Moonshot AI發(fā)布端到端強(qiáng)化學(xué)習(xí)訓(xùn)練的自主代理Kimi-Researcher,通過純強(qiáng)化學(xué)習(xí)框架突破傳統(tǒng)工作流/SFT限制,支持單軌跡70+次搜索調(diào)用與50輪以上長程推理,動態(tài)適應(yīng)工具波動與環(huán)境變化。其性能在權(quán)威測試中全面領(lǐng)先:Humanity's Last Exam Pass@1達(dá)26.9%,創(chuàng)領(lǐng)域新高;xbench-DeepSearch Pass@1達(dá)69%,顯著超越同期模型。 ▌ Kimi K2:代理智能普惠化進(jìn)程的關(guān)鍵引擎 2025年7月11日,Moonshot AI發(fā)布Kimi K2模型,開源Kimi-K2-Base基礎(chǔ)架構(gòu)與Kimi-K2-Instruct指令調(diào)優(yōu)版本,實現(xiàn)代理智能技術(shù)普惠化。該模型采用MuonClip優(yōu)化器突破訓(xùn)練穩(wěn)定性瓶頸,支持16K上下文長度的復(fù)雜任務(wù)處理;在關(guān)鍵基準(zhǔn)測試中,SWE-bench Verified以65.8% Pass@1刷新開源模型記錄,LiveCodeBench v6達(dá)53.7% Pass@1,顯著提升工具協(xié)同與代碼生成能力。同步開放的API工具調(diào)用接口為開發(fā)者提供低門檻智能體開發(fā)支持,加速工業(yè)級AI代理落地進(jìn)程。 ▌ kimi:技術(shù)創(chuàng)新與商業(yè)生態(tài)協(xié)同深化 Moonshot AI通過Kimi系列技術(shù)持續(xù)突破,2025年6月Kimi-Researcher展現(xiàn)沖突信息自糾正能力,強(qiáng)化復(fù)雜環(huán)境下的推理魯棒性;7月Kimi K2的MuonClip優(yōu)化器實現(xiàn)15.5T token訓(xùn)練零中斷,攻克大模型穩(wěn)定性瓶頸。商業(yè)化端加速生態(tài)構(gòu)建,API工具接口支持開發(fā)者快速集成多工具鏈,賦能工業(yè)級應(yīng)用如薪資數(shù)據(jù)分析;性能上,Kimi K2在Tau2 retail任務(wù)以70.6% Pass@1在開源大模型中處于領(lǐng)先,AceBench達(dá)76.5%,驗證多領(lǐng)域任務(wù)可靠性。技術(shù)-商業(yè)雙輪驅(qū)動,奠定規(guī)?;涞鼗A(chǔ)。 ▌投資建議 聚焦AI與計算機(jī)行業(yè)龍頭,把握技術(shù)迭代與生態(tài)整合機(jī)遇,關(guān)注具備核心創(chuàng)新能力的領(lǐng)軍企業(yè),在智能化浪潮中布局長期結(jié)構(gòu)性增長機(jī)會。 科技巨頭在AI及云計算領(lǐng)域的行業(yè)地位有望助力其未來發(fā)展,可繼續(xù)關(guān)注谷歌(GOOGL.0)和微軟(MSFT.0)。 ▌風(fēng)險提示 行業(yè)政策調(diào)整或影響市場預(yù)期;技術(shù)迭代速度存潛在波動風(fēng)險;終端需求波動致產(chǎn)能錯配風(fēng)險;國際政策合規(guī)可能存在壓力;資本投入回報周期存在不確定性
|
|