>> 招商證券-通信行業(yè)數(shù)字經(jīng)濟“算力網(wǎng)絡(luò)”系列17:OpenAI新模型o1發(fā)布,推理算力需求重估-240923
| 上傳日期: |
2024/9/23 |
大?。?/td>
| 1078KB |
| 格式: |
pdf 共11頁 |
來源: |
招商證券 |
| 評級: |
推薦 |
作者: |
梁程加,劉浩天,孫嘉擎 |
| 行業(yè)名稱: |
通信 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
OpenAI發(fā)布OpenAI o1-preview,該模型在回答問題前先進行思考,即引入強化學(xué)習(xí)算法產(chǎn)生一個比較長的內(nèi)部推理(思維鏈),可以將復(fù)雜任務(wù)一步步拆解,給出更加準(zhǔn)確的答案。與之前的模型相比o1提升了大模型在推理方面的能力,可以處理如數(shù)學(xué)、代碼、科學(xué)等方面更加復(fù)雜的任務(wù)。 相比gpt,o1更側(cè)重Post-Training。就像人類在回答難題之前可能會思考很長時間一樣,o1在嘗試解決問題時也會使用思維鏈(CoT)。o1通過強化學(xué)習(xí)能夠打磨自己的思維鏈,并改進自己使用的策略;可以識別并糾正自己的錯誤;能做到將復(fù)雜的步驟分解為更簡單的步驟;并實現(xiàn)在現(xiàn)有方法不起作用時嘗試不同的方法。這一過程極大地提高了模型的推理能力,在很大程度上解決了以往大模型在邏輯推理方面的不足。 o1有望帶動推理算力需求提升。OpenAI發(fā)現(xiàn)隨著更多的強化學(xué)習(xí)(訓(xùn)練時計算)和更多的思考時間(測試時計算), o1的性能也在不斷提升。Post-Training的Scaling Laws成為新的值得重點關(guān)注的方向,推理環(huán)節(jié)的算力需求上限被大幅提升。o1表明推理階段對于復(fù)雜問題的解決起到非常關(guān)鍵的作用,因此未來推理端算力可能非常重要,甚至可能比Training端算力更加重要。未來算力投資也可能更多轉(zhuǎn)向推理階段。 o1提供更多可訓(xùn)練數(shù)據(jù),加速大模型產(chǎn)業(yè)發(fā)展。由AI生成數(shù)據(jù)的可靠性提升,解決了訓(xùn)練下一代大模型數(shù)據(jù)不足的問題。目前訓(xùn)練新的大模型不可避免的要用到AI生成的數(shù)據(jù),但是生成式AI往往存在“幻覺”,在邏輯推理方面輸出的信息準(zhǔn)確度并不高。而o1大模型能夠在科學(xué)問題和邏輯推理方面生成更加可靠的答案,能夠為訓(xùn)練能夠充分理解現(xiàn)實世界的AGI提供可靠數(shù)據(jù)。 o1拓寬大模型應(yīng)用領(lǐng)域,帶來新增需求。首先,o1拓寬人工智能的應(yīng)用范圍。以往AI很難解決一些推理方面的復(fù)雜問題,因此商業(yè)化應(yīng)用局限于通用的消費者市場。而本次OpenAI新模型o1對于一些復(fù)雜問題回答的表現(xiàn)非常好,未來可能在科研、醫(yī)療等復(fù)雜應(yīng)用場景中具有很大的應(yīng)用潛力。其次,OpenAIo1有望提供新的AGI路徑,scaling law的拓展在post-training側(cè)也有更多的提升空間,這也一定程度上影響著未來模型的設(shè)計思路與發(fā)展方向。 投資建議:OpenAI o1推理端算力需求增長拉動硬件基礎(chǔ)設(shè)施建設(shè)需求。建議關(guān)注:1、光通信產(chǎn)業(yè)鏈【中際旭創(chuàng)】、【新易盛】、【天孚通信】等;2、scaling law未失效,集群規(guī)模擴大,networking Capex占比持續(xù)提升,利好交換機產(chǎn)業(yè)鏈【盛科通信】、【紫光股份】、【中興通訊】、【銳捷網(wǎng)絡(luò)】、【菲菱科思】等;3、IDC產(chǎn)業(yè)鏈算力基礎(chǔ)設(shè)施供需格局持續(xù)改善【萬國數(shù)據(jù)】、【潤澤科技】、【世紀(jì)互聯(lián)】、【奧飛數(shù)據(jù)】等;4、海外AI算力基礎(chǔ)設(shè)施龍頭【英偉達】、【博通】、【Arista】等; 風(fēng)險提示:o1模型落地進度不及預(yù)期,實際應(yīng)用效果不及預(yù)期,行業(yè)競爭格局惡化。
|
|