>> 申萬宏源-人工智能行業(yè)GenAI系列之34:網(wǎng)絡(luò)之辯,英偉達Blackwell背后的光電演繹-240330
| 上傳日期: |
2024/3/31 |
大?。?/td>
| 2967KB |
| 格式: |
pdf 共47頁 |
來源: |
申萬宏源 |
| 評級: |
-- |
作者: |
黃忠煌,李國盛,楊海晏 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
結(jié)論 AI底層硬件向“大系統(tǒng)”演進。 市場較多討論英偉達GB200 NVL系統(tǒng)的通信需求,光與銅“孰輕孰重”;我們認(rèn)為光電混合是當(dāng)前重要架構(gòu),未來更高速的光網(wǎng)絡(luò)和芯片層面的光互聯(lián)是長期方向。 基于云廠商視角,我們預(yù)計GB200 NVL系統(tǒng)是AI訓(xùn)練+推理在云端的較佳選擇。而在英偉達B系列芯片更新的節(jié)點上,我們預(yù)計后續(xù)AI芯片迭代出貨,對應(yīng)的800G/1.6T光模塊/光器件需求增長,硅光、液冷產(chǎn)業(yè)鏈投資機會也隨之增加,看好海外大廠的高速網(wǎng)絡(luò)需求的持續(xù)性。 原因及邏輯 1)英偉達的GB200 NVL72方案將72 GPU高密度配置在一個機柜中,用于大模型訓(xùn)推,其中柜內(nèi)組網(wǎng)以電氣信號背板和銅線的NVLink網(wǎng)絡(luò)為主,而機柜外擴容組網(wǎng)尤其千至萬卡互聯(lián)則需要2-3層交換機網(wǎng)絡(luò)和光通信方案。前者是芯片互聯(lián)增量,后者架構(gòu)延續(xù)但整體升級。 2)整體看,單一介質(zhì)網(wǎng)絡(luò)連接的性能,最大傳輸距離與最高帶寬成反比,且綜合考慮成本,同時考慮工程可行性。光電混合是當(dāng)前出于成本考慮的重要架構(gòu),光網(wǎng)絡(luò)和芯片層面的光互聯(lián)是長期方向。 3)硅光的演進方向明確。芯片算力性能暴增+訓(xùn)練/推理的參數(shù)需求,網(wǎng)絡(luò)、訪存性能亟需同步提升。電口瓶頸已至,芯片-板卡-設(shè)備間高速互聯(lián),光電子幾乎是迭代唯一出路。當(dāng)前放量臨近、格局逐步明晰。 4)AI硬件高密度、高功耗的路徑下,液冷方案的滲透空間巨大。 有別于大眾的認(rèn)識 市場擔(dān)心英偉達GB200系統(tǒng)為代表的AI硬件演進,光通信需求降低。我們從GB200 NVL72系統(tǒng)的拆解與理想化測算、光銅兩種方案的應(yīng)用場景、硅光產(chǎn)業(yè)的發(fā)展節(jié)奏等角度出發(fā),認(rèn)為光電混合是當(dāng)前重要架構(gòu),未來更高速的光網(wǎng)絡(luò)和芯片層面的光互聯(lián)是長期方向。 市場擔(dān)心AI從訓(xùn)練到推理的過程,對硬件的需求降低。而AI大模型參數(shù)量的增速顯著大于GPU內(nèi)存與算力增速,高集成度+大內(nèi)存+多GPU的系統(tǒng)更適配大模型訓(xùn)推,我們認(rèn)為不管是800G/1.6T光模塊/光器件需求,還是硅光、液冷的投資機會,均是后續(xù)重要的產(chǎn)業(yè)增量,看好高速網(wǎng)絡(luò)等硬件需求的持續(xù)性。 相關(guān)標(biāo)的:聚焦AI算力網(wǎng)絡(luò)產(chǎn)業(yè)鏈 光通信之中際旭創(chuàng)、新易盛、天孚通信、華工科技、光迅科技、源杰科技等。算力設(shè)備之紫光股份、銳捷網(wǎng)絡(luò)、中興通訊、烽火通信以及盛科通信等。液冷與IDC之英維克、飛榮達、潤澤科技等。 風(fēng)險提示: 1)芯片與系統(tǒng)的技術(shù)演進速度幾乎是歷史最快,同時也意味著演進方向可能多元化,科技大廠定制芯片的需求也說明了這一點。不同的系統(tǒng)架構(gòu)和網(wǎng)絡(luò)實踐,可能會影響網(wǎng)絡(luò)器件、設(shè)備等的長期需求。 2)大模型算法的發(fā)展方向,例如參數(shù)量的變化、模型設(shè)計的變化等,也直接影響了底層的硬件架構(gòu)設(shè)計,可能造成硬件需求的波動。
|
|