>> 東興證券-超節(jié)點與Scale up網(wǎng)絡(luò)行業(yè):谷歌、AMD、國產(chǎn)超節(jié)點持續(xù)發(fā)力,打破英偉達獨大格局-260302
| 上傳日期: |
2026/3/3 |
大?。?/td>
| 5465KB |
| 格式: |
pdf 共68頁 |
來源: |
東興證券 |
| 評級: |
推薦 |
作者: |
石偉晶 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
投資摘要: 超節(jié)點與Scale-up網(wǎng)絡(luò)是突破算力與通信瓶頸、支撐萬億級大模型與高實時性應(yīng)用的關(guān)鍵基礎(chǔ)設(shè)施。本篇超節(jié)點與Scale up網(wǎng)絡(luò)行業(yè)深度報告,詳細研究英偉達、谷歌、AMD以及華為四家頭部AI算力芯片廠商在此領(lǐng)域的布局進展以及各自優(yōu)勢。我們認為,超節(jié)點與Scale-up網(wǎng)絡(luò)正處于快速發(fā)展期,并將成為算力芯片、網(wǎng)絡(luò)部件(PCB板、交換芯片、光器件、高速銅纜)、存儲部件、供電和散熱設(shè)施部件等新興技術(shù)的重要應(yīng)用市場。 (1)英偉達:超節(jié)點領(lǐng)先優(yōu)勢建立在NVLink和NVLink Switch。 在超節(jié)點技術(shù)方案上,英偉達處于領(lǐng)先優(yōu)勢。2024-2025年,英偉達陸續(xù)推出GH200 NVL72、GB200/ GB300NVL72等成熟超節(jié)點解決方案。根據(jù)大摩預測,2025年英偉達GB200/300 NVL72出貨量約2800臺。展望2026-2027年,英偉達計劃推出Vera Rubin NVL144和Rubin Ultra NVL576?;ヂ?lián)GPU數(shù)將從72顆進一步向576顆發(fā)展。屆時,英偉達將發(fā)布新一代Kyber機架,架構(gòu)引入NVLink Switch Blade(NVLink交換機刀片),通過PCB中板替代傳統(tǒng)5000+根有源銅纜??梢钥吹剑琑ubin Ultra NVL576仍保持較強的工程創(chuàng)新能力。 英偉達超節(jié)點的優(yōu)勢建立在NVLink和NVLink Switch。為實現(xiàn)AI訓練集群高帶寬與低延遲數(shù)據(jù)傳輸,NVLink重新設(shè)計通信架構(gòu),并引入一系列先進技術(shù),包括網(wǎng)狀拓撲、差分信號傳輸、流量調(diào)度信用機制、多Lane綁定技術(shù)、統(tǒng)一內(nèi)存空間等。截止2025年,NVLink 5 Switch實現(xiàn)支持單GPU到GPU帶寬1800GB/s,可構(gòu)建72 GPU的NVLink域,總帶寬達130 TB/s(雙向),支持72 GPU全互聯(lián)通信。在后續(xù)計劃中,NVSwitch Gen6和Gen7的GPU-to-GPU通信帶寬繼續(xù)升級為3.6TB/s。 但另一方面,Scale up網(wǎng)絡(luò)興起源于滿足大模型分布式訓練和推理中的張量并行(TP)與專家并行(EP)。目前AI產(chǎn)業(yè)也在探索降低TP與EP規(guī)模的技術(shù)方案,從而降低Scale up網(wǎng)絡(luò)規(guī)模的上限。我們認為,Scaleup網(wǎng)絡(luò)的發(fā)展空間或限制英偉達在超節(jié)點領(lǐng)域的領(lǐng)先優(yōu)勢。為保持領(lǐng)先優(yōu)勢,實現(xiàn)Scale up網(wǎng)絡(luò)和Scaleout網(wǎng)絡(luò)融合或?qū)⒊蔀橛ミ_超節(jié)點新的發(fā)展趨勢。 ?。?)華為:對外開放靈衢互聯(lián)協(xié)議,超節(jié)點性能追趕英偉達。 國內(nèi)Scale Up協(xié)議尚未統(tǒng)一,華為靈衢協(xié)議尚未被國內(nèi)業(yè)界廣泛接受。在Scale Up協(xié)議方面,華為推出靈衢協(xié)議,并從2.0版本起轉(zhuǎn)向開放標準。除此之外,國內(nèi)其他廠商正探索多種互聯(lián)協(xié)議,包括中移OISA、騰訊ETH-X、高通量以太網(wǎng)ETH+以及中興通訊OLink等。為打破生態(tài)壁壘,國內(nèi)正積極推動標準統(tǒng)一,比如工信部正牽頭推動CLink協(xié)議,旨在形成統(tǒng)一的國內(nèi)標準。 華為超節(jié)點依靠集群化方式實現(xiàn)性能追趕。Atlas 950超節(jié)點預計2026年第四季度發(fā)布,相比英偉達同樣將在2026年下半年上市的NVL144總算力2.52 EFLOPS(FP8),其算力達到8 EFLOPS(FP8)。此外,Atlas 950超節(jié)點在內(nèi)存容量1152TB與互聯(lián)帶寬16.3PB/s,也實現(xiàn)大幅領(lǐng)先。我們認為,短期內(nèi),華為超節(jié)點依靠集群化實現(xiàn)性能追趕,但在超節(jié)點復雜性、可靠性、功耗等維度需要平衡。從整體解決方案看,英偉達在超節(jié)點的芯片工藝、軟件生態(tài)與系統(tǒng)集成上的優(yōu)勢仍難以撼動。 Atlas 950超節(jié)點互聯(lián)方案或?qū)⒄{(diào)整,顯示華為超節(jié)點技術(shù)在標準化階段仍需夯實。相比上一代超節(jié)點,華為Atlas 950超節(jié)點不再使用全光互聯(lián)架構(gòu),其通過“柜內(nèi)正交銅互聯(lián)+柜間光互聯(lián)”的混合設(shè)計,在機柜內(nèi)部利用銅互聯(lián)實現(xiàn)高可靠、低成本和低功耗的連接,跨機柜則通過光互聯(lián)保障系統(tǒng)的可擴展性,從而在維持系統(tǒng)可擴展性的同時,有效控制總體擁有成本(TCO)。 ?。?)谷歌:建立光互聯(lián)超節(jié)點,與英偉達形成不對稱競爭。 谷歌TPU超節(jié)點建立成熟的光互聯(lián)Scale up網(wǎng)絡(luò)。從技術(shù)成熟度看,2023-2025年谷歌陸續(xù)推出TPU v4、TPU v5p、TPU v7三代超節(jié)點,完成了技術(shù)路線探索和方案標準化。此外TPU v7也獲得外部企業(yè)認可。 2026年,Anthropic將直接從博通采購近100萬顆TPU v7 Ironwood AI芯片,本地部署在其控制的數(shù)據(jù)中心。2027年,谷歌將推出第8代TPU,對標Nvidia Vera Rubin??梢钥吹剑瑢脮r谷歌TPU超節(jié)點的性能指標進一步優(yōu)化提升。 谷歌TPU超節(jié)點競爭優(yōu)勢建立在OCS交換機,技術(shù)路線獨樹一幟。相比英偉達、華為、AMD等超節(jié)點廠商,谷歌是全球首個將光電路交換機(OCS)大規(guī)模商用部署于Scale up網(wǎng)絡(luò)的企業(yè),技術(shù)路線獨樹一幟。谷歌OCS交換機,涉及精密光學、機械工程與半導體工藝的深度交叉應(yīng)用,在光互聯(lián)領(lǐng)域構(gòu)筑一道高壁壘的技術(shù)護城河。 相較于電分組交換機,光電路交換技術(shù)具備諸多優(yōu)勢:光電路交換機可跨多代光收發(fā)模塊技術(shù)復用、光電路交換機的每比特能耗較電分組交換機低數(shù)個數(shù)量級、光電路交換機引入的時延極小。 OCS交換機商用落地
|
|