>> 招商證券-電子行業(yè)英偉達(dá)GTC2025跟蹤報告:2028年全球萬億美金Capex可期,關(guān)注CPO、正交背板等新技術(shù)趨勢-250320
| 上傳日期: |
2025/3/20 |
大?。?/td>
| 2588KB |
| 格式: |
pdf 共31頁 |
來源: |
招商證券 |
| 評級: |
推薦 |
作者: |
鄢凡,程鑫,諶薇 |
| 行業(yè)名稱: |
電子 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
事件: 英偉達(dá)GTC 2025大會于3月17-21日舉辦,英偉達(dá)CEO黃仁勛于3月19日發(fā)表主題演講,介紹AI加速計算新時代、AI加速計算的新品、CPO芯片及集成光子引擎、以及AI技術(shù)在自動駕駛、機(jī)器人等前沿領(lǐng)域的應(yīng)用。綜合演講及材料信息,總結(jié)要點如下: 評論: 1、數(shù)據(jù)中心28年Capex望超萬億美元,訓(xùn)練推理帶來100倍Tokens增長。 1)資本開支:數(shù)據(jù)中心、CSP和相關(guān)基礎(chǔ)設(shè)施的資本開支將大幅增加,預(yù)計2028年數(shù)據(jù)中心建設(shè)將達(dá)到1萬億美元,絕大部分投資或?qū)⒂糜诩铀儆嬎阈酒?024年公司向四大云服務(wù)商共交付130萬顆Hopper GPU,預(yù)計2025年將出貨360萬顆Blackwell。英偉達(dá)認(rèn)為,世界正在經(jīng)歷一場革命性轉(zhuǎn)型,全球數(shù)據(jù)中心正在向人工智能工廠轉(zhuǎn)型,計算機(jī)將為軟件生成Tokens,處理分析并生成AI驅(qū)動的研究和應(yīng)用。2)訓(xùn)練及推理:英偉達(dá)概述了三層次的AI,即GenerativeAI、Agentic AI以及Physical Al,從生成式到AI推理再到理解物理層面;由于訓(xùn)練和推理模型的計算量劇增,AI基礎(chǔ)設(shè)施在短時間內(nèi)增長驚人,如今所需計算量較去年預(yù)計增長100倍,當(dāng)AI技術(shù)生成Tokens時,會生成代表推理步驟的單詞序列,致使Tokens數(shù)量大幅增加,為保持模型響應(yīng)交互性,需將計算速度及Tokens速度提高10倍。 2、Blackwell全面投產(chǎn)且進(jìn)展順利,展示Rubin和Feynman等未來代際產(chǎn)品。 1)Blackwell:英偉達(dá)表示,Blackwell已全面投產(chǎn)且進(jìn)展較快,客戶需求量較大,Blackwell NVL72結(jié)合Dynamo推理性能提升了40倍,相當(dāng)于一座HopperAI工廠的性能;英偉達(dá)將于25H2發(fā)布Blackwell Ultra,算力較GB200 NVL72提升約50%(FP8精度算力達(dá)0.36EF),搭載HBM3E、內(nèi)存從192GB提升到了288GB,搭載CX8鏈路并達(dá)到14.4TB/s的傳輸速率。2)Vera RubinNVL144:預(yù)計26H2推出,包括VeraCPU+ RubinGPU,同時調(diào)用時Rubin能在推理時實現(xiàn)每秒50千萬億次浮點運(yùn)算,Rubin內(nèi)存將升級為288GB容量的HBM4,帶寬也會從原來的8TB/s大幅提升至13TB/s,擴(kuò)展NVLink后Rubin帶寬翻倍至260TB/s,同時采用CX9鏈路并達(dá)到28.8TB/s傳輸速率;3)RubinUltra NVL576:預(yù)計27H2推出,F(xiàn)P4精度算力達(dá)15 EF、FP8精度算力達(dá)5 EF,相較于GB300 NVL72性能提升約14倍;Rubin Ultra NVL576搭載HBM4e內(nèi)存、帶寬達(dá)到4.6 PB/s,并支持1.5PB/S帶寬的NVLink 7,與上一代相比提升約12倍,同時采用CX9鏈路及115.2 TB/s傳輸速率,較上一代提升約8倍。4)Feynman:預(yù)計2028年上市,Vera CPU、NVSwitch-NEXT、Spectrum7、CX10網(wǎng)卡等配套都將同步迭代,迎接千兆瓦AI工廠時代。 3、英偉達(dá)推出CPO交換機(jī),預(yù)計2026年開始將隨Rubin系列逐步推向市場。 1)Quantum-XCPO交換機(jī):預(yù)計25H2推出,整體交換容量為115.2Tb/s,相比可插拔光模塊方案能耗降低約3.5倍,并帶來網(wǎng)絡(luò)彈性提升10倍以及部署效率提升1.3倍;每個Quantum-XCPO交換機(jī)包含4個Switch模塊,單Switch具備28.8Tb/s傳輸速率,采用臺積電N4代工,具備3.6TFLOPSFP8精度的算力;Switch周圍放置6個光學(xué)組件,組件內(nèi)含3個1.6T可拆卸硅光引擎(共計18個),由324路光纖連接,其中包括36路光纖輸入及288路光纖輸出。硅光引擎采用200Gb/sDe微環(huán)調(diào)制器,光纖耦合采用臺積電COUPE平臺、N6工藝生產(chǎn),用垂直耦合方式,與3D封裝的EPIC進(jìn)行光路耦合。交換機(jī)外部共有1152路單模光纖,即8×2(收發(fā))×3(光引擎數(shù))×6(光組件數(shù))×4(芯片數(shù)),單個模塊包括8個激光器用于自動溫度跟蹤、波長和功率調(diào)諧,整個Quantum-X交換機(jī)對外接口包括18個外置光源輸入,144個MPO連接器、324根光連接,對應(yīng)115太比特每秒的吞吐量。2)Spectrum-XCPO:預(yù)計26H2推出,分為兩種型號,①SN6810包含128*800GB/S端口,背板帶寬102.4TB/S,②SN6800包含512*800Gb/S端口,背板帶寬409.6TB/S;3)MRM micromirror技術(shù):結(jié)構(gòu)為1個小波導(dǎo)連接1個環(huán)形結(jié)構(gòu),當(dāng)光信號在波導(dǎo)中傳輸時,環(huán)形結(jié)構(gòu)能產(chǎn)生共振、控制波導(dǎo)反射率、通過吸收光阻斷光信號,將直接連續(xù)激光束轉(zhuǎn)化為0或1;由于英偉達(dá)選擇這項技術(shù),25H2硅光子交換機(jī)將順利推出,未來英偉達(dá)將硅光子學(xué)與共封裝技術(shù)相結(jié)合,無需收發(fā)器,可直接將光纖接入512接口的交換機(jī)中,擴(kuò)展到數(shù)十萬個甚至數(shù)百萬個GPU規(guī)模的能力,采用CPO交換機(jī)可以幫助數(shù)據(jù)中心節(jié)省60MW的電力,相當(dāng)于100個Rubin的耗電量。4)合作伙伴:波若威科技、Coherent、康寧、Fabrinet、富士康、Lumentum、SENKO、矽品SPIL、住友電工、天孚光通信TFC、臺積電等。 4、智駕推出Halos系統(tǒng),機(jī)器人領(lǐng)域推出開源通用基礎(chǔ)模型Isaac Groot N1。 ?、僮詣玉{駛:英偉達(dá)認(rèn)為自動駕駛時代已經(jīng)來臨,英偉達(dá)在汽車安全領(lǐng)域發(fā)布了Halos系統(tǒng),通過Omniverse加速自動駕駛汽車開發(fā),Cosmos的預(yù)測和推理能力支持AI優(yōu)先的自動駕駛系統(tǒng),該系統(tǒng)通過模型蒸餾、閉環(huán)訓(xùn)練和合成數(shù)據(jù)生成實現(xiàn)端到端可訓(xùn)練。②機(jī)器人:英偉
|
|