>> 申萬宏源-計算機行業(yè)智聯(lián)汽車深度三十三暨華為系列深度之六-特斯拉Dojo+英偉達GPU+谷歌TPU+昇騰:趨勢是帶寬與擴展性!-230918
| 上傳日期: |
2023/9/18 |
大?。?/td>
| 2211KB |
| 格式: |
pdf 共29頁 |
來源: |
申萬宏源 |
| 評級: |
強于大市 |
作者: |
劉洋,李國盛,楊海晏 |
| 行業(yè)名稱: |
汽車 |
| 下載權限: |
此報告為加密報告 |
|
|
本期投資提示: 特斯拉Dojo芯片、華為服務器/AI能力都是近期產(chǎn)業(yè)重要事件。本篇報告分析特斯拉Dojo/英偉達GPU/谷歌TPU/華為昇騰等的異同,并做AI產(chǎn)業(yè)計算和通信趨勢的預測。 Dojo芯片與架構的特色至少包括存算一體/擴展性強/路由便捷/帶寬高。在IEEEMICRO2020上,特斯拉發(fā)布FSD《 Compute Solution for Tesla ’s Full Self-DrivingComputer》。在2022年8月hotchips 34大會上,特斯拉發(fā)布《The Microarchitectureof Dojo, Tesla’s Exa-Scale Computer》和《Dojo Super-Compute System Scaling forMLTraining》。Dojo至少有存算一體/擴展性強/路由便捷/帶寬高四個特色,詳見正文。 英偉達GPU/谷歌TPU/昇騰AI/Tesla DSA,從架構解釋異同。1)2010年以來,英偉達GPU主要架構至少包括八類,具備衍生關系。趨勢:注重互聯(lián)/注重帶寬和擴展性/對AI支持與時俱進(從Cuda Core到Tensor Core,增加對INT/BF16等AI新趨勢的支持,結構稀疏矩陣支持)。2)根據(jù)TPU五代架構,趨勢:注重互聯(lián)/注重擴展性/對AI支持與時俱進(如用脈動陣列的方法支持矩陣乘法)。3)根據(jù)華為官網(wǎng)和《機器之心》等,華為昇騰(達芬奇架構)應與谷歌TPU有類似之處。4)共同點是擴展性/AI甚至大模型下特殊操作,區(qū)別是Dojo有特殊性(不同處理器設計是“架構向后兼容”,不需要顛覆架構)。 計算部分的未來趨勢:1)與時俱進,適應AI數(shù)據(jù)精度/場景特殊運算。2)帶寬最大化,延展性關鍵化。3)核心數(shù)可能減少。正文有詳細論述。 通信部分:DIP和TTPoE是Dojo的網(wǎng)絡核心。Dojo系統(tǒng)的構架過程,以node核心為最小單元,每1個D1包含354個nodes、每1個Tile包含25個D1、每1個Tray包含6個Tiles,每個機柜包含2組Tray。Dojo Interface Processor(DIP)用于HBM內(nèi)存擴容、PCIe擴展、以及對外的網(wǎng)絡連接。Tesla Transport Protocol可以對應于CXL、NVLink等,基于以太網(wǎng)提供400Gb/s的核心網(wǎng)絡帶寬。 通信部分的未來趨勢:Dojo試圖打破馮諾依曼約束,借助軟件與網(wǎng)絡,平衡系統(tǒng)中的時延、帶寬、資源消耗量和傳輸距離。我們推算Dojo的網(wǎng)絡設備與器件使用情況,基礎BasePOD 177個機柜的規(guī)模下,假設fat-tree的2層交換架構組網(wǎng)且全部使用光通信系統(tǒng),總共需要14160×2=28320個光模塊,對應177個機柜中的53100個D1芯片,另外Host系統(tǒng)預計也需要若干光模塊。若Dojo系統(tǒng)與Nvidia A100系統(tǒng)對標,顯著差異是網(wǎng)絡帶寬從200Gb網(wǎng)絡升級至400Gb、SRAM與DRAM容量與帶寬提升、引入15kw的液冷封裝方案,最終整體算力性能顯著提升。 流量環(huán)節(jié):關注中際旭創(chuàng)、華工科技、新易盛、天孚通信、中興通訊、紫光股份、銳捷網(wǎng)絡等;計算環(huán)節(jié):關注浪潮信息、勝宏科技(電子)、神州數(shù)碼(tmt)等;華為產(chǎn)業(yè)鏈:關注華大九天(tmt,EDA)、軟通動力(大模型+OS+數(shù)據(jù)庫)、長電科技(電子,封測)、潤達醫(yī)療(醫(yī)療AI)、賽意信息(MetaERP)、中軟國際、廣電運通、神州數(shù)碼等;特斯拉和智能車產(chǎn)業(yè)鏈:關注德賽西威、立訊精密(電子)、雙環(huán)傳動(機械&汽車)等。 風險:關注由于復工/宏觀環(huán)境等擾動,2022-2023年內(nèi)存在業(yè)績波動風險。GPU/DSA、智聯(lián)汽車、機器人領域一向的風險依然是研究競爭、產(chǎn)業(yè)鏈地位與管理。若難以相對準確地把握,可能會選中了次好的公司,對投資產(chǎn)生不良的結果。
|
|