>> 上海證券-計(jì)算機(jī)行業(yè)先進(jìn)科技主題周報(bào):英偉達(dá)發(fā)布H200,生成式AI算力設(shè)施再演進(jìn)-231123
| 上傳日期: |
2023/11/24 |
大小: |
444KB |
| 格式: |
pdf 共4頁(yè) |
來(lái)源: |
上海證券 |
| 評(píng)級(jí): |
增持 |
作者: |
劉京昭 |
| 行業(yè)名稱(chēng): |
計(jì)算機(jī) |
| 下載權(quán)限: |
此報(bào)告為加密報(bào)告 |
|
|
主要觀(guān)點(diǎn) 年初以來(lái),以GPT為代表的生成式人工智能模型持續(xù)落地和商業(yè)化,展現(xiàn)出生成式人工智能模型在辦公、教育等場(chǎng)景下的巨大潛力。作為人工智能模型訓(xùn)練與應(yīng)用部署的重要基礎(chǔ)設(shè)施,面向人工智能的算力設(shè)施設(shè)計(jì)指標(biāo)也不斷升級(jí),促使以算力和通信為代表的人工智能基礎(chǔ)設(shè)施迎來(lái)新的增長(zhǎng)空間。 本周上證指數(shù)報(bào)收3054.37點(diǎn),周漲跌幅為+0.51%;深證成指報(bào)收9979.69點(diǎn),周漲跌幅為+0.01%;創(chuàng)業(yè)板指報(bào)收1986.53點(diǎn),周漲跌幅為-0.93%;滬深300指數(shù)報(bào)收3568.07點(diǎn),周漲跌幅為-0.51%。中證人工智能指數(shù)報(bào)收1096.65點(diǎn),周漲跌幅+2.77%,板塊跑贏大盤(pán)。 在人工智能主線(xiàn)方面,本周值得關(guān)注的有: 1)NVIDIA面向推理場(chǎng)景發(fā)布H200:在SC23上,NVIDIA宣布推出NVIDIAHGXH200。NVIDIAHGXH200基于NVIDIAHopper架構(gòu),配備N(xiāo)VIDIAH200 Tensor Core GPU和HBM3e顯存,能夠更好地支持處理生成式AI和高性能計(jì)算場(chǎng)景下的工作負(fù)載。NVIDIAH200所配備的141GBHBM3e顯存擁有4.8 TB/s的帶寬,與NVIDIAH100相比,顯存增加76%,帶寬增加43%。以L(fǎng)lama2-70B模型為例,NVIDIAH200的推理速度是NVIDIAH100的1.9倍,大幅提高了對(duì)生成式AI推理場(chǎng)景的支持能力。 2)微軟發(fā)布面向AI場(chǎng)景的ASIC芯片,Microsoft 365 Copilot正式開(kāi)放商用:微軟在今年的Ignite大會(huì)上發(fā)布了針對(duì)生成式AI場(chǎng)景進(jìn)行了優(yōu)化的ASIC芯片—Maia 100,以及專(zhuān)為在Microsoft云上運(yùn)行通用計(jì)算工作負(fù)載而設(shè)計(jì)的Arm架構(gòu)CPU—Cobalt 100。在內(nèi)存帶寬方面,Maia100配置了1.6TB/s的帶寬,介于同為CSPs自研ASIC芯片的TPU v5和Trainium/Inferentia2之間。在網(wǎng)絡(luò)方面,類(lèi)似于TPU v5的專(zhuān)有ICI網(wǎng)絡(luò),每塊Maia 100擁有內(nèi)置的RDMA以太網(wǎng)IO,單塊芯片的單向IO速率為4.8Tb/s,超越了NVIDIA和AMD的最新計(jì)算卡。此外,Microsoft 365 Copilot正式面向企業(yè)開(kāi)放商用,而OpenAI發(fā)布的GPT-3.5 Turbo、GPT-4 Turbo、DALLE·3也在微軟Azure上正式商用或發(fā)布了預(yù)覽版本。 3)可穿戴設(shè)備AIPin問(wèn)世:初創(chuàng)公司Humane發(fā)布了其首款配置了生成式AI語(yǔ)言助理的可穿戴設(shè)備AIPin,并于11月16日正式上市。AIPin可以固定在衣物上,通過(guò)激光將顯示界面投射到手掌上,然后通過(guò)點(diǎn)擊、手勢(shì)或語(yǔ)音來(lái)完成交互。根據(jù)Humane公布的配置,AIPin搭載的是一款未知型號(hào)的高通8核心SoC,峰值頻率為2.1GHz,低于同樣為8核心的高通8 Gen3。 我們認(rèn)為:(1)算力端:H200在硬件配置上,較H100提升了顯存容量和顯存帶寬,針對(duì)推理場(chǎng)景進(jìn)行了優(yōu)化,有望助力解決推理端算力緊缺的現(xiàn)狀,為下一階段生成式AI應(yīng)用的落地奠定基礎(chǔ)。同時(shí),在端側(cè)算力方面,以AIPin和Google Pixel 8為代表的終端設(shè)備開(kāi)始配備AI助手類(lèi)應(yīng)用,考慮到網(wǎng)絡(luò)連接的不穩(wěn)定性等因素,部分不依賴(lài)網(wǎng)絡(luò)的端側(cè)的推理成為生成式AI落地的重要方向。(2)算法端:具備文生文或文生圖功能的生成式AI模型不斷迭代升級(jí),以Microsoft 365 Copilot為代表的AI+辦公應(yīng)用正借助成熟模型加速落地。(3)應(yīng)用端:隨著算力設(shè)施支持能力的提升,以及算法持續(xù)迭代,人工智能應(yīng)用有望逐步豐富并不斷降低使用成本。 此外,本周衛(wèi)星通信領(lǐng)域也值得關(guān)注: Starship運(yùn)載火箭第二次試射:由SpaceX公司研發(fā)并生產(chǎn)的Starship(星艦)運(yùn)載火箭進(jìn)行了第二次試射。試射過(guò)程中,一、二級(jí)火箭進(jìn)行了熱分離。星艦?zāi)壳暗脑O(shè)計(jì)最大載荷為100-150噸,是同樣由SpaceX公司研發(fā)的獵鷹9號(hào)運(yùn)載火箭的至少4.4倍。我們認(rèn)為:星艦相較其他在役的運(yùn)載火箭,具有載荷大、單次使用成本低的優(yōu)點(diǎn)。若火箭能完成設(shè)計(jì)和驗(yàn)證,有望進(jìn)一步降低衛(wèi)星發(fā)射成本,有助于低軌道通信衛(wèi)星的大批量發(fā)射,或?qū)⒓铀傩l(wèi)星互聯(lián)網(wǎng)的落地進(jìn)度,降低長(zhǎng)期維護(hù)成本。 投資建議 我們建議:跟蹤生成式AI發(fā)展進(jìn)程,應(yīng)優(yōu)先關(guān)注商業(yè)化落地的性?xún)r(jià)比,特別是有無(wú)充足的算力設(shè)施支持其后續(xù)的發(fā)展。在商業(yè)化落地的過(guò)程中,前期算力設(shè)施領(lǐng)域的增長(zhǎng)空間會(huì)較為明顯,且具有較高的確定性。后期隨著軟件應(yīng)用的成熟,應(yīng)優(yōu)先關(guān)注需求具有較高確定性的高成長(zhǎng)空間賽道中,上下游綁定較為緊密,具有較高行業(yè)壁壘的低估值公司。 科技板塊中,建議關(guān)注以下賽道: 1)液冷:隨著GPU服務(wù)器上架數(shù)量的不斷提高,其散熱問(wèn)題也逐漸受到關(guān)注。近年來(lái),通信運(yùn)營(yíng)商和地方政府陸續(xù)發(fā)布文件,對(duì)新建和存量數(shù)據(jù)中心的PUE等關(guān)鍵能耗指標(biāo)做出限制。這有利于液冷在服務(wù)器市場(chǎng)提高滲透率,實(shí)現(xiàn)確定下較高的增長(zhǎng)。與下游服務(wù)器廠(chǎng)商有較強(qiáng)合作關(guān)系的液冷廠(chǎng)商,有望取得較好的營(yíng)收和利潤(rùn)增長(zhǎng)。 2)光模塊/光引擎:在GPU服務(wù)器集群中,交換機(jī)與交換機(jī)間往往采取光纜連接,由于GPU互相訪(fǎng)問(wèn)顯存的需要,網(wǎng)絡(luò)架構(gòu)需具備低延遲、高速率的特性。因此,800G、400G光模塊爆發(fā)了較大的需求量,此前研發(fā)、測(cè)試進(jìn)度較快,與Google、NVIDIA等下游客戶(hù)已存在合作關(guān)系的行業(yè)頭部企業(yè)有望獲得競(jìng)爭(zhēng)優(yōu)
|
|