>> 西部證券-計算機行業(yè)周觀點第18期:數(shù)據(jù)中心低碳化趨勢明確,國產(chǎn)算力有望加速滲透-240727
| 上傳日期: |
2024/7/27 |
大?。?/td>
| 297KB |
| 格式: |
pdf 共2頁 |
來源: |
西部證券 |
| 評級: |
-- |
作者: |
鄭宏達 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
核心結(jié)論 為訓(xùn)練出更強大的模型,搶占AI應(yīng)用高地,海外AI巨頭正競相構(gòu)建10萬卡GPU集群。從GPT-4發(fā)布到現(xiàn)在,全球大模型都沒有出現(xiàn)明顯的能力躍升,原因之一就是現(xiàn)在AI巨頭沒有大幅增加在單一模型上投入的算力,目前主流大模型投入的訓(xùn)練算力基本都是GPT-4水平。2024年7月22日,ElonMusk宣布由xAI、X和英偉達等合力打造的由10萬塊H100組成的孟菲斯超級集群開始投入訓(xùn)練,而OpenAI/ Microsoft、Meta等AI巨頭也正在努力打造10萬卡的GPU集群。 根據(jù)SemiAnalysis測算,為了支持服務(wù)器、存儲設(shè)備、網(wǎng)絡(luò)設(shè)備這些核心IT設(shè)備,一個10萬塊H100組成的集群所需的功耗大約是150MW。要建造10萬塊H100的超大型訓(xùn)練集群,不僅需要至少40億美元的資本支出,還需要解決電力供應(yīng)等問題。單個GPU的功率為700W,加上每個H100服務(wù)器內(nèi)還有CPU、NIC(網(wǎng)絡(luò)接口卡)、PSU(電源供應(yīng)單元)等等部件,所以每塊GPU還要額外消耗大概575W。在集群內(nèi),還需要存儲服務(wù)器、網(wǎng)絡(luò)交換機、光模塊等等,這些設(shè)備會額外再占用大概10%的功耗。所以,一個10萬塊H100集群的功耗超過150MW,一年的消耗就是1.59TWh(15.9億度電),約等于15萬個家庭一年的用電量,按$0.078/Kwh的單價來計算,這個集群每年在電力這一項上的支出就高達1.239億美元。作為對比,美國最大的國家實驗室的超級計算機El Capitan只需要30MW的關(guān)鍵IT電力,大概只有一個10萬塊H100集群功耗的1/5。 為推動國內(nèi)數(shù)據(jù)中心綠色低碳發(fā)展,多部門近日聯(lián)合印發(fā)專項行動計劃,提出數(shù)據(jù)中心應(yīng)采用達到能效標準的服務(wù)器。7月23日,由國家發(fā)展改革委、工業(yè)和信息化部、國家能源局、國家數(shù)據(jù)局等共同制定的《數(shù)據(jù)中心綠色低碳發(fā)展專項行動計劃》(以下簡稱《行動計劃》)正式發(fā)布。《行動計劃》提出:新建及改擴建數(shù)據(jù)中心應(yīng)采用能效達到《塔式和機架式服務(wù)器能效限定值及能效等級》(GB43630-2023)和《服務(wù)器和數(shù)據(jù)存儲設(shè)備能效“領(lǐng)跑者”評價要求》(T/CECA-G 0284-2024)規(guī)定的節(jié)能水平及以上服務(wù)器產(chǎn)品。 《服務(wù)器和數(shù)據(jù)存儲設(shè)備能效“領(lǐng)跑者”評價要求》(以下簡稱《評價要求》)對服務(wù)器能效水平提出了評價標準,其中:配置小于14nm設(shè)備制造的通用圖形處理器作為輔助處理加速器的服務(wù)器,其能效應(yīng)符合:先進水平≥1.00TFLOPS/W,節(jié)能水平≥0.50 TFLOPS/W。 我們認為《行動計劃》的發(fā)布,有利于推動國產(chǎn)算力向綠色低碳的目標發(fā)展,促進符合相關(guān)《評價要求》的國產(chǎn)算力加速滲透。 風(fēng)險提示:產(chǎn)業(yè)政策轉(zhuǎn)變、技術(shù)進展不及預(yù)期、應(yīng)用落地不及預(yù)期、行業(yè)競爭加劇、國際環(huán)境發(fā)生變化。
|
|