>> 招商證券-計算機行業(yè)AIGC系列報告(二)-算力:AIGC時代的“賣鏟人”-230402
| 上傳日期: |
2023/4/2 |
大?。?/td>
| 2242KB |
| 格式: |
pdf 共28頁 |
來源: |
招商證券 |
| 評級: |
強于大市 |
作者: |
劉玉萍,周翔宇 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
本篇報告系統(tǒng)地梳理了大模型訓練及推理需要多少算力。 大模型參數(shù)量快速提升,Transformer架構(gòu)成為發(fā)展趨勢。根據(jù)最新論文對“涌現(xiàn)”效應的研究,當模型訓練量超過1022后,模型準確率有了很大的提升,近年來,NLP模型的發(fā)展十分迅速,模型的參數(shù)量每年以5至10倍的速度在提升,背后的推動力即大模型可以帶來更強大更精準的語言語義理解和推理能力。Transformer架構(gòu)通過計算數(shù)據(jù)之間的關系提取信息,相較于卷積神經(jīng)網(wǎng)絡具有更強大的運算效率,更適合參數(shù)和數(shù)據(jù)集龐大的自然語言處理學習。 基于GPT3大模型的訓練/推理所需的算力及金額測算。 訓練端,以GPT3為例,完成一次大模型訓練所需的算力需求量為3646PF·Days,若用10000張英偉達V100/A100訓練則分別需要14.59/3.34天,對應訓練費用分別為4.72/1.89百萬美元。 推理端,以GPT3為例,1000個token的推理算力需求約為350TFLOPS,對應推理成本約為0.15美分。 英偉達GPU是當前最適合做訓練的AI芯片。GPU提供多核并行計算的基礎,且核心數(shù)眾多,可以支撐大量數(shù)據(jù)的并行運算,英偉達Tensor Core技術能夠通過降低精度,在性能方面實現(xiàn)數(shù)量級的提高。此外,針對大規(guī)模AI訓練,英偉達推出DGX系統(tǒng),包括A100、H100、BasePOD、SuperPOD四款產(chǎn)品,其中,DGXA100、DGXH100為英偉達當前服務于AI領域的服務器產(chǎn)品。 投資建議:算力是AIGC時代的“賣鏟人”。我們認為發(fā)展算力基礎設施是AIGC產(chǎn)業(yè)發(fā)展中必不可少的環(huán)節(jié),我國在算力領域仍有較大成長空間。其中,國產(chǎn)AI芯片領域重點推薦寒武紀(電子聯(lián)合覆蓋)、海光信息(電子聯(lián)合覆蓋);服務器領域重點推薦中科曙光、浪潮信息。 風險提示:AI服務器供應鏈風險;AI芯片研發(fā)不及預期風險;AI相關上市公司短期漲幅過大風險。
|
|