>> 西部證券-計算機行業(yè)人工智能系列報告(四)/算力系列報告(一)-推理芯片:生成式AI驅(qū)動,或迎來重大機遇-240509
| 上傳日期: |
2024/5/10 |
大?。?/td>
| 1239KB |
| 格式: |
pdf 共10頁 |
來源: |
西部證券 |
| 評級: |
超配 |
作者: |
鄭宏達 |
| 行業(yè)名稱: |
計算機 |
| 下載權限: |
此報告為加密報告,僅限高級會員查看 |
|
|
生成式AI模型性能不斷提升,或處于更大規(guī)模放量前夕,推理需求有望高速增長。OpenAI于2022年11月推出生成式AI應用ChatGPT,在不到兩個月的時間內(nèi),月活躍用戶數(shù)突破1億人。以ChatGPT為代表的生成式AI應用快速迭代、落地,模型推理的算力需求逐漸顯現(xiàn)。隨著生成式AI模型參數(shù)和Token數(shù)量不斷增加,模型單次推理所需的算力持續(xù)攀升。同時,ChatGPT、Gemini、Kimi等聊天機器人的用戶數(shù)逐步上升,MicrosoftCopilot、Adobe Firefly、WPSAI等辦公助手持續(xù)落地,用戶側(cè)的流量不斷上升,推理算力未來有望超過訓練算力,最終訓練芯片與推理芯片數(shù)量之比或達到2:8。 量化技術(Quantization)是決定生成式AI推理成本的關鍵因素,量化技術的迭代升級有望降低推理門檻,為CPU+ASIC、CPU+FPGA等技術路線的發(fā)展,以及國產(chǎn)算力的放量提供了技術基礎。人工智能模型的量化技術從最初的FP16量化快速發(fā)展到目前應用最成熟的INT8量化,再到正在進一步研究中的INT4量化,呈現(xiàn)出數(shù)據(jù)精度逐步降低,內(nèi)存或顯存占用不斷減少的趨勢。這一趨勢有助于CPU+ASIC、CPU+FPGA等技術路線通過軟硬件的優(yōu)化提高推理能力,也有助于國產(chǎn)算力通過增加低精度計算單元等方式,以較成熟的制程工藝實現(xiàn)可用的推理算力。 消費級GPU產(chǎn)品和海外CSP企業(yè)的自研芯片同樣被用于推理場景。英偉達和AMD的消費級GPU產(chǎn)品,同樣具備接近千億參數(shù)量級的生成式AI模型的推理能力,從側(cè)面說明推理芯片的門檻相對較低。谷歌、微軟、亞馬遜、Meta等海外CSP企業(yè)在大規(guī)模采購英偉達數(shù)據(jù)中心GPU的同時,也在積極自研用于模型訓練和推理的芯片,有望成為滿足推理算力需求的另一種途徑。 我們認為:生成式AI的發(fā)展是一個不斷迭代升級的過程,隨著國內(nèi)生成式AI模型的質(zhì)量持續(xù)提升,有望出現(xiàn)更多優(yōu)質(zhì)應用,從而帶動推理算力需求快速上升。在推理場景下,算力的性價比顯得更為重要。在供給端有所限制的情況下,國產(chǎn)推理芯片有望受益于國內(nèi)生成式AI應用的落地,迎來重大發(fā)展機遇。 建議關注: 1)AI推理芯片:寒武紀、海光信息。 2)算力服務器:浪潮信息、中科曙光、神州數(shù)碼、工業(yè)富聯(lián)。 風險提示:人工智能技術落地和商業(yè)化不及預期;產(chǎn)業(yè)政策轉(zhuǎn)變;宏觀經(jīng)濟不及預期。
|
|