完美世界小说下载,重生之毒妃梅果小说,手机推荐排行榜

>> 西部證券-計算機行業(yè)人工智能系列報告(四)／算力系列報告(一)-推理芯片：生成式AI驅(qū)動，或迎來重大機遇-240509

上傳日期：	2024/5/10	大?。?/td>	1239KB
格式：	pdf 共10頁	來源：	西部證券
評級：	超配	作者：	鄭宏達
行業(yè)名稱：	計算機
下載權限：	此報告為加密報告，僅限高級會員查看

生成式AI模型性能不斷提升，或處于更大規(guī)模放量前夕，推理需求有望高速增長。OpenAI于2022年11月推出生成式AI應用ChatGPT，在不到兩個月的時間內(nèi)，月活躍用戶數(shù)突破1億人。以ChatGPT為代表的生成式AI應用快速迭代、落地，模型推理的算力需求逐漸顯現(xiàn)。隨著生成式AI模型參數(shù)和Token數(shù)量不斷增加，模型單次推理所需的算力持續(xù)攀升。同時，ChatGPT、Gemini、Kimi等聊天機器人的用戶數(shù)逐步上升，MicrosoftCopilot、Adobe Firefly、WPSAI等辦公助手持續(xù)落地，用戶側(cè)的流量不斷上升，推理算力未來有望超過訓練算力，最終訓練芯片與推理芯片數(shù)量之比或達到2：8。
　　量化技術（Quantization）是決定生成式AI推理成本的關鍵因素，量化技術的迭代升級有望降低推理門檻，為CPU+ASIC、CPU+FPGA等技術路線的發(fā)展，以及國產(chǎn)算力的放量提供了技術基礎。人工智能模型的量化技術從最初的FP16量化快速發(fā)展到目前應用最成熟的INT8量化，再到正在進一步研究中的INT4量化，呈現(xiàn)出數(shù)據(jù)精度逐步降低，內(nèi)存或顯存占用不斷減少的趨勢。這一趨勢有助于CPU+ASIC、CPU+FPGA等技術路線通過軟硬件的優(yōu)化提高推理能力，也有助于國產(chǎn)算力通過增加低精度計算單元等方式，以較成熟的制程工藝實現(xiàn)可用的推理算力。
　　消費級GPU產(chǎn)品和海外CSP企業(yè)的自研芯片同樣被用于推理場景。英偉達和AMD的消費級GPU產(chǎn)品，同樣具備接近千億參數(shù)量級的生成式AI模型的推理能力，從側(cè)面說明推理芯片的門檻相對較低。谷歌、微軟、亞馬遜、Meta等海外CSP企業(yè)在大規(guī)模采購英偉達數(shù)據(jù)中心GPU的同時，也在積極自研用于模型訓練和推理的芯片，有望成為滿足推理算力需求的另一種途徑。
　　我們認為：生成式AI的發(fā)展是一個不斷迭代升級的過程，隨著國內(nèi)生成式AI模型的質(zhì)量持續(xù)提升，有望出現(xiàn)更多優(yōu)質(zhì)應用，從而帶動推理算力需求快速上升。在推理場景下，算力的性價比顯得更為重要。在供給端有所限制的情況下，國產(chǎn)推理芯片有望受益于國內(nèi)生成式AI應用的落地，迎來重大發(fā)展機遇。
　　建議關注：
　　1）AI推理芯片：寒武紀、海光信息。
　　2）算力服務器：浪潮信息、中科曙光、神州數(shù)碼、工業(yè)富聯(lián)。
　　風險提示：人工智能技術落地和商業(yè)化不及預期；產(chǎn)業(yè)政策轉(zhuǎn)變；宏觀經(jīng)濟不及預期。

相關行業(yè)報告

久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频