>> 財通證券-電子行業(yè)LPU專題報告一:架構(gòu)創(chuàng)新突破大模型推理延遲瓶頸,廣闊市場空間有望快速放量-260315
| 上傳日期: |
2026/3/16 |
大小: |
1244KB |
| 格式: |
pdf 共22頁 |
來源: |
財通證券 |
| 評級: |
看好 |
作者: |
唐佳 |
| 行業(yè)名稱: |
電子 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
核心觀點 LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu):LPU是專為順序處理的計算密集型任務(wù)設(shè)計的新型芯片架構(gòu),核心在于TSP架構(gòu),包含五大功能模塊,將經(jīng)典的處理器五級流水線拆散在整個芯片內(nèi),進而消除了硬件的復(fù)雜性,使指令執(zhí)行順序和時間具有確定性。在TSP架構(gòu)下,編譯器可以直接訪問并精確控制芯片的底層硬件狀態(tài),實現(xiàn)了軟件定義硬件。 LPU可縮短大模型推理過程中的延遲,提高用戶體驗感:大模型在推理過程中會存在延遲,延遲與用戶體驗感精密掛鉤,大模型推理過程中的延遲主要在Decode階段,核心瓶頸在于內(nèi)存帶寬。LPU具備更快的內(nèi)存帶寬,可縮短大模型推理過程中的延遲。同時,基于LPU的大模型不僅具有更快的推理速度,還可以提供更具性價比的價格,可進一步提高用戶體驗感。 LPU具備廣闊的潛在發(fā)展空間,已步入量產(chǎn)初期:目前Tokens的消耗量大幅增長,2024年初我國日均Token的消耗量為1000億,2026年2月主流大模型合計日均Token消耗已到180萬億級別,Tokens消耗量快速增長,帶動推理芯片市場規(guī)模的高增長。LPU可降低大模型推理的延遲,我們認(rèn)為LPU有望在推理芯片市場中逐步滲透,具有高成長性的市場空間。目前LPU已步入量產(chǎn)初期,放量在即。 投資建議:我們認(rèn)為LPU受益于低推理延時的優(yōu)異表現(xiàn),有望實現(xiàn)快速滲透,我們看好LPU的高成長性及LPU以機柜出貨時帶來的PCB機會,建議關(guān)注:智微智能(參股元川微)、星宸科技(多輪增資元川微)、滬電股份(英偉達(dá)PCB供應(yīng)商)、勝宏科技(英偉達(dá)PCB供應(yīng)商)、深南電路。 風(fēng)險提示:AI技術(shù)迭代不及預(yù)期的風(fēng)險;大模型發(fā)展不及預(yù)期的風(fēng)險;LPU行業(yè)發(fā)展不及預(yù)期的風(fēng)險
|
|