久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频

研報(bào)下載就選股票報(bào)告網(wǎng)
您好,歡迎來(lái)到股票分析報(bào)告網(wǎng)!登錄   忘記密碼   注冊(cè)
>> 華泰證券-科技行業(yè)再談NV的下一個(gè)Mellanox:Groq LPU的整合-260306
上傳日期:   2026/3/6 大?。?/td>   1017KB
格式:   pdf  共12頁(yè) 來(lái)源:   華泰證券
評(píng)級(jí):   增持 作者:   何翩翩
下載權(quán)限:   此報(bào)告為加密報(bào)告
本報(bào)告延續(xù)我們2026年1月12日發(fā)布的《英偉達(dá)吸收Groq定義AI下半場(chǎng)》觀點(diǎn)。彼時(shí)我們指出,英偉達(dá)整合Groq的戰(zhàn)略,與其2020年收購(gòu)Mellanox一脈相承,核心在于吸收人才及將領(lǐng)先的底層IP內(nèi)生化,以補(bǔ)齊架構(gòu)層面的結(jié)構(gòu)性短板。盡管市場(chǎng)普遍預(yù)期英偉達(dá)可能在GTC 2026上發(fā)布一款獨(dú)立的LPU機(jī)架,但我們認(rèn)為僅為權(quán)宜之計(jì)。從長(zhǎng)期戰(zhàn)略視角看,我們預(yù)計(jì),自Feynman架構(gòu)起,Groq的LPU將被納入英偉達(dá)GPU路線圖,并將確定性、低時(shí)延計(jì)算能力以架構(gòu)級(jí)方式嵌入CUDA及GPU軟件棧之中,為正在崛起的Agentic AI時(shí)代鋪墊。我們認(rèn)為,2026年或?yàn)锳gentic AI的元年。英偉達(dá)與Groq的整合,恰逢產(chǎn)業(yè)范式從以吞吐為核心的模型訓(xùn)練階段,轉(zhuǎn)向以低時(shí)延為核心的代理AI部署階段。我們認(rèn)為,在確立大模型訓(xùn)練階段的領(lǐng)先地位后,英偉達(dá)正進(jìn)一步定義AI下半場(chǎng)的架構(gòu)規(guī)則。隨著產(chǎn)業(yè)重心由吞吐驅(qū)動(dòng)的訓(xùn)練轉(zhuǎn)向時(shí)延驅(qū)動(dòng)的代理AI部署,英偉達(dá)已同時(shí)掌握兩種范式下的核心架構(gòu)能力,建立雙重平臺(tái)的技術(shù)壁壘。
  Feynman:順應(yīng)Agentic AI演進(jìn),與Groq恰逢其時(shí)的架構(gòu)融合
  我們認(rèn)為,此次整合在時(shí)間維度上具有明顯的前瞻布局。我們預(yù)計(jì)Feynman將以Chiplet形式,將LPU通過(guò)TSV與SoIC混合鍵合技術(shù),與計(jì)算Die面對(duì)面集成,并在HBM之外引入一層高速SRAM存儲(chǔ)層,專(zhuān)為代理AIChain-of-Thought推理場(chǎng)景優(yōu)化。同時(shí),F(xiàn)eynman采用臺(tái)積電A16制程亦具關(guān)鍵意義。其背面供電設(shè)計(jì)釋放芯片正面空間,為垂直堆疊與高密度集成創(chuàng)造條件,但與此同時(shí)也將對(duì)熱管理與功率管理提出更高要求。我們預(yù)計(jì)Feynman有望于2028年推出,時(shí)間節(jié)點(diǎn)與代理AI商業(yè)化拐點(diǎn)大致重合。在互連層面,Groq的RealScale架構(gòu)在約576顆芯片規(guī)模時(shí)將面臨確定性性能的物理上限。若將LPU封裝于Feynman構(gòu)架內(nèi)部,英偉達(dá)有望繞開(kāi)這一規(guī)模擴(kuò)展的約束,使確定性執(zhí)行層直接繼承NVLink的擴(kuò)展能力,而無(wú)需承受Groq獨(dú)立拓?fù)浣Y(jié)構(gòu)所帶來(lái)的規(guī)模限制。
  CUDA:吸收GroqWare,強(qiáng)化Agentic AI時(shí)代的生態(tài)鎖定
  我們認(rèn)為,軟件層整合同樣至關(guān)重要。GroqWare采用以編譯器靜態(tài)調(diào)度為核心的執(zhí)行模型,而CUDA則以運(yùn)行時(shí)動(dòng)態(tài)調(diào)度為基礎(chǔ),兩者在執(zhí)行哲學(xué)上存在根本差異。如何在不破壞現(xiàn)有生態(tài)的前提下實(shí)現(xiàn)融合,是此次整合的關(guān)鍵所在。我們預(yù)計(jì)英偉達(dá)將從三層架構(gòu)推進(jìn)整合:1)在編譯器層面,將GroqWare的靜態(tài)調(diào)度能力納入CUDA編譯流程,使確定性執(zhí)行能力成為底層編譯能力的一部分;2)在運(yùn)行時(shí)層面,通過(guò)TensorRT作為調(diào)度橋梁,自動(dòng)識(shí)別低批次、低時(shí)延、代理AI推理類(lèi)負(fù)載,并將其分發(fā)至LPU執(zhí)行;3)在生態(tài)層面,以標(biāo)準(zhǔn)CUDA納入LPU能力,使現(xiàn)有深度學(xué)習(xí)框架無(wú)需修改即可調(diào)用相關(guān)算力資源。
  LPU:聚焦低時(shí)延推理場(chǎng)景,而非全部推理負(fù)載
  我們認(rèn)為L(zhǎng)PU并非面向所有推理任務(wù),其結(jié)構(gòu)性?xún)?yōu)勢(shì)主要體現(xiàn)在低時(shí)延或具有人機(jī)交互屬性的代理AI場(chǎng)景。在此類(lèi)場(chǎng)景中,核心瓶頸在于低時(shí)延約束下的內(nèi)存帶寬,而非計(jì)算吞吐能力本身。以大模型推理中的自回歸解碼階段為例,盡管所有推理流程均包含解碼,但在低批次、強(qiáng)時(shí)延約束的在線服務(wù)場(chǎng)景中,請(qǐng)求難以進(jìn)行高效并行聚合,GPU并行計(jì)算能力無(wú)法充分發(fā)揮,系統(tǒng)瓶頸隨之轉(zhuǎn)向內(nèi)存帶寬。我們認(rèn)為,這類(lèi)以低時(shí)延為核心約束的負(fù)載,正是LPU發(fā)揮優(yōu)勢(shì)的典型場(chǎng)景。在多步代理AI任務(wù)中,該特征或進(jìn)一步放大。每一步推理的時(shí)延都會(huì)累積為端到端響應(yīng)時(shí)間,并被用戶(hù)直接感知。我們也認(rèn)為,在這種高度順序化的執(zhí)行鏈條中,LPU所提供的確定性、無(wú)資源爭(zhēng)用的執(zhí)行機(jī)制,相較傳統(tǒng)GPU的動(dòng)態(tài)調(diào)度體系,更具優(yōu)勢(shì)。
  風(fēng)險(xiǎn)提示:技術(shù)落地緩慢、需求不及預(yù)期等。
  
 
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號(hào):蜀ICP備15031742號(hào)-1

正镶白旗| 比如县| 罗甸县| 新田县| 扬州市| 林周县| 景泰县| 开化县| 道真| 辉县市| 清原| 志丹县| 惠州市| 宁晋县| 吴旗县| 红原县| 句容市| 曲阳县| 巴林左旗| 榆社县| 清水河县| 枞阳县| 武乡县| 兴义市| 宝鸡市| 永嘉县| 义乌市| 库尔勒市| 钦州市| 大余县| 克什克腾旗| 西贡区| 尼勒克县| 新密市| 乌鲁木齐县| 襄垣县| 万安县| 湖口县| 中西区| 邵东县| 威宁|