>> 西部證券-計算機(jī)行業(yè)周觀點(diǎn)第46期:英偉達(dá)部分收編Groq,或?yàn)檠a(bǔ)全推理芯片拼圖-251228
| 上傳日期: |
2025/12/28 |
大?。?/td>
| 236KB |
| 格式: |
pdf 共2頁 |
來源: |
西部證券 |
| 評級: |
-- |
作者: |
鄭宏達(dá),盧可欣 |
| 行業(yè)名稱: |
計算機(jī) |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
12月25日,據(jù)Business insider、CNBC等外媒報道,英偉達(dá)已經(jīng)同意以約200億美元的現(xiàn)金,收購成立9年的AI芯片公司Groq的核心資產(chǎn)。英偉達(dá)此次并非采取傳統(tǒng)的收購標(biāo)的公司100%股權(quán)的方式。根據(jù)Groq官方博客與英偉達(dá)的說法,這是一項(xiàng)非排他性授權(quán)協(xié)議,其主要內(nèi)容包括:1)業(yè)務(wù)分割:英偉達(dá)將獲得Groq的所有資產(chǎn)與技術(shù)授權(quán),但Groq旗下的GroqCloud云端業(yè)務(wù)并不在交易范圍內(nèi),將維持獨(dú)立運(yùn)作。2)人才吸納:作為該協(xié)議的一部分,Groq的創(chuàng)始人Jonathan Ross、Groq的總裁Sunny Madra以及Groq團(tuán)隊(duì)的其他成員將加入英偉達(dá),以幫助推進(jìn)和擴(kuò)大授權(quán)技術(shù)的規(guī)模。3)公司獨(dú)立性:Groq將繼續(xù)作為一家“獨(dú)立公司”運(yùn)作,由原首席財務(wù)官Simon Edwards出任新任首席執(zhí)行官,GroqCloud將繼續(xù)正常運(yùn)營,不會中斷。 Groq成立于2016年,其AI芯片產(chǎn)品旨在實(shí)現(xiàn)高吞吐量、低成本的推理,而不是訓(xùn)練。Groq核心團(tuán)隊(duì)來自谷歌TPU工程團(tuán)隊(duì),創(chuàng)始人Jonathan Ross是谷歌TPU項(xiàng)目的核心研發(fā)人員。在成立之初,Groq就確定了“編譯器優(yōu)先”的策略,即由官方提供一個幫助客戶拆分計算任務(wù)、最大化并行計算的軟件,提升推理效率。Groq還提出“LPU芯片”概念,即“語言處理單元”,專門用于大語言模型推理任務(wù)。Groq表示,LPU芯片速度比H100快10倍,成本僅為其十分之一,以滿足全球企業(yè)對“實(shí)時、低延遲”的AI推理服務(wù)的渴求。值得注意的是,在芯片內(nèi)存設(shè)計方面,LPU架構(gòu)摒棄了外部HBM,直接采用片上SRAM,可以有效較低推理成本及延遲,Groq披露的數(shù)據(jù)顯示,Groq芯片的片上內(nèi)存帶寬高達(dá)80TB/s以上,而目前頂尖GPU采用的HBM帶寬僅約為8TB/s。 大模型推理需求高增,英偉達(dá)收編Groq或?yàn)檠a(bǔ)全推理芯片拼圖。2025年,各大廠日均tokens高速增長,12月18日,在Force大會現(xiàn)場,火山引擎總裁譚待宣布:截至今年12月,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍。市場上對于專門處理推理工作負(fù)載的專用芯片需求正在不斷增長。推理芯片側(cè),由于對成本和能效的極致追求,技術(shù)路線呈現(xiàn)出百花齊放的態(tài)勢,Cerebras、Groq以及各大云廠商自研芯片與英偉達(dá)差距并沒有訓(xùn)練端大。通過部分“收編”Groq,英偉達(dá)不僅可以整合了一個潛在強(qiáng)力技術(shù)對手,規(guī)避反壟斷風(fēng)險,還有望在未來的AI產(chǎn)能大戰(zhàn)中,開辟一條不依賴HBM供應(yīng)鏈的新戰(zhàn)線,專門針對高頻、低延遲推理市場。 推薦:1)推理芯片:寒武紀(jì)、海光信息;2)服務(wù)器:中科曙光、浪潮信息、神州數(shù)碼、華勤技術(shù)。 風(fēng)險提示:AI技術(shù)進(jìn)展不及預(yù)期、行業(yè)競爭加劇、國際環(huán)境發(fā)生變化。
|
|