>> 德邦證券-通信行業(yè)周報:英偉達產(chǎn)品安全存疑,利好國產(chǎn)算力鏈全方位閉環(huán)-250826
| 上傳日期: |
2025/8/26 |
大?。?/td>
| 1391KB |
| 格式: |
pdf 共19頁 |
來源: |
德邦證券 |
| 評級: |
優(yōu)于大市 |
作者: |
李宏濤 |
| 行業(yè)名稱: |
通信 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
1.投資策略 1.1英偉達安全性存疑,或加速國產(chǎn)芯片替代。我們認為,英偉達的安全問題或?qū)⒃斐蓢鴥?nèi)算力芯片供給的真空。鑒于近期我國算力卡的進步,相關(guān)產(chǎn)業(yè)鏈條將有望迎來快速發(fā)展。1、英偉達算力芯片被曝出存在嚴重安全問題。為維護中國用戶網(wǎng)絡(luò)安全、數(shù)據(jù)安全,依據(jù)有關(guān)法律規(guī)定,國家網(wǎng)信辦31日約談了英偉達公司,要求英偉達公司就對華銷售的H20算力芯片漏洞后門安全風險問題進行說明并提交相關(guān)證明材料。這對于英偉達在中國市場的后續(xù)訂單或有非常惡劣的影響。2、IDC副總裁周震剛表示,2024年中國數(shù)據(jù)中心加速卡中已有半數(shù)以上是推理卡。且2024年國內(nèi)數(shù)據(jù)中心加速卡市場中,國產(chǎn)算力占比大約三成,周震剛預計2025年上半年占比應(yīng)該會超四成。中國加速計算服務(wù)器市場出貨量2024年同比增長97.3%,預計2025年增長52.9%。3、礪算科技已發(fā)布GPU芯片7G 100及其首款顯卡產(chǎn)品Lisuan eXtreme LX。在3DMark Fire Strike測試中,消費級的礪算7G106得分為26800分,大致相當于英偉達RTX 3060 Ti GDDR6X,或者AMDRX 7600。在游戲測試中,礪算科技分別展示了該顯卡游玩《黑神話:悟空》、《古墓麗影:暗影》以及《明末:淵虛之羽》的畫面。在《黑神話:悟空》中,礪算科技宣稱平均游戲幀率大于70,分辨率為1080P,畫質(zhì)為高。 1.2 UE8M0 FP8推動軟硬協(xié)同生態(tài)閉環(huán)加速落地。我們認為,DeepSeek -V3.1推動了國產(chǎn)算力卡對FP8精度的支持,有望極大程度推動國產(chǎn)算例卡的在大模型領(lǐng)域的“易用性”。國產(chǎn)算力卡應(yīng)用有望迎來質(zhì)的飛躍。1、DeepSeek明確指出其V3.1版本使用了UE8M0 FP8 Scale的參數(shù)精度,并在評論區(qū)直接聲明UE8M0FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。2、FP8是一種8位浮點數(shù)表示法,相對于傳統(tǒng)的FP16、FP32,它顯著減少了存儲,提高了計算吞吐。TransformerEngine應(yīng)用混合的FP8和FP16 /BF16精度格式,大幅加速Transformer訓練,同時保持準確性。FP8也可大幅提升大型語言模型推理的速度,性能提升高達Ampere架構(gòu)的30倍。3、英偉達GPU無論是Hopper架構(gòu)、還是AdaLovelace架構(gòu)都支持Transformer Engine進行FP8的訓練和推理。4、谷歌、零一萬物等技術(shù)團隊均采用FP8實現(xiàn)AI模型推理加速。5、國產(chǎn)算力卡支持FP8的傳統(tǒng)技術(shù)方案將FP8模型提前轉(zhuǎn)換為FP16或BF16格式才能運行,這將導致性能損失。 1.3 AI加持帶來業(yè)績提升,下半年資本開支有望放量。我們認為,我國以運營商及云廠商為代表的算力需求方在算力基礎(chǔ)設(shè)施上的需求明確,資本開支也有望在下半年持續(xù)投放。1、三大運營商半年報算力相關(guān)業(yè)務(wù)收入增長良好①中國電信云服務(wù)收入為573億元,同比增長3.8%,智能服務(wù)收入63億元,同比增長89.4%。②中國聯(lián)通云服務(wù)收入為376億元,同比增長4.6%,數(shù)據(jù)中心收入為144億元同比增長9.4%。2、中國移動云服務(wù)收入561億元,同比增長11.3%。2、三大運營商上半年資本開支謹慎,下半年將迎投資放量。2025年上半年,中國電信、中國聯(lián)通、中國移動資本開支占全年開支比分別為40.9%、36.7%和38.6%。三大運營商上半年資本開支占全年資本開支比為38.9%??傤~同比下降16.5%,中國電信下降27.5%。三運營商在業(yè)績發(fā)布會上均表示,將保持年初資本開支計劃。據(jù)財報數(shù)據(jù)推算,中國電信、中國聯(lián)通、中國移動下半年資本開支分別為494億元、348億元和928億元,占全年資本開支比分別為59.1%、63.3%和61.4%。3、國內(nèi)云廠商騰訊今年中報業(yè)績良好,CEO表示騰訊在AI領(lǐng)域持續(xù)投入并從中獲益。在保持三大核心業(yè)務(wù)堅實增長的同時,騰訊持續(xù)加碼AI戰(zhàn)略投入,二季度AI研發(fā)投入202.5億元,同比同比增長17%。資本開支191.1億元,同比增長119%。 2.行業(yè)要聞 2.1 DeepSeek-V3.1發(fā)布,針對國產(chǎn)芯片設(shè)計。據(jù)微信公眾號DeepSeek,8月21日DeepSeek-V3.1正式發(fā)布。升級包含以下主要變化:①混合推理架構(gòu):一個模型同時支持思考模式與非思考模式;②更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案;③更強的Agent能力:通過Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。在工具調(diào)用/智能體支持增強:1、編程智能體:在代碼修復測評SWE與命令行終端環(huán)境下的復雜任務(wù)(Terminal-Bench)測試中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明顯提高。2、搜索智能體:DeepSeek-V3.1在多項搜索評測指標上取得了較大提升。在需要多步推理的復雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上,DeepSeek-V3.1性能已大幅領(lǐng)先R1-0528。3、思考效率提升:經(jīng)過思維鏈壓縮訓練后,V3.1-Think在輸出token數(shù)減少20%-50%的情況下,各項任務(wù)的平均表現(xiàn)與R1-0528持平。同時,V3.1在非思考模式下的輸出長度也得到了有效控制,相比于DeepSeek-V3-0324,能夠在輸出長度明顯減少的情況下保持相同的模型性能。需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。另
|
|