久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频

研報(bào)下載就選股票報(bào)告網(wǎng)
您好,歡迎來(lái)到股票分析報(bào)告網(wǎng)!登錄   忘記密碼   注冊(cè)
>> 山西證券-計(jì)算機(jī)行業(yè):DeepSeek有望推動(dòng)AI應(yīng)用生態(tài)加速繁榮-250206
上傳日期:   2025/2/7 大小:   431KB
格式:   pdf  共4頁(yè) 來(lái)源:   山西證券
評(píng)級(jí):   領(lǐng)先大市 作者:   方聞千
行業(yè)名稱:   計(jì)算機(jī)
下載權(quán)限:   無(wú)限制-登錄即可下載
事件描述:
  1月20日,DeepSeek R1模型正式發(fā)布,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的性能比肩OpenAI o1正式版,目前已在網(wǎng)頁(yè)端、APP端和API全面上線。DeepSeek在開(kāi)源DeepSeek R1 Zero和DeepSeek R1兩個(gè)660B模型的同時(shí),蒸餾并開(kāi)源了6個(gè)小模型,其中32B和70B模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1 mini的效果。
  事件點(diǎn)評(píng):
  DeepSeek R1和V3模型在強(qiáng)化學(xué)習(xí)、MoE架構(gòu)、MTP、PTX編程等多個(gè)維度進(jìn)行全方位優(yōu)化,整體性能對(duì)齊國(guó)際頂尖大模型。DeepSeek模型優(yōu)異的性能主要得益于其團(tuán)隊(duì)在多個(gè)維度進(jìn)行系統(tǒng)性優(yōu)化,其中,1)強(qiáng)化學(xué)習(xí):DeepSeek R1模型直接從V3基礎(chǔ)模型實(shí)施強(qiáng)化學(xué)習(xí)訓(xùn)練,成為首個(gè)無(wú)監(jiān)督微調(diào)的強(qiáng)化學(xué)習(xí)訓(xùn)練模型,在激發(fā)模型自我學(xué)習(xí)能力的同時(shí)降低數(shù)據(jù)標(biāo)注的成本;2)MoE:相比于GShard等傳統(tǒng)MoE架構(gòu),DeepSeek MoE專家粒度更細(xì),其擁有256個(gè)路由專家和1個(gè)共享專家,能夠大幅提升模型性能;3)MTP:即多token預(yù)測(cè),通過(guò)提前預(yù)測(cè)部分輸出token,DeepSeek模型效率得到顯著提升;4)PTX編程:DeepSeek開(kāi)創(chuàng)性地采用類似匯編語(yǔ)言的英偉達(dá)并行線程執(zhí)行(PTX)編程,而非完全依賴CUDA,PTX作為一種非常接近底層硬件的指令集架構(gòu),使DeepSeek團(tuán)隊(duì)能夠?qū)崿F(xiàn)更細(xì)粒度的優(yōu)化操作。此外,DeepSeek還支持FP8精度訓(xùn)練、使用多頭潛在注意力機(jī)制等實(shí)現(xiàn)高效訓(xùn)練和推理。
  對(duì)應(yīng)用的影響:模型性能提升疊加調(diào)用成本下降,AI應(yīng)用發(fā)展有望加速。憑借架構(gòu)創(chuàng)新和工程優(yōu)化,DeepSeek用更少的數(shù)據(jù)和更低的成本就研發(fā)出性能比肩OpenAI o1的模型,目前包括國(guó)內(nèi)的百度、騰訊及海外的微軟、亞馬遜等在內(nèi)的大型CSP均已接入DeepSeek模型,通過(guò)其云平臺(tái)向AI應(yīng)用開(kāi)發(fā)者及用戶輸出模型能力。同時(shí),DeepSeek R1的使用成本大幅低于o1模型,DeepSeek R1 API的服務(wù)定價(jià)為每百萬(wàn)輸入tokens 1元(緩存命中)/4元(緩存未命中)、每百萬(wàn)輸出tokens 16元,而o1的輸入價(jià)格為每百萬(wàn)tokens55元(緩存命中)/110元(緩存未命中),輸出價(jià)格為每百萬(wàn)tokens 438元?;贒eepSeek等低成本的高性能模型,上層AI應(yīng)用的開(kāi)發(fā)及落地有望加速,根據(jù)AI產(chǎn)品榜數(shù)據(jù),DeepSeek APP上線20天日活突破2000萬(wàn),已成為全球增速最快的AI應(yīng)用,同時(shí),部分初創(chuàng)公司已開(kāi)始從OpenAI模型向DeepSeek切換,其中,企業(yè)級(jí)AI代理開(kāi)發(fā)商SuperFocus將從GPT-4o等模型轉(zhuǎn)向DeepSeek。
  對(duì)算力的影響:推理算力需求有望爆發(fā),國(guó)產(chǎn)芯片廠商將充分受益。在訓(xùn)練端,雖然DeepSeek V3論文中公布的557.6萬(wàn)美元訓(xùn)練成本僅考慮了正式訓(xùn)練階段,不包括與此前架構(gòu)、算法和數(shù)據(jù)研究及消融實(shí)驗(yàn)相關(guān)的成本,但我們認(rèn)為,基于DeepSeek的算法創(chuàng)新和工程優(yōu)化效果顯著,其總訓(xùn)練成本仍將顯著低于其他主流模型,而這將推動(dòng)中小型大模型廠商沿著DeepSeek的路徑再次大力投入模型研發(fā),從而助推訓(xùn)練算力需求持續(xù)增長(zhǎng);在推理端,DeepSeek有望促進(jìn)AI應(yīng)用發(fā)展提速,進(jìn)而顯著刺激推理算力需求。由于AI推理對(duì)單個(gè)集群的算力要求遠(yuǎn)低于訓(xùn)練,而更關(guān)注推理效率和性價(jià)比,ASIC以及國(guó)產(chǎn)芯片有望逐步搶占英偉達(dá)GPU的份額,目前華為昇騰、海光信息、寒武紀(jì)、昆侖芯等國(guó)產(chǎn)AI芯片第一梯隊(duì)廠商正加速追趕英偉達(dá),其中,昇騰910B已基本可對(duì)標(biāo)A100,成為國(guó)內(nèi)互聯(lián)網(wǎng)廠商國(guó)產(chǎn)訓(xùn)練芯片的首選,而寒武紀(jì)、海光信息、昆侖芯新一代主力產(chǎn)品思元590、深算三號(hào)、昆侖芯3代未來(lái)有望對(duì)H20形成替代。
  投資建議:DeepSeek在保持高性能的同時(shí)降低使用成本,將加速AI應(yīng)用發(fā)展,進(jìn)而推動(dòng)推理算力需求快速增長(zhǎng),同時(shí),基于DeepSeek蒸餾的小模型將加快模型在端側(cè)場(chǎng)景的落地,因此重點(diǎn)關(guān)注1)各領(lǐng)域的頭部AI應(yīng)用廠商,包括金山辦公、漢得信息、彩訊股份、萬(wàn)興科技、三六零、新致軟件、泛微網(wǎng)絡(luò)、能科科技、潤(rùn)達(dá)醫(yī)療等;2)國(guó)產(chǎn)算力芯片廠商,包括海光信息、寒武紀(jì)等;3)AI服務(wù)器廠商,包括四川長(zhǎng)虹、神州數(shù)碼、拓維信息、浪潮信息、中科曙光、華勤技術(shù)等;4)算力云廠商,包括青云科技、優(yōu)刻得等;5)端側(cè)硬件廠商,包括美格智能、移遠(yuǎn)通信、廣和通、樂(lè)鑫科技、中科藍(lán)訊、恒玄科技等。
  風(fēng)險(xiǎn)提示:AI產(chǎn)品落地不及預(yù)期,行業(yè)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn),技術(shù)研發(fā)進(jìn)展不及預(yù)期。
  
相關(guān)行業(yè)報(bào)告
 
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號(hào):蜀ICP備15031742號(hào)-1