完美世界辰东,言情小说君子以泽,怎么写网络小说

>> 山西證券-計(jì)算機(jī)行業(yè)：DeepSeek有望推動(dòng)AI應(yīng)用生態(tài)加速繁榮-250206

上傳日期：	2025/2/7	大小：	431KB
格式：	pdf 共4頁(yè)	來(lái)源：	山西證券
評(píng)級(jí)：	領(lǐng)先大市	作者：	方聞千
行業(yè)名稱：	計(jì)算機(jī)
下載權(quán)限：	無(wú)限制-登錄即可下載

事件描述：
　　1月20日，DeepSeek R1模型正式發(fā)布，在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的性能比肩OpenAI o1正式版，目前已在網(wǎng)頁(yè)端、APP端和API全面上線。DeepSeek在開(kāi)源DeepSeek R1 Zero和DeepSeek R1兩個(gè)660B模型的同時(shí)，蒸餾并開(kāi)源了6個(gè)小模型，其中32B和70B模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1 mini的效果。
　　事件點(diǎn)評(píng)：
　　DeepSeek R1和V3模型在強(qiáng)化學(xué)習(xí)、MoE架構(gòu)、MTP、PTX編程等多個(gè)維度進(jìn)行全方位優(yōu)化，整體性能對(duì)齊國(guó)際頂尖大模型。DeepSeek模型優(yōu)異的性能主要得益于其團(tuán)隊(duì)在多個(gè)維度進(jìn)行系統(tǒng)性優(yōu)化，其中，1）強(qiáng)化學(xué)習(xí)：DeepSeek R1模型直接從V3基礎(chǔ)模型實(shí)施強(qiáng)化學(xué)習(xí)訓(xùn)練，成為首個(gè)無(wú)監(jiān)督微調(diào)的強(qiáng)化學(xué)習(xí)訓(xùn)練模型，在激發(fā)模型自我學(xué)習(xí)能力的同時(shí)降低數(shù)據(jù)標(biāo)注的成本；2）MoE：相比于GShard等傳統(tǒng)MoE架構(gòu)，DeepSeek MoE專家粒度更細(xì)，其擁有256個(gè)路由專家和1個(gè)共享專家，能夠大幅提升模型性能；3）MTP：即多token預(yù)測(cè)，通過(guò)提前預(yù)測(cè)部分輸出token，DeepSeek模型效率得到顯著提升；4）PTX編程：DeepSeek開(kāi)創(chuàng)性地采用類似匯編語(yǔ)言的英偉達(dá)并行線程執(zhí)行（PTX）編程，而非完全依賴CUDA，PTX作為一種非常接近底層硬件的指令集架構(gòu)，使DeepSeek團(tuán)隊(duì)能夠?qū)崿F(xiàn)更細(xì)粒度的優(yōu)化操作。此外，DeepSeek還支持FP8精度訓(xùn)練、使用多頭潛在注意力機(jī)制等實(shí)現(xiàn)高效訓(xùn)練和推理。
　　對(duì)應(yīng)用的影響：模型性能提升疊加調(diào)用成本下降，AI應(yīng)用發(fā)展有望加速。憑借架構(gòu)創(chuàng)新和工程優(yōu)化，DeepSeek用更少的數(shù)據(jù)和更低的成本就研發(fā)出性能比肩OpenAI o1的模型，目前包括國(guó)內(nèi)的百度、騰訊及海外的微軟、亞馬遜等在內(nèi)的大型CSP均已接入DeepSeek模型，通過(guò)其云平臺(tái)向AI應(yīng)用開(kāi)發(fā)者及用戶輸出模型能力。同時(shí)，DeepSeek R1的使用成本大幅低于o1模型，DeepSeek R1 API的服務(wù)定價(jià)為每百萬(wàn)輸入tokens 1元（緩存命中）/4元（緩存未命中）、每百萬(wàn)輸出tokens 16元，而o1的輸入價(jià)格為每百萬(wàn)tokens55元（緩存命中）/110元（緩存未命中），輸出價(jià)格為每百萬(wàn)tokens 438元?；贒eepSeek等低成本的高性能模型，上層AI應(yīng)用的開(kāi)發(fā)及落地有望加速，根據(jù)AI產(chǎn)品榜數(shù)據(jù)，DeepSeek APP上線20天日活突破2000萬(wàn)，已成為全球增速最快的AI應(yīng)用，同時(shí)，部分初創(chuàng)公司已開(kāi)始從OpenAI模型向DeepSeek切換，其中，企業(yè)級(jí)AI代理開(kāi)發(fā)商SuperFocus將從GPT-4o等模型轉(zhuǎn)向DeepSeek。
　　對(duì)算力的影響：推理算力需求有望爆發(fā)，國(guó)產(chǎn)芯片廠商將充分受益。在訓(xùn)練端，雖然DeepSeek V3論文中公布的557.6萬(wàn)美元訓(xùn)練成本僅考慮了正式訓(xùn)練階段，不包括與此前架構(gòu)、算法和數(shù)據(jù)研究及消融實(shí)驗(yàn)相關(guān)的成本，但我們認(rèn)為，基于DeepSeek的算法創(chuàng)新和工程優(yōu)化效果顯著，其總訓(xùn)練成本仍將顯著低于其他主流模型，而這將推動(dòng)中小型大模型廠商沿著DeepSeek的路徑再次大力投入模型研發(fā)，從而助推訓(xùn)練算力需求持續(xù)增長(zhǎng)；在推理端，DeepSeek有望促進(jìn)AI應(yīng)用發(fā)展提速，進(jìn)而顯著刺激推理算力需求。由于AI推理對(duì)單個(gè)集群的算力要求遠(yuǎn)低于訓(xùn)練，而更關(guān)注推理效率和性價(jià)比，ASIC以及國(guó)產(chǎn)芯片有望逐步搶占英偉達(dá)GPU的份額，目前華為昇騰、海光信息、寒武紀(jì)、昆侖芯等國(guó)產(chǎn)AI芯片第一梯隊(duì)廠商正加速追趕英偉達(dá)，其中，昇騰910B已基本可對(duì)標(biāo)A100，成為國(guó)內(nèi)互聯(lián)網(wǎng)廠商國(guó)產(chǎn)訓(xùn)練芯片的首選，而寒武紀(jì)、海光信息、昆侖芯新一代主力產(chǎn)品思元590、深算三號(hào)、昆侖芯3代未來(lái)有望對(duì)H20形成替代。
　　投資建議：DeepSeek在保持高性能的同時(shí)降低使用成本，將加速AI應(yīng)用發(fā)展，進(jìn)而推動(dòng)推理算力需求快速增長(zhǎng)，同時(shí)，基于DeepSeek蒸餾的小模型將加快模型在端側(cè)場(chǎng)景的落地，因此重點(diǎn)關(guān)注1）各領(lǐng)域的頭部AI應(yīng)用廠商，包括金山辦公、漢得信息、彩訊股份、萬(wàn)興科技、三六零、新致軟件、泛微網(wǎng)絡(luò)、能科科技、潤(rùn)達(dá)醫(yī)療等；2）國(guó)產(chǎn)算力芯片廠商，包括海光信息、寒武紀(jì)等；3）AI服務(wù)器廠商，包括四川長(zhǎng)虹、神州數(shù)碼、拓維信息、浪潮信息、中科曙光、華勤技術(shù)等；4）算力云廠商，包括青云科技、優(yōu)刻得等；5）端側(cè)硬件廠商，包括美格智能、移遠(yuǎn)通信、廣和通、樂(lè)鑫科技、中科藍(lán)訊、恒玄科技等。
　　風(fēng)險(xiǎn)提示：AI產(chǎn)品落地不及預(yù)期，行業(yè)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn)，技術(shù)研發(fā)進(jìn)展不及預(yù)期。
　　

相關(guān)行業(yè)報(bào)告

久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频