欢乐颂小说txt,欢乐颂小说在线阅读

>> 國投證券-計算機行業(yè)周報：DeepSeek-V3模型發(fā)布，AI軍備競賽持續(xù)-241230

上傳日期：	2024/12/30	大小：	813KB
格式：	pdf 共7頁	來源：	國投證券
評級：	領(lǐng)先大市	作者：	趙陽,夏瀛韜
行業(yè)名稱：	計算機
下載權(quán)限：	無限制-登錄即可下載

DeepSeek-V3模型發(fā)布，極致性價比打破算力制約
　　2024年12月26日，幻方量化旗下的公司深度求索（DeepSeek）發(fā)布DeepSeek-V3版本大模型。根據(jù)官方的技術(shù)報告披露，DeepSeek-V3模型采用MoE架構(gòu)，參數(shù)量達到671B，具備極致的性價比：
　　1）經(jīng)濟效益凸顯，打破算力制約：根據(jù)技術(shù)報告披露，DeepSeek-V3在預訓練階段，在每萬億tokens上訓練僅需18萬H800 GPU hour，即擁有2048個H800 GPU的集群上僅需3.7天。因此，預訓練階段在不到兩個月的時間內(nèi)完成，耗時266.4萬GPU hour。結(jié)合11.9萬GPU hour的上下文長度擴展和5000 GPU hour的后訓練，DeepSeek-V3的完整訓練僅需278.8萬GPU hour。技術(shù)文檔假設H800 GPU的租用價格為每GPU hour 2美元，該模型的總訓練成本僅為557.6萬美元。這一訓練成本大大低于其他的海外模型如Llama-3.1、GPT-4o、Claude-3.5等，具有非常強的經(jīng)濟性。
　　2）極致性價比，成本下降同時能力提升：根據(jù)技術(shù)報告披露，DeepSeek-V3率先采用了無輔助損失的負載均衡策略，最大限度地減少了因鼓勵負載均衡而導致的性能下降。在預訓練階段，模型設計了一個FP8混合精度訓練框架，通過算法、框架和硬件的協(xié)同設計，克服了跨節(jié)點MoE訓練中的通信瓶頸，實現(xiàn)了近乎完全的計算通信重疊。這顯著提高了訓練效率并降低了訓練成本。在后訓練階段，將推理能力從DeepSeek R1系列中的模型提取到DeepSeek-V3中。DeepSeek-V3的多項評測成績超越Qwen2.5-72B和Llama-3.1-405B等其他開源模型，并在性能上和頭部的閉源模型GPT-4o以及Claude-3.5-Sonne。
　　利好國產(chǎn)算力和國內(nèi)AI應用。我們認為DeepSeek-V3的發(fā)布，表明在有限算力的情況下，可以實現(xiàn)較好的模型能力，利好國產(chǎn)算力需求的提升，以及加速國內(nèi)AI應用的發(fā)展，關(guān)注國產(chǎn)算力：寒武紀、海光信息、中科曙光、神州數(shù)碼、浪潮信息等；國內(nèi)AI應用：鼎捷數(shù)智、漢得信息、金山辦公、科大訊飛、邁富時、佳發(fā)教育、萬興科技、美圖公司等。
　　小米加大AI模型投入，軍備競賽持續(xù)
　　2024年12月26日，根據(jù)財聯(lián)社報告，小米正在著手搭建自己的GPU萬卡集群，將對AI大模型大力投入。我們認為小米入局表明AI軍備競賽持續(xù)，一方面利好算力投入，另一方面AI手機、智能駕駛、AI可穿戴設備等端側(cè)AI或?qū)⒊蔀樾∶字攸c布局的領(lǐng)域，建議關(guān)注相應投資機會。
　　風險提示：1）宏觀經(jīng)濟變化影響企業(yè)信息化支出；2）財政與貨幣政策低于預期；3）供應鏈波動加大，影響科技產(chǎn)業(yè)發(fā)展。
　　
　　

相關(guān)行業(yè)報告

久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频