久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频

研報下載就選股票報告網(wǎng)
您好,歡迎來到股票分析報告網(wǎng)!登錄   忘記密碼   注冊
>> 國投證券-計算機行業(yè)周報:DeepSeek-V3模型發(fā)布,AI軍備競賽持續(xù)-241230
上傳日期:   2024/12/30 大小:   813KB
格式:   pdf  共7頁 來源:   國投證券
評級:   領(lǐng)先大市 作者:   趙陽,夏瀛韜
行業(yè)名稱:   計算機
下載權(quán)限:   無限制-登錄即可下載
DeepSeek-V3模型發(fā)布,極致性價比打破算力制約
  2024年12月26日,幻方量化旗下的公司深度求索(DeepSeek)發(fā)布DeepSeek-V3版本大模型。根據(jù)官方的技術(shù)報告披露,DeepSeek-V3模型采用MoE架構(gòu),參數(shù)量達到671B,具備極致的性價比:
  1)經(jīng)濟效益凸顯,打破算力制約:根據(jù)技術(shù)報告披露,DeepSeek-V3在預訓練階段,在每萬億tokens上訓練僅需18萬H800 GPU hour,即擁有2048個H800 GPU的集群上僅需3.7天。因此,預訓練階段在不到兩個月的時間內(nèi)完成,耗時266.4萬GPU hour。結(jié)合11.9萬GPU hour的上下文長度擴展和5000 GPU hour的后訓練,DeepSeek-V3的完整訓練僅需278.8萬GPU hour。技術(shù)文檔假設H800 GPU的租用價格為每GPU hour 2美元,該模型的總訓練成本僅為557.6萬美元。這一訓練成本大大低于其他的海外模型如Llama-3.1、GPT-4o、Claude-3.5等,具有非常強的經(jīng)濟性。
  2)極致性價比,成本下降同時能力提升:根據(jù)技術(shù)報告披露,DeepSeek-V3率先采用了無輔助損失的負載均衡策略,最大限度地減少了因鼓勵負載均衡而導致的性能下降。在預訓練階段,模型設計了一個FP8混合精度訓練框架,通過算法、框架和硬件的協(xié)同設計,克服了跨節(jié)點MoE訓練中的通信瓶頸,實現(xiàn)了近乎完全的計算通信重疊。這顯著提高了訓練效率并降低了訓練成本。在后訓練階段,將推理能力從DeepSeek R1系列中的模型提取到DeepSeek-V3中。DeepSeek-V3的多項評測成績超越Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上和頭部的閉源模型GPT-4o以及Claude-3.5-Sonne。
  利好國產(chǎn)算力和國內(nèi)AI應用。我們認為DeepSeek-V3的發(fā)布,表明在有限算力的情況下,可以實現(xiàn)較好的模型能力,利好國產(chǎn)算力需求的提升,以及加速國內(nèi)AI應用的發(fā)展,關(guān)注國產(chǎn)算力:寒武紀、海光信息、中科曙光、神州數(shù)碼、浪潮信息等;國內(nèi)AI應用:鼎捷數(shù)智、漢得信息、金山辦公、科大訊飛、邁富時、佳發(fā)教育、萬興科技、美圖公司等。
  小米加大AI模型投入,軍備競賽持續(xù)
  2024年12月26日,根據(jù)財聯(lián)社報告,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入。我們認為小米入局表明AI軍備競賽持續(xù),一方面利好算力投入,另一方面AI手機、智能駕駛、AI可穿戴設備等端側(cè)AI或?qū)⒊蔀樾∶字攸c布局的領(lǐng)域,建議關(guān)注相應投資機會。
  風險提示:1)宏觀經(jīng)濟變化影響企業(yè)信息化支出;2)財政與貨幣政策低于預期;3)供應鏈波動加大,影響科技產(chǎn)業(yè)發(fā)展。
  
  
 
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號:蜀ICP備15031742號-1

年辖:市辖区| 汉寿县| 马龙县| 上饶县| 天津市| 米脂县| 雅江县| 内黄县| 同德县| 毕节市| 新蔡县| 彭山县| 淮安市| 栾川县| 双流县| 宁明县| 遂溪县| 布尔津县| 淮滨县| 云南省| 正安县| 龙海市| 长乐市| 太和县| 阿瓦提县| 晋江市| 静宁县| 祁东县| 竹山县| 新巴尔虎右旗| 馆陶县| 文昌市| 祥云县| 怀来县| 连江县| 隆昌县| 耒阳市| 抚松县| 临武县| 宣威市| 崇阳县|