久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频

研報(bào)下載就選股票報(bào)告網(wǎng)
您好,歡迎來(lái)到股票分析報(bào)告網(wǎng)!登錄   忘記密碼   注冊(cè)
>> 甬興證券-計(jì)算機(jī)行業(yè)點(diǎn)評(píng):DeepSeek開(kāi)啟模型平權(quán)時(shí)代,AI應(yīng)用前景可期-250206
上傳日期:   2025/2/8 大?。?/td>   426KB
格式:   pdf  共3頁(yè) 來(lái)源:   甬興證券
評(píng)級(jí):   增持 作者:   夏明達(dá),李行杰
下載權(quán)限:   此報(bào)告為加密報(bào)告
事件概述
  據(jù)IT之家,近日深度求索正式發(fā)布DeekSeek-V3及DeepSeek-R1模型并同步開(kāi)源,前者為6710億參數(shù)的專(zhuān)家混合模型,性能比肩GPT4o和Claude-3.5-Sonnet等世界頂尖閉源模型;后者在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版,其API定價(jià)為每百萬(wàn)輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬(wàn)輸出tokens 16元。
  核心觀點(diǎn)
  DeepSeek-V3:FP8精度以及框架優(yōu)化,助推訓(xùn)練成本“向下”
  據(jù)《DeepSeek-V3 Technical Report》(DeepSeek-AI,2024),針對(duì)V3模型,深度求索引入FP8混合精度訓(xùn)練框架(首次驗(yàn)證其在極大規(guī)模模型上的有效性),通過(guò)FP8計(jì)算和存儲(chǔ)的支持,有效實(shí)現(xiàn)了加速訓(xùn)練和減少GPU內(nèi)存使用;框架方面,深度求索設(shè)計(jì)了DualPipe算法,模型擴(kuò)展后依然可保持固定的通信成本。V3訓(xùn)練經(jīng)濟(jì)效益優(yōu)異,預(yù)訓(xùn)練階段的每萬(wàn)億標(biāo)記僅需180KH800 GPU小時(shí);若假設(shè)H800 GPU租賃價(jià)格為每GPU小時(shí)2美元,總訓(xùn)練成本僅為557.6萬(wàn)美元。
  DeepSeek-R1:后訓(xùn)練(無(wú)SFT)及蒸餾,驗(yàn)證推理能力提升通路
  據(jù)《 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning》(DeepSeek-AI,2025),R1是基于R1-Zero迭代而來(lái),后者基于V3-Base作為基礎(chǔ)模型,并采用GRPO作為RL框架,未經(jīng)過(guò)監(jiān)督微調(diào)(supervised fine-tuning,SFT)作為預(yù)處理步驟,仍展現(xiàn)了卓越的推理能力。R1在R1-Zero的基礎(chǔ)上,融入冷啟動(dòng)數(shù)據(jù)微調(diào)及RL訓(xùn)練后得到,表現(xiàn)達(dá)到OpenAI-o1-1217水平。DeepSeekR1-Zero允許模型探索思維鏈(CoT)以解決復(fù)雜問(wèn)題,亦是首次驗(yàn)證了大模型推理能力提升可以?xún)H通過(guò)RL而無(wú)需SFT,具有較強(qiáng)啟示意義。在蒸餾方面,深度求索亦驗(yàn)證了“大”模型向“小”模型蒸餾所得到的較小密集模型表現(xiàn)優(yōu)異。
  模型平權(quán)時(shí)代到來(lái),AI下游應(yīng)用有望進(jìn)入快速增長(zhǎng)期
  DeepSeek為代表的廠商持續(xù)降低API調(diào)用單價(jià),同時(shí)國(guó)產(chǎn)模型性能持續(xù)提升,AI模型進(jìn)入普惠發(fā)展期,技術(shù)平權(quán)時(shí)代已然到來(lái),下游應(yīng)用側(cè)公司有望以更低成本享受更強(qiáng)基座性能,增益其經(jīng)營(yíng)表現(xiàn),AI應(yīng)用側(cè)有望進(jìn)入高速增長(zhǎng)期。
  投資建議
  DeepSeek引領(lǐng)新一輪LLM性能及成本提質(zhì)增效,有望帶動(dòng)AI應(yīng)用進(jìn)入發(fā)力階段,關(guān)注各垂直行業(yè)AI進(jìn)展,標(biāo)的方面建議關(guān)注科大訊飛、金山辦公、泛微網(wǎng)絡(luò)、福昕軟件、致遠(yuǎn)互聯(lián)、潤(rùn)達(dá)醫(yī)療、焦點(diǎn)科技、潤(rùn)澤科技等。
  風(fēng)險(xiǎn)提示
  產(chǎn)業(yè)發(fā)展不及預(yù)期、政策推進(jìn)力度不及預(yù)期、國(guó)產(chǎn)替代不及預(yù)期。
  
相關(guān)研報(bào)
 
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號(hào):蜀ICP備15031742號(hào)-1