>> 長江證券-軟件與服務(wù)行業(yè)AI產(chǎn)業(yè)跟蹤:DeepSeek-V3.2正式版發(fā)布,關(guān)注大模型商業(yè)化落地進展-251203
| 上傳日期: |
2025/12/3 |
大?。?/td>
| 618KB |
| 格式: |
pdf 共5頁 |
來源: |
長江證券 |
| 評級: |
看好 |
作者: |
宗建樹 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
事件描述 12月1日,DeepSeek-V3.2和DeepSeek-V3.2-Speciale正式發(fā)布。官方網(wǎng)頁端、App和API均已更新為V3.2版本。Speciale版本目前僅以臨時API服務(wù)形式開放,以供社區(qū)評測與研究。 事件評論 定位“為Agent構(gòu)建的推理優(yōu)先模型”,V3.2包含兩個版本:(1)V3.2:是V3.2-Exp的官方繼任者,平衡推理能力與生成長度,作為日常主力模型(Daily Driver),提供GPT5級別的性能;(2)V3.2-Speciale:專攻深度推理能力的極限版本,該版本專為解決復(fù)雜任務(wù)設(shè)計,消耗更多Token。 數(shù)學(xué)編程能力表現(xiàn)突出,Agent評測中達到了當(dāng)前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。技術(shù)報告顯示,DeepSeek-V3.2-Speciale在2025年國際數(shù)學(xué)奧林匹克(IMO)、國際信息學(xué)奧林匹克(IOI)、ICPC世界總決賽及CMO中均取得了金牌級成績,在數(shù)學(xué)編程等多項推理基準(zhǔn)上,全面超越GPT-5 High,略次于Gemini 3.0Pro。 V3.2實現(xiàn)了高計算效率與卓越推理、Agent性能的統(tǒng)一,是首個將思考直接整合到工具使用中的模型,同時支持在思考和非思考模式下使用工具。背后的核心能力與技術(shù)突破來自:(1)DeepSeek Sparse Attention (DSA):模型結(jié)構(gòu)與Exp版本相同,引入高效注意力機制,大幅降低計算復(fù)雜度,并針對長上下文場景進行了優(yōu)化,引入“思維上下文管理”;(2)可擴展強化學(xué)習(xí)框架:通過穩(wěn)健的RL協(xié)議與后訓(xùn)練(post-training)算力擴展,實現(xiàn)了高性能表現(xiàn);(3)大規(guī)模Agent任務(wù)合成管線:涵蓋1800+環(huán)境及8.5萬+復(fù)雜指令,這一合成管線不僅提升了模型在復(fù)雜交互環(huán)境中的遵循度和泛化能力,更讓DeepSeek-V3.2將“思考”直接整合進工具使用(Tool-Use)的模型,同時支持在思考和非思考模式下使用工具。因此,我們認(rèn)為相比于Exp版(實驗版)最大的進化邏輯在于,核心引擎不變,但Agent能力質(zhì)變。 DSA技術(shù)成功落地,實現(xiàn)了速度、成本、智能的均衡。我們認(rèn)為,DeepSeek從V3.2-Exp到V3.2正式版的迭代,本質(zhì)上展示了一條區(qū)別于行業(yè)主流“大模型堆算力擴規(guī)?!钡牡诙窂剑涸谒懔Y源受限的前提下,通過更高效的模型架構(gòu)、更精細(xì)的訓(xùn)練策略以及更開放的開發(fā)生態(tài),實現(xiàn)推理能力的躍遷。對產(chǎn)業(yè)而言,這一模式的可復(fù)制性與成本結(jié)構(gòu)的優(yōu)化,使其具備“以更低邊際成本逼近強智能能力”的潛力,有望在未來的AI原生應(yīng)用、智能體生態(tài)和推理側(cè)市場中形成結(jié)構(gòu)性競爭優(yōu)勢。 2025年DeepSeek已發(fā)布7款模型,開源陣營持續(xù)擴大。后續(xù)展望來看,關(guān)注AI產(chǎn)品發(fā)布超預(yù)期情況與AIAgent落地進展。繼續(xù)看好國產(chǎn)AI鏈、國產(chǎn)算力鏈以及國內(nèi)AI出海,持續(xù)重點推薦鏟子股和卡位優(yōu)勢顯著的巨頭本身。 風(fēng)險提示 1、AI技術(shù)發(fā)展不及預(yù)期; 2、下游應(yīng)用需求不及預(yù)期。
|
|