>> 興業(yè)證券-計算機行業(yè)DeepSeek:加速迭代的開源大模型引領(lǐng)者-260213
| 上傳日期: |
2026/2/13 |
大小: |
1509KB |
| 格式: |
pdf 共19頁 |
來源: |
興業(yè)證券 |
| 評級: |
推薦 |
作者: |
蔣佳霖 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
投資要點: DeepSeek:長期主義,引領(lǐng)開源模型生態(tài)。1)引領(lǐng)開源模型生態(tài),重塑AI產(chǎn)業(yè)格局。深度求索(DeepSeek)于2023年7月正式成立,由梁文鋒旗下的量化投資機構(gòu)幻方量化設(shè)立。2025年1月20日,推理模型DeepSeek-R1憑借更低的訓(xùn)練成本以及領(lǐng)先的模型能力,打破國外模型的壟斷地位,加速AI技術(shù)平權(quán),深刻影響了全球AI產(chǎn)業(yè)格局。2)組織架構(gòu)扁平,團隊年輕化。DeepSeek團隊規(guī)模不到140人,組織架構(gòu)扁平,核心技術(shù)人員主要來自國內(nèi)頂尖高校。3)估值方面:深度求索堅守長期主義,不以短期商業(yè)利益為導(dǎo)向,至今未進行過外部融資,截至2025年9月30日,DeepSeek估值預(yù)計達到1.05萬億元。 復(fù)盤:低成本部署,推動AI應(yīng)用落地“奇點”。DeepSeek持續(xù)推動模型訓(xùn)推成本優(yōu)化,在算力資源有限的情況下突破模型的數(shù)學(xué)、代碼、復(fù)雜推理能力上限,推動垂直場景及端側(cè)AI應(yīng)用落地。1)DeepSeek-V3:極致降本,指明模型進化第二路徑。2024年12月,公司推出DeepSeek-V3,訓(xùn)練成本僅557萬美元,性能表現(xiàn)比肩GPT-4。DeepSeekV3采用了自研MoE架構(gòu)、多頭潛在注意力(MLA)機制、FP8混合精度技術(shù)、多token預(yù)測等核心技術(shù),大幅降低了模型的訓(xùn)練及推理成本。2)DeepSeek-R1:推理能力領(lǐng)先,推動AI應(yīng)用落地。2025年1月,公司發(fā)布推理模型DeepSeek-R1正式版,推理性能對齊OpenAI-o1,模型可以低成本私有化部署,很大程度上推動了金融、醫(yī)療、政務(wù)等垂直場景以及端側(cè)AI的應(yīng)用落地。 展望:V4有望2月發(fā)布,應(yīng)用生態(tài)潛力較大。1)模型:關(guān)注V4模型降本及編程能力提升。根據(jù)The Information的報道,DeepSeek有望在2月中旬發(fā)布新一代旗艦?zāi)P蚔4,內(nèi)部測試顯示V4的代碼生成和處理能力,超越了Claude和GPT系列模型。根據(jù)近期DeepSeek對于mHC、Engram、DeepSeek OCR-2等技術(shù)更新,預(yù)計后續(xù)模型有望在模型成本下降、參數(shù)規(guī)模擴大、長上下文窗口、AI編程、多模態(tài)理解、Agent能力等方面進一步突破。2)應(yīng)用:生態(tài)能力為大模型商業(yè)化核心壁壘?,F(xiàn)階段AI競賽從比拼模型能力逐步轉(zhuǎn)向在現(xiàn)實世界中大規(guī)模部署落地,我們判斷DeepSeek后續(xù)的商業(yè)化有望加速?;谄溟_源策略、領(lǐng)先模型能力和更低部署成本,DeepSeek有望成為AI通用基礎(chǔ)設(shè)施,后續(xù)有望嵌入到海量B端和C端AI應(yīng)用產(chǎn)品中。目前,DeepSeek已全面接入云廠商、三大運營商,并與辦公、手機、汽車、金融、醫(yī)療等行業(yè)客戶廣泛開展合作。 投資建議與公司梳理:隨著以DeepSeek為代表的國產(chǎn)大模型持續(xù)迭代,建議關(guān)注AI應(yīng)用、算力的投資機會,包括:1)AI應(yīng)用:卓易信息、漢得信息、合合信息、新大陸、中控技術(shù)、稅友股份、金山辦公、科大訊飛、福昕軟件、慧辰股份、同花順;2)算力:海光信息、寒武紀(jì)、中科曙光、首都在線、神州數(shù)碼、宏景科技、網(wǎng)宿科技。 風(fēng)險提示:1)行業(yè)競爭加劇的風(fēng)險;2)應(yīng)用進展不及預(yù)期的風(fēng)險。
|
|