>> 申萬宏源-計算機行業(yè)GenAI系列報告之65:AI Infra,應(yīng)用滲透下的又一賣鏟人-251222
| 上傳日期: |
2025/12/23 |
大小: |
1924KB |
| 格式: |
pdf 共30頁 |
來源: |
申萬宏源 |
| 評級: |
增持 |
作者: |
洪依真,黃忠煌,曹崢 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
本期投資提示: AIInfra作為AI模型訓(xùn)練與推理的底層支撐,已成為應(yīng)用落地的關(guān)鍵“賣鏟人”。本篇報告核心解答三個問題:1)哪些Infra軟件是剛需;2)生成式AI給核心Infra軟件帶來了何種影響;3)生成式AI影響下,競爭格局和態(tài)勢如何變化,廠商又如何動作。 算力調(diào)度是決定模型推理盈利水平的核心變量。國內(nèi)模型Token收費顯著低于海外,成本敏感度更高。阿里Aegaeon通過Token級調(diào)度可減少82% GPU用量,華為Flex:ai提升30%算力利用率,高效調(diào)度能力成為模型推理廠商盈利關(guān)鍵。根據(jù)我們測算,在單日10億查詢量下,若使用H800芯片,單卡吞吐能力每提升10%,毛利率能夠提升2-7個百分點。 數(shù)據(jù)類Infra需求先于應(yīng)用爆發(fā),向量數(shù)據(jù)庫成剛需。RAG技術(shù)滲透率快速提升,Gartner預(yù)測2025年企業(yè)采用率將達(dá)68%。向量數(shù)據(jù)庫作為RAG核心組件,支撐海量數(shù)據(jù)毫秒級檢索,市場需求持續(xù)高增。 AI時代數(shù)據(jù)架構(gòu)從“分析優(yōu)先”轉(zhuǎn)向“實時運營+分析協(xié)同”,行業(yè)發(fā)生了幾點重要的變化:1) NoSQL+OLTP數(shù)據(jù)庫再風(fēng)靡,通過補充向量索引能力切入向量數(shù)據(jù)庫市場;2)數(shù)據(jù)湖、數(shù)據(jù)倉庫廠商(OLAP為主)通過并購、合作方式引入AI模型,向全棧工具邁進。 MongoDB憑借“低門檻+高彈性”,契合中小客戶低成本AI落地需求,增長彈性突出。MongoDB作為文檔型NoSQL數(shù)據(jù)庫,其適配非結(jié)構(gòu)化數(shù)據(jù)存儲與高頻實時CRUD操作,契合AI原生應(yīng)用與Agent需求,2025年收購Voyage AI補齊向量檢索能力。FY26Q3核心產(chǎn)品實現(xiàn)30%增速,增長彈性突出。 Snowflake與Databricks靠全流程工具鏈和客戶粘性,占據(jù)數(shù)據(jù)密集型行業(yè)核心場景,但需應(yīng)對CSP跨界競爭與實時能力短板。Snowflake與Databricks以O(shè)LAP為核心向全棧工具延伸,靠海量數(shù)據(jù)處理能力成為中大型企業(yè)首選,但TP能力暫有不足(尤其是Snowflake),面臨中小市場滲透與云廠商擠壓壓力。 GPU主導(dǎo)數(shù)據(jù)控制中心,存儲與數(shù)據(jù)庫技術(shù)升級。NVIDIA推出SCADA方案實現(xiàn)GPU直連SSD,將IO延遲降至微秒級。向量數(shù)據(jù)庫需適配GPU并行計算,通過列式存儲、算子重寫等技術(shù)升級,匹配AI實時推理需求。 結(jié)論和投資分析意見:生成式AI+Agent加速滲透,AI infra軟件作為應(yīng)用部署的基礎(chǔ)設(shè)施,有望進入高速增長期??春酶邔崟r性、可靈活拓展的分布式交易型數(shù)據(jù)庫廠商(OLTP),以及增量的向量數(shù)據(jù)庫。相關(guān)標(biāo)的:MongoDB、達(dá)夢數(shù)據(jù)、英方軟件、Snowflake、深信服等。 風(fēng)險提示:商業(yè)化與IT支出不及預(yù)期;生態(tài)競爭加劇風(fēng)險,云廠商自研與平臺整合擠壓份額;技術(shù)迭代與產(chǎn)品成熟度風(fēng)險。
|
|