>> 東吳證券-互聯(lián)網(wǎng)傳媒行業(yè)深度報告:多模態(tài)技術加速,AI商業(yè)宏圖正啟-231218
| 上傳日期: |
2023/12/19 |
大?。?/td>
| 3487KB |
| 格式: |
pdf 共40頁 |
來源: |
東吳證券 |
| 評級: |
看好 |
作者: |
張良衛(wèi),周良玖 |
| 行業(yè)名稱: |
傳媒 |
| 下載權限: |
無限制-登錄即可下載 |
|
|
多模態(tài):AGI必經(jīng)之路與商業(yè)宏圖起點。(1)多模態(tài)是實現(xiàn)通用人工智能的必經(jīng)之路。模態(tài)數(shù)據(jù)輸入可幫助模型能力和用戶體驗提高,允許多模態(tài)數(shù)據(jù)輸出也更符合真實世界需要。在數(shù)據(jù)、算法及算力上的要求都要高于單模態(tài),這一波自然語言大模型發(fā)展為其他模態(tài)提供技術參考,行業(yè)有望加速發(fā)展。(2)多模態(tài)是AI商業(yè)宏圖起點。多模態(tài)大模型有望真正為企業(yè)降本增效,且企業(yè)可將節(jié)省的成本用于提高產品/服務質量或者技術創(chuàng)新,推動生產力進一步提升;C端技術平權下內容創(chuàng)作有望達到一個成本與質量更優(yōu)的均衡點,或出現(xiàn)新的、空間更大的UGC平臺。 多模態(tài)大模型的技術脈絡與前進方向:(1)視覺模型:數(shù)據(jù)與算法往往同步發(fā)展,大型高質量數(shù)據(jù)集是模型突破重要基礎,而近年視覺算法在泛化性、可提示性、生成質量和穩(wěn)定性等方面突破將推動技術拐點到來以及爆款應用出現(xiàn)。其中2D圖像生成引領視覺模型前進方向,由于2D圖像生成是視覺模型中要求相對較低的領域,因此更容易實現(xiàn)技術突破,也出現(xiàn)了midjourney這類爆款應用,其兼顧使用門檻及生成效果,數(shù)據(jù)飛輪效應開始體現(xiàn)。文生圖成本仍有優(yōu)化空間,其中通用類應用由于需求相對剛性且有較強的付費意愿,盈利領先。3D資產生成、視頻生成等領域受益于擴散算法成熟,但數(shù)據(jù)與算法難點多于圖像生成,其中視頻生成當前可類比2D圖像生成的2021年(已有上億規(guī)模數(shù)據(jù)集、擴散模型取得突破),且考慮到LLM對AI各領域的加速作用以及已出現(xiàn)較好的開源模型,2024年行業(yè)或取得更大的發(fā)展。3D資產生成則相對更加早期。(2)聽覺模型:數(shù)據(jù)仍有缺口,23年以來技術有所突破。未來技術成熟后可為企業(yè)/內容制造商/娛樂應用提供高性價比的音樂作品,或基于娛樂屬性向C端收費。(3)具身智能:相對遠期,AI+機器人實現(xiàn)與現(xiàn)實世界交互。 海外技術領先,國內技術與應用同步發(fā)展。(1)海外:OPENAI和谷歌在多模態(tài)領域布局的廣度和技術先進程度上都處于領先地位,且都推出了表現(xiàn)較好的通用多模態(tài)大模型。而Stability.ai、midjourney、runway等垂類獨角獸也對技術突破和產品創(chuàng)新發(fā)揮重要作用。(2)國內:國內數(shù)據(jù)、算法、算力均有劣勢,但海外算法開源有利于國內技術追趕;考慮到中國科技公司在產品運營和迭代方面實力更強,技術與應用有望同步發(fā)展。國內大廠及大模型公司均積極布局多模態(tài),有望結合生態(tài)優(yōu)勢進行變現(xiàn);萬興科技、美圖等AI視覺應用公司亦有望受益于底層技術進步。 投資建議:我們推薦在多模態(tài)方向已有布局或具備布局能力的標的:昆侖萬維、萬興科技、美圖,建議關注新國都;多模態(tài)技術進步利好電商、游戲、教育、營銷等領域AI應用發(fā)展,推薦焦點科技、中文在線、盛天網(wǎng)絡、藍色光標、鳳凰傳媒、世紀天鴻等,建議關注掌趣科技等;建議關注受益于AI視頻應用發(fā)展的多模態(tài)技術公司,如虹軟科技、當虹科技等;算力方向建議把握板塊龍頭投資機會,推薦中際旭創(chuàng)等龍頭。 風險提示:多模態(tài)技術發(fā)展不及預期,倫理與隱私問題,商業(yè)化拓展不及預期,算力基礎設施發(fā)展不及預期。
|
|