>> 國盛證券-通信行業(yè)深度:AI文生視頻,多模態(tài)應用的下一站-231009
| 上傳日期: |
2023/10/9 |
大?。?/td>
| 2565KB |
| 格式: |
pdf 共24頁 |
來源: |
國盛證券 |
| 評級: |
中配(下調) |
作者: |
宋嘉吉,孫爽 |
| 行業(yè)名稱: |
通信 |
| 下載權限: |
無限制-登錄即可下載 |
|
|
市場認為,AI應用已經逐漸步入成熟期,但未見殺手級應用。本篇報告中,我們謹以“文生視頻”這一多模態(tài)應用為例,闡述AI應用的發(fā)展尚處于早期,相對應地,算力需求遠未見頂。 文生視頻是多模態(tài)AIGC圣杯,優(yōu)化迭代速度慢。視頻是多幀圖像的組合,然而文生視頻在文生圖的基礎上增加了時間維度,技術實現更困難。即便是Meta和Google這樣的硅谷人工智能巨頭,在文生視頻上進展緩慢,它們分別推出的Make-A-Video和Phenaki均尚未公測。 文生視頻底層模型及技術仍在優(yōu)化,未篩選出最優(yōu)模型。文生視頻技術主要發(fā)展過程經歷了基于GAN和VAE、基于Transformer模型、基于擴散模型三個階段。目前主流的文生視頻模型主要依托Transformer模型和擴散模型。1)基于Transformer的代表Phenaki突破了視頻生成時長限制,但效果相對粗糙缺少細節(jié)。2)基于擴散模型的代表Make-AVideo重在提升視頻質量,但其視頻時長均在4s以內。 文生視頻效果各異,總體質量較低。當前文生視頻可公測應用較少,僅有RunwayGen-2、ZeroScope及Pika Labs等少數幾個,它們有如下共同問題:1)復雜人物動作生成幀連續(xù)效果較差;2)非日常場景的視頻架構能力連續(xù)能力一般;3)多主體視頻生成缺乏邏輯連續(xù)性等。 文生視頻當前商用化程度較低,可從圖片生成看其商業(yè)前景。1)根據七麥數據,圖片生成類應用在多模態(tài)大模型中,表現出較強的收費能力,應用數量上占比最高。2)當前唯一收費的文生視頻應用(RunwayGen-2),商業(yè)模式與圖片生成趨同,即主要按照生成量定價。 看好人像生成細分領域,但營收持續(xù)增長能力仍待驗證。1)Lensa AI推出人像生成功能后,去年12月前12日內創(chuàng)收2930萬美元,但2023年7月全球收入已回落為100萬美元;2)妙鴨相機上線即火爆,半月營收估計超過29萬美元,后續(xù)須上線新模板、新玩法維持營收增長。 看好算力儲備大廠在多模態(tài)生成領域的發(fā)展。1 )文生圖應用Midjourney日活達1500萬,年收入超1億美元,它推出的多版無限量套餐、高速GPU服務反映出市場對算力的巨大需求。2)目前國內文生圖多為計次付費,尚未出現無限量套餐,或因算力受限,我們認為,具有算力儲備的云服務廠商在發(fā)展視頻生成類應用上具有天然優(yōu)勢。 看好業(yè)務協同向發(fā)展,看好文生視頻與文生圖、圖生視頻的聯動。AI對產品價值的拉動表現為:1)促活、拉新:Adobe、Microsoft 365Copilot分別在軟件原有基礎上推出AI工具;2)提升產品價格:OfficeCopilot是基于GPT-4 API的應用,Copilot加入后Office當前四種商業(yè)版整體訂閱價格漲幅達53-240%。我們看好文生視頻能與原有產品產生協同,降本增效的公司,例如游戲、影視制作等領域的公司。 投資建議:1)算力:AIGC蓬勃發(fā)展的基石,建議關注光通信,包括中際旭創(chuàng)、天孚通信、新易盛、太辰光、德科立;算力設備:盛科通信、恒為科技、銳捷網絡、寒武紀、美格智能、紫光股份、工業(yè)富聯、中興通訊等;算力租賃:中貝通信、云賽智聯等;2)模型層:建議關注金山辦公、萬興科技、科大訊飛等;3)應用層:看好游戲的迭代創(chuàng)新,建議關注愷英網絡、神州泰岳、盛天網絡、游族網絡等。 風險提示:倫理風險、知識產權及版權風險、計算資源限制。
|
|