>> 萬聯(lián)證券-傳媒行業(yè)AI產(chǎn)業(yè)系列深度報告(一):生成式AI多領(lǐng)域落地,賦能傳媒行業(yè)發(fā)展-240628
| 上傳日期: |
2024/6/28 |
大?。?/td>
| 2388KB |
| 格式: |
pdf 共21頁 |
來源: |
萬聯(lián)證券 |
| 評級: |
-- |
作者: |
夏清瑩,李中港 |
| 行業(yè)名稱: |
傳媒 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
行業(yè)核心觀點: 生成式人工智能(Generative AI),指的是通過人工智能技術(shù)自動生成內(nèi)容的生產(chǎn)方式。著重于創(chuàng)造新的、有創(chuàng)意的數(shù)據(jù),其關(guān)鍵原理在于學(xué)習(xí)和理解數(shù)據(jù)的分布,進(jìn)而生成具有相似特征的新數(shù)據(jù)。自“十三五”、“十四五”規(guī)劃將人工智能作為重點任務(wù),明確了戰(zhàn)略發(fā)展目標(biāo)之后,國家陸續(xù)出臺指導(dǎo)性及支持性政策推動生成式AI發(fā)展,目前在圖像、文本、音頻、視頻等多種領(lǐng)域都有廣泛的應(yīng)用。 投資要點: 圖像生成:Midjourney穩(wěn)住行業(yè)龍頭地位,AI文生圖邁向多模態(tài)融合。AI文生圖,即通過人工智能技術(shù)解析文字描述內(nèi)容,提取關(guān)鍵信息,利用深度學(xué)習(xí)模型形成草圖,再經(jīng)過優(yōu)化算法細(xì)化圖像細(xì)節(jié),增強(qiáng)圖像質(zhì)量,輸出符合描述的視覺內(nèi)容,是近年來快速發(fā)展的一項技術(shù)。 1)自身發(fā)展,自2023年起,圖像生成已經(jīng)在攝影藝術(shù)、設(shè)計、二次元、CG藝術(shù)和影視制作等多個行業(yè)得到廣泛應(yīng)用,目前該技術(shù)不僅限于單一的圖像生成模型,而是開始向多模態(tài)融合方向發(fā)展,市場規(guī)模高速增長,網(wǎng)民參與度顯著提升; 2)產(chǎn)品,目前市場上的產(chǎn)品已經(jīng)發(fā)展比較成熟,主流的AI文生圖工具分別有Midjourney V6、Adobe Firefly 3、Stable Diffusion 3、Dalle 3等。Midjourney產(chǎn)品迭代速度快于同行,整體圖像產(chǎn)出質(zhì)量顯著提高,同時通過龐大的用戶量及用戶數(shù)據(jù),使得積累的數(shù)據(jù)集具有獨家性,并依托這些數(shù)據(jù)進(jìn)行反復(fù)訓(xùn)練,來構(gòu)建自我藝術(shù)風(fēng)格,鞏固自身競爭優(yōu)勢,穩(wěn)住文生圖龍頭地位。 視頻生成:新品推出受到市場關(guān)注,創(chuàng)新點賦能行業(yè)發(fā)展。AI文生視頻的本質(zhì)是能夠根據(jù)輸入的文本描述自動生成相應(yīng)的視頻內(nèi)容。這項技術(shù)結(jié)合了自然語言處理(NLP)、計算機(jī)視覺、圖像生成和動畫技術(shù)等多個領(lǐng)域的研究成果,通過訓(xùn)練大量文本和視頻數(shù)據(jù),依靠文本解析、圖像生成、動態(tài)渲染等核心技術(shù),將文字轉(zhuǎn)化為圖像,并賦予這些圖像動態(tài)效果,全自動化形成視頻文件。 1)自身發(fā)展,技術(shù)更迭帶動行業(yè)發(fā)展,真正興起點在于將擴(kuò)散模型在文生圖領(lǐng)域經(jīng)驗拓展至文生視頻,成為AI視頻生成領(lǐng)域的主流技術(shù)路徑,帶動行業(yè)產(chǎn)品推出頻率及數(shù)量顯著提升,但由于存在缺乏相符性高的訓(xùn)練數(shù)據(jù)、計算成本高昂、信息冗雜難處理等挑戰(zhàn),目前市場仍處于初期階段,潛力可期; 2)產(chǎn)品,目前市場上受到關(guān)注度較高的文生視頻產(chǎn)品分別是來自O(shè)penAI的Sora、Pika1.0、近期快手推出的可靈、Luma AI推出的DreamMachine以及Runway推出的GEN-3。新品的推出通常伴隨著領(lǐng)域技術(shù)的突破,從目前的文生視頻能力來看,已經(jīng)具備了一定的產(chǎn)業(yè)生產(chǎn)力未來將賦能影視產(chǎn)業(yè)鏈,為其降本增效提供助力。 音頻生成:音樂生成類市場潛力大,企業(yè)探索視頻生音頻技術(shù)。AI音頻利用先進(jìn)的人工智能技術(shù)和復(fù)雜算法來創(chuàng)造音頻內(nèi)容,包括語音合成、音樂制作和聲音效果合成等。通過融合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,AI音頻生成技術(shù)能夠精確地模仿人類的語音、音樂節(jié)奏和聲音效果,生成自然且逼真的音頻,廣泛應(yīng)用于娛樂、廣告、教育和新聞傳播等多個領(lǐng)域。 1)自身發(fā)展,AI音頻生成行業(yè)的產(chǎn)業(yè)鏈以中游AI音頻算法和服務(wù)平臺為核心,上下游協(xié)同發(fā)展,從應(yīng)用場景來看,語音合成占主導(dǎo),音樂生成潛力大,語音識別應(yīng)用成熟; 2)產(chǎn)品,標(biāo)桿性的音樂生成類音頻AI是由Suno AI研發(fā)的Suno系列產(chǎn)品,于今年5月推出了V3.5版本,維持了與Open AI合作,一次性完成歌詞、演唱、編曲、配樂等全部流程,領(lǐng)先于市面上單純生成音樂的同類型產(chǎn)品,同時關(guān)注到ElevenLabs及Google DeepMind均宣布了自動匹配畫面AI生成音效產(chǎn)品,即無需人工輸入提示詞也可以為視頻配音,實現(xiàn)真正的AI音頻及AI視頻合作,這將帶領(lǐng)文生視頻邁入有聲時代,實現(xiàn)行業(yè)再突破,雙向促進(jìn)市場繁榮發(fā)展。 傳媒行業(yè)應(yīng)用:AI賦能傳媒子行業(yè),助力技術(shù)變革。在影視、游戲等多個傳媒互聯(lián)網(wǎng)的細(xì)分領(lǐng)域進(jìn)行廣泛應(yīng)用,從而提升內(nèi)容生產(chǎn)效率,降低內(nèi)容生產(chǎn)成本,助力行業(yè)變革,建議關(guān)注已有生成式AI應(yīng)用落地的公司。 1)游戲方面,生成式AI能壓縮游戲整體項目的研發(fā)周期與人員規(guī)模,大幅降低游戲制作成本,降本增效;對已有的游戲進(jìn)行產(chǎn)品更新升級,實現(xiàn)真正的人與AI的互動,優(yōu)化游戲體驗;對電競行業(yè)進(jìn)行數(shù)字化創(chuàng)新;營銷買量制作周期縮短,縮減營銷成本; 2)廣告營銷方面,生成式AI內(nèi)容生產(chǎn)能力契合廣告營銷需求,從獲取廣告創(chuàng)意、進(jìn)行內(nèi)容生成、后期進(jìn)行廣告投放,最后實現(xiàn)高效的消費轉(zhuǎn)化,有望顯著提升營銷內(nèi)容生產(chǎn)效率,同時降低優(yōu)質(zhì)營銷內(nèi)容生產(chǎn)門檻; 3)影視方面,生成式AI從劇本制作、影視制片、導(dǎo)演拍攝、后期制作以及宣發(fā)營銷五大環(huán)節(jié)對整體影視制作提供助力,大幅縮短創(chuàng)意落地實現(xiàn)的時間成本,也降低了影片創(chuàng)作的人力成本,顯著提高工作效率。 風(fēng)險因素:政策環(huán)境變化;市場競爭加??;創(chuàng)新技術(shù)應(yīng)用不及預(yù)期;AI版權(quán)及知識侵權(quán)風(fēng)險;市場需求的不確定性;違規(guī)違法風(fēng)險
|
|