>> 國信證券-互聯(lián)網(wǎng)行業(yè)AI事件點評:OpenAI發(fā)布文生視頻模型Sora,賦能內(nèi)容創(chuàng)作與社交平臺-240227
| 上傳日期: |
2024/2/27 |
大?。?/td>
| 650KB |
| 格式: |
pdf 共7頁 |
來源: |
國信證券 |
| 評級: |
超配 |
作者: |
張倫可 |
| 行業(yè)名稱: |
互聯(lián)網(wǎng) |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
事項: 2024年2月16日,OpenAI推出全新文生視頻模型“Sora”,宣稱為可以理解真實世界規(guī)則的世界模擬器。用戶可以輸入提示詞,生成最長為六十秒的模擬真實世界的視頻。相比此前Pika、Runway等工具,Sora具備向前擴展視頻,視頻拼接、多鏡頭視頻生成等新能力,在視頻時長,擬真度與一致性等方面也大幅領(lǐng)先??紤]到技術(shù)還不成熟以及安全倫理風(fēng)險,Sora目前僅提供給內(nèi)測用戶使用,未向公眾開放。 國信互聯(lián)網(wǎng)觀點:1)Sora作為新一代AI文生視頻模型,能力提升顯著:2023年,文生視頻模型開始陸續(xù)發(fā)布。大多產(chǎn)品處于早期階段,生成視頻時長少于5秒且風(fēng)格單一、邏輯錯誤較多??萍即髲S在這一領(lǐng)域的代表產(chǎn)品有Meta的Emu Video、谷歌的W.A.L.T和Lumiere、字節(jié)跳動的MagicVideo等。其它初創(chuàng)團隊如Runway、Stability AI、Pika Labs也開發(fā)了當(dāng)前代表性的文生視頻模型Gen-2、Stable Animation、pika1.0。新發(fā)布的Sora采用創(chuàng)新性技術(shù),不僅擁有視頻拼接、多鏡頭視頻生成等新能力,更在視頻時長,擬真度與一致性等方面大幅領(lǐng)先;2)2024年文生視頻大模型領(lǐng)域競爭加劇,各大廠商加快開發(fā)節(jié)奏:2024年1月2日,文生圖著名初創(chuàng)公司Midjourney宣布加快訓(xùn)練文生視頻模型。Runway開發(fā)的Gen-2模型也進行了快速更新,視頻質(zhì)量大幅提升,視頻時長提高至18秒。國內(nèi)大廠字節(jié)跳動與騰訊在1月公布了MagicVideo V2與VideoCrafter2;3)Sora的領(lǐng)先優(yōu)勢較難打破,促使社交及內(nèi)容平臺等科技大廠與OpenAI更緊密的合作:雖然Sora技術(shù)報告并未展示出突破性的創(chuàng)新,其視頻轉(zhuǎn)化成基本視覺單元、降維等技術(shù)手段在計算機視覺領(lǐng)域并非特別復(fù)雜。但是Sora模型的成功不僅僅依賴于公開的技術(shù)路徑,更多來自于未公開的技術(shù)細節(jié),如訓(xùn)練數(shù)據(jù)的來源與處理、模型的技術(shù)細節(jié)(如優(yōu)化器、迭代訓(xùn)練輪次、迭代補償、收斂標準等)以及對算力和資源的需求??紤]到Sora模型的目前先進程度和實際效果,在OpenAI算力與資源都領(lǐng)先的情況下,Runway等初創(chuàng)企業(yè)以及科技大廠追趕的難度較大。雖然在模型層面科技公司不一定能夠追趕上OpenAI的領(lǐng)先技術(shù),但YouTube、Facebook、Tiktok等視頻及社交平臺本身具有除了技術(shù)優(yōu)勢之外的高護城河,平臺公司可以利用Sora技術(shù)進一步增強用戶體驗和內(nèi)容質(zhì)量、降低內(nèi)容創(chuàng)作的成本,OpenAI和社交及內(nèi)容平臺之間的合作關(guān)系可能會更加緊密。 風(fēng)險提示: AI模型技術(shù)發(fā)展不及預(yù)期,文生視頻商業(yè)化進展不及預(yù)期,大模型幻覺、倫理等安全性問題。
|
|