>> 東方證券-計算機行業(yè):Pika 1.0再掀AI視頻熱潮,多模態(tài)技術(shù)路徑仍有探索空間-231206
| 上傳日期: |
2023/12/6 |
大?。?/td>
| 909KB |
| 格式: |
pdf 共13頁 |
來源: |
東方證券 |
| 評級: |
看好 |
作者: |
浦俊懿,陳超,謝忱 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
核心觀點 文生視頻Pika 1.0發(fā)布,AI影像熱潮再起。11月29日,AI文生視頻軟件Pika 1.0版本發(fā)布,熱度迅速席卷全網(wǎng)。Pika成立于今年7月,Pika 1.0是其第一個正式推出的版本,能夠根據(jù)文字自動生成和編輯3D動畫、動漫、卡通和電影,還能夠支持對于視頻的實時編輯和修改。Pika的創(chuàng)始人是兩位斯坦福大學(xué)人工智能實驗室的前博士生郭文景和Chenlin Meng,目前Pika已融資3輪,估值超過2億美元。到現(xiàn)在為止Pika已經(jīng)有了50萬用戶。 近期AI+視頻方向更新頻發(fā)。11月以來,海外在AI生成視頻領(lǐng)域的動作進展較快。11月3日,Runway發(fā)布Gen-2模型更新,把生成的視頻清晰度提升到了4K精度,改進了結(jié)果的保真度和一致性。并隨后在11月20日上線了運動筆刷功能,只需對著圖像任意位置一刷,就能讓靜止的一切物體動起來;11月16日,Meta發(fā)布了Emu Video,能夠基于文本和圖像輸入生成視頻剪輯;11月18日,字節(jié)跳動發(fā)布PixelDance,在生成視頻的動態(tài)性上得到了顯著提升;11月21日,Stability AI發(fā)布了自家的生成視頻模型Stable Video Diffusion,支持文本到視頻、圖像到視頻生成,并且還支持物體從單一視角到多視角的轉(zhuǎn)化,也就是3D合成。 大語言模型技術(shù)路徑已收斂,而視頻生成模型仍處于探索期。在OpenAI的技術(shù)方向引領(lǐng)下,目前語言模型的技術(shù)路徑基本就是GPT這一條路。而多模態(tài)技術(shù)方面,目前沒有一家公司處于絕對領(lǐng)先地位,技術(shù)路徑仍存在探索的可能。AI視頻的生成面臨流暢性、幀生成邏輯、協(xié)調(diào)性等等問題,模型需要生成每一幀發(fā)生的事情,而用戶的prompt往往非常簡略,無法像圖像生成一樣為每一幀提供詳細的描述,種種原因都導(dǎo)致了目前AI視頻生成技術(shù)仍無法做到非常完美,技術(shù)路線也多種多樣。 語言模型是對物理世界的抽象描述,多模態(tài)數(shù)據(jù)能夠更真實反映物理世界屬性,能感知真實物理世界的多模態(tài)模型應(yīng)用前景更加廣闊。語言作為一種精煉的表述載體,可以對物理世界進行抽象描述,例如文生圖和文生視頻中,用戶都可以用簡短的一句話或者幾句話來對想要生成的圖像或視頻進行描述。但是從承載的信息量來講,語言所能承載的信息是遠遠不及圖像和視頻的。而多模態(tài)的數(shù)據(jù)例如圖像、視頻、音頻、振動等信息,則更加能反映出物理世界的真實屬性,是真正對于物理世界狀態(tài)的感知,與人類感知世界的方式更加接近。我們認為,未來的多模態(tài)模型將能夠真正實現(xiàn)對世界狀態(tài)的完整感知,也因此能具備更多的應(yīng)用場景。 多模態(tài)是生成式AI下一步重點方向,百花齊放的應(yīng)用場景有望探索?,F(xiàn)階段大語言模型的競爭已經(jīng)非常激烈,從技術(shù)突破的角度來看,我們認為,下一階段的重點攻克方向必然會是多模態(tài)技術(shù)。能夠真正處理和應(yīng)用好多模態(tài)AI能力,才能真正打通物理世界和數(shù)字世界的障壁,用最基礎(chǔ)的感知世界能力直接生成操作,實現(xiàn)與物理世界最自然的交互。因此,基于多模態(tài)的應(yīng)用場景仍需不斷探索,AI視頻生成僅僅是多模態(tài)技術(shù)路徑中的一個小方向,多模態(tài)領(lǐng)域的ChatGPT時刻還未到來。 投資建議與投資標的 我們認為,在多模態(tài)模型應(yīng)用場景上具備良好布局和卡位的公司值得關(guān)注。建議關(guān)注??低?002415,買入)(電子組覆蓋)、大華股份(002236,買入)(電子組覆蓋)、螢石網(wǎng)絡(luò)(688475,未評級)(電子組覆蓋)、中科創(chuàng)達(300496,買入)、虹軟科技(688088,未評級)、科大訊飛(002230,買入)、萬興科技(300624,未評級)等公司 風險提示 技術(shù)落地不及預(yù)期;政策監(jiān)管風險
|
|