>> 華創(chuàng)證券-計算機(jī)行業(yè)AI+專題系列點評(六):生成交互式AI模型——Genie點評-240229
|
事項: 繼Gemini,Gemma之后,2024年2月26日,Google又推出了Genie,其生成的虛擬環(huán)境自主可控。 評論: Genie是一個從僅視頻數(shù)據(jù)中訓(xùn)練的生成交互式環(huán)境。Genie可將看不見的圖像作為提示,從而有創(chuàng)建完全想象的虛擬世界,并與用戶交互,用戶可以在Genie生成的環(huán)境中進(jìn)行逐幀行動,Genie開拓了具有創(chuàng)造力的表達(dá)新方式。此外,谷歌提出Genie學(xué)到的潛在動作可以轉(zhuǎn)移到真實的人類設(shè)計的環(huán)境中,應(yīng)用于多個領(lǐng)域,且不需要任何額外領(lǐng)域知識。 Genie基于內(nèi)存高效架構(gòu),訓(xùn)練過程無動作標(biāo)簽數(shù)據(jù)。Genie在模型組件中采用內(nèi)存高效ST-transformer架構(gòu),用以平衡內(nèi)存和計算約束。用戶可以在Genie生成的環(huán)境中進(jìn)行逐幀行動,該功能主要由三個關(guān)鍵組件決定,潛在行動模型、視頻tokenizer及自回歸動態(tài)模型。 Genie性能優(yōu)良,應(yīng)用場景廣泛。Genie具有良好的穩(wěn)健性,大規(guī)模數(shù)據(jù)訓(xùn)練效果優(yōu)良。此外Google僅使用OOD來定性評估Genie模型。定性實驗結(jié)果表明,Genie可以生成跨不同領(lǐng)域的高保真、可控視頻。Genie突破限制,模擬可變形物體,未來Genie可以被用于訓(xùn)練多任務(wù)智能體的基礎(chǔ)世界模型。 投資建議:Genie作為一種通用方法,性能優(yōu)良,未來應(yīng)用場景廣泛,有望帶動游戲等創(chuàng)新型行業(yè)發(fā)展,涉及算力、大模型以及AI+應(yīng)用(繪圖、視頻)等領(lǐng)域。建議關(guān)注:1)算力基礎(chǔ):海光信息、寒武紀(jì)、龍芯中科;2)服務(wù)器:中科曙光、浪潮信息、紫光股份、高新發(fā)展、神州數(shù)碼、拓維信息等;3)大模型:科大訊飛、商湯、三六零等;4)AI+應(yīng)用:金山辦公、萬興科技、美圖、虹軟科技、當(dāng)虹科技。 風(fēng)險提示:多模態(tài)技術(shù)發(fā)展不及預(yù)期、算力基礎(chǔ)設(shè)施建設(shè)不及預(yù)期、AI應(yīng)用需求不及預(yù)期。
|
|