>> 國盛證券-傳媒行業(yè)周報:OpenAI開源3D模型生成器,谷歌發(fā)布AI語言模型PaLM 2-230514
| 上傳日期: |
2023/5/15 |
大?。?/td>
| 1084KB |
| 格式: |
pdf 共10頁 |
來源: |
國盛證券 |
| 評級: |
增持 |
作者: |
顧晟,吳珺 |
| 行業(yè)名稱: |
傳媒 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
行情概覽:本周(5.8-5.12)中信一級傳媒板塊下跌5.92%。本周AI板塊出現(xiàn)調(diào)整,并帶動傳媒板塊調(diào)整,我們認為調(diào)整是在短期錄得較大漲幅以后的正?,F(xiàn)象,長期看AI產(chǎn)業(yè)才剛剛起步,后續(xù)AI垂直應(yīng)用將陸續(xù)落地,在助力板塊估值提升的同時,將提升市場對于AI產(chǎn)業(yè)的認知,同時傳媒一季報的強勁表現(xiàn)顯示板塊觸底反彈后的業(yè)績彈性。我們繼續(xù)維持年度策略觀點,處于估值底部+基金低配+新技術(shù)驅(qū)動的傳媒板塊配置正當時,建議重視今年傳媒板塊機會。 板塊觀點與推薦標的:AI方向:1)核心資產(chǎn)大模型:昆侖萬維;2)游戲:愷英網(wǎng)絡(luò)、神州泰岳、盛天網(wǎng)絡(luò)、巨人網(wǎng)絡(luò)、完美世界、湯姆貓、游族網(wǎng)絡(luò)等;3)數(shù)據(jù):中國科傳、同方股份、中國出版、中信出版等;4)出版:南方傳媒、鳳凰傳媒、中文傳媒、長江傳媒、城市傳媒等;5)IP:奧飛娛樂、唐德影視、中文在線、上海電影等;6)AI陪伴:華策影視、歡瑞世紀、遙望科技等。港股:關(guān)注降本增效推進虧損收窄的平臺型企業(yè)【快手】,與消費復(fù)蘇進展相關(guān)的潮玩盲盒龍頭【泡泡瑪特】,產(chǎn)業(yè)爆發(fā)在即的【阜博集團】。 OpenAI開源3D模型生成器Shap-E,文本轉(zhuǎn)3D模型再度提速。OpenAI發(fā)布全新隱式text-to-3D模型Shap-E,通過進一步研發(fā)通用人工智能核心應(yīng)用技術(shù)的自然語言描述技術(shù)Prompt Engineering(PE),在3D領(lǐng)域再度做出了前沿探索。該創(chuàng)新型3D模型生成器能將描述性的文本轉(zhuǎn)化為相應(yīng)具有高度細節(jié)和復(fù)雜度的3D模型。此前,OpenAI曾于去年12月發(fā)布基于點云的顯式3D生成模型Point-E,其相比競品模型DreamFusion提速約600倍,Shap-E則在Point-E的基礎(chǔ)之上再次升級。利用生成隱函數(shù)的參數(shù)來渲染紋理網(wǎng)格和神經(jīng)輻射場,Shap-E能適用于各種復(fù)雜三維隱性表征的條件生成。在共享相同的模型結(jié)構(gòu)、數(shù)據(jù)集和條件機制的情況下,Shap-E優(yōu)化了性能表現(xiàn),能在更高維的多表示輸出空間中提高樣本質(zhì)量,同時在收斂速度方面也有所提升。隨著文本轉(zhuǎn)3D技術(shù)的再度提速,AICG領(lǐng)域再獲利好,創(chuàng)作效率與質(zhì)量均有望進一步提高。 谷歌發(fā)布AI語言模型PaLM 2,賦能谷歌25項功能產(chǎn)品。5月11日,谷歌在I/O大會上發(fā)布最新的人工智能(AI)語言模型PaLM 2,該產(chǎn)品相比PaLM 1而言在推理、編碼和翻譯等一系列基于文本的任務(wù)上均有顯著提升。通過廣泛的邏輯與推理訓(xùn)練以及多語言文本訓(xùn)練,PaLM 2已具備極強的邏輯推理能力,支持以100多種語言進行輸出,適應(yīng)多種消費者與企業(yè)環(huán)境。為更好地執(zhí)行企業(yè)客戶的特定任務(wù),PaLM 2推出了不同版本,目前其分為四種規(guī)格,從小到大依次為Gecko、Otter、Bison和Unicorn,依據(jù)特定領(lǐng)域的數(shù)據(jù)進行了微調(diào)。其中,體積最小的Gecko支持手機運行,其每秒可處理20個Token,大約相當于16或17個單詞。目前,PaLM 2已被用于支持谷歌25項功能和產(chǎn)品,其中包括AI聊天機器人Bard、谷歌文檔、幻燈片和工作表等。 Meta開源AI模型ImageBind,利用多模態(tài)鏈接創(chuàng)造多感官體驗。Meta發(fā)布開源AI模型ImageBind,該模型支持橫跨6種不同模態(tài),包括視覺數(shù)據(jù)(以圖像和視頻的形式)、溫度(紅外圖像)、文本音頻深度信息、由慣性測量單元IMU產(chǎn)生的運動讀數(shù)6種數(shù)據(jù)類型,是首個將6種類型的數(shù)據(jù)組合到單個嵌入空間中的模型。該模型的核心概念是將多種類型的數(shù)據(jù)鏈接到一個多維索引中,即嵌入空間,使不同模態(tài)的數(shù)據(jù)類型能夠相互鏈接,讓單類型輸入能實現(xiàn)跨模態(tài)檢索,從而為用戶創(chuàng)造包含視覺、聲音、觸感等各類互動的多感官體驗。目前該模型正處于研究階段,暫未開發(fā)直接的消費者應(yīng)用。隨著多模態(tài)AI模型的不斷研發(fā),未來模型將可能添加其他感官輸入流,包括“觸摸、語音、嗅覺和大腦功能磁共振信號”,進一步創(chuàng)造豐富的多感官體驗,助力沉浸式內(nèi)容創(chuàng)作。 風險提示:政策監(jiān)管風險,競爭加劇風險。
|
|