>> 中航證券-計算機(jī)行業(yè)點評-AI:多模態(tài)加速,視頻類驚艷,生態(tài)重要性凸顯-231208
| 上傳日期: |
2023/12/10 |
大?。?/td>
| 1223KB |
| 格式: |
pdf 共5頁 |
來源: |
中航證券 |
| 評級: |
增持 |
作者: |
鄒潤芳,盧正羽 |
| 行業(yè)名稱: |
計算機(jī) |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
谷歌Gemini性能測試完勝GPT-4,大模型多模態(tài)應(yīng)用加速 根據(jù)澎湃新聞,當(dāng)?shù)貢r間12月6日,谷歌公司宣布推出據(jù)稱“最大、最強(qiáng)、最通用”的新大型語言模型Gemini。谷歌DeepMind首席執(zhí)行官、Gemini團(tuán)隊代表德米斯·哈薩比斯(Demis Hassabis)表示,谷歌運行了32個完善的多模態(tài)基準(zhǔn)測試來比較Gemini和OpenAI的GPT-4,Gemini“在32項基準(zhǔn)測試的30項中大幅領(lǐng)先”。MMLU(大規(guī)模多任務(wù)語言理解)是測試AI模型知識和問題解決能力的最流行方法之一,而Gemini首次在MMLU的得分率達(dá)到90.0%,是第一個在MMLU測試中超過人類專家的模型。Gemini包括一套三種不同規(guī)模的模型:Gemini Ultra是最大、功能最強(qiáng)大的類別,被定位為GPT-4的競爭對手;Gemini Pro是一款中端型號,性能優(yōu)于GPT-3.5,可擴(kuò)展多種任務(wù);Gemini Nano用于特定任務(wù)和移動設(shè)備。除了文字之外,Gemini還可以理解多種形式的輸入和輸出,包括文字、代碼、音頻、圖片和視頻。Gemini能很好地理解具有細(xì)微差別的信息,回答與復(fù)雜主題相關(guān)的問題,這就使其尤其擅長解釋數(shù)學(xué)和物理等復(fù)雜科目中的推理。谷歌還發(fā)布了一個時長六分鐘的視頻,展現(xiàn)了測試員和Gemini的一些有趣互動,其中包括讓Gemini識別圖片并用多種語言描述、讓Gemini利用一張地圖設(shè)計智力問答、和Gemini玩杯子游戲和推理小游戲等等。在整個過程中,Gemini的反應(yīng)速度都非???,還會生成音頻和圖片來輔助回答,并可以用上一些口語化乃至幽默化的表達(dá)。我們認(rèn)為,當(dāng)前大模型應(yīng)用仍處于技術(shù)不斷迭代的快速成長初期階段。未來,各類大模型將具備更強(qiáng)的多模態(tài)能力,有效解決不同場景下細(xì)分領(lǐng)域、更加復(fù)雜的應(yīng)用,賦能千行百業(yè)提質(zhì)增效。AI大模型多模態(tài)應(yīng)用有加速落地趨勢。 AI視頻軟件“Pika”表現(xiàn)驚艷,文生視頻類應(yīng)用或催化傳媒、游戲類行業(yè)創(chuàng)作生產(chǎn)及運營效率提升 稍早,初創(chuàng)企業(yè)Pika Labs宣布推出旗下首個AI視頻軟件Pika 1.0,迅速在各大社交媒體上走紅。根據(jù)相關(guān)資料,pika 1.0包括新的人工智能模型,能夠通過一句簡潔的文字或是一張圖片生成視頻,還可以簡單易用地生成和編輯各種風(fēng)格的視頻,如3D動畫、動漫、卡通和電影。也可以通過簡單的指令實現(xiàn)畫布延展、局部修改、視頻時長拓展等編輯。Pika社區(qū)已經(jīng)發(fā)展到50萬用戶,每周生成數(shù)百萬個視頻。目前,成立于2023年4月、僅有四名成員的Pika Labs已經(jīng)完成三輪合計5500萬美元的融資,最新估值為2.5億美元。此外,Runway最近推出了Runway Gen-2生成式AI模型新版本,能夠生成圖像、視頻和帶文本的視頻。其“運動畫筆”(Motion Brush)功能,可以讓圖片變成視頻,迅速動起來。A股創(chuàng)業(yè)板企業(yè)萬興科技300624),在公眾號上線AI創(chuàng)作的短視頻《女孩的一生》,展現(xiàn)了國內(nèi)多媒體大模型的視頻生成能力。AI類視頻應(yīng)用,還有Meta的Emu Video,以及字節(jié)跳動的Pixels Dance等等。我們認(rèn)為,文生視頻類AI大模型應(yīng)用或催化傳媒、游戲類行業(yè)創(chuàng)作生產(chǎn)及運營效率提升。準(zhǔn)確把握產(chǎn)業(yè)發(fā)展趨勢、擁有前瞻性技術(shù)布局的相關(guān)企業(yè),可能較快取得市場先發(fā)優(yōu)勢。 GPTs助力“普惠”AIGC,AI生態(tài)建設(shè)重要性凸顯 OpenAI首次開發(fā)者大會推出的簡易定制GPT工具(GPTs)引發(fā)開發(fā)熱潮,一周時間GPTs的數(shù)量就達(dá)到1.5萬個。由于使用量過大,11月15日阿爾特曼宣布暫停ChatGPTPlus新用戶注冊。該功能是ChatGPT的付費版,月費20美元,付費開通才能開發(fā)定制GPTs和使用其他人開發(fā)的GPTs。自定義GPTs是OpenAI在開發(fā)者大會上推出的一項重磅功能,用戶無需任何代碼,全程支持可視化點擊操作。只需要給ChatGPT對話指令、額外的知識數(shù)據(jù),然后選擇是否需要網(wǎng)絡(luò)搜索、數(shù)據(jù)分析和圖片生成等多模態(tài)功能,就能構(gòu)建法律、寫作、營銷等特定領(lǐng)域的ChatGPT助手,發(fā)布到GPTStore,可賺取分成收益。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏表示:“技術(shù)創(chuàng)新的最終目的是應(yīng)用,人類進(jìn)入AI時代的標(biāo)志是出現(xiàn)大量的AI原生應(yīng)用,而不是出現(xiàn)大量的大模型”。我們認(rèn)為,數(shù)據(jù)、算法、算力、應(yīng)用導(dǎo)向、工程化能力等均是AI落地開花,以及進(jìn)一步普惠化應(yīng)用的必要條件。而構(gòu)建起創(chuàng)新開放、彈性包容、全鏈貫通、功能完備的產(chǎn)業(yè)生態(tài),更是保障產(chǎn)業(yè)長期健康、穩(wěn)健發(fā)展的充分且必要條件。 投資建議∶我們認(rèn)為,大模型多模態(tài)應(yīng)用有加速落地趨勢,或催化千行百業(yè)數(shù)智化、普惠化創(chuàng)新發(fā)展。建議關(guān)注:1、基礎(chǔ)算力:軟通動力擬收購?fù)接嬎銠C(jī))、神州數(shù)碼、中科曙光、浪潮信息;2、大模型:中科創(chuàng)達(dá)、科大訊飛;3、視頻、游戲應(yīng)用:萬興科技、昆侖萬維、盛天網(wǎng)絡(luò)、當(dāng)虹科技;4、AI硬件終端:大華股份、漫步者、螢石網(wǎng)絡(luò);5、文本辦公:福昕軟件、金山辦公。 風(fēng)險提示:需求釋放不及預(yù)期;競爭加劇;技術(shù)進(jìn)展不及預(yù)期。
|
|