>> 華鑫證券-電力設(shè)備行業(yè)點(diǎn)評報告:谷歌發(fā)布原生多模態(tài)大模型Gemini,有望推動具身智能發(fā)展-231211
| 上傳日期: |
2023/12/12 |
大?。?/td>
| 201KB |
| 格式: |
pdf 共4頁 |
來源: |
華鑫證券 |
| 評級: |
推薦 |
作者: |
傅鴻浩,臧天律 |
| 行業(yè)名稱: |
電力 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
事件 美國當(dāng)?shù)貢r間12月6日,谷歌發(fā)布原生多模態(tài)大模型Gemini 1.0,其中Gemini Ultra復(fù)雜度最高,能夠處理最為困難的任務(wù);Pro能力稍弱,是一個可擴(kuò)展至多任務(wù)的最佳模型;Nano則是一款可以在手機(jī)端側(cè)運(yùn)行的模型。 投資要點(diǎn) ▌ Google DeepMind持續(xù)推進(jìn)大模型發(fā)展 DeepMind成立于2010年,采用跨學(xué)科方法構(gòu)建通用人工智能系統(tǒng),并于2015年推出了AlphaGo,是第一個擊敗圍棋世界冠軍的計算機(jī)程序;Google Brain于2011年啟動,于2017年推出了著名的Transformer架構(gòu),后來Transformer也成了幾乎所有大語言模型的基礎(chǔ)模型,同時Brain團(tuán)隊后續(xù)還在機(jī)器人領(lǐng)域中使用PaLM-SayCan的大語言模型,并創(chuàng)造了機(jī)器人領(lǐng)域第一個視覺語言動作模型(RT-2)。谷歌于2023年4月將這兩個世界領(lǐng)先的實驗室合并成立了GoogleDeepMind,在此基礎(chǔ)上谷歌一直持續(xù)推進(jìn)大模型的發(fā)展。 繼2022年推出PaLM模型之后,2023年3月谷歌推出了PaLM-E具身多模態(tài)語言模型,由大語言模型PaLM(5400億參數(shù))和視覺模型ViT(220億參數(shù))結(jié)合而成。 2023年5月,在谷歌I/O 2023大會上,合并后的GoogleDeepMind推出PaLM 2模型,相較于其前身PaLM,PaLM 2在高級推理、翻譯和代碼生成等任務(wù)上表現(xiàn)更加優(yōu)秀。 此次推出的Gemini是一款原生的多模態(tài)大模型,傳統(tǒng)的多模態(tài)模型是將文字、圖片、聲音等模態(tài)經(jīng)過處理之后的組合系統(tǒng),他們的統(tǒng)一協(xié)調(diào)性并不強(qiáng)。而Gemini是原生多模態(tài)架構(gòu),擁有無縫的跨模態(tài)的能力。目前Gemini Pro已經(jīng)上線谷歌Bard,支持文字與圖片輸入。 ▌ Gemini在多項測試中表現(xiàn)較好,算力需求更上一層 Gemini系列中最強(qiáng)的模型Gemini Ultra在32個基準(zhǔn)測試中的30個取得了行業(yè)最強(qiáng)的成績,同時也是第一個在MMLU(著名的知識與邏輯測試)上達(dá)到人類專家水平(得分超過90%)的模型。除了文本,Gemini Ultra在多模態(tài)的推理任務(wù)中同樣有很大的突破,在最近的MMMU基準(zhǔn)測試中,它關(guān)于多學(xué)科任務(wù)的圖片問題得到了62.4%,比此前的最佳模型(GPT4)高出5%以上。 Gemini同樣是以Transformer模型為基礎(chǔ)模型,訓(xùn)練GeminiUltra在多個數(shù)據(jù)中心使用了大量的TPUv4加速器,數(shù)量相較于此前谷歌旗艦?zāi)P蚉aLM-2有了明顯提升。 ▌ Gemini將進(jìn)一步推動具身智能發(fā)展 以chatgpt為代表的語言類大模型展現(xiàn)出了龐大的先驗知識庫與強(qiáng)大的通識理解能力,但是大部分模型仍主要以單一文字模態(tài)為主。而對于具身智能而言,所需的模態(tài)不僅是文字,還有圖片視頻等,未來嗅覺、味覺、觸覺、溫度、濕度等同樣是需要引入模型的模態(tài)??梢哉f多模態(tài)是人形機(jī)器人行業(yè)發(fā)展的必由之路。 此前谷歌發(fā)布的RT-2模型,由大語言模型PaLM與視覺模型ViT結(jié)合而成,成功引入多模態(tài)訓(xùn)練,盡管也能夠理解、執(zhí)行任務(wù),但其本質(zhì)是不同模態(tài)的模型各自訓(xùn)練好之后的結(jié)合,而Gemini是真正的端到端多模態(tài),即在訓(xùn)練大模型的時候就同步穿插各種模態(tài)的數(shù)據(jù),并且展現(xiàn)出優(yōu)秀的能力,無需對多種模態(tài)進(jìn)行拆分,預(yù)計以Gemini為基礎(chǔ)的機(jī)器人大模型也將逐步問世,這將推動具身智能的模型進(jìn)一步發(fā)展。 我們看好Gemini推出并應(yīng)用于具身智能領(lǐng)域后對于機(jī)器人行業(yè)帶來的板塊效應(yīng),對電力設(shè)備板塊維持“推薦”評級。 ▌風(fēng)險提示 機(jī)器人下游發(fā)展不及預(yù)期;算力與算法模型更新迭代不及預(yù)期;行業(yè)競爭加劇風(fēng)險等。
|
|