>> 中信證券-前瞻&互聯(lián)網(wǎng)行業(yè)全球人工智能AI行業(yè)重大事項點評:谷歌GEMINI模型發(fā)布,AI進(jìn)入多模態(tài)時代-231207
|
近日,谷歌宣布發(fā)布新一代大模型Gemini,再次引發(fā)市場對人工智能產(chǎn)業(yè)的持續(xù)關(guān)注。Gemini模型作為谷歌以及全球范圍內(nèi)最先發(fā)布的多模態(tài)模型,在性能上是第一個在MMLU上超越人類專家的模型。模型根據(jù)體量大小分為GeminiUltra、Gemini Pro、以及Gemini Nano三個版本,支持在云端以及邊緣測運行。同時谷歌同步發(fā)布最新版本的計算芯片TPU v5p,相較上一代TPU v4性價比提升2.3倍。我們認(rèn)為,多模態(tài)Gemini模型的正式發(fā)布,一方面可以拓寬應(yīng)用場景的拓展,另一方面能夠帶來算力需求的持續(xù)升級。我們持續(xù)看好后續(xù)AI產(chǎn)業(yè)的前景,料后續(xù)GPT-5等模型的發(fā)布亦將帶來更多的催化。 ▍產(chǎn)品發(fā)布:多模態(tài)模型Gemini、TPU v5p等新品發(fā)布。近日,谷歌進(jìn)行新一輪的產(chǎn)品發(fā)布,包含AI軟件及計算硬件等領(lǐng)域。模型層面,谷歌發(fā)布了最新的多模態(tài)模型Gemini,基于TPU進(jìn)行訓(xùn)練,可以概括和無縫地理解、操作和組合不同類型的信息。模型包括Ultra、Pro、Nano三個版本,能夠在從數(shù)據(jù)中心到移動設(shè)備的所有設(shè)備上高效運行。TPU亦更新至v5p版本,與上一代TPU v4相比,性價比提高了2.3倍。 ▍Gemini:實現(xiàn)多模態(tài),性能得到大幅提升。根據(jù)谷歌披露,Gemini是基于Transformer decoder構(gòu)建的多模態(tài)模型,其性能較原有的單一模型更為全面,支持32K的contex長度。根據(jù)公司披露,Gemini Ultra在大型語言模型(LLM)研發(fā)中使用的32個廣泛使用的學(xué)術(shù)基準(zhǔn)中的30個方面,其性能超過了當(dāng)前最先進(jìn)的結(jié)果。Gemini Ultra的得分為90.0%,是第一個在MMLU(大規(guī)模多任務(wù)語言理解)方面優(yōu)于人類專家的模型,橫向?qū)Ρ葋砜炊鄠€任務(wù)性能超過GPT4。在公司披露的技術(shù)文檔中,Gemini能夠?qū)崿F(xiàn)圖標(biāo)理解與格式轉(zhuǎn)換、基于圖片的多個問答、文生圖、圖片理解與推理、幾何問題求解、圖片信息關(guān)聯(lián)、基于圖片以及提示詞的問答、梗圖理解、圖片邏輯解釋、代碼生成、數(shù)學(xué)問題求解、表格轉(zhuǎn)換及計算、復(fù)雜圖片生成、視頻理解等功能。 ▍訓(xùn)練方法:基于TPU v5e及v4訓(xùn)練,數(shù)據(jù)集類型更為豐富。Gemini的預(yù)訓(xùn)練數(shù)據(jù)集使用來自web文檔、書籍和代碼的數(shù)據(jù),包括圖像、音頻和視頻數(shù)據(jù),并通過篩選、過濾方式去除有害數(shù)據(jù),提升數(shù)據(jù)質(zhì)量。硬件層面,采用了谷歌的TPU v5e及v4訓(xùn)練,并針對任務(wù)進(jìn)行優(yōu)化,訓(xùn)練的硬件規(guī)模相較上一代的PaLM2顯著提升。后續(xù)來看,谷歌將繼續(xù)推出更高級的TPU v5p,進(jìn)一步提升訓(xùn)練效果。 ▍后續(xù)展望:持續(xù)關(guān)注在谷歌體系內(nèi)的導(dǎo)入進(jìn)展,以及GPT-5等多模態(tài)模型進(jìn)展。根據(jù)谷歌產(chǎn)品發(fā)布會,目前,Gemini的初始版本已在Bard(12月6日)中提供,開發(fā)人員版本將于12月13日通過Google Cloud的API提供。根據(jù)谷歌的計劃,Bard將使用Gemini Pro的微調(diào)版本進(jìn)行更高級的推理、計劃、理解等。谷歌還將Gemini引入Pixel,Pixel 8 Pro是第一款搭載Gemini Nano的智能手機(jī)。在接下來的幾個月里,Gemini將出現(xiàn)在谷歌體系內(nèi)更多產(chǎn)品和服務(wù)中,如搜索、廣告、Chrome和Duet AI。在當(dāng)前的搜索場景中,Gemini能夠降低大約40%的延遲。對整個產(chǎn)業(yè)來講,谷歌產(chǎn)品化、商業(yè)化的推進(jìn)亦將帶來行業(yè)整體的變化,同時伴隨GPT-5等模型的推出,我們預(yù)計將看到:1)多模態(tài)模型帶來的算力需求增長以及2)越來越多的AI場景與產(chǎn)品的出現(xiàn)。 ▍風(fēng)險因素:AI核心技術(shù)發(fā)展不及預(yù)期風(fēng)險;科技領(lǐng)域政策監(jiān)管持續(xù)收緊風(fēng)險;全球宏觀經(jīng)濟(jì)復(fù)蘇不及預(yù)期風(fēng)險;宏觀經(jīng)濟(jì)波動導(dǎo)致歐美企業(yè)IT支出不及預(yù)期風(fēng)險;全球云計算市場發(fā)展不及預(yù)期風(fēng)險;企業(yè)數(shù)據(jù)泄露、信息安全風(fēng)險;行業(yè)競爭持續(xù)加劇風(fēng)險等。 ▍投資建議:短期來看,Gemini的發(fā)布將進(jìn)一步帶來對多模態(tài)模型的更多期待,對產(chǎn)業(yè)而言,多模態(tài)料將帶動算力需求的提升;而在中長期來看預(yù)計,多模態(tài)模型的升級將豐富相關(guān)產(chǎn)品的使用場景,疊加硬件升級、算法優(yōu)化帶來的成本優(yōu)化,2C產(chǎn)品的進(jìn)展值得期待。我們持續(xù)看好本輪生成式AI浪潮對科技產(chǎn)業(yè)的長周期影響和改變,繼續(xù)關(guān)注算力、算法、數(shù)據(jù)、應(yīng)用等環(huán)節(jié)的領(lǐng)先廠商。在美股市場,我們建議持續(xù)關(guān)注英偉達(dá)、臺積電、特斯拉、微軟、谷歌、亞馬遜、Meta、AMD、Arista、Adobe、Snowflake等。
|
|