>> 海通證券-計(jì)算機(jī)行業(yè)跟蹤周報(bào)324期:谷歌發(fā)布Gemini,Pika獲得資本市場(chǎng)高度關(guān)注-231210
| 上傳日期: |
2023/12/11 |
大?。?/td>
| 397KB |
| 格式: |
pdf 共2頁(yè) |
來(lái)源: |
海通證券 |
| 評(píng)級(jí): |
優(yōu)于大市 |
作者: |
楊林,楊蒙 |
| 行業(yè)名稱: |
計(jì)算機(jī) |
| 下載權(quán)限: |
此報(bào)告為加密報(bào)告,僅限高級(jí)會(huì)員查看 |
|
|
谷歌發(fā)布多模態(tài)AI模型Gemini,在眾多領(lǐng)先基準(zhǔn)測(cè)試中取得領(lǐng)先。根據(jù)谷歌黑板報(bào)官微,谷歌Gemini大模型正式發(fā)布,它從一開(kāi)始就被創(chuàng)建為多模態(tài)的模型,這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。Gemini也是谷歌迄今為止最靈活的模型,從數(shù)據(jù)中心到移動(dòng)設(shè)備,它能夠在所有設(shè)備上高效運(yùn)行。其先進(jìn)的功能將顯著改善開(kāi)發(fā)者和企業(yè)客戶通過(guò)AI構(gòu)建和擴(kuò)展的方式。谷歌針對(duì)三種不同的尺寸對(duì)第一代Gemini 1.0進(jìn)行了優(yōu)化:Gemini Ultra —谷歌規(guī)模最大且功能最強(qiáng)大的模型,適用于高度復(fù)雜的任務(wù)。Gemini Pro —谷歌適用于各種任務(wù)的最佳模型。Gemini Nano —谷歌端側(cè)設(shè)備上最高效的模型。Pixel 8 Pro是首款搭載Gemini Nano的智能手機(jī),它可以支持錄音應(yīng)用中的“總結(jié)”等新功能,并在Gboard中推出“智能回復(fù)”功能,從WhatsApp開(kāi)始,2024年還將推出更多信息應(yīng)用。未來(lái)幾個(gè)月,Gemini將應(yīng)用于谷歌更多的產(chǎn)品和服務(wù),如Search、Ads、Chrome和Duet AI。從自然圖像、音頻和視頻理解到數(shù)學(xué)推理,在被大型語(yǔ)言模型研究和開(kāi)發(fā)中廣泛使用的32項(xiàng)學(xué)術(shù)基準(zhǔn)中,Gemini Ultra的性能有30項(xiàng)都超過(guò)了目前最先進(jìn)的水平。Gemini Ultra的得分率為90.0%,是第一個(gè)在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)測(cè)試中超過(guò)人類專家的模型,MMLU綜合使用了數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等57個(gè)科目,用于測(cè)試世界知識(shí)和解決問(wèn)題的能力。 Gemini原生多模態(tài)設(shè)計(jì),在幾乎各領(lǐng)域都擁有先進(jìn)能力。到目前為止,創(chuàng)建多模態(tài)模型的標(biāo)準(zhǔn)方法是分別訓(xùn)練不同模態(tài)的組件,然后將它們拼接在一起,以粗略模擬某些功能。這些模型有時(shí)可以很好地完成描述圖像等特定任務(wù),但在概念性更強(qiáng)、更復(fù)雜的推理方面卻顯得力不從心。谷歌將Gemini設(shè)計(jì)為原生多模態(tài),從一開(kāi)始就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練。然后,谷歌利用額外的多模態(tài)數(shù)據(jù)對(duì)其進(jìn)行微調(diào),以進(jìn)一步提高其有效性。這有助于Gemini從最初階段就能對(duì)輸入的各種內(nèi)容順暢地進(jìn)行理解和推理,遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有的多模態(tài)模型,其能力幾乎各個(gè)領(lǐng)域都是最先進(jìn)的。Gemini 1.0具有復(fù)雜的多模態(tài)推理能力,可幫助理解復(fù)雜的書(shū)面和視覺(jué)信息。這使得它具有獨(dú)特的技能,可以在海量的數(shù)據(jù)中發(fā)掘難以辨別的知識(shí)內(nèi)容。它擁有通過(guò)閱讀、過(guò)濾以及理解信息,從數(shù)十萬(wàn)份文件中提取見(jiàn)解的卓越能力,將有助于在從科學(xué)到金融等多個(gè)領(lǐng)域以數(shù)字化速度實(shí)現(xiàn)新的突破。Gemini 1.0經(jīng)過(guò)訓(xùn)練,可以同時(shí)識(shí)別并理解文本、圖像、音頻等,因此它能更好地理解具有細(xì)微差別的信息,回答與復(fù)雜主題相關(guān)的問(wèn)題。這就讓它尤其擅長(zhǎng)解釋數(shù)學(xué)和物理等復(fù)雜科目中的推理。谷歌的第一代Gemini可以理解、解釋和生成世界上最流行的編程語(yǔ)言(如Python、Java、C++和Go)的高質(zhì)量代碼。它能夠跨語(yǔ)言工作并對(duì)復(fù)雜信息進(jìn)行推理,這些能力使其成為世界領(lǐng)先的編碼基礎(chǔ)模型之一。我們認(rèn)為,Gemini的發(fā)布,代表多模態(tài)大模型的發(fā)展進(jìn)入了新時(shí)期,未來(lái)AI在各行業(yè)商業(yè)落地有望持續(xù)加速。 文生視頻AI軟件Pika獲得資本市場(chǎng)高度關(guān)注,AI賦能多業(yè)態(tài)應(yīng)用或?qū)⒓铀俾涞?。根?jù)證券日?qǐng)?bào)網(wǎng),一款A(yù)I應(yīng)用軟件的火爆出圈引發(fā)資本市場(chǎng)高度關(guān)注。近日,文生視頻公司Pika推出Pika1.0,其能夠生成和編輯3D動(dòng)畫(huà)、動(dòng)漫、卡通和電影等各種風(fēng)格的視頻,一經(jīng)推出便在各大社交媒體上迅速走紅。11月29號(hào),Pika1.0正式上線,其宣傳視頻顯示,只需在該軟件的視頻輸入框內(nèi)輸入“馬斯克穿著太空服,3D動(dòng)畫(huà)”的關(guān)鍵詞,一個(gè)身穿太空服的卡通馬斯克便躍于屏上。Pika1.0支持多種風(fēng)格視頻的生成和修改,此外,用戶還能夠通過(guò)Pika實(shí)現(xiàn)畫(huà)布延展、局部修改、視頻時(shí)長(zhǎng)拓展等編輯需求。Pika1.0一經(jīng)發(fā)布便在國(guó)內(nèi)外社交平臺(tái)上獲得了不少粉絲。Open AI創(chuàng)始成員Andrej Karpathy在社交平臺(tái)上轉(zhuǎn)發(fā)了Pika1.0的內(nèi)容并表示:“每個(gè)人都能成為多模式夢(mèng)想的導(dǎo)演,就像《盜夢(mèng)空間》中的建筑師一樣?!眹?guó)內(nèi)也有不少AIGC博主試用并點(diǎn)評(píng)了Pika1.0,稱其無(wú)論是生成質(zhì)量、編輯能力還是易用性方面,可能都達(dá)到了當(dāng)前技術(shù)的天花板。目前,Pika社區(qū)已經(jīng)發(fā)展到50萬(wàn)名用戶,每周生成數(shù)百萬(wàn)個(gè)視頻。在Pika1.0推出的當(dāng)天,公司還表示已獲得了總金額5500萬(wàn)美元的融資。我們認(rèn)為,類似于Pika這類隨著文生視頻的AI程序的能力不斷迭代,未來(lái)AI賦能多業(yè)態(tài)應(yīng)用或?qū)⒓铀俾涞亍?br> 建議關(guān)注:神州數(shù)碼、博思軟件、創(chuàng)業(yè)慧康、嘉和美康、新國(guó)都、賽意信息、海康威視、金山辦公。風(fēng)險(xiǎn)提示:AI技術(shù)發(fā)展不及預(yù)期的風(fēng)險(xiǎn),AI商業(yè)落地不及預(yù)期的風(fēng)險(xiǎn)。
|
|