久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频

研報(bào)下載就選股票報(bào)告網(wǎng)
您好,歡迎來(lái)到股票分析報(bào)告網(wǎng)!登錄   忘記密碼   注冊(cè)
>> 華泰證券-計(jì)算機(jī)行業(yè)專題研究-多模態(tài)ChatGPT:AGI更進(jìn)一步-230926
上傳日期:   2023/9/26 大?。?/td>   489KB
格式:   pdf  共5頁(yè) 來(lái)源:   華泰證券
評(píng)級(jí):   增持 作者:   謝春生
行業(yè)名稱:   計(jì)算機(jī)
下載權(quán)限:   此報(bào)告為加密報(bào)告
新版ChatGPT:落地語(yǔ)音對(duì)話和識(shí)圖功能
  9月25日,OpenAI官宣即將在ChatGPT中推出語(yǔ)音和多模態(tài)功能,支持用戶直接與ChatGPT進(jìn)行語(yǔ)音對(duì)話和多模態(tài)圖像問(wèn)答。未來(lái)兩周,新功能將向ChatGPTPlus和Enterprise用戶開(kāi)放,其中語(yǔ)音對(duì)話(需開(kāi)啟設(shè)置)將在手機(jī)的iOS和Android客戶端推出,識(shí)圖功能將面向包含網(wǎng)頁(yè)端的所有平臺(tái)。OpenAI在3月提出的GPT-4多模態(tài)識(shí)圖能力正式落地。安全性上,OpenAI通過(guò)Red Team測(cè)試模型在極端主義和科學(xué)領(lǐng)域的風(fēng)險(xiǎn),且拒絕對(duì)圖片中的人進(jìn)行分析,從而實(shí)現(xiàn)負(fù)責(zé)任的AI。完整版的多模態(tài)ChatGPT將在手機(jī)端率先實(shí)現(xiàn),或?qū)㈤_(kāi)啟智能終端時(shí)代。
  情理之中:復(fù)盤OpenAI的多模態(tài)之路
  3月14日,OpenAI官宣GPT-4,并在演示和技術(shù)報(bào)告中展示了多模態(tài)識(shí)圖能力(僅展示了單圖識(shí)別)。9月18日,據(jù)The Information信息,出于視覺(jué)功能可能被不良利用等安全原因,多模態(tài)功能早期僅向Be My Eyes公司提供,近期OpenAI正準(zhǔn)備將其廣泛推出。9月25日,OpenAI官宣驗(yàn)證了該信息。值得注意的是,The Information還指出OpenAI正在訓(xùn)練新的多模態(tài)模型Gobi來(lái)抗衡Google即將推出的多模態(tài)模型Gemini,而本次的GPT-4V(ison)并非多模態(tài)的Gobi模型。此外,5月18日,ChatGPT iOS發(fā)布時(shí),已支持語(yǔ)音多模態(tài),即Whisper語(yǔ)音轉(zhuǎn)文本輸入。
  意料之外:多圖識(shí)別、聚焦分析和語(yǔ)音對(duì)話
  結(jié)合官方發(fā)布的視頻和博客,我們總結(jié)了新版ChatGPT超預(yù)期的多模態(tài)能力:1)支持用戶同時(shí)上傳多張圖像,并以自然語(yǔ)言的方式提問(wèn),ChatGPT將結(jié)合文字與圖像多模態(tài)進(jìn)行理解和回答,幫助用戶分析日常生活中的問(wèn)題和工作中的圖表等復(fù)雜數(shù)據(jù)。2)ChatGPT手機(jī)App內(nèi)置了繪圖工具,支持用戶標(biāo)注圖像中的具體對(duì)象,讓ChatGPT聚焦性的推理作答。3)賦予了ChatGPT語(yǔ)音輸出能力,結(jié)合之前已集成的Whisper語(yǔ)音識(shí)別能力,實(shí)現(xiàn)了ChatGPT和用戶的完整語(yǔ)音對(duì)話,并支持5種音色。
  技術(shù)解析:語(yǔ)音新模型+多模態(tài)涌現(xiàn)能力
  語(yǔ)音模態(tài),語(yǔ)音輸出功能基于新的文本到語(yǔ)音模型,能夠從文本和樣本語(yǔ)音中生成人類音頻。圖像模態(tài),OpenAI公開(kāi)了GPT-4V的system card:1)GPT-4V于2022年訓(xùn)練完成。2)GPT-4V訓(xùn)練方式與GPT-4相同,先使用互聯(lián)網(wǎng)圖像和文本數(shù)據(jù)進(jìn)行混合預(yù)訓(xùn)練,來(lái)預(yù)測(cè)下一個(gè)單詞;然后通過(guò)InstructGPT沿用至今的RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))技術(shù)來(lái)用額外數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),實(shí)現(xiàn)與人類的對(duì)齊。3)在文本和圖像多模態(tài)的混合,以及大規(guī)模模型提供的智能和推理能力下,模型能夠涌現(xiàn)新的能力。
  未來(lái)布局:多模態(tài)ChatGPT開(kāi)啟智能終端時(shí)代,AGI更進(jìn)一步
  我們認(rèn)為,大模型向智能終端側(cè)部署是模型應(yīng)用的重要方向之一。本次ChatGPT更新,完整的語(yǔ)音和多模態(tài)識(shí)圖能力率先在手機(jī)端實(shí)現(xiàn),而PC端的語(yǔ)音功能將被延后,智能終端對(duì)多模態(tài)的支持能力優(yōu)勢(shì)開(kāi)始顯現(xiàn)。從OpenAI官方介紹視頻和文檔看,多模態(tài)ChatGPT已能夠較為全面的覆蓋用戶的生活和工作場(chǎng)景。未來(lái)隨著模型多模態(tài)能力的迭代完善,或能賦能機(jī)器人、汽車等更加復(fù)雜的智能終端,AGI更進(jìn)一步。
  風(fēng)險(xiǎn)提示:宏觀經(jīng)濟(jì)波動(dòng),技術(shù)進(jìn)步不及預(yù)期。本報(bào)告內(nèi)容均基于客觀信息整理,不構(gòu)成投資建議。
  
相關(guān)行業(yè)報(bào)告
 
Copyright ? 2005 - 2021 Nxny.com All Rights Reserved 備案號(hào):蜀ICP備15031742號(hào)-1

邯郸市| 永德县| 含山县| 崇信县| 福州市| 天峻县| 临沂市| 新营市| 新巴尔虎右旗| 历史| 永仁县| 库车县| 大新县| 米泉市| 加查县| 彭水| 巴塘县| 天柱县| 开封市| 尖扎县| 忻城县| 永德县| 永德县| 隆安县| 泰安市| 高淳县| 邯郸市| 玉环县| 湛江市| 射阳县| 黔江区| 汉寿县| 栖霞市| 绥江县| 德令哈市| 体育| 扶余县| 木兰县| 仙游县| 大庆市| 奉新县|