>> 銀河證券-計(jì)算機(jī)行業(yè):聊天機(jī)器人頂流ChatGPT,開啟自然語(yǔ)言處理領(lǐng)域新篇章-221211
| 上傳日期: |
2022/12/13 |
大?。?/td>
| 856KB |
| 格式: |
pdf 共10頁(yè) |
來源: |
銀河證券 |
| 評(píng)級(jí): |
推薦 |
作者: |
吳硯靖,鄒文倩 |
| 行業(yè)名稱: |
計(jì)算機(jī) |
| 下載權(quán)限: |
無(wú)限制-登錄即可下載 |
|
|
事件:12月1日,美國(guó)人工智能公司OpenAI在網(wǎng)頁(yè)上推出自然語(yǔ)言處理領(lǐng)域(NLP)的模型ChatGPT,它能夠通過對(duì)話方式進(jìn)行交互,并根據(jù)用戶輸入的自然語(yǔ)言文本內(nèi)容,自動(dòng)生成新的文本內(nèi)容。一周內(nèi),ChatGPT的用戶已突破100萬(wàn)。 什么是ChatGPT:ChatGPT是在GPT 3.5大模型語(yǔ)言模型(LLM,即Large Language Model)的基礎(chǔ)上,加入“基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF,Reinforcement Learning from Human Feedback)”來不斷微調(diào)(Fine-tune)預(yù)訓(xùn)練語(yǔ)言模型,使得LLM模型學(xué)會(huì)理解不同類型的命令指令,并通過多重標(biāo)準(zhǔn)合理判斷基于給定的prompt輸入指令,輸出的是否為優(yōu)質(zhì)信息(這些標(biāo)準(zhǔn)包括:富含信息、內(nèi)容豐富、對(duì)用戶有幫助、無(wú)害、不包含歧視信息等)。 ChatGPT引爆AIGC,AIGC將迎多場(chǎng)景爆發(fā)期。AIGC即AIGenerated Content,是繼UGC、PGC之后利用AI技術(shù)自動(dòng)生成內(nèi)容的新型生產(chǎn)方式。相比UGC和PGC,AIGC的最大不同是基于海量數(shù)據(jù)、風(fēng)格隨機(jī)多變、跨模態(tài)融合、認(rèn)知交互力等新技術(shù)導(dǎo)向特征。隨著ChatGPT的技術(shù)日漸成熟,AIGC將在電商虛擬主播、教育、金融、醫(yī)療、影視娛樂等多場(chǎng)景爆發(fā),并進(jìn)一步催生元宇宙的快速發(fā)展。 ChatGPT的技術(shù)發(fā)展路徑:從GPT-1到InstructGPT,數(shù)據(jù)量與參數(shù)量不斷增加,模型精度和能力提升。2018年,在自然語(yǔ)言處理領(lǐng)域(NLP)剛興起時(shí),OpenAI就推出了初代GPT,它的運(yùn)行邏輯是:先通過無(wú)標(biāo)簽數(shù)據(jù)學(xué)習(xí)生成語(yǔ)言模型,并能夠運(yùn)用于一些與有監(jiān)督任務(wù)無(wú)關(guān)的NLP任務(wù)中。此后再根據(jù)特定的下游任務(wù)進(jìn)行有監(jiān)督的微調(diào),提高其泛化能力。 GPT-2擴(kuò)展了網(wǎng)絡(luò)參數(shù)和數(shù)據(jù)集,進(jìn)行多任務(wù)學(xué)習(xí),可以在數(shù)據(jù)量足夠豐富且模型容量足夠大時(shí),通過訓(xùn)練語(yǔ)言模型就能夠完成有監(jiān)督學(xué)習(xí)的任務(wù)。 對(duì)比GPT-2,2020年推出的GPT-3最顯著的特征是龐大的數(shù)據(jù)量和參數(shù)投入,整體訓(xùn)練過程耗資1200萬(wàn)美元,投入數(shù)據(jù)量達(dá)上萬(wàn)億,模型參數(shù)量達(dá)到1750億。GPT-3延續(xù)了前兩代GPT的技術(shù)架構(gòu),但改變了“大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練+下游數(shù)據(jù)標(biāo)注微調(diào)”的方式,采用情境學(xué)習(xí)(in-context learning)來提高模型對(duì)話輸出的性能。GPT-3的規(guī)模和語(yǔ)言能力幾乎是最強(qiáng)大的。它能在不做微調(diào)的情況下,在一些傳統(tǒng)的NLP任務(wù)中表現(xiàn)得更好,包括實(shí)現(xiàn)閉卷問答、模式解析、純語(yǔ)言建模、機(jī)器翻譯等;在新的領(lǐng)域,GPT-3將NLP的應(yīng)用擴(kuò)展到缺乏足夠訓(xùn)練數(shù)據(jù)的領(lǐng)域,例如在開發(fā)程序代碼、文章生成和信息檢索領(lǐng)域取得了實(shí)質(zhì)性的進(jìn)展。然而,GPT-3在推理和理解能力上還有較長(zhǎng)的路要走,在自然語(yǔ)言推理(NLI)任務(wù)中表現(xiàn)不佳。 InstructGPT和ChatGPT:更好地遵循用戶意圖、更少的虛假信息。OpenAI在2022年初發(fā)布了InstructGPT。該語(yǔ)言模型通過“基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)和監(jiān)督學(xué)習(xí)”來提高輸出質(zhì)量。雖然InstructGPT的參數(shù)量?jī)H為13億左右,相比于GPT-3縮小了100倍以上;但在遵循指令方面,能夠更好地遵循用戶意圖,將有害的、不真實(shí)或者有偏差的信息輸出最小化。在優(yōu)化的模型上,ChatGPT基于InstructGPT進(jìn)一步改進(jìn),在模型結(jié)構(gòu)和訓(xùn)練流程上遵循上述方式,但收集和標(biāo)注數(shù)據(jù)的方式上發(fā)生了變化,通過采取監(jiān)督學(xué)習(xí)的方式讓模型學(xué)習(xí)人類排序的方式。 ChatGPT的優(yōu)勢(shì)與缺陷:優(yōu)勢(shì)是ChatGPT不需要任何額外的訓(xùn)練就能在多種不同的領(lǐng)域中應(yīng)用并快速輸出高質(zhì)量的文本,相較于以前的模型已具備較強(qiáng)的自然語(yǔ)言處理能力。但目前ChatGPT在精準(zhǔn)性、真實(shí)性、重復(fù)率和依賴性等問題上尚待改善:第一、由于技術(shù)實(shí)現(xiàn)的問題,ChatGPT會(huì)不可避免地寫出一些似是而非、或者荒謬的答案,這將導(dǎo)致植入虛假數(shù)據(jù)和誤導(dǎo)用戶的風(fēng)險(xiǎn)。ChatGPT依然沒有完全克服大型語(yǔ)言模型(LLM)的這一常見缺點(diǎn);第二、在較長(zhǎng)的會(huì)話中,由于訓(xùn)練數(shù)據(jù)的偏差和過度修正,ChatGPT會(huì)過度強(qiáng)調(diào)某些短語(yǔ)或者句子,導(dǎo)致重復(fù)性高的問題;第三、ChatGPT的強(qiáng)大能力依賴語(yǔ)料庫(kù)、數(shù)據(jù)量的抓取和復(fù)雜的訓(xùn)練過程。ChatGPT模型依賴于大規(guī)模離線語(yǔ)料進(jìn)行訓(xùn)練,往往不能充分接受并采用在線提供的即時(shí)信息,難以理解對(duì)話中提及的因果關(guān)系,也無(wú)法基于已有信息進(jìn)行推測(cè),這距離人類舉一反三的能力相差較遠(yuǎn)。 可能存在的瓶頸:ChatGPT本身的缺陷可能通過技術(shù)進(jìn)步和優(yōu)化訓(xùn)練方式得到解決,但它的爆火卻引發(fā)了人們對(duì)AIGC行業(yè)中安全性、倫理約束和創(chuàng)造力的思考,或?qū)⒊蔀榘l(fā)展瓶頸。一方面,由于RLFH并不能完全避免ChatGPT訓(xùn)練庫(kù)中學(xué)習(xí)到的不道德或有偏見的回答,也會(huì)導(dǎo)致在模糊提示或引導(dǎo)回答的過程中讓ChatGPT輸出一些有害信息,導(dǎo)致輸出結(jié)果的安全性降低。另一方面,在創(chuàng)造性、創(chuàng)作倫理和知識(shí)產(chǎn)權(quán)等方面并未形成有效界定。在數(shù)據(jù)挖掘、大規(guī)模計(jì)算、統(tǒng)計(jì)、多線程工作等數(shù)據(jù)處理分析領(lǐng)域,人工智能有著人類不可比擬的優(yōu)勢(shì),但是以“創(chuàng)新和感知”為基礎(chǔ)的創(chuàng)造過程是機(jī)器學(xué)習(xí)和模型難以訓(xùn)練的。目前ChatGPT能夠在用戶的引導(dǎo)下快速生成小說、詩(shī)歌、散文、編程等需要?jiǎng)?chuàng)造力的內(nèi)容,或許將對(duì)創(chuàng)作者和以版權(quán)為基礎(chǔ)的行業(yè)造成沖擊。文
|
|