《完美世界》txt全集,小说阅读网站,琅琊榜海宴小说

>> 銀河證券-計(jì)算機(jī)行業(yè)：聊天機(jī)器人頂流ChatGPT，開啟自然語(yǔ)言處理領(lǐng)域新篇章-221211

上傳日期：	2022/12/13	大?。?/td>	856KB
格式：	pdf 共10頁(yè)	來源：	銀河證券
評(píng)級(jí)：	推薦	作者：	吳硯靖,鄒文倩
行業(yè)名稱：	計(jì)算機(jī)
下載權(quán)限：	無(wú)限制-登錄即可下載

事件：12月1日，美國(guó)人工智能公司OpenAI在網(wǎng)頁(yè)上推出自然語(yǔ)言處理領(lǐng)域（NLP）的模型ChatGPT，它能夠通過對(duì)話方式進(jìn)行交互，并根據(jù)用戶輸入的自然語(yǔ)言文本內(nèi)容，自動(dòng)生成新的文本內(nèi)容。一周內(nèi)，ChatGPT的用戶已突破100萬(wàn)。
　　什么是ChatGPT：ChatGPT是在GPT 3.5大模型語(yǔ)言模型（LLM,即Large Language Model）的基礎(chǔ)上，加入“基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF，Reinforcement Learning from Human Feedback）”來不斷微調(diào)（Fine-tune）預(yù)訓(xùn)練語(yǔ)言模型，使得LLM模型學(xué)會(huì)理解不同類型的命令指令，并通過多重標(biāo)準(zhǔn)合理判斷基于給定的prompt輸入指令，輸出的是否為優(yōu)質(zhì)信息（這些標(biāo)準(zhǔn)包括：富含信息、內(nèi)容豐富、對(duì)用戶有幫助、無(wú)害、不包含歧視信息等）。
　　ChatGPT引爆AIGC，AIGC將迎多場(chǎng)景爆發(fā)期。AIGC即AIGenerated Content，是繼UGC、PGC之后利用AI技術(shù)自動(dòng)生成內(nèi)容的新型生產(chǎn)方式。相比UGC和PGC，AIGC的最大不同是基于海量數(shù)據(jù)、風(fēng)格隨機(jī)多變、跨模態(tài)融合、認(rèn)知交互力等新技術(shù)導(dǎo)向特征。隨著ChatGPT的技術(shù)日漸成熟，AIGC將在電商虛擬主播、教育、金融、醫(yī)療、影視娛樂等多場(chǎng)景爆發(fā)，并進(jìn)一步催生元宇宙的快速發(fā)展。
　　ChatGPT的技術(shù)發(fā)展路徑:從GPT-1到InstructGPT，數(shù)據(jù)量與參數(shù)量不斷增加，模型精度和能力提升。2018年，在自然語(yǔ)言處理領(lǐng)域（NLP）剛興起時(shí)，OpenAI就推出了初代GPT，它的運(yùn)行邏輯是：先通過無(wú)標(biāo)簽數(shù)據(jù)學(xué)習(xí)生成語(yǔ)言模型，并能夠運(yùn)用于一些與有監(jiān)督任務(wù)無(wú)關(guān)的NLP任務(wù)中。此后再根據(jù)特定的下游任務(wù)進(jìn)行有監(jiān)督的微調(diào)，提高其泛化能力。
　　GPT-2擴(kuò)展了網(wǎng)絡(luò)參數(shù)和數(shù)據(jù)集，進(jìn)行多任務(wù)學(xué)習(xí)，可以在數(shù)據(jù)量足夠豐富且模型容量足夠大時(shí)，通過訓(xùn)練語(yǔ)言模型就能夠完成有監(jiān)督學(xué)習(xí)的任務(wù)。
　　對(duì)比GPT-2，2020年推出的GPT-3最顯著的特征是龐大的數(shù)據(jù)量和參數(shù)投入，整體訓(xùn)練過程耗資1200萬(wàn)美元，投入數(shù)據(jù)量達(dá)上萬(wàn)億，模型參數(shù)量達(dá)到1750億。GPT-3延續(xù)了前兩代GPT的技術(shù)架構(gòu)，但改變了“大規(guī)模數(shù)據(jù)集預(yù)訓(xùn)練+下游數(shù)據(jù)標(biāo)注微調(diào)”的方式，采用情境學(xué)習(xí)（in-context learning）來提高模型對(duì)話輸出的性能。GPT-3的規(guī)模和語(yǔ)言能力幾乎是最強(qiáng)大的。它能在不做微調(diào)的情況下，在一些傳統(tǒng)的NLP任務(wù)中表現(xiàn)得更好，包括實(shí)現(xiàn)閉卷問答、模式解析、純語(yǔ)言建模、機(jī)器翻譯等；在新的領(lǐng)域，GPT-3將NLP的應(yīng)用擴(kuò)展到缺乏足夠訓(xùn)練數(shù)據(jù)的領(lǐng)域，例如在開發(fā)程序代碼、文章生成和信息檢索領(lǐng)域取得了實(shí)質(zhì)性的進(jìn)展。然而，GPT-3在推理和理解能力上還有較長(zhǎng)的路要走，在自然語(yǔ)言推理（NLI）任務(wù)中表現(xiàn)不佳。
　　InstructGPT和ChatGPT：更好地遵循用戶意圖、更少的虛假信息。OpenAI在2022年初發(fā)布了InstructGPT。該語(yǔ)言模型通過“基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）和監(jiān)督學(xué)習(xí)”來提高輸出質(zhì)量。雖然InstructGPT的參數(shù)量?jī)H為13億左右，相比于GPT-3縮小了100倍以上；但在遵循指令方面，能夠更好地遵循用戶意圖，將有害的、不真實(shí)或者有偏差的信息輸出最小化。在優(yōu)化的模型上，ChatGPT基于InstructGPT進(jìn)一步改進(jìn)，在模型結(jié)構(gòu)和訓(xùn)練流程上遵循上述方式，但收集和標(biāo)注數(shù)據(jù)的方式上發(fā)生了變化，通過采取監(jiān)督學(xué)習(xí)的方式讓模型學(xué)習(xí)人類排序的方式。
　　ChatGPT的優(yōu)勢(shì)與缺陷：優(yōu)勢(shì)是ChatGPT不需要任何額外的訓(xùn)練就能在多種不同的領(lǐng)域中應(yīng)用并快速輸出高質(zhì)量的文本，相較于以前的模型已具備較強(qiáng)的自然語(yǔ)言處理能力。但目前ChatGPT在精準(zhǔn)性、真實(shí)性、重復(fù)率和依賴性等問題上尚待改善：第一、由于技術(shù)實(shí)現(xiàn)的問題，ChatGPT會(huì)不可避免地寫出一些似是而非、或者荒謬的答案，這將導(dǎo)致植入虛假數(shù)據(jù)和誤導(dǎo)用戶的風(fēng)險(xiǎn)。ChatGPT依然沒有完全克服大型語(yǔ)言模型（LLM）的這一常見缺點(diǎn)；第二、在較長(zhǎng)的會(huì)話中，由于訓(xùn)練數(shù)據(jù)的偏差和過度修正，ChatGPT會(huì)過度強(qiáng)調(diào)某些短語(yǔ)或者句子，導(dǎo)致重復(fù)性高的問題；第三、ChatGPT的強(qiáng)大能力依賴語(yǔ)料庫(kù)、數(shù)據(jù)量的抓取和復(fù)雜的訓(xùn)練過程。ChatGPT模型依賴于大規(guī)模離線語(yǔ)料進(jìn)行訓(xùn)練，往往不能充分接受并采用在線提供的即時(shí)信息，難以理解對(duì)話中提及的因果關(guān)系，也無(wú)法基于已有信息進(jìn)行推測(cè)，這距離人類舉一反三的能力相差較遠(yuǎn)。
　　可能存在的瓶頸：ChatGPT本身的缺陷可能通過技術(shù)進(jìn)步和優(yōu)化訓(xùn)練方式得到解決，但它的爆火卻引發(fā)了人們對(duì)AIGC行業(yè)中安全性、倫理約束和創(chuàng)造力的思考，或?qū)⒊蔀榘l(fā)展瓶頸。一方面，由于RLFH并不能完全避免ChatGPT訓(xùn)練庫(kù)中學(xué)習(xí)到的不道德或有偏見的回答，也會(huì)導(dǎo)致在模糊提示或引導(dǎo)回答的過程中讓ChatGPT輸出一些有害信息，導(dǎo)致輸出結(jié)果的安全性降低。另一方面，在創(chuàng)造性、創(chuàng)作倫理和知識(shí)產(chǎn)權(quán)等方面并未形成有效界定。在數(shù)據(jù)挖掘、大規(guī)模計(jì)算、統(tǒng)計(jì)、多線程工作等數(shù)據(jù)處理分析領(lǐng)域，人工智能有著人類不可比擬的優(yōu)勢(shì)，但是以“創(chuàng)新和感知”為基礎(chǔ)的創(chuàng)造過程是機(jī)器學(xué)習(xí)和模型難以訓(xùn)練的。目前ChatGPT能夠在用戶的引導(dǎo)下快速生成小說、詩(shī)歌、散文、編程等需要?jiǎng)?chuàng)造力的內(nèi)容，或許將對(duì)創(chuàng)作者和以版權(quán)為基礎(chǔ)的行業(yè)造成沖擊。文

相關(guān)行業(yè)報(bào)告

久久一日本道色综合久久_国产最爽的av片在线观看_精品成人Av一区二区三区_94久久国产乱子伦精品免费_国产三级网站在线观看_和女邻居做爰在线观看_wymfw最新免费_国产强奷在线免费阅读_95在线观看视频