>> 國(guó)盛證券-區(qū)塊鏈行業(yè)點(diǎn)評(píng):AIGC與數(shù)據(jù)要素的思考-230212
| 上傳日期: |
2023/2/12 |
大?。?/td>
| 344KB |
| 格式: |
pdf 共3頁(yè) |
來(lái)源: |
國(guó)盛證券 |
| 評(píng)級(jí): |
增持 |
作者: |
宋嘉吉 |
| 行業(yè)名稱: |
|
| 下載權(quán)限: |
無(wú)限制-登錄即可下載 |
|
|
近期隨著微軟將ChatGPT嵌入搜索引擎,AIGC繼續(xù)成為市場(chǎng)焦點(diǎn)。市場(chǎng)此前認(rèn)為AIGC可能是一個(gè)類似于元宇宙的主題,但當(dāng)看到產(chǎn)品和商業(yè)模式的陸續(xù)落地,慢慢地感受到AIGC將為技術(shù)、產(chǎn)業(yè)產(chǎn)生更為深遠(yuǎn)的影響。上周我們從CPO算力的角度尋找AI算力下光器件技術(shù)的預(yù)期差,本周聚焦AIGC與數(shù)據(jù)要素。 1、ChatGPT的勝利,LLM的正名之戰(zhàn) 從技術(shù)發(fā)展上看,此前的AI較多聚焦于知識(shí)圖譜、深度學(xué)習(xí)。知識(shí)圖譜是一種結(jié)構(gòu)化的語(yǔ)義庫(kù),就是把面向特定行業(yè)、特定場(chǎng)景的各類知識(shí)按照特定的關(guān)系進(jìn)行呈現(xiàn)。而手動(dòng)完成知識(shí)圖譜過(guò)于費(fèi)事費(fèi)力,便引入了深度學(xué)習(xí),然而近年來(lái)進(jìn)展卻仍較緩慢。而ChatGPT背后的LLM(大型語(yǔ)言模型,Large Language Model)卻將所有任務(wù)統(tǒng)一到生成環(huán)節(jié)下,即通過(guò)海量數(shù)據(jù)的訓(xùn)練,獲得對(duì)后續(xù)內(nèi)容(Token)的預(yù)測(cè)。根據(jù)我們和產(chǎn)業(yè)界的交流,其實(shí)這種算法一直都有,但讓大家驚訝的是OpenAI通過(guò)如此長(zhǎng)時(shí)間的投入、積累、訓(xùn)練,將LLM用得爐火純青、獨(dú)辟蹊徑。就像金庸小說(shuō)中很多武林高手雖身懷多個(gè)絕技卻無(wú)法登上華山之巔,而郭靖卻憑借降龍十八掌多年苦練而一戰(zhàn)成名。2020年,GPT3.0的出現(xiàn)也標(biāo)志著LLM推動(dòng)行業(yè)進(jìn)入通用人工智能時(shí)代,真正的AIGC時(shí)代逐步拉開(kāi)序幕。 2、數(shù)據(jù)要素——不僅是交易,更要使用 2020年起,我國(guó)逐步明確將數(shù)據(jù)作為資本、勞動(dòng)、技術(shù)以外的新型生產(chǎn)要素,2022年更是在政策中頻頻提及,并快速推進(jìn)成立數(shù)據(jù)交易市場(chǎng)。其實(shí)從2015起,當(dāng)大數(shù)據(jù)概念興起之時(shí),國(guó)內(nèi)就陸續(xù)出現(xiàn)過(guò)地方性數(shù)據(jù)交易平臺(tái),但因?yàn)閿?shù)據(jù)隱私保護(hù)的立法、技術(shù)平臺(tái)不完善,數(shù)據(jù)交易并未興起,而今隨著政策完善,數(shù)據(jù)要素價(jià)值將被進(jìn)一步挖掘。但我們認(rèn)為,交易只是第一步,如何使用數(shù)據(jù)才是根本。數(shù)據(jù)是一種特殊的資產(chǎn),當(dāng)A有一本書(shū)、B有一本書(shū),如果兩者交換借閱,那么A和B各讀了兩本書(shū),這是“1+1=2”的線性關(guān)系,但當(dāng)A或B將書(shū)中的知識(shí)融會(huì)貫通后,其輸出往往是“1+1>2”的,那如果是10本書(shū)、100本書(shū)呢?這種價(jià)值類似于LLM模型進(jìn)行海量數(shù)據(jù)訓(xùn)練后形成的“通識(shí)化底座”,對(duì)接各個(gè)行業(yè)后能快速形成應(yīng)用,是對(duì)數(shù)據(jù)要素價(jià)值的完美呈現(xiàn)和商業(yè)變現(xiàn),一定程度上也消除了數(shù)據(jù)孤島問(wèn)題,畢竟人工對(duì)接數(shù)據(jù)需求效率太低,只有依靠機(jī)器進(jìn)行訓(xùn)練才能快速迭代當(dāng)下海量數(shù)據(jù)并承載應(yīng)用。所有合規(guī)數(shù)據(jù)的掌握者都應(yīng)成為這個(gè)“AI底座”的數(shù)據(jù)投喂者和使用者。 3、AIGC+數(shù)據(jù)要素,未來(lái)信息安全的制高點(diǎn) ChatGPT的興起讓全世界看到AI技術(shù)不再高冷,每個(gè)人都可以提出問(wèn)題、輸入數(shù)據(jù)或范例和ChatGPT互動(dòng),本質(zhì)上這為ChatGPT的訓(xùn)練提供了海量的人工反饋,相信在下一代GPT-4中將更好地展示這一效果。從2022年開(kāi)始,我們與大量業(yè)內(nèi)團(tuán)隊(duì)交流,其焦點(diǎn)仍在模型與訓(xùn)練。即便像Stable Diffusion開(kāi)源,但基于此模型產(chǎn)品的數(shù)據(jù)集和訓(xùn)練方法并不開(kāi)源,類似于告訴大家紅燒肉的圖片,但沒(méi)有烹飪過(guò)程細(xì)節(jié),美味依然難以復(fù)現(xiàn)。而隨著OpenAI產(chǎn)品、商業(yè)模型日漸完善,其飛輪效應(yīng)將逐步顯現(xiàn),全球龍頭地位將更加明顯。融合了AI的通用性和海量數(shù)據(jù)訓(xùn)練能力,微軟New Bing的推出重新定義了搜索引擎,ChatGPT聯(lián)網(wǎng)后也會(huì)接觸到更多信息,搶占信息安全的制高點(diǎn)。作為一種數(shù)字化的創(chuàng)新,且迭代速度遠(yuǎn)快于傳統(tǒng)產(chǎn)業(yè),發(fā)令槍已響,預(yù)計(jì)2023年國(guó)內(nèi)外各科技大廠將陸續(xù)推出AIGC領(lǐng)域的產(chǎn)品,競(jìng)爭(zhēng)態(tài)勢(shì)值得觀察。 4、倫理與監(jiān)管,AIGC的新焦點(diǎn) 2022年11月份,我們就AIGC的法律合規(guī)問(wèn)題與專業(yè)律師進(jìn)行過(guò)討論,一個(gè)簡(jiǎn)單的例子:通過(guò)DALL-E2、Midjourney生成的圖片,其版權(quán)是屬于“Prompt提出者”、“AIGC平臺(tái)提供方”還是“訓(xùn)練數(shù)據(jù)提供方”?目前歐美就此問(wèn)題爭(zhēng)論頗多,版權(quán)、就業(yè)等都是焦點(diǎn),目前尚未有定論。此外,在數(shù)據(jù)收集、訓(xùn)練中涉及到的歧視、偏見(jiàn)也引發(fā)了社會(huì)關(guān)注,此方向的論文數(shù)量大增,可以想象,數(shù)字世界也是人的映射,必然帶有某種價(jià)值取向。ChatGPT的快速迭代將把道德倫理與監(jiān)管的問(wèn)題推向臺(tái)前,站在數(shù)據(jù)要素的角度就是如何用好數(shù)據(jù)、規(guī)范治理的問(wèn)題,我們也將繼續(xù)關(guān)注該領(lǐng)域的全球進(jìn)展。 風(fēng)險(xiǎn)提示:AIGC發(fā)展不及預(yù)期,數(shù)據(jù)要素發(fā)展不及預(yù)期。
|
|