>> 招商證券-傳媒行業(yè)OpenAI發(fā)布會點評:OpenAI強(qiáng)化微調(diào)提升專業(yè)模型能力,關(guān)注相關(guān)受益公司-241209
| 上傳日期: |
2024/12/10 |
大?。?/td>
| 289KB |
| 格式: |
pdf 共2頁 |
來源: |
招商證券 |
| 評級: |
推薦 |
作者: |
顧佳 |
| 行業(yè)名稱: |
傳媒 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
2024年12月6日,OpenAI在發(fā)布會第二日宣布推出強(qiáng)化微調(diào)功能(Reinforcement Fine-Tuning),開發(fā)者可以使用極少訓(xùn)練數(shù)據(jù)在特定領(lǐng)域輕松創(chuàng)建專家模型。OpenAICEOSam Altman表示:強(qiáng)化微調(diào)的alpha項目現(xiàn)已啟動,正式版將會在25Q1發(fā)布。 強(qiáng)化微調(diào)通過少量示例實現(xiàn)高效適應(yīng),重視高質(zhì)量數(shù)據(jù)集合作。根據(jù)OpenAI,強(qiáng)化微調(diào)是一種先進(jìn)的模型定制技術(shù),允許開發(fā)者通過使用數(shù)十到數(shù)千個高質(zhì)量的任務(wù)來定制模型,并根據(jù)提供的參考答案來評估模型的響應(yīng)。這種技術(shù)通過加強(qiáng)模型在類似問題上的推理能力,提高了模型在特定任務(wù)和領(lǐng)域上的準(zhǔn)確性。值得注意的是,OpenAI在強(qiáng)化微調(diào)研究計劃中強(qiáng)調(diào)希望與愿意共享數(shù)據(jù)集的組織合作,利用這些數(shù)據(jù)進(jìn)一步優(yōu)化模型性能,進(jìn)一步有望為具備優(yōu)質(zhì)數(shù)據(jù)集儲備的相關(guān)領(lǐng)域公司帶來商業(yè)化價值提升,如教育、醫(yī)療等領(lǐng)域,同時也有望為業(yè)內(nèi)具備類似專業(yè)領(lǐng)域模型布局的公司提供產(chǎn)品能力參考。 強(qiáng)化微調(diào)研究計劃內(nèi)測結(jié)果表現(xiàn)出色,專業(yè)領(lǐng)域模型能力有望提升。強(qiáng)化微調(diào)技術(shù)目前處于內(nèi)部測試階段,計劃在25年全面推出。強(qiáng)化微調(diào)研究計劃具體內(nèi)容:1)API訪問權(quán)限:參與者將獲得強(qiáng)化微調(diào)API的alpha版本訪問權(quán)限,以便在專業(yè)領(lǐng)域進(jìn)行測試。2)反饋與改進(jìn):OpenAI征求用戶反饋,以便在API公開發(fā)布之前對其進(jìn)行改進(jìn)。3)數(shù)據(jù)集合作:OpenAI希望與愿意共享數(shù)據(jù)集的組織合作,利用這些數(shù)據(jù)進(jìn)一步優(yōu)化模型性能。在OpenAI內(nèi)部測試中,微調(diào)后的o1模型在生物化學(xué)、安全、法律和醫(yī)療保健等解決復(fù)雜任務(wù)的研究領(lǐng)域取得出色表現(xiàn)。 我們認(rèn)為強(qiáng)化微調(diào)功能有助于優(yōu)化定制模型顯著提升專業(yè)領(lǐng)域能力,建議關(guān)注1)在垂直領(lǐng)域有高質(zhì)量獨家數(shù)據(jù)集儲備的公司,有望受益于模型專業(yè)領(lǐng)域能力提升帶來的數(shù)據(jù)集使用變現(xiàn)率提升,如【中文在線】【上海電影】【視覺中國】【中國科傳】【中信出版】等;以及2)各垂類領(lǐng)域AI應(yīng)用及模型專業(yè)領(lǐng)域推理能力重點布局公司,如【昆侖萬維】【朗瑪信息】【盛天網(wǎng)絡(luò)】【第四范式】【世紀(jì)天鴻】【科大訊飛】(計算機(jī)覆蓋)等。 風(fēng)險提示:行業(yè)競爭加劇、應(yīng)用落地進(jìn)展不及預(yù)期、政策監(jiān)管風(fēng)險。
|
|