>> 方正證券-計算機行業(yè)研究-視覺大模型:大模型的下一個引爆點-230409
| 上傳日期: |
2023/4/10 |
大?。?/td>
| 673KB |
| 格式: |
pdf 共2頁 |
來源: |
方正證券 |
| 評級: |
推薦 |
作者: |
方聞千 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
事件:4月6日,Meta AI發(fā)布了史上首個圖像分割基礎(chǔ)模型Segment Anything Model(SAM),改變了傳統(tǒng)的CV(計算機視覺)技術(shù)路徑,基于統(tǒng)一框架Prompt Encoder,能夠?qū)φ掌蛘咭曨l中指定的任一對象,如關(guān)鍵點、邊界框、文字等進行物體分割,并實現(xiàn)零樣本遷移。 大模型在計算機領(lǐng)域的突破已臨近技術(shù)突破的節(jié)點。隨著2020年VIT模型的發(fā)布后,Attention/transformer在計算機視覺開始得到深度應(yīng)用,近三年在語義分割、目標檢測等多個CV關(guān)鍵任務(wù)上SOTA模型性能持續(xù)提升,大模型在計算機視覺正在突破原有CNN模型的性能瓶頸。 Meta公司近期發(fā)布Segment Anything Model (SAM)模型,標志著在計算機視覺的分割任務(wù)上已經(jīng)取得重大突破。相較于此前模型,SAM模型一方面泛化能力大幅提升,能夠?qū)W會了關(guān)于物體的一般概念,甚至包括在訓(xùn)練過程中沒有遇到過的物體和圖像類型,另一方面相較于此前的視覺模型仍依賴手動標注來訓(xùn)練,SAM能夠泛化到新任務(wù)和新領(lǐng)域,這種靈活性在圖像分割領(lǐng)域尚屬首創(chuàng)。 投資邏輯:計算機視覺(CV)作為人工智能領(lǐng)域最大的應(yīng)用領(lǐng)域,將成為繼自然語言處理(NLP)之后AI技術(shù)的下一個引爆點。計算機視覺涉及到非常廣泛的下游應(yīng)用場景,在各場景中,我們認為,安防、自動駕駛、工業(yè)等有望率先實現(xiàn)商業(yè)化,其中,1)安防:應(yīng)用于人臉識別、視頻監(jiān)控、門禁卡、防盜報警等安防場景中。相關(guān)標的:??低?、大華股份、商湯科技、云從科技等;2)自動駕駛:應(yīng)用于自動駕駛感知層,如車道線檢測、障礙物檢測、信號燈識別等自動駕駛場景。相關(guān)標的:中科創(chuàng)達、德賽西威、虹軟科技、千方科技、奧比中光等;3)工業(yè):應(yīng)用于工業(yè)生產(chǎn)線的產(chǎn)品質(zhì)量控制、安全監(jiān)控、工業(yè)檢測等工業(yè)場景。相關(guān)標的:凌云光、天準科技等。 風險提示:產(chǎn)業(yè)變革和新技術(shù)落地節(jié)奏不及預(yù)期;AI技術(shù)的發(fā)展易引起法律和監(jiān)管問題;中美貿(mào)易摩擦加劇風險。
|
|