>> 東方證券-計算機行業(yè)動態(tài)跟蹤:Meta發(fā)布SAM模型,CV領(lǐng)域迎來新突破-230410
| 上傳日期: |
2023/4/10 |
大小: |
283KB |
| 格式: |
pdf 共3頁 |
來源: |
東方證券 |
| 評級: |
看好 |
作者: |
浦俊懿,陳超,謝忱 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
此報告為加密報告,僅限高級會員查看 |
|
|
4月6日,Meta公司發(fā)布通用圖像分割模型Segment-Anything Model(SAM)和圖像注釋數(shù)據(jù)集Segment-Anything 1-Billion(SA-1B)。SAM模型可根據(jù)文本指令等方式,實現(xiàn)零樣本下對任意圖像行分割,其靈活性在圖像分割領(lǐng)域尚屬首創(chuàng),SAM的發(fā)布可以稱為CV領(lǐng)域的“GPT-3時刻”,或?qū)⒓铀賵D像分割視頻領(lǐng)域的研究。此外,Meta還開源了包含1100萬張圖像和11億個掩碼的訓(xùn)練數(shù)據(jù)集SA1B,該數(shù)據(jù)集可用于研究目的,并且在開放許可Apache 2.0下可用。 SAM支持多方式靈活執(zhí)行圖像分割,并且具備零樣本遷移能力。盡管過去圖像分割在眾多領(lǐng)域已得到了廣泛應(yīng)用,但為特定任務(wù)創(chuàng)建準確的分割模型通常需要技術(shù)專家進行高度專業(yè)化的工作,此外,該項任務(wù)還需要大量的領(lǐng)域標注數(shù)據(jù),種種因素限制了圖像分割的進一步發(fā)展。而SAM已學(xué)會物體的一般概念,支持文本、關(guān)鍵點、邊框等多種方式為任何圖像和視頻中的任意物體生成Mask,甚至包括訓(xùn)練中未遇到過的目標。SAM足夠通用,涵蓋廣泛用例,并且可以在新的圖像領(lǐng)域上即開即用,無需額外的訓(xùn)練,這種零樣本遷移能力開啟了CV圖像分割領(lǐng)域的GPT-3時代。 SAM有望賦能眾多垂直領(lǐng)域,釋放AI強大潛力。從應(yīng)用角度看,SAM可與其他系統(tǒng)靈活集成,獲取輸入提示,例如,從AR/VR中獲取視線范圍來選擇對象、用文本輸入檢測界定對象等。目前,Meta公司內(nèi)部已開始使用SAM,對其網(wǎng)站的圖片、審核、Facebook和Instagram用戶推薦內(nèi)容等進行標記,同時,其官網(wǎng)也展示了SAM在VR/AR、智慧農(nóng)業(yè)等領(lǐng)域的顛覆性應(yīng)用暢想。此外,在自動駕駛領(lǐng)域,SAM有利于檢測行人、汽車、障礙物等,提升智能汽車算法數(shù)據(jù)標注的效率,使算法迭代加速;在工業(yè)視覺領(lǐng)域,零部件在工業(yè)生產(chǎn)線包裝過程中存在檢測速度慢、自動化檢測水平低下、檢測準確率不高等問題,SAM可有效改善這些問題;在醫(yī)療領(lǐng)域,SAM可對醫(yī)學(xué)影像進行分割標注,幫助醫(yī)生進行病理分析和診斷;在數(shù)據(jù)標注領(lǐng)域,SAM可提高注釋圖像效率,新注釋數(shù)據(jù)則可反過來用于更新SA,迭代改善模型和數(shù)據(jù)集。我們認為,SAM將賦能自動駕駛、工業(yè)視覺、醫(yī)療、數(shù)據(jù)標注等眾多行業(yè)領(lǐng)域,相關(guān)領(lǐng)域標的將因此充分收益。 投資建議與投資標的 SAM以其靈活多樣的圖像分割能力和零樣本遷移能力,使其有望提高特定任務(wù)下分割模型的效率,我們看好SAM的強大賦能能力,CV大模型及應(yīng)用領(lǐng)域相關(guān)標的值得關(guān)注:建議關(guān)注光庭信息(301221,買入)、千方科技(002373,未評級)、虹軟科技(688088,未評級)、當虹科技(688039,買入)、奧普特(688686,未評級)、萬興科技(300624,未評級)、海康威視(002415,買入)(電子組覆蓋)、大華股份(002236,買入)(電子組覆蓋)。 風(fēng)險提示 AI技術(shù)發(fā)展不及預(yù)期風(fēng)險;芯片供應(yīng)不足風(fēng)險
|
|