>> 中郵證券-計算機行業(yè):Meta推出SAM模型,機器視覺里程碑-230410
| 上傳日期: |
2023/4/11 |
大?。?/td>
| 561KB |
| 格式: |
pdf 共4頁 |
來源: |
中郵證券 |
| 評級: |
強于大市 |
作者: |
孫業(yè)亮 |
| 行業(yè)名稱: |
計算機 |
| 下載權(quán)限: |
無限制-登錄即可下載 |
|
|
Meta發(fā)布圖像分割模型SAM,展現(xiàn)出零樣本性能 近日Meta在論文中發(fā)布新模型Segment Anything Model (SAM),用于識別、分割圖像和視頻中的物體。與其他計算機視覺模型相比,SAM的創(chuàng)新性主要體現(xiàn)在以下幾個方面:1)SAM基于1100萬張圖像和11億個掩碼的海量數(shù)據(jù)集進(jìn)行訓(xùn)練,是迄今為止最大的分割數(shù)據(jù)集;2)SAM在分割任務(wù)中展現(xiàn)出較強的零樣本性能,能對從未訓(xùn)練過的圖片進(jìn)行精準(zhǔn)分割,初步驗證了多模態(tài)技術(shù)路徑及其泛化能力;3)SAM開創(chuàng)性地與Prompt結(jié)合了起來,標(biāo)志著自然語言處理的Prompt模式開始被應(yīng)用在了計算機視覺領(lǐng)域。Meta表示,目前公司內(nèi)部已經(jīng)開始使用SAM相關(guān)技術(shù),用于在Facebook、Instagram等社交平臺上照片的標(biāo)記、內(nèi)容審核和內(nèi)容推薦等。 國內(nèi)廠商積極布局,有望掀起通用視覺模型熱潮 繼Meta發(fā)布SAM后,智源研究院視覺團(tuán)隊推出通用分割模型SegGPT(Segment Everything In Context)。與SAM的精細(xì)標(biāo)注能力相比,SegGPT模型更偏重于批量化標(biāo)注分割能力,無論是在圖像還是視頻環(huán)境,用戶在畫面上標(biāo)注識別一類物體,即可批量化識別分割出其他所有同類物體。從測試結(jié)果看,研究人員在廣泛的任務(wù)上對SegGPT進(jìn)行了評估,包括少樣本語義分割、視頻對象分割、語義分割和全景分割,結(jié)果顯示SegGPT模型同樣展現(xiàn)出強大的零樣本場景遷移能力,并在COCO和PASCAL等經(jīng)典CV數(shù)據(jù)集上取得最優(yōu)性能。 工業(yè)制造領(lǐng)域是圖像分割模型較好的應(yīng)用入口 在工業(yè)制造領(lǐng)域,圖像分割是圖像識別和機器視覺至關(guān)重要的預(yù)處理,相關(guān)技術(shù)被用于捕捉和處理圖像,為設(shè)備提供操作指導(dǎo)的應(yīng)用,具體場景包括亂序零件的分揀等。以往為特定任務(wù)創(chuàng)建準(zhǔn)確的分割模型通常需要領(lǐng)域?qū)<疫M(jìn)行高度專業(yè)化的工作,同時需要強大的算力與大量精準(zhǔn)標(biāo)注的數(shù)據(jù),而SAM等通用圖像分割模型實現(xiàn)了機器視覺核心技術(shù)的范式突破,未來有助于減少大量的數(shù)據(jù)標(biāo)注工作。 我國工業(yè)領(lǐng)域?qū)Σ捎脠D像和機器視覺技術(shù)的工業(yè)自動化、智能化需求廣泛提升,以工業(yè)相機、圖像采集卡、光源及圖像處理軟件為核心的視覺產(chǎn)品日益完善。根據(jù)億歐智庫的統(tǒng)計數(shù)據(jù),中國機器視覺器件和系統(tǒng)的銷售額從2012年的19.8億元增長至2021年的161億元,復(fù)合增長率達(dá)到31.7%,目前3D技術(shù)領(lǐng)域80%以上的市場份額被海外企業(yè)占據(jù),國產(chǎn)化需求將進(jìn)一步推動我國工業(yè)視覺產(chǎn)業(yè)的快速發(fā)展。從工業(yè)視覺下游行業(yè)來看,3C電子、半導(dǎo)體、新能源行業(yè)合計占比約80%,我們認(rèn)為伴隨消費電子等產(chǎn)品不斷升級,對于機器視覺的通用性、準(zhǔn)確性要求將更高,圖像分割等AI技術(shù)有望帶來工業(yè)制造領(lǐng)域的降本增效。 投資建議 目前SAM模型及數(shù)據(jù)集均為開源,可以靈活集成于更大的AI系統(tǒng),隨著SAM的演進(jìn)與發(fā)展,該技術(shù)可能會成為工業(yè)質(zhì)檢、AR/VR、自動駕駛、衛(wèi)星遙感等多領(lǐng)域的強大的輔助工具,我們看好SAM等圖像分割模型在機器視覺中的應(yīng)用,建議關(guān)注相關(guān)標(biāo)的: ?。?)奧普特:機器視覺核心部件龍頭,深度學(xué)習(xí)(工業(yè)AI)、3D視覺工序覆蓋持續(xù)增長; ?。?)凌云光:智能視覺裝備供應(yīng)商,開展多種AI算法、計算成像、大數(shù)據(jù)與認(rèn)知圖譜等技術(shù)研究; ?。?)奧比中光:聚焦3D視覺感知,與微軟、英偉達(dá)聯(lián)合研發(fā)制造3D iToF相機Femto Mega; (4)千方科技:智慧交通行業(yè)領(lǐng)軍,視覺智能算法賦能車路協(xié)同,有望與大股東阿里形成全方位合作; ?。?)聲迅股份:安防整體解決方案提供商,加大訓(xùn)練算力投入,為安防視頻圖像分析、智能行為分析等提供算力支持。 風(fēng)險提示 行業(yè)競爭加劇風(fēng)險;SAM模型落地不及預(yù)期;機器視覺相關(guān)技術(shù)發(fā)展不及預(yù)期等。
|
|