>> 西部證券-計算機行業(yè)Meta發(fā)布SAM點評:Meta發(fā)布SAM,看好多模態(tài)解決方案產(chǎn)業(yè)鏈-230409
| 上傳日期: |
2023/4/10 |
大?。?/td>
| 335KB |
| 格式: |
pdf 共2頁 |
來源: |
西部證券 |
| 評級: |
超配 |
作者: |
邢開允,趙宇陽 |
| 行業(yè)名稱: |
計算機 |
| 下載權限: |
此報告為加密報告 |
|
|
事件:本周三,Meta研究部門發(fā)布了一篇名為其“Segment Anything(分割一切)”的論文,文中介紹了一個全新的Segment Anything Model(即SAM),可以用于識別圖像和視頻中的物體,甚至是人工智能從未被訓練過的物品。 Meta可以快速識別照片/視頻中的所有物體,并智能地將其分割成不同的形狀和板塊。1)相較于普通的摳圖軟件來說,原本需要手動選擇的目標,現(xiàn)在只需要SAM的識別就可以快速分割畫面中的物品,且精準度,效率都要比個人操作高。2)此外,SAM的一大突破還在于,即使是在訓練過程中從未遇到過的物品和形狀,人工智能也能將其準確識別并分割出來。3)交互方面,SAM還支持用戶使用各種交互性的方式來分離出想要的物體??梢酝ㄟ^將鼠標懸浮在該物體之上,就能自動定位出物體的輪廓。即使是顏色非常相近或者有連人眼都很難快速分辨出的倒影的圖片之中,SAM都能非常準確找出輪廓邊線。也可以直接通過輸入文字查詢,AI就可以找到并標記出這個圖片中對應的文字對象。4)視頻方面,對于視頻中的物體,SAM也能準確識別并且還能快速標記出物品的種類、名字、大小,并自動用ID給這些物品進行記錄和分類。5)編輯方面,除了能把物品從圖像中精準地分離出來,SAM還能支持對這個物品的編輯。 SAM基于1100萬張照片訓練,模型和數(shù)據(jù)全部開源,看好多模態(tài)解決方案產(chǎn)業(yè)鏈。1)SAM開創(chuàng)性地跟Prompt結合了起來。它可以接受各種輸入提示,例如點擊、框選或指定想要分割的對象,這種輸入并不是一次性指令,你可以不停地對圖像下達不同的指令達到最終的編輯效果,這也意味著此前在自然語言處理的Prompt模式也開始被應用在了計算機視覺領域;此外,SAM基于1100萬張圖像和11億個掩碼的海量數(shù)據(jù)集上進行訓練,這是迄今為止最大的分割數(shù)據(jù)集;SAM在各種分割任務上具有很強的零樣本性能。零樣本意味著SAM可以在不對特定任務或領域進行任何額外訓練或微調(diào)的情況下分割對象。2)我們看好多模態(tài)產(chǎn)業(yè)鏈,Meta此次推出SAM預示著大模型在多模態(tài)發(fā)展方面更進一步,布局計算機視覺/視頻的廠商有望在Meta產(chǎn)品推出的背景下持續(xù)受益。 建議關注:多模態(tài)解決方案產(chǎn)業(yè)鏈:當虹科技:公司專注于智能視頻技術的算法研究,聚焦AI視覺應用,有望受益大模型多模態(tài)應用;羅普特:聚焦AI視覺應用的小巨人,布局存算一體,有望受益大模型多模態(tài)應用。 風險提示:大模型發(fā)展不及預期;下游需求不及預期;產(chǎn)業(yè)鏈發(fā)生變化。
|
|