>> 五礦證券-機械設備行業(yè)人形機器人報告(一):大模型視角下人形機器人的現(xiàn)在和未來-231219
| 上傳日期: |
2023/12/20 |
大?。?/td>
| 3945KB |
| 格式: |
pdf 共33頁 |
來源: |
五礦證券 |
| 評級: |
看好 |
作者: |
祁巖 |
| 行業(yè)名稱: |
機械 |
| 下載權限: |
此報告為加密報告 |
|
|
報告要點 人形機器人的核心價值在于通用+智能,將和工業(yè)機器人共同推動制造業(yè)智能化。工業(yè)機器人雖然技術成熟,但卻無法解決泛化性的問題,不適應現(xiàn)代制造業(yè)柔性生產(chǎn)的需要。我們認為人形機器人將作為工業(yè)機器人的補充,與工業(yè)機器人共同推進制造業(yè)的智能化發(fā)展。“人形”只是表象,人形機器人的核心價值在于通用+智能。未來的工廠中,工業(yè)機器人、人形機器人、人工或?qū)⒁?:2:1的比例存在。 以GPT為代表的大模型是邁向通用人工智能AGI的重要一步。之前的人工智能屬于專業(yè)AI,走的是“先專后通”的發(fā)展路徑。而以GPT為代表的大模型具備了一定的常識和推理能力,有望走出一條“先通后?!钡陌l(fā)展路徑。而具備控制、感知、執(zhí)行能力的AIAgent是大模型落地的重要形式。 LLM與機器人結(jié)合的研究在短時間取得了眾多突破,讓我們對產(chǎn)業(yè)化多了一份信心。我們把人形機器人視為LLM+機器人領域的AIAgent。LLM的引入解決了之前機器人行業(yè)的兩大痛點:1)交互不便,無法理解人類的自然語言;2)不夠聰明,無法對復雜任務自主拆解。在LLM與機器人結(jié)合方面,學界取得了眾多進展。Google在2022年發(fā)表的SayCan模型,解決了LLM作為語言模型無法適應現(xiàn)實世界的問題;2022年12月,google發(fā)布RT-1模型,使人形機器人表現(xiàn)出了泛化性,可以解決未訓練場景的任務;2023年2月,微軟發(fā)表ChatGPT for Robots,提出用LLM語言模型控制機器人的方法,使機器人可以利用LLM模型的“常識”和推理能力;2023年3月,google發(fā)布PaLM-E模型,把具身信息融入大模型,進一步提升了泛化能力;2023年7月,google發(fā)布視覺-語言-動作(VLA)的機器人模型RT-2,模型直接輸出機器人的動作,泛化能力進一步增長,并為解決機器人數(shù)據(jù)缺乏問題提供了一種新的思路。 人形機器人的商業(yè)化落地需要具體的場景。當前人形機器人產(chǎn)業(yè)面對數(shù)據(jù)不足、算力不足、人機交互安全性、長尾場景等挑戰(zhàn),終極的通用人形機器人還比較遙遠,但是基于特定場景的人形機器人可以降低對數(shù)據(jù)、算力的依賴,有望率先落地。2023年10月,亞馬遜宣布已經(jīng)在倉庫試用人形機器人Digit。 自動駕駛與人形機器人有眾多相似之處,自動駕駛的發(fā)展歷程有借鑒意義。何小鵬認為,自動駕駛本質(zhì)上是機器人科學,智能汽車公司最終也會和機器人公司在技術、產(chǎn)品、生態(tài)等等方面融合。參考自動駕駛的發(fā)展歷程,我們認為人形機器人的發(fā)展也會有3個趨勢:1)終極的人形機器人還很遙遠,但基于特定場景的機器人會率先落地;2)隨著人形機器人對大數(shù)據(jù)、大模型的要求越來越高,數(shù)據(jù)閉環(huán)能力越來越關鍵;3)端到端模型可以節(jié)省算力,但當前受限于數(shù)據(jù)、規(guī)模。區(qū)分規(guī)劃算法、控制算法的多模塊的方案更容易落地,其中連接LLM和控制算法的prompt是瓶頸所在。 風險提示:1.人工智能技術仍在快速發(fā)展階段,軟硬件都在持續(xù)迭代中,行業(yè)發(fā)展存在較大技術風險。 2.人形機器人作為新興產(chǎn)業(yè),產(chǎn)業(yè)鏈尚不成熟,可能阻礙產(chǎn)品的商業(yè)化落地。
|
|