>> 中信證券-產(chǎn)業(yè)策略自動駕駛系列:FSDV12將迎重大架構(gòu)變化 “端到端自動駕駛”影響幾何?-231010
| 上傳日期: |
2023/10/10 |
大?。?/td>
| 2269KB |
| 格式: |
pdf 共24頁 |
來源: |
中信證券 |
| 評級: |
-- |
作者: |
連一席,沈思越 |
| 下載權(quán)限: |
此報告為加密報告 |
|
|
特斯拉多次表示FSDV12將實現(xiàn)全新的“端到端自動駕駛”,模型架構(gòu)將迎來重大變化。對于新架構(gòu)的技術(shù)細(xì)節(jié)和潛在影響,市場仍有較多疑惑和分歧。根據(jù)特斯拉對外披露的信息及馬斯克在X平臺(前推特)發(fā)布的信息,我們推測特斯拉內(nèi)部目前有兩條“端到端”路線同步在研:1)級聯(lián)式端到端神經(jīng)網(wǎng)絡(luò);2)World Model。我們認(rèn)為,F(xiàn)SDV12是前者的可能性較大,有望于明年初落地,以更好地實現(xiàn)L3能力;World Model仍較為新興,但中長期有望成為自動駕駛乃至具身智能領(lǐng)域的基礎(chǔ)模型,可類比GPT之于LLM,或?qū)π袠I(yè)格局產(chǎn)生顛覆性影響。 ▍可能性1(較高):級聯(lián)式端到端神經(jīng)網(wǎng)絡(luò),大幅提升訓(xùn)練效率和性能上限,有望助力自動駕駛系統(tǒng)更好地實現(xiàn)L3能力,但能否邁向L4仍待觀望。 技術(shù)本質(zhì):系統(tǒng)從輸入到輸出,全程使用神經(jīng)網(wǎng)絡(luò)算法,無需任何人工規(guī)則介入。當(dāng)前,自動駕駛模型多為模塊化架構(gòu),感知預(yù)測、規(guī)劃、控制等不同任務(wù)分屬于多個不同的小模型,且下游規(guī)控環(huán)節(jié)普遍仍以規(guī)則為主。而“端到端”神經(jīng)網(wǎng)絡(luò)在輸入圖像后,可直接輸出轉(zhuǎn)向、剎車、加速等控制指令。為提升訓(xùn)練效果,“端到端”的大神經(jīng)網(wǎng)絡(luò)可能由多個小的子神經(jīng)網(wǎng)絡(luò)級聯(lián)而成。但與傳統(tǒng)模塊化架構(gòu)用“規(guī)則”連接模塊不同,級聯(lián)式神經(jīng)網(wǎng)絡(luò)的子模塊是以“神經(jīng)網(wǎng)絡(luò)”的方式自行訓(xùn)練堆疊,因此可通過數(shù)據(jù)驅(qū)動優(yōu)化整個端到端模型,避免“局部最優(yōu),而非全局最優(yōu)”的困境。 潛在影響:更好地實現(xiàn)L3能力。端到端/神經(jīng)網(wǎng)絡(luò)的核心好處在于模型迭代的關(guān)鍵由“工程師”變?yōu)榱烁子谝?guī)?;摹皵?shù)據(jù)和算力”,因而訓(xùn)練效率和性能上限有望得到顯著提升。落到實處,我們認(rèn)為端到端方案所展示出的性能潛力有望大幅提升自動駕駛系統(tǒng)的接管水平,從而實現(xiàn)真正無可爭議的L3能力(例如達(dá)到每周接管1次)。但端到端模型的“黑盒”問題目前產(chǎn)業(yè)界尚未有十分成熟的解決方案,因此我們認(rèn)為,其最終能否邁向追求極致安全性的L4全無人駕駛?cè)源^望。 發(fā)展進(jìn)度:有望搭載于FSDV12,明年初正式落地的可能性較大。2023年8月26日,馬斯克在X平臺(前推特)進(jìn)行了FSDV12 demo的駕駛直播。我們認(rèn)為,盡管直播中展現(xiàn)出的能力距離正式推送給消費(fèi)者仍有距離,但可基本推斷當(dāng)前的V12模型已十分接近端到端,再配合特斯拉在數(shù)據(jù)和算力上的巨大投入,V12接下來至年底的迭代速度有望大幅加快。 ▍可能性2(較低):World Model,有望打造自動駕駛領(lǐng)域的基礎(chǔ)底座,引領(lǐng)視覺的GPT時刻;目前或仍處于GPT-1階段,但發(fā)展速度值得期待,中長期看或?qū)π袠I(yè)格局產(chǎn)生顛覆性影響。 技術(shù)本質(zhì):無需標(biāo)注、自監(jiān)督的預(yù)訓(xùn)練模型。World Model可生成自動駕駛相關(guān)的連續(xù)幀視頻場景,其本質(zhì)是對視頻中的豐富語義以及背后的物理規(guī)律進(jìn)行學(xué)習(xí),從而對物理世界的演化產(chǎn)生深刻理解。基于World Model所提供的豐富語義信息以及對世界強(qiáng)大的理解力,自動駕駛模型的感知與預(yù)測能力有望得到顯著提升,規(guī)劃、控制等下游任務(wù)也有望迎刃而解。 潛在影響:為自動駕駛提供了一套未經(jīng)證明的新路徑,若得以走通,將對行業(yè)產(chǎn)生較大顛覆。中短期來看,World Model或?qū)⒅饕獞?yīng)用于數(shù)據(jù)合成和仿真模擬環(huán)節(jié),廠商的車隊規(guī)模對算法訓(xùn)練的重要性或有所下降,數(shù)據(jù)閉環(huán)的框架也將有所改變。長期來看,World Model有潛力成為自動駕駛乃至具身智能領(lǐng)域的基礎(chǔ)模型,可類比GPT為所有NLP問題提供了一個通用解??紤]到更標(biāo)準(zhǔn)化的解決方案和更巨大的資金投入(資金需求或是這一代BEV+Transformer方案的數(shù)倍),行業(yè)內(nèi)有望出現(xiàn)少數(shù)幾家強(qiáng)大的World Model基礎(chǔ)模型層平臺方,以SaaS或API的方式為主機(jī)廠/運(yùn)營方提供自動駕駛能力,行業(yè)格局和合作模式或?qū)l(fā)生較大變化。 發(fā)展進(jìn)度:仍處早期,但發(fā)展速度值得期待。我們認(rèn)為,特斯拉、Wayve等公司不約而同地在今年推出World Model,很大程度上是受到了GPT的啟發(fā)。目前,World Model或仍處于GPT-1的階段,但考慮到目前行業(yè)整體對“大模型”潛力的強(qiáng)烈共識、算力的升級以及以特斯拉為代表的玩家此前積累的海量數(shù)據(jù),我們認(rèn)為World Model從0到1的爆發(fā)或較ChatGPT更快(OpenAI從GPT-1至GPT-3.5共歷經(jīng)4年)。 ▍國內(nèi)玩家距離“端到端”仍有較遠(yuǎn)距離。無論是級聯(lián)式端到端神經(jīng)網(wǎng)絡(luò)還是World Model,我們總結(jié)其核心壁壘皆在于:1)專業(yè)的AI人才團(tuán)隊,2)海量的視頻數(shù)據(jù),以及3)巨大的算力投入。國內(nèi)主機(jī)廠從2023年開始陸續(xù)實現(xiàn)這一代“BEV+Transformer”架構(gòu)的量產(chǎn)上車,盡快實現(xiàn)“脫圖”以及盡可能多地“開城”是國內(nèi)智駕車企當(dāng)前的重點。 對于下一代的“端到端”技術(shù)路線,國內(nèi)主機(jī)廠目前最快也仍處于早期預(yù)研階段,且在人才、數(shù)據(jù)、算力三方面較特斯拉皆有較大差距,因此從預(yù)研到上車樂觀看或也需3年左右的時間。 而對于前景更不明朗的World Model(或需等待特斯拉有更多成果展示),面臨著較大銷售和交付壓力的國內(nèi)主機(jī)廠,在新技術(shù)的人才和資源投入上或也有所
|
|