>> 太平洋證券-汽車行業(yè)點評:OpenAI o3加速智駕VLA-241230
| 上傳日期: |
2024/12/31 |
大?。?/td>
| 228KB |
| 格式: |
pdf 共3頁 |
來源: |
太平洋證券 |
| 評級: |
看好 |
作者: |
劉虹辰 |
| 行業(yè)名稱: |
汽車 |
| 下載權限: |
無限制-登錄即可下載 |
|
|
事件:近期,OpenAI推出新的推理系列模型o3和o3-mini,接近AGI的AI模型擁有真正的通用推理能力,有望加速智駕VLA。 接近AGI的AI模型加速智駕VLA。傳統(tǒng)自動駕駛系統(tǒng)分為感知、規(guī)劃、定位和決策等多個模塊,端到端架構則強調(diào)“感知決策一體化”,提高智駕能力上限。o3具備更先進、近似人類的推理能力,在代碼編寫、數(shù)學競賽和掌握人類博士級別的科學知識等方面,均超越了o1,自動駕駛開始真正依靠人工智能而不是詳盡的地圖繪制和編碼來取得進步。端到端可全面實現(xiàn)擬人高效決策升級。全AI網(wǎng)絡架構高效傳遞信息,端到端是一體化的模型,信息都在模型內(nèi)部傳遞,具有更高上限,用戶所能感受到的整套系統(tǒng)的動作、決策都“更加擬人”;一體化模型可在GPU里一次完成推理,且端到端延遲更低,車輛動作響應及時。 以端到端+VLM為例,將智駕系統(tǒng)分為系統(tǒng)一(快系統(tǒng))和系統(tǒng)二(慢系統(tǒng))。系統(tǒng)1(快系統(tǒng))經(jīng)歷了三個進化階段:第一代為NPN架構,包含感知、定位、規(guī)劃、導航、NPN等模塊,支撐了理想汽車100城城市NOA推送。NPN使用部分道路和地圖的先驗信息,幫助車輛識別道路特征,減少對高精地圖的依賴。但即使可以減少依賴,依然沒有一個圖商能提供城市的高精地圖,輕圖則無法具有時效性的迭代。第二代為分段式端到端(Two Models),模塊更少,只剩下感知和規(guī)劃,無需等先驗信息更新,有導航就能開,支撐著現(xiàn)階段理想無圖NOA全國都能開的實現(xiàn)。第三代為一體化端到端( One Model),真正意義上的端到端,輸入是傳感器、輸出是行駛軌跡,全部由一個模型實現(xiàn)。理想VLM擅長邏輯推理,實現(xiàn)慢系統(tǒng)人腦思考。在端到端基礎上,理想汽車引入了VLM視覺語言模型以達到人腦思考效果,用更擅長邏輯推理的VLM,去執(zhí)行復雜的分析,在駕駛中給系統(tǒng)一提供更加符合邏輯、準確的駕駛決策。OpenAI推出新的推理系列模型o3和o3-mini,接近AGI的AI模型擁有真正的通用推理能力,有望加速智駕VLA。 風險提示 智駕進展不及預期,技術升級不及預期,控制成本不及預期。
|
|