[汽車之家 資訊] 日前,理想汽車發布下一代自動駕駛架構MindVLA。MindVLA是一個能與用戶溝通、理解用戶意圖的智能體,可以理解為是一名能聽懂用戶說話的專職機器人司機。MindVLA是一種視覺-語言-行為大模型,是機器人大模型的新范式,它將空間智能、語言智能和行為智能統一在一個模型里。據悉,MindVLA將在7月份與理想i8同步推出,現款搭載英偉達雙Orin X芯片的車型也同樣能支持MindVLA。
MindVLA將為用戶帶來全新的產品形態和產品體驗,有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機!奥牭枚笔怯脩艨梢酝ㄟ^語音指令改變車輛的路線和行為,例如用戶在陌生園區尋找超市,只需要通過理想同學對車輛說:“帶我去找超市”,車輛將在沒有導航信息的情況下,自主漫游找到目的地;車輛行駛過程中,用戶還可以跟理想同學說:“開太快了”“應該走左邊這條路”等,MindVLA能夠理解并執行這些指令。
“看得見”是指MindVLA具備強大的通識能力,不僅能夠認識星巴克、肯德基等不同的商店招牌,當用戶在陌生地點找不到車輛時,可以拍一張附近環境的照片發送給車輛,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動找到用戶。
“找得到”意味著車輛可以自主地在地庫、園區和公共道路上漫游,其中典型應用場景是用戶在商場地庫找不到車位時,可以跟車輛說:“去找個車位停好”,車輛就會自主尋找車位,即便遇到死胡同,車輛也會自如地倒車,重新尋找合適的車位停下,整個過程不依賴地圖或導航信息,完全依賴MindVLA的空間理解和邏輯推理能力。
MindVLA利用Diffusion將Action Token解碼成優化的軌跡,并通過自車行為生成和他車軌跡預測的聯合建模,提升了在復雜交通環境中的通行能力。面對部分長尾場景,理想建立起人類偏好數據集,并且創新性地應用RLHF(基于人類反饋的強化學習)微調模型的采樣過程,最終使MindVLA能夠學習和對齊人類駕駛行為,顯著提升自動駕駛系統的安全下限。(編譯/汽車之家 顏歡)
好評理由:
差評理由: