極氪石穿空：端到端Plus更像“老司機” ，提前決策規避潛在風險

孫瑩

2024年11月20日 19:32 原創來源：汽車之家發布于:北京

收藏舉報/糾錯向編輯提問

[汽車之家行業] 11月15日，第二十二屆廣州國際汽車展覽會正式開幕。在本屆車展中，汽車之家邀請了極氪智能科技產品管理部部長石穿空展開深入交流，共話車市風云、聚力行業未來。

在此次交流中，石穿空向汽車之家表示：“此次車展，我們發布了面向未來的技術架構，引入了端到端Plus的概念。Plus是什么呢？就是我們的數字先覺網絡。數字先覺網絡不是一個圖，它更多是本地司機的長期記憶，就和大腦的海馬體有點像的，短期的記憶。它每天都在發生，又很重要，轉化成長期記憶存儲起來給大腦調用，跟海馬體的功能很像。有它的加持，可以做到決策的提前，規避潛在的風險�！�

極氪智能科技產品管理部部長石穿空

以下為對話實錄：

汽車之家：目前無圖智駕大概量產上車的情況怎么樣？

石穿空：我們現在包括無圖城市NZP10月份開始大規模公測，到今天為止我們進一步擴大公測規模，預計可以達到萬人的規模。到今年年底整個無圖NZP就會釋放給全量的用戶。本身我們全國萬人用戶可以到處都能用，到年底所有用戶都可以放給他們，包括搭載“浩瀚智駕2.0”的幾個車型都會開放出去。

汽車之家：我們的無圖智駕在今年年底可以全國開通，全國跑了？

石穿空：全國和全量搭載浩瀚智駕2.0系統車型的用戶。

汽車之家：如何理解我們的數字先覺網絡，端到端架構是怎么應用？

石穿空：因為極氪相對來說起步比其他新勢力，一些頭部友商起步比較晚，所以我們在整個技術的規劃，尤其是技術架構的規劃上面，寧愿在開始的時候想的清楚一點，這樣避免在后面少走彎路。我們一開始就做了很多思考，端到端是行業都比較認同的技術，本身這個事情是確定要去做的。

從去年12月第一代發布的時候，我們已經在做。包括近期友商在做的視覺大語言模型，我們阿爾法實驗室也在做這個研究，同步我們在明年上半年，甚至可能會更早，類似于視覺語言大模型也會上車。

在這個基礎上我們也會思考，汽車的傳感器不只是視覺，還有激光，還有毫米波雷達，甚至將來還包括聲音，因為人開車時都有各方面的思路，這些信息都是對于自動駕駛來說，我們將來不僅會搞視覺語言大模型，還會做多模態的語言大模型，MLM的大模型。這是行業在走的方向，我們也是提前去思考的，并且端到端已經在今年8月正式落地了。

我們同時在思考另外一個問題，比如我經常在杭州灣和上海待的時間比較多，開車去上海和杭州灣，用句夸張的話說，我閉著眼睛都知道上下班的路是怎么樣，相當于是本地老司機。其實我們會發現，包括落地端到端之后，整個無圖NZP我們做了很多測試，本身它實際的體驗已經非常好了，相信整個行業也是一樣的。包括路口的通行，類人性已經非常好了。但我們發現一些問題是端到端和VLM，甚至將來的MLM可能解決不了的。我們思考一個問題，為什么一個本地老司機在本地開的很好，但到了外地他就會謹慎很多。因為我們想不通，你的駕駛技巧也在，駕駛經驗也在，該學的這些知識也都學過，為什么到陌生的地方就是變謹慎了，開的慢了，所以我們帶著這個疑問也在目前技術架構上思考這些問題。

這就是今天我們帶來思考的結果，也是跟行業分享一下我們思考探索的情況，今天上午我們發布了面向未來的技術架構，在端到端+MLM，以及有一個安全底線基礎模型上，我們引入了端到端Plus的概念。Plus是什么呢？就是我們的數字先覺網絡。舉個例子，比如說你看到前面某一個車，可能是三車道的路，其中一個車道前面有一個深坑。人開呢，這個深坑會繞開，或者實在繞不開，可能會減速。端到端Plus大模型如果這種場景學習過，它在光照條件比較好的情況也能去處理的。有可能在五六十米、七八十米之外看見之后，它學過了，周邊的交通環境也比較好，可能會繞開，當它繞不開也會減速通行。但這里仍然存在一個問題，有些場景下，比如說逆光或者黑夜，有可能整個光照條件也不好，等它到七八十米時并不能很好地實時識別，可能要等到更近了，包括大燈照的更清楚了，才能識別準確，更可信任了。那時候已經是二三十米了，等它識別出來，一個80碼的速度去過，它可能來不及響應。識別之后有可能不得不來個急減速，體感就很不好。急減速之后還得壓過去，這個坑如果深的話，有可能胎或者輪轂都會受到傷害。甚至更嚴重的，還會影響方向盤，還會導致事故。

也有些人會說不一定減速，周邊沒有障礙的話可以發起急的轉向，但要在二三十米發起急轉向，后方有來車也是很危險的。不管怎么樣，這種情況就會導致潛在風險的可能。你有數字先覺網絡，因為這條路假設是陌生的，沒有辦法。這條路你是每天上下班都會開的，我不一定要看見，我在1公里之外，甚至200米開外就知道前面是有個坑的，我沒必要等到看到再去做響應，可能會提前去做一些響應，是表達這個意思。數字先覺網絡可以做到決策的提前，規避潛在的風險。

舉個例子，比如他們都說扁鵲治病很厲害，但真正厲害的是扁鵲治未病之病，生小病時已經治好了，其實先覺網絡就是這樣一個思考！

汽車之家：比如我們很多車在路上跑會收集很多數據，把實時數據，比如路況信息，一些障礙信息提前輸入到端到端Plus網絡之中，同樣路況下我知道前面有一定障礙風險了，提前減速，做提前的準備，再結合端到端更好地去過這個路口或路段。

石穿空：對，我們說本地老司機。

汽車之家：極氪車主都可以共享數據。

石穿空：現在我們剛起步，將來我們規劃當中你開的本地化信息也可以共享。我這邊要強調數字先覺網絡不是一個圖，這次我們的無圖NZP只用了SD的導航信息，任何高清地圖我們都沒有用。數字先覺更多是本地司機的長期記憶，就和大腦的海馬體有點像的，短期的記憶。它每天都在發生，又很重要，然后會轉化成長期記憶存儲起來給大腦調用，跟海馬體的功能很像。我們起了一個名字叫“數字先覺網絡”，幫助大家更好的理解，它不只是一個圖。圖里可能是一些車道級信息，然后停止線，拓撲做得很細，但你會發現坑不能算作傳統意義上的高精地圖。還有小區路口，經常有車躥出來，這不是高清地圖能標識的。還有紅綠燈被樹葉遮擋，這種是動態的時空環境的信息。

我們把數據先覺網絡歸納兩部分：1.信息先覺，有道路先覺、行為先覺、時空先覺。2.經驗先覺，我們將來會利用數字先覺網絡去把人駕的經驗和信息進一步學習和提煉，實現駕駛經驗的先覺。我們知道上海司機開車的風格和武漢司機，成都、重慶、廣州的開車風格都不一樣，不僅每個地方司機開車風格不一樣，甚至每個人開車風格也不一樣。這里把人開車的風格，將來也可以丟到數字先覺網絡里訓練，可以實現千城千面，更遠的將來可以實現千人千面，因為只有自己的開車風格是最習慣的。你把一個上海司機開車風格丟到武漢去，他肯定不喜歡的。

端到端比以前規則時代已經好很多了，因為規則時代可能更像是新手司機，我不知道這樣比喻對不對�？赡芾蠋熃踢^的，教練教過的，他知道，他會去開，老師沒有教過的，他不知道怎么辦了，像新手司機。端到端之后，他更像一個開了幾年的老司機，老師教過的東西，他上了路也有沒有遇到的情況，他自己摸索了。就像數據給喂了之后，他摸索學會了，有一些老師沒有教過的也能開。它的泛化性比規則要好，因為數據丟進去之后，它不僅遇到的問題知道怎么解，類似的一連串的問題也能解。端到端還是比規則時代提升了很多。

如果比作駕駛考試的話，相對于原來規則你考個六七十分，端到端上限能大幅度提升到90分。而VLM/MLM，像人類老司機一樣，我們開車場景不只是車或者人，有一些物理世界通識在里面。比如一個尼龍袋，端到端學習后認為是一個突出的物體，是個GOD通用障礙物，不能撞。但有了VLM/MLM，它知道是尼龍袋可以壓過去，有更多的知識在里面，不僅是交通知識，會幫助這個司機變成一個人類老司機。

如果說端到端+VLM/MLM，可以做到95分，再進一步你要考到99分的話，就需要數字先覺網絡，將來在更多的情況下體驗會更好。

汽車之家：特斯拉和小鵬已經是純視覺，還有激光雷達的輔助，極氪未來考慮純視覺路線，還是激光雷達技術作為保障？

石穿空：在技術上我們兩條路線都是在做準備的，為什么都在做準備呢？其實有一個信息，我不知道你有沒有注意到，我們“浩瀚智駕1.0”發布之后，我們上線的007既有激光版又有純視覺版的。像其他友商最近在上純視覺的智駕，其實我們去年12月份時候已經上了純視覺版的，那時候只支持高速的能力。我們第一次量產時是同時配置兩個車型，其他廠商要么發激光的，要么先發視覺的，沒有兩個配置一塊同時發的。

對于第二點來說，你的問題更多是純視覺將來要不要去做純視覺版城區的智駕。技術上我們會一直準備的，但用不用，這里有兩個考量，我們本身的觀點認為作為將來智駕的發展，包括現在從安全角度來講，激光也還是有必要的。因為激光本身是主動光的探測，它在整個探測結果的時延、精度以及測速和測量距離、位置的精度上，其實是有天然不可替代的優勢。然后尤其在黑夜或者雨霧、逆光場景，它不像攝像頭會需要ISP做不同的調校，讓算法去調優。本身算力就會涉及到時延，激光是主動物理的探測，純視覺是基于算法的，時延上本身就會有些影響。還有測量精度，激光是有些優勢的。我們認為純視覺就像教一個小孩去學習，他本身學習能力要很強，視覺是打底的，是主要的東西。但激光并不是沒有用，激光的優勢是顯而易見的。你優先把視覺做得很強，再用激光好上加好。

我們認為激光將來更多用于安全的冗余、安全的兜底，包括面向將來更高階的駕駛，怎么去做冗余，傳感器的冗余是很有必要的，這是技術上的思考。

當然，是不是激光或者純視覺，更多是商業上的思考，成本上去掉激光會更便宜一點。還有車型的定位是怎樣的，其實好多用戶越來越懂智駕了，它的芯片算力大不大，有沒有配置激光，用戶第一印象就是有沒有這個。有了這個，我們會認為好，然后再說算法怎么牛，體驗好不好。所以是兩方面，一方面是技術的，一方面是商業上的車型定位，以及這個車型將來對應的用戶群體怎么樣，這個可能不是技術上怎么樣，技術上就做好準備。

汽車之家：我們現在聽到一些用戶聲音，一種是用純視覺的，覺得算法已經特別好了；還有一種認為用純視覺就省成本，不給高端硬件。還有的認為用激光的更安全更有保證，還有的認為用激光的算法不好，用戶也在搖擺之中，這個階段智駕大家還是在選走哪個方向，哪個路走得更順，我們都可以去選擇。

石穿空：這兩個技術路線，我個人認為不是技術路線之爭，因為帶激光在視覺算法上的技術儲備我們一直在做的，不會說用激光之后純視覺就不搞了，肯定純視覺基礎上再加入激光，同步在搞，本身不是技術路線之爭，完全是產品定義的考量。你可以有純視覺，也可以有激光，具體取決于自己車型面向的是什么樣的用戶群體，你的車想賣到什么樣的成本價位，用戶群體是怎樣的，是這個思考，我認為不是技術路線。我不認為搞了激光之后，視覺技術就不搞了。

汽車之家：最后一個問題，剛才聊了這么多智駕方面，極氪除了智駕，在本身產品競爭力上也很強，現在有什么可以分享新技術，以及未來極氪產品的規劃。

石穿空：面對未來兩三年的技術架構，包括我們早上發布端到端Plus的新技術架構和數字先覺網絡，技術方面我就不再重復了。

產品上最新的規劃，也是前面陳總介紹過的，除了無圖城市NZP，我在年底會全國全量釋放給搭載“浩瀚智駕2.0”車型，車位到車位的功能，2025年就看車位到車位了，因為2024年大家都在看無圖全國，2025年就在看車位到車位。車位到車位，其實目前為止，但我還沒有看今天廣州車展的情況，反正之前我了解到也就1-2家友商給媒體試駕過，給用戶試駕過，其實沒有幾家。我們極氪是第一批這樣去發，包括10月底我們已經給大量媒體真正體驗過端到端，我們地庫的兩個抬桿可以過，還上了高速的ETC，我們的端到端支持一次可以過4個抬桿。

汽車之家：今天友商這些我們在實踐中已經可以體驗了。

石穿空：因為我們本身泊車的能力也很強，機械車位也可以支持，因為現在整個行業支持機械車位的也就一兩家。我們針對無劃線車位，本身泊車就支持。所以端到端我們預計2025年1月份會分批開始啟動，向用戶推送。我們的目標是計劃在2025年年中左右，上半年看能不能更大規模給用戶推送出去，大概是這樣的。

汽車之家：謝謝，今年極氪是給了我們非常多驚喜的品牌，包括產品，包括技術，包括價格。

石穿空：下半年我們迭代很快，包括無圖智駕方案，用戶反饋說其實他沒有那么急，但極氪是真的快！

汽車之家：以前我們感覺新勢力往前跑得很快，我們這些有傳統車企背景的品牌會比較嚴謹�，F在看，極氪不管從嚴謹角度還是從技術迭代角度都很快，讓用戶可以持續體驗，在銷量上勢頭也很猛，包括7X銷量也是能印證的。除了卷價格之外，極氪的產品力也很強。

向編輯孫瑩提問

文章標簽：高端對話