[汽車之家 行業] 自特斯拉針對自動駕駛提出“端到端”技術路徑,并于2023年8月進行路測直播后,國內自動駕駛行業對此密切關注,并把“端到端”上車提上日程,為何業內將“端到端”視為自動駕駛發展方向?端到端技術落地需要面臨哪些挑戰?
『輕舟智航聯合創始人、CEO 于騫』
在2024中國汽車論壇同期,中國汽車工業協會聯合戰略合作伙伴汽車之家,特別策劃【車界先鋒】,邀請行業領軍人物,共同探討中國汽車產業的發展之道,本期嘉賓為輕舟智航聯合創始人、CEO于騫。
于騫指出,端到端技術的發展并非一蹴而就,特斯拉在量產領域的成功,讓這一技術路線變得異;鸨。端到端技術的核心在于數據驅動,它通過機器學習的方式,將自動駕駛的各個模塊整合成一個統一的模型,實現了從感知到決策的全鏈條自動化。這種技術趨勢的演進,標志著自動駕駛技術棧的一次重大變革。
在談及純視覺技術對激光雷達行業的潛在影響時,于騫認為,無論是純視覺還是結合激光雷達,端到端的方法都能適用。不過。雖然激光雷達在當前技術限制下提供了必要的安全冗余,但從長遠來看,視覺技術完全有能力實現高等級的自動駕駛。人眼作為一個高度復雜的傳感器,遠超現有攝像頭的能力,隨著技術的進步,純視覺系統有望達到甚至超越人類駕駛員的水平。
輕舟智航在端到端研發過程中展現出明顯的競爭優勢。于騫解釋說,“端到端技術的發展依賴于數據的規模和質量。隨著算力的提升和數據規模的擴大,端到端成為了可能。輕舟智航在機器學習領域的深厚積累,加上對大規模量產數據的接觸,為公司在端到端模型的開發上提供了強大的優勢!
于騫還提到,自動駕駛技術棧的發展已經從以模型為中心轉變為以數據為中心的研發范式。輕舟智航堅持以數據驅動的方式推動自動駕駛技術的發展,并在數據閉環能力上積累了強大的護城河。這種能力不依賴于傳感器或車載計算單元,而是依賴于強大的數據篩選、標注、訓練和測試能力。
面對端到端技術帶來的挑戰,如模型更新的快速性、大規模數據訓練、數據篩選和自動化標注等,輕舟智航已經有了充分的準備。于騫認為,這些挑戰的克服是實現端到端模型快速開發、迭代和部署的關鍵。
在談到特斯拉FSD可能進入中國市場的影響時,于騫表示,這將為消費者提供更多選擇,并對市場產生積極的教育和引領作用。特斯拉作為行業的引領者,將推動更多的消費者和車企認可和接受自動駕駛產品。
以下為對話實錄(精編):
汽車之家:最近特斯拉提出了端到端自動駕駛技術路線后,我們發現國內的自動駕駛行業對此非常關注,也將之視為自動駕駛的發展方向,您覺得為何端到端會成為行業的一個共同的方向?
于騫:其實端到端的技術演進不光是在特斯拉,更早的英偉達、Waymo都有這方面的工作,特斯拉對于整個行業的引領性很強,大家非常關注它,把端到端這件事變得非常的火爆,而且它確實也把這件事做到量產狀態,量產和不量產還是非常不一樣,雖然更早都是在學術界論文上講得比較多,真正大規模量產還是在特斯拉首先做到的,這個確實是非常不容易的。
我們在自動駕駛的技術棧里面如果形成一個大的集合來講,你可以發現技術趨勢是逐漸把非機器學習的部分擠的越來越小,在系統模型架構這部分以前是把每一個模塊拼接起來,現在整個都是一個模型,實現完全的基于機器學習的方式,完全通過數據驅動來實現這樣的智能駕駛能力,這一點來講我認為是一個必然趨勢。
為什么端到端是大家都認可的一件事,因為趨勢是這樣走的,可以講它實現了數據驅動里面的關鍵一環。
汽車之家:有觀點說純視覺技術可能更適合端到端,我們看到特斯拉馬上要發布Robotaxi,如果真的能夠靠攝像頭就能實現無人駕駛,這個對于激光雷達行業來說會不會是一個整體的打擊,您如何看待激光雷達的前景?
于騫:其實端到端和傳感器是兩個不同維度的事情,端到端不管是使用激光雷達還是不使用激光雷達,純視覺或者激光雷達跟端到端并沒有直接的關系。視覺的傳感器可以用端到端的方法進行訓練,加了激光雷達一樣可以用端到端的方法訓練,其實本質上對端到端并沒有很大的影響,兩個不同的維度,一個是傳感器的維度,一個是算法方法的維度。
我認為要真正實現大規模的自動駕駛甚至是無人駕駛,其實激光雷達并不是必須的,只是因為我們現有技術的限制、方法的限制,使得我們比較依賴激光雷達。其實我們在人的駕駛行為來講,人不會關注前面這輛車離我是185米還是187米,我們照?梢蚤_車。我們也不需要測速,我們也不需要測那個車對我是80公里還是82公里,相對速度我們也并不關心。是因為我們技術的限制、技術的方法、技術的范式使我們必須知道其它車對我們的距離、速度,需要這樣的測量。
真正來講,如果真正實現完全數據驅動的方式,其實我認為是不需要額外的傳感器,這個是從技術層面來講,長期來講我認為視覺是完全可以實現非常高等級的自動駕駛。
回到現階段現實的產品角度來講,對用戶提供接近L4或者已經是L4的無人駕駛的話,我認為激光雷達在某一些場景下還是必須的,因為它提供了更多安全的冗余,提供了另外的一個視角,使得L4的應用可以有很多冗余的備份。從傳感器的角度、從計算的角度,從算法和設計的角度有很多冗余的設計,你可以理解為激光雷達是視覺傳感器的一個備份。如果我們的視覺傳感器壞了,它可以作為一個有益的補充,或者視覺傳感器某種情況下視覺失效情況下激光雷達作為一個補充。
從長期來講,如果我們不講產品不講投入的話,我覺得視覺完全可以實現無人駕駛,但是這個涉及到非常復雜的討論。因為我們講的攝像頭和人眼還是有很大的差異,人眼是一個高度復雜的傳感器,遠超現在攝像頭的傳感器,我們人眼是一個高度復雜的帶各種各樣的高級功能的攝像頭,這只是一個比喻。長期來講我是非常堅信視覺是可以做非常高等級的自動駕駛。
汽車之家:您能不能介紹一下輕舟智航在端到端研發過程中的競爭優勢?
于騫:其實我覺得端到端是一種新的研發范式,這種研發范式的到來其實很大程度上是依賴于數據的規!,F在我們可以看到整個發展過程中不是單一的,為什么端到端不是十年前發生或者五年前發生,為什么這個時間點發生,很大程度上跟我們的算力和數據規模是相關的。
如果你在更早的時間出現了端到端,即便有這樣的技術,它可能更多停留在論文和實驗室階段。正是由于我們在算力水平提升了,我們的數據規模變大了,相應的方法就會出現,可以講這是一個事物發展必然的一個階段。
對于輕舟來講我們首先在技術方面積累了大量的基礎,在基于機器學習,不管是感知模型、預測模型、規劃模型,我們本身每一個模塊幾乎都是基于機器學習的方法。端到端是自然而然會發生的,相應來講把模型整合在一起實現端到端的訓練,這本身是一個必然的趨勢。
從人才角度來講我們輕舟也有很多的牛人和非常高的人才密度,在這方面我們不管是算法和算力都有很多的基礎。更重要的一點我們有機會接觸到大規模量產的數據,使得這些數據能夠幫我們在端到端方面獲得非常強的優勢。所以我覺得最終在端到端的模型里,它一定是把數據的優勢發揮到極致,臨界點可能在百萬臺車在路上跑,才會使端到端真的實現特別好的體驗。
其實在我們日常很多模型的開發中我們發現,當你的數據規模達到一定的臨界點的時候,模型可能并沒有什么大的變化,但是整個模型的能力泛化性變得非常好,這一點也是非常重要的。這一點我講的數據并不僅是規模大、數據量大而已,一方面是數據的規模,還有數據的質量、數據的覆蓋都很重要。如果你的量很大,但是你的質量很差,非常差的一些數據的話其實很難去訓練,另外來講如果你的數據分布不合理也會造成的很多的問題。
數據規模某種程度上不是說單純的規模越大越好,相對你要保證數據整體的質量、分布,規模當然也很重要。我覺得整個的自動駕駛研發范式已經逐漸從以模型為中心,轉變成以數據為中心的研發范式,這個是非常大的變化。
這一點也是輕舟一直以來堅持的一個研發范式,堅持以數據為中心,數據驅動的方式推動整個自動駕駛的發展。
所以我經常會講自動駕駛技術棧是一種冰山理論,我們經常看到車載的計算單元、車的傳感器,甚至是傳感器安裝的位置,幾個攝像頭、幾個毫米波幾個激光雷達,這些東西更多是冰山能看到的一角,其實在冰山下面需要非常強大的數據閉環能力,包括怎么樣進行大規模的數據篩選,怎么進行大規模的數據標注,怎么能實現海量數據的訓練,高效的訓練實現大規模仿真的閉環,以及怎么進行高效測試,這種能力其實是不依賴于你的傳感器、車載計算單元,甚至不依賴于你的安裝位置,這才是自動駕駛的核心,輕舟在這方面積累了非常強的護城河。
汽車之家:馬斯克也在前段時間說過,沒有像特斯拉一樣那么多的車隊通過影子模式對系統進行閉環測試的話就無法參加端到端的游戲,單單用大模型的數據是否能跟得上?
于騫:我覺得大模型和端到端也是兩個概念,我非常認同數據規模是非常重要的,一定是要有很大的車隊的規模,有很多數據的閉環的機會。如果只是在相對來講很小的數據規模上,很多的簡單的測試車隊很小規模,其實你的數據覆蓋、數據的質量和數據的分布是很難達到,都沒有辦法訓練出一個真正端到端的體驗,這一點來講他說的是蠻對的。
整個技術的發展其實是一個比較有意思的過程,比如說早期大家在做機器學習訓練的時候很多情況下大家是使用CPU的訓練,需要的CPU是一個很大的集群,比如說在谷歌需要巨量的CPU集群去做訓練,那個是早期的時候。
當GPU出現的時候就把巨量CPU的訓練集群變成了一塊GPU的板卡就搞定了,整個技術的發展是在不斷進化的,包括早期GPT的一次訓練,GPT2.0訓練要花很多的錢,現在可能隨便一臺臺式機就可以搞定,技術演進是在變化的。
我認為端到端的技術發展最終都會進入到端到端的技術范式里面,甚至說這一點來講,大家都在進入這么一個技術范式,就在于誰能夠把海量的數據用好,能夠實現這樣數據快速的閉環,這才是核心能力。
汽車之家:除了您提到的數據,您覺得端到端還面臨哪些方面的挑戰?
于騫:其實我覺得端到端這件事之前大家很多會講不可解釋性、黑盒,這些早就已經不是問題了,其實我覺得很大程度上怎么能夠更快實現模型的更新。我們在一些應用場景里面想快速修復一些問題的時候,比如說如果原來基于規則、基于模塊的設計,這一塊的問題更新了把這個地方修改了,馬上就立竿見影。但是在端到端的模型里面會發現很難針對某一個case專門修復它,怎么能夠實現這樣的模型快速的更新迭代,這是一個比較有挑戰的問題,當然這里面還有很多你怎么大規模訓練這些數據,怎么進行數據的篩選,怎么能夠進行快速的數據的自動化標注,怎么能夠在仿真的情況下進行高效的測試,這些都是在端到端的使用和部署中都在講的實際中的困難,這些我們輕舟都有很多的儲備,可以使得我們在這方面快速實現端到端模型快速的開發、迭代和部署。
汽車之家:大家都在猜測FSD很快要進入到中國,您覺得會對中國車企也好、智能駕駛企業也好帶來哪些影響呢?
于騫:我覺得是特別好的一件事,對于特斯拉如果能進入中國的話,首先消費者大家有一個更好的選擇,同時我覺得對這個市場也會有更好的教育和更好的引領。我們始終是把特斯拉看成是一個行業的引領者,它使得更多的消費者、更多的用戶、更多車企能夠看到產品可以做成這樣子,教育市場的作用,讓更多的消費者來認可這樣的產品,所以我覺得這件事對行業來進是一個大好事。
汽車之家:價格戰持續了一年,這個壓力會不會傳導到智能化的一些供應鏈上面?在這個背景下,我們是如何兼顧性能的同時又發揮更高的一個效益和成本優勢?
于騫:首先我覺得在整個中國新能源市場上大家確實是卷得不得了,這個和整個行業是相關的。很多車企都不盈利或者盈利情況堪憂,競爭環境是非常惡劣的或者非常激烈的競爭態勢。我覺得在這個時間點我們很大程度上還是要堅持我們的用戶價值,如果我們進入到一個不講用戶價值、純殺價這么一個過程,這個市場我們就徹底毀掉了。
其實可以看到在這個行業里面為什么所謂的智能駕駛大家覺得沒有那么好用,還是回到你沒有給到消費者帶來“iPhone”時刻,他沒有覺得這個事兒我用了以后太好了再也回不去了,我們還是有各種各樣的問題。所以我覺得智能駕駛這個行業正好處在一個行業發展的關鍵期,正在不斷產生新的用戶價值,用戶在越來越接受這件事。但是我們還差一步,只要我們跨過用戶價值這一步。舉個例子,我們現在誰會想到智能手機里沒有一個拍照的功能,這是必須有的功能,什么時候我們的智能駕駛變成汽車的一個必須功能,沒有這個功能車就不叫車,可能這件事的用戶價值就真的凸顯出來,我覺得很快會進入到這個階段。
我們現在所區分的產品形態還是中間形態,包括高速NOA、城市NOA,甚至是記憶行車,我認為這個是產品的中間形態。真正再往前發展我們就應該進入到讓用戶的學習門檻非常低,上車按一個鍵馬上就可以開,基本上可以從脫手到脫眼這么一個狀態,雖然可能還是在高階輔助駕駛這么一個階段,產品的體驗學習的曲線會非常短,讓用戶真的覺得這個事兒是一個必需品。
當然這個一定是在前提安全的基礎上,我相信很快會有這樣的體驗出來,現在都是手扶著,甚至手不用扶著也可以開得非常好,達到了一定安全的水平之后,我覺得很快會有這樣的產品出現。
汽車之家:現在很多的企業也把出海作為一個業務增長點,相比整車出口,智駕出海還是一件新鮮的事兒,您能不能跟我們透露一下輕舟智航有沒有一些出海的計劃?
于騫:我們是非常看重海外市場,我覺得在整個智能駕駛和新能源汽車還是一個相對來講不是一個單一市場,我們其實在車來講,不管在全球任何地方開車,好的駕駛體驗是相通的,這一點上目前來講我們是基于在中國的市場環境下,我們還是要看整個全世界的機會。
尤其是我們看到中國的智能駕駛、中國的新能源車在全世界范圍內已經進入到引領者的階段,走到了全世界的前面,甚至成為舞臺的中央。
尤其是在智能駕駛領域,我們中國的智能駕駛的體驗其實比海外來講,在客戶體驗上來講,用戶價值上來講已經領先了。在中國很多會先體驗一些新的產品、新發布了一些新的產品,新的用戶體驗的出現,海外可能會在2-3年之后才會出現,這正是我們的機會,我們也在積極布局海外的客戶拓展的機會。
可以看到不管是在智駕芯片還是傳感器,包括產品的功能和方案全世界的首發都是在中國,這是一個顯而易見的事實。不光是國產的芯片,海外的芯片首發車型也是在中國,這一點來講中國市場已經成為一個行業的聚光燈下,甚至比海外的市場還要再領先一段時間,正是我們這些企業利用好的機會,我們在積極布局。
好評理由:
差評理由: