在NVIDIA GTC 2025大會上,卓馭AI的首席執行官陳曉智帶來了一場引人矚目的演講,主題聚焦于“基于端到端世界模型的生成式智駕體驗”。在這場演講中,陳曉智不僅分享了卓馭在智能駕駛領域的最新突破,還首次揭示了他們的創新成果——可支持自然語言交互的個性化生成式智能駕駛方案GenDrive。
卓馭認為,高階智能駕駛不僅應追求擬人化的駕駛體驗,更應滿足用戶的個性化需求?;谶@一理念,他們率先提出了“生成式智駕”的概念,并通過GenDrive方案將其變為現實。相較于傳統智能駕駛,生成式智駕不僅能提供更為人性化的駕駛感受,更能根據用戶的個人偏好進行靈活調整。
傳統的端到端智能駕駛架構,主要依賴于預測范式,即根據傳感器的輸入來預測下一步的動作。然而,卓馭的GenDrive方案則采用了更為先進的生成式技術。它通過構建世界模型,能夠生成未來可能發生的多種情境,并結合用戶的偏好和環境信息,選擇出最優的行駛軌跡。
卓馭的端到端世界模型架構,底層為強大的硬件平臺,包括智駕控制器,能夠適配如英偉達DRIVE Orin / Thor SoC等計算平臺,同時支持不同類型的傳感器配置。在模型輸入端,他們通過Vision Encoder和Tokenizers對傳感器數據、導航信息以及歷史軌跡進行編碼。駕駛風格和用戶的語音指令也被巧妙地融入模型中,使得輸出更為精準和個性化。
在模型輸出方面,卓馭的方案不僅包括對周圍環境的語義和幾何理解,還能生成未來多種可能性的駕駛場景。最終的駕駛軌跡,則是與用戶風格偏好和語音指令完美對齊的結果,為用戶帶來前所未有的個性化駕駛體驗。
卓馭的端到端世界模型訓練方式同樣令人矚目。他們采用大模型典型的預訓練+后訓練模式,實現了“硬件無關”的平臺化訓練。這意味著,針對不同傳感器構型和芯片類型,只需訓練一個模型,即可輕松部署到不同的硬件構型上,大大提高了效率和靈活性。
基于這一先進的架構,卓馭的生成式智能駕駛方案GenDrive具備了一系列令人興奮的功能。例如,用戶可以自定義場景級別的駕駛風格,包括跟車、速度控制、路口轉彎和變道等。GenDrive還能在線學習和模仿用戶的駕駛風格,只需一段時間的駕駛記錄,模型就能自動學習出用戶的偏好。結合座艙內的人臉識別技術,它還能自動綁定不同的用戶ID,自動激活相應的駕駛風格。
更令人驚嘆的是,GenDrive還支持自然語言交互。用戶可以通過語音指令來控制駕駛風格和具體動作。無論是要求“開慢點”以避免暈車,還是指示“不要開最左邊車道”,模型都能準確理解用戶意圖,并實時調整行駛軌跡。
據卓馭官方透露,這一開創性的生成式智能駕駛體驗,將在今年內搭載于相關車型上實現量產落地。這無疑將為智能駕駛領域帶來一場革命性的變革。