近日,在第五屆焉知汽車年會“智能輔助駕駛論壇”上,魔視智能乘用車產品副總經理張崢以《智駕模型的泛化思路》為主題,深度剖析了智能駕駛技術的演進邏輯與核心挑戰(zhàn)。
作為深耕智駕領域多年的先行者,魔視智能以“泛化能力”為突破口,提出從感知升級到認知覺醒的全鏈路解決方案,為行業(yè)提供了應對復雜場景、突破數據瓶頸的新思路。
感知的邊界,是智駕泛化的第一道門檻。魔視智能用“融合”與“治理”雙輪驅動,讓機器“看得見”更“看得懂”。
張崢指出,感知模型的泛化能力是智駕系統(tǒng)的基石。魔視智能通過 “傳感器性能+數據驅動+算法進化”三位一體路徑,構建全方位的環(huán)境理解能力。
傳感器融合創(chuàng)新
打破單模態(tài)局限,整合攝像頭、激光雷達、毫米波雷達等多傳感器數據,通過多模態(tài)時空前融合算法,實現語義、空間、運動信息的精準捕捉。
4D數據治理體系
自主研發(fā)自動化標注工具與大模型挖掘技術,實現場景元素的高效提取與失效案例閉環(huán),結合3D資產庫與AIGC生成,破解長尾數據難題,降低數據邊際成本。
算法迭代進化
從單模態(tài)白名單任務到通用感知任務,引入開集數據自監(jiān)督預訓練與視覺語言對齊,提升模型對未知場景的適應性。

端到端的“快”需要海量數據支撐,而“穩(wěn)”則依賴對現實邏輯的深度理解。我們用仿真與實車數據“兩條腿走路”,讓算法既聰明又可靠。
在決策規(guī)劃層面,魔視智能提出了分階段泛化策略,兼顧性能上限與落地可行性。
規(guī)則優(yōu)先,夯實下限
基于結構化感知的經典規(guī)劃器,通過仿真數據快速驗證規(guī)則邏輯,確?;A安全性與功能穩(wěn)定性。
兩段式端到端,模仿人類
以感知結果為輸入,結合強化學習優(yōu)化類人駕駛行為,平衡規(guī)則與數據驅動的優(yōu)勢。
一段式端到端,突破天花板
探索感知-決策-控制一體化模型,依托3DGS場景重建與虛幻5仿真環(huán)境,生成高多樣性數據,結合強化學習挖掘模型潛力。

VLA不是技術的終點,而是認知的起點。當智駕系統(tǒng)學會“思考”,數據將從“燃料”變?yōu)椤按呋瘎薄?/p>
張崢表示,當我們面對數據驅動的局限性,魔視智能將目光投向視覺語言行為(VLA)范式——一種更接近人類認知的智能體架構。
VLA的核心優(yōu)勢
通過視覺模塊、語言模塊、行為模塊的協同,賦予智駕系統(tǒng)常識推理與交互學習能力,減少對海量數據的依賴。
認知覺醒的關鍵
基于R1強化學習范式,利用少量數據微調即可實現跨場景泛化;通過世界模型+人類偏好對齊,讓VLA在非同源環(huán)境中快速適應,甚至超越人類司機的表現。
云端到板端的落地路徑
先在云端訓練大模型,再通過知識蒸餾部署輕量化板端模型,兼顧性能與算力效率。

從多模態(tài)感知到VLA智能體,在這場技術與認知的雙重革命中,魔視智能已率先邁出關鍵一步,不僅展現了其對技術趨勢的前瞻洞察,更揭示了 “以認知驅動泛化”的戰(zhàn)略版圖。
未來,魔視智能持續(xù)探索智能駕駛邊界,逐步構建更像人、更聰明、更高效的智駕生態(tài)體,為行業(yè)打開認知智駕的新紀元。
-
智能駕駛
+關注
關注
5文章
3010瀏覽量
51293 -
輔助駕駛
+關注
關注
1文章
416瀏覽量
15810 -
魔視智能
+關注
關注
0文章
57瀏覽量
1682
原文標題:從“看見”到“認知”,魔視智能解碼智駕泛化之道
文章出處:【微信號:motovis,微信公眾號:魔視智能MOTOVIS】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
航盛電子獲評2025第五屆深圳質量百強企業(yè)
德力西電氣亮相第五屆碳中和博鰲大會
Allegro亮相第五屆汽車AI智能底盤大會
魔視智能亮相第五屆焉知汽車年會
評論