91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

理想汽車發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

理想汽車 ? 來(lái)源:理想汽車 ? 2026-03-18 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2026年3月17日,理想汽車基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開(kāi)啟全能范式——下一代統(tǒng)一視覺(jué)-語(yǔ)言-動(dòng)作自動(dòng)駕駛大模型探索》,發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1。MindVLA-o1通過(guò)五大技術(shù)創(chuàng)新,構(gòu)建了面向物理世界智能的自動(dòng)駕駛基礎(chǔ)模型,讓自動(dòng)駕駛看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效。

詹錕表示:“當(dāng)我們把視覺(jué)、語(yǔ)言和行動(dòng)統(tǒng)一到一個(gè)模型中時(shí),它已不再只是自動(dòng)駕駛模型,而是在逐漸演化為面向物理世界的通用智能體?;谕惶譜LA模型,不僅可以控制車輛,也能夠擴(kuò)展到機(jī)器人。因此,自動(dòng)駕駛只是物理AI的起點(diǎn),未來(lái)這類基礎(chǔ)模型將驅(qū)動(dòng)新的具身智能范式。”

01從規(guī)則時(shí)代到AI時(shí)代,理想輔助駕駛持續(xù)演進(jìn)。

自2021年啟動(dòng)輔助駕駛自研以來(lái),理想輔助駕駛技術(shù)架構(gòu)經(jīng)歷了多輪關(guān)鍵迭代,持續(xù)的技術(shù)探索與工程實(shí)踐,為理想汽車在軟硬件一體化研發(fā)領(lǐng)域積累了深厚的基礎(chǔ)研究能力與研發(fā)實(shí)力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺(jué)語(yǔ)言模型)雙系統(tǒng)架構(gòu)量產(chǎn)交付,輔助駕駛首次真正具備了跨場(chǎng)景、跨任務(wù)的統(tǒng)一理解能力。2025年,理想汽車進(jìn)一步將空間理解、語(yǔ)言理解與行動(dòng)決策統(tǒng)一到同一模型框架,構(gòu)建了基于VLA、世界模型與強(qiáng)化學(xué)習(xí)三大技術(shù)棧的VLA司機(jī)大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機(jī)大模型月使用率達(dá)到80%,VLA指令累計(jì)使用1225.4萬(wàn)次;春節(jié)期間理想輔助駕駛總里程達(dá)2.5億公里,VLA指令使用次數(shù)達(dá)130.3萬(wàn)次。規(guī)?;挠脩趄?yàn)證與持續(xù)積累的真實(shí)場(chǎng)景數(shù)據(jù),為理想汽車推進(jìn)下一代自動(dòng)駕駛技術(shù)演進(jìn)提供了堅(jiān)實(shí)基礎(chǔ)。

02MindVLA-o1五大技術(shù)創(chuàng)新:看得更遠(yuǎn)、想得更深、行得更穩(wěn)、進(jìn)化更快、部署更高效

理想汽車提出下一代統(tǒng)一架構(gòu)——MindVLA-o1。該架構(gòu)以原生多模態(tài)MoE Transformer為核心,通過(guò)五大技術(shù)創(chuàng)新——3D空間理解、多模態(tài)思考、統(tǒng)一行為生成、閉環(huán)強(qiáng)化學(xué)習(xí)(Closed-loop RL)和軟硬件協(xié)同設(shè)計(jì)(Hardware–Software Co-Design),構(gòu)建了面向物理世界智能的自動(dòng)駕駛基礎(chǔ)模型。

b493b170-21e5-11f1-90a1-92fbcf53809c.png

在感知層面,理想汽車采用以視覺(jué)為核心的3D ViT Encoder(3D視覺(jué)模型編碼器),并利用激光雷達(dá)點(diǎn)云作為三維幾何提示,引導(dǎo)模型理解真實(shí)空間結(jié)構(gòu),使其在單一表示中同時(shí)具備語(yǔ)義理解與三維感知能力。同時(shí)引入前饋式3DGS表示(Feedforward 3D Representation),將場(chǎng)景拆分為靜態(tài)環(huán)境與動(dòng)態(tài)物體分別建模,并通過(guò)下一幀預(yù)測(cè)(Next-state prediction)作為自監(jiān)督信號(hào),使模型同時(shí)學(xué)習(xí)深度信息、語(yǔ)義結(jié)構(gòu)與物體運(yùn)動(dòng),最終形成融合空間結(jié)構(gòu)與時(shí)間上下文的高質(zhì)量3D表示。具備3D空間理解能力,使模型看得更遠(yuǎn)。

b4f0b956-21e5-11f1-90a1-92fbcf53809c.png

在思考層面,自動(dòng)駕駛既要理解當(dāng)前環(huán)境,也要預(yù)測(cè)未來(lái)幾秒的場(chǎng)景演化。在語(yǔ)言模型承擔(dān)語(yǔ)義理解、常識(shí)知識(shí)和交互能力的基礎(chǔ)上,理想汽車還引入了預(yù)測(cè)式隱世界模型,在隱空間中高效模擬未來(lái)。訓(xùn)練分三階段:第一,用海量視頻數(shù)據(jù)預(yù)訓(xùn)練Latent World Token(隱世界詞元),構(gòu)建未來(lái)表征;第二,在MindVLA-o1中持續(xù)世界模型的推演,形成隱空間的未來(lái)推理能力;第三,將世界模型、多模態(tài)推理能力及駕駛行為進(jìn)行聯(lián)合訓(xùn)練與對(duì)齊。由此,模型不僅能理解當(dāng)前場(chǎng)景并進(jìn)行邏輯判斷,還能在隱空間中提前“想象”未來(lái)畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態(tài)思考(Generative Multimodal Thinking)。擁有多模態(tài)思考能力,讓模型想得更深。

b54f03ee-21e5-11f1-90a1-92fbcf53809c.png

在行為層面,理想汽車構(gòu)建了統(tǒng)一行為生成(Unified Action Generation)機(jī)制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構(gòu),并引入專門的Action Expert(動(dòng)作專家),從3D場(chǎng)景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,并結(jié)合多模態(tài)思考生成高精度駕駛軌跡。其次,為滿足實(shí)時(shí)性要求,系統(tǒng)采用并行解碼(Parallel Decoding),同時(shí)生成所有軌跡點(diǎn),大幅提升效率。最后,引入Discrete Diffusion(離散擴(kuò)散)進(jìn)行多輪迭代優(yōu)化,類似逐步去噪,確保軌跡空間連續(xù)、時(shí)間穩(wěn)定,并符合車輛動(dòng)力學(xué)約束。形成統(tǒng)一行為生成機(jī)制,使模型行得更穩(wěn)。

b5ab2070-21e5-11f1-90a1-92fbcf53809c.png

在模型迭代層面,理想汽車構(gòu)建了閉環(huán)強(qiáng)化學(xué)習(xí)框架,讓模型不僅能從真實(shí)數(shù)據(jù)學(xué)習(xí),還能在世界模擬器(World Simulator)中持續(xù)探索和優(yōu)化策略。為此,理想汽車將傳統(tǒng)逐步優(yōu)化式重建升級(jí)為Feed-forward(前饋)場(chǎng)景重建,使系統(tǒng)能夠瞬時(shí)生成大規(guī)模、高保真駕駛場(chǎng)景,支持大規(guī)模并行訓(xùn)練。同時(shí),結(jié)合生成式模型(Generative Models),模擬環(huán)境可擴(kuò)展、編輯并生成全新場(chǎng)景。為支持大規(guī)模模擬與訓(xùn)練,理想汽車開(kāi)發(fā)了統(tǒng)一的3D Gaussian Splatting(3D高斯?jié)姙R)渲染引擎和分布式訓(xùn)練框架,渲染速度提升近2倍,整體訓(xùn)練成本降低約75%,實(shí)現(xiàn)低成本、高效率的強(qiáng)化學(xué)習(xí)閉環(huán)。在閉環(huán)強(qiáng)化學(xué)習(xí)框架下,模型實(shí)現(xiàn)更快進(jìn)化。

b602d0a4-21e5-11f1-90a1-92fbcf53809c.png

為解決傳統(tǒng)端側(cè)大模型部署耗時(shí)長(zhǎng)、調(diào)試頻繁的問(wèn)題,理想汽車提出面向端側(cè)大模型的軟硬件協(xié)同設(shè)計(jì)定律,將模型結(jié)構(gòu)與驗(yàn)證損失建模,并結(jié)合Roofline模型刻畫硬件計(jì)算能力與內(nèi)存帶寬限制,在模型性能與硬件約束之間建立統(tǒng)一的分析框架。理想汽車基座模型團(tuán)隊(duì)評(píng)估了近2000種模型架構(gòu)配置,在英偉達(dá)Orin與Thor平臺(tái)上完成驗(yàn)證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構(gòu)探索時(shí)間從數(shù)月縮短至數(shù)天,大幅提升端側(cè)VLA模型的設(shè)計(jì)與部署效率。在軟硬件協(xié)同設(shè)計(jì)定律下,模型部署更高效。

b6613a5e-21e5-11f1-90a1-92fbcf53809c.png

03自動(dòng)駕駛只是起點(diǎn),為具身智能構(gòu)建“數(shù)字大腦”。

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統(tǒng)一的VLA數(shù)據(jù)引擎,負(fù)責(zé)大規(guī)模數(shù)據(jù)的采集、清洗和自動(dòng)標(biāo)注;MindVLA-o1,統(tǒng)一的原生多模態(tài)VLA模型,可以理解環(huán)境、進(jìn)行推理,并生成駕駛行為;MindSim,可控的多模態(tài)世界模型,用于生成復(fù)雜駕駛場(chǎng)景并支持大規(guī)模閉環(huán)訓(xùn)練;RL Infra(強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施),通過(guò)獎(jiǎng)勵(lì)模型和策略學(xué)習(xí),使系統(tǒng)在仿真與真實(shí)環(huán)境中自我進(jìn)化。

四部分協(xié)同形成完整閉環(huán),使AI能夠感知、理解并在物理世界中自主行動(dòng),并持續(xù)學(xué)習(xí)。從結(jié)構(gòu)上看,這套系統(tǒng)如同一個(gè)“數(shù)字大腦”:感知層對(duì)應(yīng)視覺(jué)皮層,推理與規(guī)劃如前額葉,場(chǎng)景生成似運(yùn)動(dòng)皮層,強(qiáng)化學(xué)習(xí)則類似多巴胺反饋,實(shí)現(xiàn)了感知、理解、行動(dòng)和持續(xù)優(yōu)化的完整閉環(huán)。

該框架不僅服務(wù)于汽車,也可擴(kuò)展至機(jī)器人及各種物理系統(tǒng)。對(duì)理想汽車而言,車是最大號(hào)的機(jī)器人,其本質(zhì)是在構(gòu)建硅基生命體的軀干與大腦。

b6bef2d4-21e5-11f1-90a1-92fbcf53809c.png

理想汽車在持續(xù)推進(jìn)技術(shù)創(chuàng)新的同時(shí),在人工智能領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議和期刊發(fā)表了大量研究成果,其中MindVLA-o1相關(guān)的多篇論文已在CVPR、ICLR、ICRA、AAAI等國(guó)際頂會(huì)上發(fā)表。未來(lái),理想汽車將繼續(xù)以用戶價(jià)值為導(dǎo)向,投入前沿研究以及核心技術(shù)自研,持續(xù)構(gòu)建面向物理世界智能的完整AI系統(tǒng),堅(jiān)定邁向全球領(lǐng)先的具身智能企業(yè)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14910

    瀏覽量

    180263
  • 理想汽車
    +關(guān)注

    關(guān)注

    0

    文章

    338

    瀏覽量

    4107
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3679

    瀏覽量

    5202

原文標(biāo)題:理想汽車發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

文章出處:【微信號(hào):lixiangzhizao,微信公眾號(hào):理想汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    禾賽科技純固態(tài)補(bǔ)盲雷達(dá)FTX獲得長(zhǎng)安汽車下一代平臺(tái)車型定點(diǎn)

    今日,全球激光雷達(dá)領(lǐng)導(dǎo)者禾賽科技(NASDAQ: HSAI;HKEX: 2525)宣布,其第二純固態(tài)補(bǔ)盲雷達(dá) FTX 已成功獲得長(zhǎng)安汽車下一代智能化 L3 平臺(tái)車型前裝量產(chǎn)定點(diǎn)。此次合作標(biāo)志著 L3 級(jí)自動(dòng)駕駛核心感知技術(shù)正式
    的頭像 發(fā)表于 03-13 14:04 ?776次閱讀

    華為在MWC 2026正式發(fā)布下一代WAN目標(biāo)網(wǎng)架構(gòu)

    在MWC26巴塞羅那期間,華為數(shù)據(jù)通信產(chǎn)品線總裁王雷在產(chǎn)品與解決方案發(fā)布會(huì)上正式發(fā)布下一代WAN目標(biāo)網(wǎng)架構(gòu)。他表示,面向智能體互聯(lián)網(wǎng)時(shí)代,華為從安全韌性、多維感知、網(wǎng)絡(luò)自治三個(gè)維度全面升級(jí)IP承載網(wǎng),助力運(yùn)營(yíng)商構(gòu)建自主防御的網(wǎng)
    的頭像 發(fā)表于 03-05 11:12 ?437次閱讀

    理想汽車發(fā)布端側(cè)大模型軟硬協(xié)同設(shè)計(jì)定律

    近日,理想汽車聯(lián)合國(guó)創(chuàng)決策智能技術(shù)研究所正式發(fā)布端側(cè)大模型“軟硬協(xié)同設(shè)計(jì)定律”,提出面向車載與邊緣場(chǎng)景的大模型軟硬
    的頭像 發(fā)表于 03-04 16:00 ?771次閱讀
    <b class='flag-5'>理想</b><b class='flag-5'>汽車</b><b class='flag-5'>發(fā)布</b>端側(cè)大<b class='flag-5'>模型</b>軟硬協(xié)同設(shè)計(jì)定律

    如何構(gòu)建適合自動(dòng)駕駛的世界模型

    提出的。那世界模型自動(dòng)駕駛落地的正解嗎? 什么是世界模型? 世界模型對(duì)于自動(dòng)駕駛汽車來(lái)說(shuō),更像
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的世界<b class='flag-5'>模型</b>?

    自動(dòng)駕駛汽車如何實(shí)現(xiàn)自動(dòng)駕駛

    人類駕駛員而言是非常直觀且有效的指令,但對(duì)于自動(dòng)駕駛汽車來(lái)說(shuō),則意味著需要套極其復(fù)雜的感知、理解與決策鏈路。 自動(dòng)駕駛如何看清文字?
    的頭像 發(fā)表于 02-10 08:50 ?667次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>汽車</b>如何實(shí)現(xiàn)<b class='flag-5'>自動(dòng)駕駛</b>

    德州儀器TDA5系列SoC助力下一代自動(dòng)駕駛汽車設(shè)計(jì)

    在中央計(jì)算平臺(tái)的幫助下,汽車行業(yè)的自動(dòng)駕駛水平越來(lái)越高。TDA5 系列等 SoC 通過(guò)集成式 C7 NPU 和芯片就緒型設(shè)計(jì)提供安全、高效的 AI 性能。這些 SoC 使汽車制造商能夠更輕松地實(shí)現(xiàn) ADAS 功能,為從基礎(chǔ)車型到
    的頭像 發(fā)表于 01-12 11:28 ?1965次閱讀
    德州儀器TDA5系列SoC助力<b class='flag-5'>下一代</b><b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>汽車</b>設(shè)計(jì)

    黃仁勛:未來(lái)十年很多汽車自動(dòng)駕駛 英偉達(dá)發(fā)布Alpamayo汽車模型平臺(tái)

    在當(dāng)?shù)貢r(shí)間1月5日黃仁勛在CES 2026上發(fā)表主題演講,黃仁勛的新年首場(chǎng)演講中重點(diǎn)提及自動(dòng)駕駛、機(jī)器人等。 黃仁勛:未來(lái)十年很多汽車自動(dòng)駕駛 黃仁勛認(rèn)為AI發(fā)展的
    的頭像 發(fā)表于 01-06 11:45 ?1162次閱讀

    世界模型是讓自動(dòng)駕駛汽車理解世界還是預(yù)測(cè)未來(lái)?

    ? [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型自動(dòng)駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對(duì)自動(dòng)駕駛的作用時(shí),難免會(huì)出現(xiàn)分歧。它到底是讓自動(dòng)駕駛汽車
    的頭像 發(fā)表于 12-16 09:27 ?906次閱讀
    世界<b class='flag-5'>模型</b>是讓<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>汽車</b>理解世界還是預(yù)測(cè)未來(lái)?

    模型中常提的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺(jué)語(yǔ)言模型和世界模型的全新
    的頭像 發(fā)表于 11-22 10:59 ?2541次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會(huì)對(duì)<b class='flag-5'>自動(dòng)駕駛</b>產(chǎn)生什么影響?

    不同等級(jí)的自動(dòng)駕駛技術(shù)要求上有何不同?

    談到自動(dòng)駕駛,不可避免地會(huì)涉及到自動(dòng)駕駛分級(jí),美國(guó)汽車工程師學(xué)會(huì)(SAE)根據(jù)自動(dòng)駕駛系統(tǒng)與人類駕駛員參與
    的頭像 發(fā)表于 10-18 10:17 ?2743次閱讀

    小鵬汽車在全球AI頂會(huì)展示下一代自動(dòng)駕駛模型

    此前,北京時(shí)間6月11-14日,計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2025在美國(guó)田納西州納什維爾舉行,小鵬汽車受邀參與自動(dòng)駕駛研討會(huì)CVPR WAD(Workshop on Autonomous
    的頭像 發(fā)表于 06-23 09:13 ?1191次閱讀

    SEGGER發(fā)布下一代安全實(shí)時(shí)操作系統(tǒng)embOS-Ultra-MPU

    2025年3月,SEGGER發(fā)布滿足周期定時(shí)分辨率要求的下一代安全實(shí)時(shí)操作系統(tǒng)embOS-Ultra-MPU,該系統(tǒng)基于成熟的embOS-Classic-MPU和embOS-Ultra操作系統(tǒng)構(gòu)建。
    的頭像 發(fā)表于 03-31 14:56 ?1385次閱讀

    自動(dòng)駕駛模型中常提的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    近年來(lái),人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別以及自動(dòng)駕駛等多個(gè)領(lǐng)域取得了突破性進(jìn)展。自動(dòng)駕駛作為未來(lái)智能交通的重要方向,其核心技術(shù)之
    的頭像 發(fā)表于 03-28 09:16 ?1400次閱讀

    NVIDIA Halos自動(dòng)駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動(dòng)駕駛開(kāi)發(fā)技術(shù)套件,涵蓋車輛架構(gòu)到 AI 模型,包括芯片、軟件、工具和服務(wù)。 物理 AI 正在為自動(dòng)駕駛和機(jī)器人開(kāi)發(fā)技術(shù)的交叉領(lǐng)域釋放新的可能性,尤其是加速了
    的頭像 發(fā)表于 03-25 14:51 ?1204次閱讀

    理想汽車推出全新自動(dòng)駕駛架構(gòu)

    2025年3月18日,理想汽車自動(dòng)駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動(dòng)駕駛物理智能體的關(guān)鍵
    的頭像 發(fā)表于 03-19 14:12 ?1124次閱讀