近日,北京大學(xué)與智元機(jī)器人的聯(lián)合實(shí)驗(yàn)室有了重大成果,北?攜?智元機(jī)器?團(tuán)隊(duì)提出 OmniManip 架構(gòu)。
在具身智能領(lǐng)域,將視覺(jué)語(yǔ)言基礎(chǔ)模型(VLMs)應(yīng)用于機(jī)器人實(shí)現(xiàn)通用操作一直是核心問(wèn)題。目前存在兩大挑戰(zhàn),一是VLMs缺乏精確3D理解能力,二是難以將高層次推理轉(zhuǎn)化為機(jī)器人低層次動(dòng)作。
為解決這些難題,OmniManip架構(gòu)應(yīng)運(yùn)而生。它基于以對(duì)象為中心的3D交互基元,把VLM的高層次推理能力轉(zhuǎn)化為機(jī)器人的低層次高精度動(dòng)作。針對(duì)大模型幻覺(jué)和真實(shí)環(huán)境操作的不確定性,OmniManip引入了VLM規(guī)劃和機(jī)器人執(zhí)行的雙閉環(huán)系統(tǒng)設(shè)計(jì)。
OmniManip的關(guān)鍵設(shè)計(jì)亮點(diǎn)頗多,包括基于VLM的任務(wù)解析,可將復(fù)雜任務(wù)分解為多個(gè)明確主動(dòng)物體、被動(dòng)物體和動(dòng)作類型的結(jié)構(gòu)化階段。還有閉環(huán)機(jī)器人執(zhí)行,通過(guò)物體6D姿態(tài)跟蹤器實(shí)時(shí)更新物體位姿,轉(zhuǎn)換為機(jī)械臂操作軌跡。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31127瀏覽量
222462 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
572瀏覽量
11323
發(fā)布評(píng)論請(qǐng)先 登錄
廣州團(tuán)隊(duì)研制出機(jī)器人“觸覺(jué)皮膚”
江智機(jī)器人技術(shù)核心團(tuán)隊(duì)
北大團(tuán)隊(duì)實(shí)現(xiàn)超高靈敏短波紅外探測(cè)新突破
北大團(tuán)隊(duì)最新研究:AI芯片算力提升數(shù)倍,能效提升超90倍
導(dǎo)遠(yuǎn)科技核心成果亮相2025瑞士機(jī)器人展
機(jī)器人看點(diǎn):智元機(jī)器人公司完成股改 湃特納機(jī)器人完成數(shù)千萬(wàn)元A輪融資
湖北大數(shù)據(jù)集團(tuán)到訪維智科技參觀交流
東北大學(xué)開(kāi)源鴻蒙技術(shù)俱樂(lè)部正式揭牌成立
元禾控股投資先楫半導(dǎo)體:國(guó)產(chǎn)高性能MCU駛?cè)?b class='flag-5'>機(jī)器人控制“快車道”
匯川技術(shù)四大架構(gòu)重磅發(fā)布
彭志輝(稚暉君)創(chuàng)立的智元機(jī)器人預(yù)計(jì)明年出貨量達(dá)數(shù)萬(wàn)臺(tái) 2026是盈利元年
智子科技攜小智機(jī)器人首秀高校講臺(tái)
勱微機(jī)器人攜無(wú)人叉車解決方案亮相LET 2025廣州物流展
橋接智能制造:PROFINET與Devicenet混合架構(gòu)賦能汽車擦凈機(jī)器人升級(jí)
常見(jiàn)的PFC拓?fù)?b class='flag-5'>架構(gòu)及控制方法
北大攜智元機(jī)器?團(tuán)隊(duì)提出OmniManip架構(gòu)
評(píng)論