91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

奧比中光助力機(jī)器人客戶快速實(shí)現(xiàn)創(chuàng)新應(yīng)用開(kāi)發(fā)與量產(chǎn)制造

奧比中光 ? 來(lái)源:奧比中光 ? 2023-12-13 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

是時(shí)候給大模型造個(gè)身體了。

近期,奧比中光研發(fā)團(tuán)隊(duì)結(jié)合機(jī)械臂與大模型,利用語(yǔ)音、語(yǔ)言、視覺(jué)-語(yǔ)言大模型,輔以O(shè)rbbec Gemini 2系列深度相機(jī)的數(shù)據(jù)輸入,打造出一個(gè)能夠理解、執(zhí)行語(yǔ)音任務(wù)的機(jī)械臂。

該項(xiàng)目以斯坦福大學(xué)李飛飛教授團(tuán)隊(duì)打造的機(jī)器人智能體為基礎(chǔ),通過(guò)解決泛化、觀測(cè)、控制等一系列工程化難題,將基于多模態(tài)大模型的機(jī)械臂從仿真環(huán)境落地到現(xiàn)實(shí)世界,拓展智能機(jī)械臂應(yīng)用潛能。

融合多種大模型能力

讓機(jī)械臂理解、執(zhí)行語(yǔ)音指令

去年以來(lái),各類大模型的涌現(xiàn)引發(fā)了機(jī)器人產(chǎn)業(yè)新一輪發(fā)展浪潮。盡管“大模型+機(jī)器人”還處于早期技術(shù)探索階段,但隨著二者深入融合,機(jī)器人有望具備更智能的“大腦”,配合更強(qiáng)大的“眼睛”與“身體”,實(shí)現(xiàn)向具身智能的進(jìn)化。

奧比中光最新打造的大模型機(jī)械臂,可以通過(guò)語(yǔ)音Prompts作為輸入,利用多種大模型的理解能力和視覺(jué)感知能力,生成空間語(yǔ)義信息,讓機(jī)械臂理解、執(zhí)行動(dòng)作。

首先,機(jī)械臂可借助語(yǔ)音大模型,識(shí)別任務(wù)下發(fā)者的語(yǔ)音指令;同時(shí),通過(guò)兩臺(tái)Orbbec Gemini 2雙目結(jié)構(gòu)光相機(jī),獲取高質(zhì)量環(huán)境RGB和Depth數(shù)據(jù);再利用SAM、CLIP等視覺(jué)-語(yǔ)言大模型,理解場(chǎng)景信息,并進(jìn)行實(shí)時(shí)碰撞檢測(cè),最終執(zhí)行任務(wù)。

基于這一原理,奧比中光可以讓機(jī)械臂完成一系列指令,比如:

請(qǐng)記住當(dāng)前的狀態(tài)

把紅色的方塊放到黃色的框中

把綠色的方塊放到白色的框里面

把藍(lán)色的方塊逆時(shí)針旋轉(zhuǎn)30°

將藍(lán)色方塊朝著綠色方塊的方向移動(dòng)10cm

把藍(lán)色方塊放到綠色的方塊上面

請(qǐng)恢復(fù)最開(kāi)始的狀態(tài)

請(qǐng)把所有的方塊放到黃色的框中

目前,該項(xiàng)目在1.0階段打通了多模態(tài)大模型在機(jī)械臂上的應(yīng)用部署baseline。奧比中光正在進(jìn)一步優(yōu)化多模態(tài)指令理解、多傳感器融合感知、機(jī)械臂軌跡規(guī)劃控制、末端抓取控制等方面,未來(lái)將推出大模型機(jī)器人控制系統(tǒng),讓機(jī)器人更加智能、靈活,適應(yīng)更加復(fù)雜的操作場(chǎng)景。

克服泛化、觀測(cè)、控制難題

從仿真變?yōu)楝F(xiàn)實(shí)

目前,國(guó)內(nèi)外眾多針對(duì)機(jī)器人智能體的研究多在仿真環(huán)境中完成。而從虛擬仿真到真實(shí)世界,還需要克服一系列工程化落地難題。比如,在仿真環(huán)境中,相機(jī)基于理想的成像模型,可以不受成像畸變、環(huán)境光照等影響,這就對(duì)智能體在真實(shí)場(chǎng)景中的泛化能力提出了挑戰(zhàn)。

奧比中光的研發(fā)團(tuán)隊(duì)基于預(yù)訓(xùn)練的多模態(tài)機(jī)械臂模型,克服了泛化、觀測(cè)、控制等一系列落地難題:

為實(shí)現(xiàn)快速準(zhǔn)確的語(yǔ)音輸入與理解,引入語(yǔ)音預(yù)訓(xùn)練大模型,使得機(jī)械臂靈敏響應(yīng)語(yǔ)音指令。

為確保機(jī)械臂在真實(shí)世界中具備足夠的泛化能力,采用視覺(jué)-語(yǔ)言大模型,使機(jī)械臂理解適應(yīng)復(fù)雜場(chǎng)景,在多樣化的環(huán)境中穩(wěn)健執(zhí)行任務(wù)。

為處理預(yù)訓(xùn)練模型的理想相機(jī)成像問(wèn)題,設(shè)計(jì)全新標(biāo)定方案,優(yōu)化相機(jī)自動(dòng)曝光(AE)策略,解決受環(huán)境光、成像畸變、透視形變等因素帶來(lái)的挑戰(zhàn),使機(jī)械臂擁有更強(qiáng)的魯棒性。

為提高機(jī)械臂在復(fù)雜環(huán)境中的安全性,引入深度相機(jī)碰撞檢測(cè)和抓取修正,優(yōu)化機(jī)械臂控制,提高機(jī)械臂抓取場(chǎng)景的性能、精度和適應(yīng)性。

基于關(guān)鍵技術(shù)的引入與創(chuàng)新,奧比中光成功地克服了多模態(tài)機(jī)械臂在多個(gè)交叉領(lǐng)域的難題,打通工程化應(yīng)用落地的“最后一公里”。

在機(jī)器人視覺(jué)領(lǐng)域,奧比中光擁有超過(guò)8年的行業(yè)落地經(jīng)驗(yàn),服務(wù)超過(guò)100家機(jī)器人產(chǎn)業(yè)企業(yè)。通過(guò)多年合作,奧比中光在機(jī)器人3D傳感器、激光雷達(dá)、模型算法等方面積累了豐富的經(jīng)驗(yàn),助力機(jī)器人客戶快速實(shí)現(xiàn)創(chuàng)新應(yīng)用開(kāi)發(fā)與量產(chǎn)制造。

布局多模態(tài)視覺(jué)大模型

升維機(jī)器人應(yīng)用潛力

融合多種大模型能力的機(jī)械臂,可以應(yīng)用在哪些場(chǎng)景?

隨著機(jī)器人的“眼睛”(視覺(jué)傳感器)、“大腦”(大模型)、“身體”(本體)不斷發(fā)展進(jìn)化,智能機(jī)器人及機(jī)械臂有望在工業(yè)制造、柔性物流、商用服務(wù)等場(chǎng)景中率先落地。

例如,在自動(dòng)化工廠場(chǎng)景,基于多模態(tài)大模型的機(jī)器臂可以結(jié)合無(wú)人小車,進(jìn)行智能分揀、搬運(yùn);在家用服務(wù)機(jī)器人場(chǎng)景,人們可以通過(guò)簡(jiǎn)單的自然語(yǔ)言指令,讓機(jī)器人幫忙倒水、取快遞。

當(dāng)前,面向機(jī)器人產(chǎn)業(yè),奧比中光可提供單目結(jié)構(gòu)光、雙目結(jié)構(gòu)光、iToF、激光雷達(dá)、dToF等全技術(shù)路線3D視覺(jué)傳感器,并提供多傳感器融合支持。同時(shí),針對(duì)AI大模型、具身智能機(jī)器人等科技發(fā)展趨勢(shì),奧比中光正在致力于搭建機(jī)器人及AI視覺(jué)中臺(tái),通過(guò)多模態(tài)視覺(jué)大模型及智能算法的研發(fā),結(jié)合機(jī)器人視覺(jué)傳感器,將形成自主移動(dòng)定位導(dǎo)航和避障的完整產(chǎn)品方案,為全產(chǎn)業(yè)下游客戶提供全方位能力平臺(tái)及系列化產(chǎn)品方案,迎接智能機(jī)器人時(shí)代。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31093

    瀏覽量

    222358
  • 3D傳感器
    +關(guān)注

    關(guān)注

    4

    文章

    121

    瀏覽量

    27060
  • 奧比中光
    +關(guān)注

    關(guān)注

    1

    文章

    178

    瀏覽量

    9216
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3651

    瀏覽量

    5195

原文標(biāo)題:從仿真變成現(xiàn)實(shí),奧比中光大模型機(jī)械臂1.0來(lái)了!

文章出處:【微信號(hào):orbbec,微信公眾號(hào):奧比中光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Gemini 330系列雙目3D相機(jī)完成NVIDIA Jetson Thor平臺(tái)全面適配

    在CES 2026展會(huì)期間,發(fā)布專為機(jī)械臂腕部設(shè)計(jì)超小型雙目3D相機(jī)Gemini 305 立即購(gòu)買(mǎi),并正式宣布其面向機(jī)器人的標(biāo)志性產(chǎn)
    的頭像 發(fā)表于 01-12 10:22 ?320次閱讀

    OEM服務(wù)加速理療機(jī)器人量產(chǎn)落地

    近日,一款理療機(jī)器人的3D視覺(jué)感知產(chǎn)業(yè)智能制造基地進(jìn)行組裝生產(chǎn)并
    的頭像 發(fā)表于 12-17 14:24 ?411次閱讀

    營(yíng)收暴增103%!英偉達(dá)全球生態(tài)的傳感器合作伙伴!超10款自研傳感器芯片流片

    產(chǎn)業(yè)臺(tái)、打造機(jī)器人的“眼睛”?;谧匝行酒腿珬J较到y(tǒng)技術(shù),
    的頭像 發(fā)表于 11-17 18:18 ?2955次閱讀
    <b class='flag-5'>奧</b><b class='flag-5'>比</b><b class='flag-5'>中</b><b class='flag-5'>光</b>營(yíng)收暴增103%!英偉達(dá)全球生態(tài)的傳感器合作伙伴!超10款自研傳感器芯片流片

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開(kāi)發(fā)板的精密運(yùn)動(dòng)控制方案

    ”應(yīng)用提供了強(qiáng)大的硬件支撐。 五、結(jié)語(yǔ) “高精度機(jī)器人控制”是智能制造時(shí)代的核心競(jìng)爭(zhēng)力。 米爾 MYD-LT536 開(kāi)發(fā)板憑借強(qiáng)大的計(jì)算能力、豐富的工業(yè)接口與成熟的系統(tǒng)生態(tài),能夠幫助工程師
    發(fā)表于 11-14 15:48

    助力開(kāi)源人形機(jī)器人Reachy 2能力升級(jí)

    在法國(guó)Pollen Robotics的實(shí)驗(yàn)室里,今年4月發(fā)布的人形機(jī)器人Reachy 2正在完成一項(xiàng)頗具挑戰(zhàn)的任務(wù):根據(jù)食譜精準(zhǔn)分揀水果和蔬菜。Reachy 2能區(qū)分新鮮蘋(píng)果和枯萎生菜,靠的不是編程,而是
    的頭像 發(fā)表于 11-05 15:53 ?562次閱讀

    3D視覺(jué)技術(shù)賦能IROS 2025研究成果

    全球機(jī)器人領(lǐng)域最具影響力的學(xué)術(shù)會(huì)議IROS 2025于10月19日至25日在杭州國(guó)際博覽中心舉行。大會(huì)收錄的多篇論文的研究成果采用了
    的頭像 發(fā)表于 10-23 16:29 ?793次閱讀

    領(lǐng)跑韓國(guó)機(jī)器人3D視覺(jué)市場(chǎng)

    近日,國(guó)際權(quán)威行業(yè)研究機(jī)構(gòu)Interact Analysis發(fā)布《韓國(guó)商用及工業(yè)移動(dòng)機(jī)器人3D視覺(jué)市場(chǎng)分析》報(bào)告(以下簡(jiǎn)稱“報(bào)告”)。數(shù)據(jù)顯示,光在韓國(guó)商用和工業(yè)移動(dòng)
    的頭像 發(fā)表于 10-23 16:27 ?735次閱讀

    3D相機(jī)矩陣接入NVIDIA Jetson Thor平臺(tái)

    傳輸至Jetson Thor,為人形機(jī)器人等物理AI實(shí)時(shí)應(yīng)用場(chǎng)景提供豐富且實(shí)時(shí)的感知數(shù)據(jù)流。這一兼容性將使成為全球數(shù)百萬(wàn)
    的頭像 發(fā)表于 08-30 09:42 ?2654次閱讀

    助力日本車企跨界推出服務(wù)型物流機(jī)器人

    為解決當(dāng)前醫(yī)院普遍面臨的醫(yī)護(hù)資源緊張與運(yùn)輸效率低下等問(wèn)題,日本一家銷量TOP3車企跨界研發(fā)并推出了搭載雙目3D相機(jī)Gemini 2的服務(wù)型物流
    的頭像 發(fā)表于 08-30 09:39 ?1238次閱讀

    與地平線、地瓜機(jī)器人達(dá)成戰(zhàn)略合作

    8月11日,與地平線及其控股子公司地瓜機(jī)器人在北京簽訂合作協(xié)議,雙方將在機(jī)器人智能化領(lǐng)域
    的頭像 發(fā)表于 08-12 11:31 ?2306次閱讀

    發(fā)布面向機(jī)器人領(lǐng)域的全新感知產(chǎn)品矩陣

    8月8日,在北京舉辦的2025世界機(jī)器人大會(huì)上,以“靈機(jī)宜動(dòng)”為主題,發(fā)布面向機(jī)器人領(lǐng)域
    的頭像 發(fā)表于 08-12 11:28 ?2167次閱讀

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語(yǔ)音機(jī)器人逐漸成為人們生活和工作的得力助手。明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板憑借強(qiáng)大性能與豐富功能,為語(yǔ)音機(jī)器人的發(fā)
    發(fā)表于 05-28 11:36

    盤(pán)點(diǎn)#機(jī)器人開(kāi)發(fā)平臺(tái)

    地瓜機(jī)器人RDK X5開(kāi)發(fā)套件地瓜機(jī)器人RDK X5開(kāi)發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人
    發(fā)表于 05-13 15:02

    光亮相2025機(jī)器人全產(chǎn)業(yè)鏈接會(huì)

    此前,2025年4月24日-26日,參加由深圳市機(jī)器人協(xié)會(huì)牽頭發(fā)起組織的機(jī)器人全產(chǎn)業(yè)鏈接
    的頭像 發(fā)表于 04-29 10:58 ?1190次閱讀

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開(kāi)源六軸機(jī)械臂產(chǎn)品

    全球80多個(gè)國(guó)家和地區(qū)。 近日,大象機(jī)器人聯(lián)合進(jìn)迭時(shí)空推出全球首款RISC-V全棧開(kāi)源六軸機(jī)器臂“myCobot 280 RISC-V”,為開(kāi)發(fā)者打造全新的機(jī)器人開(kāi)源
    發(fā)表于 04-25 17:59