91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過NVIDIA Cosmos模型增強機器人學習

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-07-14 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通用機器人的時代已經(jīng)到來,這得益于機械電子技術(shù)和機器人 AI 基礎(chǔ)模型的進步。但目前機器人技術(shù)的發(fā)展仍面臨一個關(guān)鍵挑戰(zhàn):機器人需要大量的訓練數(shù)據(jù)來掌握諸如組裝和檢查之類的技能,而手動演示的方式難以擴展?;贜VIDIA Cosmos構(gòu)建的NVIDIA Isaac GR00T-Dreams blueprint,可以通過單張圖像和語言提示生成海量的合成軌跡數(shù)據(jù),能夠有效解決這一難題。

利用 Cosmos 世界基礎(chǔ)模型 (WFMs) 和生成式 AI,開發(fā)者可以快速創(chuàng)建用于訓練諸如NVIDIA Isaac GR00T N1.5(全球首個面向人形機器人推理和技能的開源基礎(chǔ)模型)等模型的數(shù)據(jù)。

本文將介紹 Isaac GR00T-Dreams blueprint,詳述其先進功能及其在開發(fā) Isaac GR00T N1.5 基礎(chǔ)模型中的作用。

GR00T-Dreams blueprint 概覽

Isaac GR00T-Dreams blueprint 是用于生成大量合成軌跡數(shù)據(jù)的參考工作流,生成的數(shù)據(jù)可以用于教會人形機器人在新環(huán)境中執(zhí)行新動作。

借助這一藍圖,機器人僅需極少量的人類演示數(shù)據(jù),就能夠泛化各種行為,并適應新的環(huán)境。因此,一個小型人類演示團隊就能創(chuàng)造出以往需要數(shù)千人才能產(chǎn)出的訓練數(shù)據(jù)量。

GR00T-Dreams blueprint 是對Isaac GR00T-Mimic blueprint的補充。通過使用NVIDIA Omniverse和 Cosmos Transfer-1 WFM 擴展已知任務的現(xiàn)有演示數(shù)據(jù),GR00T-Mimic 可幫助機器人培養(yǎng)深度熟練程度,并成為這些特定技能的專家。GR00T-Dreams 采用 Cosmos Predict-2 和 Cosmos Reason 為新任務和環(huán)境生成全新數(shù)據(jù),致力于使機器人成為具有廣泛適應性的通用機器人。

GR00T-Dreams blueprint 工作流

該藍圖為訓練通用機器人提供強大的“現(xiàn)實到現(xiàn)實 (real-to-real)”數(shù)據(jù)工作流,使用真實機器人數(shù)據(jù)創(chuàng)建合成軌跡,然后用于訓練物理機器人。這種方法顯著減少了對大量人類演示的需求。具體步驟如下:

8a78bc1e-5e3b-11f0-baa5-92fbcf53809c.jpg

圖 1. GR00T-Dreams blueprint 架構(gòu)

第一步:利用人類演示進行后訓練

首先,開發(fā)者收集用于人形機器人在單一環(huán)境中執(zhí)行單一任務(如抓取與放置)的一組有限的人類遠程操作軌跡。然后利用這些真實世界數(shù)據(jù)對 Cosmos Predict-2 世界基礎(chǔ)模型進行后訓練。這一步驟可讓模型學習該機器人特有的特定移動能力和功能約束。

第二步:生成“夢境”

接下來,開發(fā)者向經(jīng)過微調(diào)的 Cosmos 模型輸入初始圖像和基于文本的新指令,要求生成的機器人執(zhí)行相應動作。這會促使生成式模型創(chuàng)建大量多樣化和新穎的任務場景或未來世界狀態(tài)(也稱為“夢境”),例如打開、關(guān)閉、整理物體、清潔和分類等。這些場景以 2D 視頻的形式創(chuàng)建。

第三步:推理和過濾

生成大量“夢境”后,Cosmos Reason 模型可用于評估每個“夢境”的質(zhì)量和成功率。它會過濾掉“不好的夢境”,也就是描繪不成功或有缺陷的任務嘗試,確保僅讓高質(zhì)量和相關(guān)的場景進入下一階段。

第四步:提取神經(jīng)軌跡

選中的“夢境”最初只是 2D 視頻中的像素,隨后利用逆動力學模型 (IDM) 生成 3D 動作軌跡。IDM是用于動作標記的生成式 AI 模型,該模型通過輸入 2D 視頻中的兩個圖像幀,即“之前”和“之后”的畫面,預測出這兩個畫面之間發(fā)生的一系列動作。

這一步驟將“夢境”視頻中的視覺信息轉(zhuǎn)化為機器人能夠?qū)W習的可操作數(shù)據(jù)。這些已添加 3D 動作數(shù)據(jù)的 2D 視頻被稱為神經(jīng)軌跡。

第五步:訓練視覺運動策略

最后,這些神經(jīng)軌跡作為大規(guī)模的合成數(shù)據(jù)集,用于訓練視覺運動策略,既可以與真實世界數(shù)據(jù)協(xié)同訓練以增強性能,也可以僅通過對這些數(shù)據(jù)進行訓練,來實現(xiàn)對新行為和不可見環(huán)境的泛化。

用于機器人學習的高級功能

GR00T-Dreams 為機器人學習提供了先進的功能,包括新行為、新環(huán)境等。

新行為:即使僅有單一任務(例如抓取與放置)的訓練數(shù)據(jù),機器人也能從語言指令中學習新動作。

由 GR00T-Dreams 支持的機器人打開筆記本電腦的神經(jīng)軌跡和真實機器人 (Fourier GR-1) 執(zhí)行情況

新環(huán)境:即使世界模型僅在一個實驗室環(huán)境中訓練過,機器人也能夠泛化到完全未見過的環(huán)境。

由 GR00T-Dreams 支持的機器人將橘子放入碗中的神經(jīng)軌跡和真實機器人 (Fourier GR-1) 執(zhí)行情況

多種機器人類型:適用于從人形機器人到機械臂(如 Franka 和 SO-100)等不同類型的機器人,并支持多種攝像頭視圖。

由 GR00T-Dreams 支持的 Franka 機械臂和 SO-100 機械臂執(zhí)行不同操作任務

針對復雜任務增強學習:為具有挑戰(zhàn)性的接觸密集型任務,比如操作可變形物體(折疊)或使用工具(錘擊)等增強訓練數(shù)據(jù),形成從初始真實畫面開始的“真實到真實”工作流。

由 GR00T-Dreams 支持的機器人錘擊操作的神經(jīng)軌跡和真實機器人 (Fourier GR-1) 執(zhí)行情況

使用 GR00T-Dreams

對 GR00T N1.5 進行后訓練

可以使用 GR00T-Dreams 對視覺語言動作 (VLA) 模型進行后訓練,以在未見過的環(huán)境中實現(xiàn)新行為和操作。

NVIDIA 研究中心使用 GR00T-Dreams blueprint 生成合成訓練數(shù)據(jù),僅用 36 小時就完成了 GR00T N1.5 的開發(fā)。如果使用人工收集人類數(shù)據(jù),這一過程需要近三個月的時間。

GR00T N1.5 是 GR00T N1 的首次更新,GR00T N1 是全球首個面向通用人形機器人推理和技能的開源基礎(chǔ)模型。這個跨形態(tài)模型可以接收語言和圖像等多模態(tài)輸入,在多樣化的環(huán)境中執(zhí)行操作任務。

GR00T N1.5 的新功能:

提高對語言指令的理解準確性

借助 Isaac GR00T-Dreams,增強對新物體和新環(huán)境的泛化能力

通過 Eagle 2.5 提供更好的空間理解和開放世界視覺定位,提升視覺語言基礎(chǔ)

在材料處理和制造任務中成功率更高

開源的 NVIDIA 物理 AI 數(shù)據(jù)集

NVIDIA 擴展了其開源物理AI數(shù)據(jù)集。該數(shù)據(jù)集是 Hugging Face 上下載量最多的機器人數(shù)據(jù)集,最初于 2025 年 3 月推出,如今新增了數(shù)千條機器人軌跡,包括 Unitree G1 機器人的首批真實訓練數(shù)據(jù)和 24,000 條仿真遠程操作軌跡。

該數(shù)據(jù)集還包含各種操作任務的合成仿真數(shù)據(jù),在開發(fā) GR00T N1.5 的過程中發(fā)揮了重要的作用。

GR00T N 模型在機器人生態(tài)系統(tǒng)的應用

GR00T N 模型已經(jīng)被很多生態(tài)合作伙伴采用,包括 AeiRobot、Foxlink、光輪智能和 NEURA Robotics 等。

AeiRobot 利用這一模型使其工業(yè)機器人能夠理解自然語言,從而完成復雜的抓取與放置任務。Foxlink 利用這一模型提高其工業(yè)機械臂的靈活性和效率。光輪智能借助這一模型驗證合成數(shù)據(jù),以加快人形機器人在工廠中的部署。NEURA Robotics 正在評估這一模型,以加速其家用自動化系統(tǒng)的開發(fā)。

開始加速機器人學習

Isaac GR00T-Dreams blueprint 是用于生成大量合成軌跡數(shù)據(jù)的參考工作流,這些數(shù)據(jù)可用于教會人形機器人在新環(huán)境中執(zhí)行新動作。這一藍圖使機器人僅需極少量的人類演示數(shù)據(jù),就能夠泛化各種行為,并適應新的環(huán)境。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5597

    瀏覽量

    109785
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3755

    瀏覽量

    52121
  • 人形機器人
    +關(guān)注

    關(guān)注

    7

    文章

    978

    瀏覽量

    18507

原文標題:通過世界基礎(chǔ)模型生成的合成軌跡數(shù)據(jù)增強機器人學習

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA Cosmos世界基礎(chǔ)模型如何塑造機器人未來

    在這一演進過程中,世界模型逐漸成為連接高層智能與底層執(zhí)行的關(guān)鍵基礎(chǔ)設(shè)施。通過對環(huán)境狀態(tài)及其時間演化進行建模,世界模型使機器人系統(tǒng)能夠在受控環(huán)境中進行仿真、訓練與決策推演,從而為
    的頭像 發(fā)表于 01-22 16:38 ?547次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b>世界基礎(chǔ)<b class='flag-5'>模型</b>如何塑造<b class='flag-5'>機器人</b>未來

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助
    的頭像 發(fā)表于 12-01 09:25 ?1148次閱讀

    NVIDIA 發(fā)布三大利器,推動人形機器人邁向新紀元

    電子發(fā)燒友網(wǎng)綜合報道 在節(jié)前的機器人學習大會(CoRL)上,NVIDIA 發(fā)布了一系列突破性技術(shù),包括開源物理引擎 Newton、機器人基礎(chǔ)模型 Isaac GROOT N1.6以及全
    的頭像 發(fā)表于 10-13 04:42 ?5765次閱讀

    NVIDIA 利用全新開源模型與仿真庫加速機器人研發(fā)進程

    科研人員及開發(fā)者打造功能更強大、適應性更強的機器人。 ? 全新的 NVIDIA Isaac GR00T 開源基礎(chǔ)模型將為機器人賦予接近人類的推理能力,使其能夠拆解復雜指令,并借助已有知
    的頭像 發(fā)表于 09-30 09:52 ?3078次閱讀
    <b class='flag-5'>NVIDIA</b> 利用全新開源<b class='flag-5'>模型</b>與仿真庫加速<b class='flag-5'>機器人</b>研發(fā)進程

    NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎(chǔ)設(shè)施,為機器人領(lǐng)域開啟新篇章

    NVIDIA 通過全新 Omniverse 庫、Cosmos 物理 AI 模型及 AI 計算基礎(chǔ)設(shè)施,為機器人領(lǐng)域開啟新篇章 ? ·?全新
    的頭像 發(fā)表于 08-12 11:29 ?1788次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>通過</b>全新 Omniverse庫、<b class='flag-5'>Cosmos</b>物理AI<b class='flag-5'>模型</b>及AI計算基礎(chǔ)設(shè)施,為<b class='flag-5'>機器人</b>領(lǐng)域開啟新篇章

    利用NVIDIA Cosmos模型訓練通用機器人

    機器人領(lǐng)域的一大核心挑戰(zhàn)在于如何讓機器人掌握新任務,而無需針對每個新任務和環(huán)境耗費大量精力收集和標注數(shù)據(jù)集。NVIDIA 的最新研究方案通過生成式 AI、世界基礎(chǔ)
    的頭像 發(fā)表于 08-05 16:22 ?2119次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b><b class='flag-5'>模型</b>訓練通用<b class='flag-5'>機器人</b>

    NVIDIA展示機器人領(lǐng)域的研究成果

    在今年的機器人科學與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機器人學習的研究成果,展示了在仿真、現(xiàn)實世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1427次閱讀

    NVIDIA Isaac Lab可用環(huán)境與強化學習腳本使用指南

    Lab 是一個適用于機器人學習的開源模塊化框架,其模塊化高保真仿真適用于各種訓練環(huán)境,Isaac Lab 同時支持模仿學習(模仿人類)和強化學習(在嘗試和錯誤中進行學習),為所有
    的頭像 發(fā)表于 07-14 15:29 ?2356次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab可用環(huán)境與強化<b class='flag-5'>學習</b>腳本使用指南

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺 NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA C
    的頭像 發(fā)表于 07-09 10:17 ?826次閱讀

    NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預覽版

    NVIDIA 發(fā)布了機器人仿真參考應用 Isaac Sim 和機器人學習框架 Isaac Lab 的開發(fā)者預覽版。開發(fā)者現(xiàn)在可以通過 GitHub 訪問早期版本,搶先體驗先進功能,用于
    的頭像 發(fā)表于 07-04 14:23 ?1818次閱讀

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期發(fā)布了 Cosmos Reason-1 的 7B 和 56B 兩款多模態(tài)大語言模型 (MLLM),它們經(jīng)過了“物理 AI 監(jiān)督微調(diào)”和“物理 AI 強化學習”兩個階段
    的頭像 發(fā)表于 06-04 13:43 ?979次閱讀

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA
    的頭像 發(fā)表于 05-28 10:06 ?2131次閱讀

    NVIDIA Cosmos加速機器人和自動駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預測未來世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI 的發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?1275次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b>加速<b class='flag-5'>機器人</b>和自動駕駛汽車物理AI發(fā)展

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    模型可實現(xiàn)物理 AI 的預測、可控世界生成和推理。 兩款全新Blueprint為機器人和自動駕駛汽車后訓練提供海量物理 AI 合成數(shù)據(jù)生成技術(shù)。 1X、Agility Robotics
    的頭像 發(fā)表于 03-20 19:01 ?1349次閱讀

    深度解讀英偉達Newton機器人平臺:技術(shù)革新與跨界生態(tài)構(gòu)建

    Newton是由NVIDIA、Google DeepMind和Disney Research開發(fā)的開源、可擴展的物理引擎,旨在推進機器人學習和開發(fā)。 Newton建立在 NVIDIA Warp
    的頭像 發(fā)表于 03-20 15:15 ?2865次閱讀
    深度解讀英偉達Newton<b class='flag-5'>機器人</b>平臺:技術(shù)革新與跨界生態(tài)構(gòu)建