10月27日消息,據(jù)外媒報道,約翰斯霍普金斯大學博士生安德魯洪特(Andrew Hundt) 近日發(fā)布一篇新論文,指出應通過正強化法訓練機器人學習新技能。
這篇論文的核心思想是,在訓練機器人的過程中,應采用正強化法,即相比于在它做錯時進行懲罰,更應在它做對時進行激勵。而對于機器人來說,這種激勵機制是以評分系統(tǒng)的形式呈現(xiàn)的,類似玩游戲一樣,根據(jù)執(zhí)行任務的情況獲得積分。
安德魯表示,這種方法能夠大大縮短訓練機器人執(zhí)行任務的時間?!皺C器人希望能得到更高的分數(shù),所以它們很快就可以完成相關(guān)任務。過去機器人需要一個月的練習才能達到100%的準確性,現(xiàn)在只用兩天就能做到?!?/p>
不過他也指出,目前機器人執(zhí)行的這些任務仍然是比較初級的,比如堆積木。但在未來,機器人有望通過正強化法完成更復雜和有意義的任務。
責任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
機器人
+關(guān)注
關(guān)注
213文章
31092瀏覽量
222347
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
基于NVIDIA Isaac Lab拓展多模態(tài)機器人學習
構(gòu)建強大的智能機器人需要在復雜環(huán)境中進行測試。然而,在現(xiàn)實世界中收集數(shù)據(jù)不僅成本高昂、耗時漫長,還常常伴隨高風險。針對關(guān)鍵危險場景(例如高速碰撞或硬件故障)進行安全訓練幾乎是不可能的。更嚴重的是,現(xiàn)實世界的數(shù)據(jù)往往偏向“正常”運行條件,導致
NVIDIA Isaac Lab 2.3新增功能助力簡化機器人學習
基于真實世界演示訓練機器人策略,不僅成本高、速度慢,還容易出現(xiàn)過擬合問題,進而限制其在不同任務與環(huán)境中的泛化能力。而仿真優(yōu)先的方法可簡化開發(fā)流程、降低風險與成本,同時部署到真實環(huán)境也將更安全、適應性更強。
NVIDIA開源物理引擎與OpenUSD加速機器人學習
開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機器人是一項巨大的技術(shù)挑戰(zhàn)。這類機器人需具備與人類接近的靈巧性、感知能力、認知能力和全身協(xié)調(diào)性,以便于實時應對充滿不確定性的真實環(huán)境。
NVIDIA 發(fā)布三大利器,推動人形機器人邁向新紀元
電子發(fā)燒友網(wǎng)綜合報道 在節(jié)前的機器人學習大會(CoRL)上,NVIDIA 發(fā)布了一系列突破性技術(shù),包括開源物理引擎 Newton、機器人基礎(chǔ)模型 Isaac GROOT N1.6以及全新 AI
NVIDIA Isaac Lab多GPU多節(jié)點訓練指南
NVIDIA Isaac Lab 是一個適用于機器人學習的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓練環(huán)境,可提供各種物理 AI 功能和由 GPU 驅(qū)動的物理仿真,縮小仿真與現(xiàn)實世界之間的差距。
英偉達發(fā)布機器人 “新大腦”,黃仁勛:人形機器人三年普及
完成如 “烤面包” 這樣的復雜任務。結(jié)合 Omniverse 仿真平臺,訓練效率提高了10倍,大大縮短了機器人學習和適應現(xiàn)實環(huán)境的時間。 英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛在鏈博會上發(fā)表演講時指出,物理 AI 將推動 AI 從虛擬世界邁向?qū)嶓w領(lǐng)域,重構(gòu)工業(yè)和日常生活
易控智駕與中科院端到端自動駕駛方案入選CoRL 2025
近日,旨在分享和探討機器人技術(shù)與機器學習交叉領(lǐng)域最新進展的國際頂級機器人學習會議CoRL 2025 (Conference on Robot Learning)論文接收結(jié)果揭曉。
海默智能噴涂機器人——為工業(yè)噴涂解鎖新技能
在工業(yè)噴涂領(lǐng)域面臨高精度與柔性化雙重挑戰(zhàn)的今天,傳統(tǒng)方式受限于編程效率與復雜曲面適應性,而資深技師的寶貴經(jīng)驗亟待數(shù)字化傳承。海默機器人依托技術(shù)積累,推出移動式慣導隨動噴涂協(xié)作機器人,以“雙核動態(tài)捕捉
NVIDIA展示機器人領(lǐng)域的研究成果
在今年的機器人科學與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機器人學習的研究成果,展示了在仿真、現(xiàn)實世界遷移和決策制定領(lǐng)域的突破。
NVIDIA Isaac Lab可用環(huán)境與強化學習腳本使用指南
Lab 是一個適用于機器人學習的開源模塊化框架,其模塊化高保真仿真適用于各種訓練環(huán)境,Isaac Lab 同時支持模仿學習(模仿人類)和強化學習(在嘗試和錯誤中進行
通過NVIDIA Cosmos模型增強機器人學習
通用機器人的時代已經(jīng)到來,這得益于機械電子技術(shù)和機器人 AI 基礎(chǔ)模型的進步。但目前機器人技術(shù)的發(fā)展仍面臨一個關(guān)鍵挑戰(zhàn):機器人需要大量的訓練
NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預覽版
NVIDIA 發(fā)布了機器人仿真參考應用 Isaac Sim 和機器人學習框架 Isaac Lab 的開發(fā)者預覽版。開發(fā)者現(xiàn)在可以通過 GitHub 訪問早期版本,搶先體驗先進功能,用于在基于物理的仿真環(huán)境中構(gòu)建、訓練和測試 AI
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機器人的開發(fā)。
構(gòu)建人形機器人學習的合成運動生成流程
通用人形機器人需要能夠快速適應現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復或體力要求高的任務。這些移動機器人經(jīng)過設(shè)計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療醫(yī)療機構(gòu),它們的價值日益凸顯。
深度解讀英偉達Newton機器人平臺:技術(shù)革新與跨界生態(tài)構(gòu)建
Newton是由NVIDIA、Google DeepMind和Disney Research開發(fā)的開源、可擴展的物理引擎,旨在推進機器人學習和開發(fā)。 Newton建立在 NVIDIA Warp
如何訓練機器人學習新技能
評論