91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)辟新篇章!谷歌機(jī)器學(xué)習(xí)又有新進(jìn)展!

DR2b_Aiobservat ? 來(lái)源:YXQ ? 2019-06-22 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在谷歌最新的論文中,研究人員提出了“非政策強(qiáng)化學(xué)習(xí)”算法OPC,它是強(qiáng)化學(xué)習(xí)的一種變體,它能夠評(píng)估哪種機(jī)器學(xué)習(xí)模型將產(chǎn)生最好的結(jié)果。數(shù)據(jù)顯示,OPC比基線機(jī)器學(xué)習(xí)算法有著顯著的提高,更加穩(wěn)健可靠。

在谷歌AI研究團(tuán)隊(duì)一篇新發(fā)表的論文《通過(guò)非政策分類進(jìn)行非政策評(píng)估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他們提出了所稱的“非政策分類”,即OPC(off-policy classification)。它能夠評(píng)估AI的表現(xiàn),通過(guò)將評(píng)估視為一個(gè)分類問(wèn)題來(lái)驅(qū)動(dòng)代理性能。

研究人員認(rèn)為他們的方法是強(qiáng)化學(xué)習(xí)的一種變體,它利用獎(jiǎng)勵(lì)來(lái)推動(dòng)軟件政策實(shí)現(xiàn)與圖像輸入?yún)f(xié)同工作這個(gè)目標(biāo),并擴(kuò)展到包括基于視覺(jué)的機(jī)器人抓取在內(nèi)的任務(wù)。

“完全脫離政策強(qiáng)化學(xué)習(xí)是一種變體。代理完全從舊數(shù)據(jù)中學(xué)習(xí),對(duì)于工程師來(lái)說(shuō)這是很有吸引力的,因?yàn)樗梢栽诓恍枰锢頇C(jī)器人的情況下進(jìn)行模型迭代。”

Robotics at Google(專注機(jī)器學(xué)的的谷歌新團(tuán)隊(duì))的軟件工程師Alexa Irpan寫(xiě)道,“完全脫離政策的RL,可以在先前代理收集的同一固定數(shù)據(jù)集上訓(xùn)練多個(gè)模型,然后選擇出最佳的那個(gè)模型?!?/p>

但是OPC并不像聽(tīng)起來(lái)那么容易,正如Irpan在論文中所描述的,非政策性強(qiáng)化學(xué)習(xí)可以通過(guò)機(jī)器人進(jìn)行人工智能模型培訓(xùn),但不能進(jìn)行評(píng)估。并且在需要評(píng)估大量模型的方法中,地面實(shí)況評(píng)估通常效率太低。

OPC在假設(shè)任務(wù)狀態(tài)變化方面幾乎沒(méi)有隨機(jī)性,同時(shí)假設(shè)代理在實(shí)驗(yàn)結(jié)束時(shí)用“成功或失敗”來(lái)解決這個(gè)問(wèn)題。兩個(gè)假設(shè)中第二個(gè)假設(shè)的二元性質(zhì),允許為每個(gè)操作分配兩個(gè)分類標(biāo)簽(“有效”表示成功或“災(zāi)難性”表示失?。?/p>

另外,OPC還依賴Q函數(shù)(通過(guò)Q學(xué)習(xí)算法學(xué)習(xí))來(lái)估計(jì)行為的未來(lái)總回報(bào)。代理商選擇具有最大預(yù)期回報(bào)的行動(dòng),其績(jī)效通過(guò)所選行動(dòng)的有效頻率來(lái)衡量(這取決于Q函數(shù)如何正確地將行動(dòng)分類為有效與災(zāi)難性),并以分類準(zhǔn)確性作為非政策評(píng)估分?jǐn)?shù)。

(左圖為基線,右圖為建議的方法之一,SoftOpC)

谷歌AI團(tuán)隊(duì)使用完全非策略強(qiáng)化學(xué)習(xí)對(duì)機(jī)器學(xué)習(xí)策略進(jìn)行了模擬培訓(xùn),然后使用從以前的實(shí)際數(shù)據(jù)中列出的非策略分?jǐn)?shù)對(duì)其進(jìn)行評(píng)估。

在機(jī)器人抓取任務(wù)時(shí),他們報(bào)告OPC的一種變體SoftOPC在預(yù)測(cè)最終成功率方面表現(xiàn)最佳。假設(shè)有15種模型(其中7種純粹在模擬中訓(xùn)練)具有不同的穩(wěn)健性,SoftOPC產(chǎn)生的分?jǐn)?shù)與與真正的抓取成功密切相關(guān),并且相比于基線方法更加穩(wěn)定可靠。

在未來(lái)的研究中,研究人員打算用“噪聲”(noisier)和非二進(jìn)制動(dòng)力學(xué)來(lái)探索機(jī)器學(xué)習(xí)任務(wù)?!拔覀冋J(rèn)為這個(gè)結(jié)果有希望應(yīng)用于許多現(xiàn)實(shí)世界的RL問(wèn)題,”Irpan在論文結(jié)尾寫(xiě)道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111415
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136963
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    國(guó)資入主聯(lián)創(chuàng)電子開(kāi)啟企業(yè)發(fā)展嶄新篇章

    冬日暖陽(yáng)耀贛江,聯(lián)創(chuàng)電子譜新章。2025年12月25日,聯(lián)創(chuàng)電子科技股份有限公司(證券簡(jiǎn)稱:聯(lián)創(chuàng)電子,股票代碼:002036)股票復(fù)牌,正式書(shū)寫(xiě)企業(yè)發(fā)展歷程中的嶄新篇章。
    的頭像 發(fā)表于 01-09 14:47 ?559次閱讀

    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最新進(jìn)展

    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最新進(jìn)展
    的頭像 發(fā)表于 12-19 15:26 ?1511次閱讀
    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最<b class='flag-5'>新進(jìn)展</b>

    迅為Hi3403開(kāi)發(fā)板驅(qū)動(dòng)教程全面上線,開(kāi)啟嵌入式Linux開(kāi)發(fā)新篇章!

    迅為iTOP-Hi3403開(kāi)發(fā)板linux驅(qū)動(dòng)教程全面上線,開(kāi)啟嵌入式Linux開(kāi)發(fā)新篇章!
    的頭像 發(fā)表于 12-18 14:23 ?686次閱讀
    迅為Hi3403開(kāi)發(fā)板驅(qū)動(dòng)教程全面上線,開(kāi)啟嵌入式Linux開(kāi)發(fā)<b class='flag-5'>新篇章</b>!

    廣汽集團(tuán)與華為數(shù)字能源開(kāi)啟深度協(xié)同新篇章

    和充電表現(xiàn)、整車駕乘體驗(yàn)提升,圍繞動(dòng)力域相關(guān)系統(tǒng)和整車產(chǎn)品的設(shè)計(jì)、制造、銷售服務(wù)展開(kāi)深入合作,開(kāi)啟深度協(xié)同新篇章。
    的頭像 發(fā)表于 11-11 15:22 ?530次閱讀

    西班牙工程與技術(shù)公司攜手FLIR開(kāi)啟高溫檢測(cè)新篇章

    在鋼鐵制造這一傳統(tǒng)而充滿挑戰(zhàn)的領(lǐng)域,高溫與惡劣環(huán)境如同兩道難以逾越的鴻溝,橫亙?cè)谔嵘a(chǎn)效率與質(zhì)量的道路上。然而,西班牙工程與技術(shù)先鋒BcB Informatica y Control攜手Flir公司,構(gòu)建了創(chuàng)新的技術(shù)解決方案,正為這一行業(yè)注入智能化升級(jí)的新動(dòng)力,開(kāi)啟高溫檢測(cè)的新篇章
    的頭像 發(fā)表于 11-02 11:37 ?926次閱讀

    NVIDIA通過(guò)全新 Omniverse庫(kù)、Cosmos物理AI模型及AI計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開(kāi)啟新篇章

    NVIDIA 通過(guò)全新 Omniverse 庫(kù)、Cosmos 物理 AI 模型及 AI 計(jì)算基礎(chǔ)設(shè)施,為機(jī)器人領(lǐng)域開(kāi)啟新篇章 ? ·?全新 NVIDIA Omniverse NuRec 3D
    的頭像 發(fā)表于 08-12 11:29 ?1788次閱讀
    NVIDIA通過(guò)全新 Omniverse庫(kù)、Cosmos物理AI模型及AI計(jì)算基礎(chǔ)設(shè)施,為<b class='flag-5'>機(jī)器</b>人領(lǐng)域開(kāi)啟<b class='flag-5'>新篇章</b>

    云臺(tái)電機(jī)驅(qū)動(dòng):開(kāi)啟智能化時(shí)代的新篇章

    在科技飛速發(fā)展的今天,智能化已經(jīng)滲透到我們生活的方方面面。而在眾多科技領(lǐng)域中,云臺(tái)電機(jī)驅(qū)動(dòng)技術(shù)正以其獨(dú)特的魅力,開(kāi)啟著智能化時(shí)代的新篇章。
    的頭像 發(fā)表于 07-23 18:16 ?976次閱讀

    東風(fēng)汽車轉(zhuǎn)型突破取得新進(jìn)展

    上半年,東風(fēng)汽車堅(jiān)定高質(zhì)量發(fā)展步伐,整體銷量逐月回升,經(jīng)營(yíng)質(zhì)量持續(xù)改善,自主品牌和新能源滲透率和收益性進(jìn)一步提升,半年累計(jì)終端銷售汽車111.6萬(wàn)輛,轉(zhuǎn)型突破取得新進(jìn)展
    的頭像 發(fā)表于 07-10 15:29 ?913次閱讀

    編碼器線:精準(zhǔn)連接,高效傳動(dòng),引領(lǐng)科技新篇章

    在日新月異的科技時(shí)代,每一個(gè)微小的進(jìn)步都可能成為推動(dòng)行業(yè)變革的關(guān)鍵。編碼器線,這一看似不起眼的組件,卻在自動(dòng)化、智能制造、機(jī)器人技術(shù)等眾多高科技領(lǐng)域中扮演著至關(guān)重要的角色。今天,就讓我們一起走進(jìn)編碼器線的世界,探索它如何以精準(zhǔn)連接和高效傳動(dòng),引領(lǐng)科技新篇章。
    的頭像 發(fā)表于 06-27 16:57 ?974次閱讀

    恭賀全球購(gòu)檢測(cè)榮獲CBTL資質(zhì),邁向國(guó)際檢測(cè)認(rèn)證新篇章

    恭賀全球通檢測(cè)榮獲CBTL資質(zhì)!邁向國(guó)際檢測(cè)認(rèn)證新篇章賦能中國(guó)企業(yè)全球化近日,中國(guó)檢測(cè)認(rèn)證領(lǐng)域迎來(lái)里程碑時(shí)刻——全球通檢測(cè)(GlobalTestingServices)正式通過(guò)國(guó)際電工
    的頭像 發(fā)表于 05-27 10:41 ?405次閱讀
    恭賀全球購(gòu)檢測(cè)榮獲CBTL資質(zhì),邁向國(guó)際檢測(cè)認(rèn)證<b class='flag-5'>新篇章</b>!

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們?cè)谖錆h舉辦了Create2025百度AI開(kāi)發(fā)者大會(huì),與全球各地的5000多名開(kāi)發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展。
    的頭像 發(fā)表于 04-30 10:14 ?1337次閱讀

    松下攜手深圳廣電集團(tuán)開(kāi)啟視聽(tīng)傳播新篇章

    在2025年深圳廣播電影電視集團(tuán)(以下簡(jiǎn)稱“深圳廣電集團(tuán)”)的4K超高清采購(gòu)項(xiàng)目中,松下憑借卓越的技術(shù)實(shí)力與豐富的行業(yè)經(jīng)驗(yàn),成功中標(biāo)“新聞演播室群”、“外拍設(shè)備”等核心項(xiàng)目,標(biāo)志著松下的新媒體技術(shù)與專業(yè)視音頻產(chǎn)品在深圳廣電集團(tuán)實(shí)現(xiàn)了全面落地應(yīng)用,雙方攜手開(kāi)啟視聽(tīng)傳播新篇章
    的頭像 發(fā)表于 04-15 15:16 ?1032次閱讀

    谷歌Gemini API最新進(jìn)展

    體驗(yàn)的 Live API 的最新進(jìn)展,以及正式面向開(kāi)發(fā)者開(kāi)放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開(kāi)發(fā)者推出了許多不容錯(cuò)過(guò)的重要更新,一起來(lái)看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?1685次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展

    近日,華為公司常務(wù)董事、華為云計(jì)算CEO張平安在華為云生態(tài)大會(huì)2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展——推出基于新型高速總線架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?1963次閱讀

    國(guó)產(chǎn)首款量產(chǎn)型七位半萬(wàn)用表!青島漢泰開(kāi)啟國(guó)產(chǎn)高精度測(cè)量新篇章。

    國(guó)產(chǎn)首款量產(chǎn)型七位半萬(wàn)用表!青島漢泰開(kāi)啟國(guó)產(chǎn)高精度測(cè)量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數(shù)字萬(wàn)用表。HDM3075系列是國(guó)產(chǎn)首款實(shí)現(xiàn)量產(chǎn)的七位半萬(wàn)用表產(chǎn)品,它
    發(fā)表于 04-01 13:15