91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新型的機(jī)器學(xué)習(xí)算法剛剛攻克了一些對人工智能來說非常困難的電子游戲

IEEE電氣電子工程師 ? 來源:lq ? 2018-12-04 10:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在蒙特祖瑪?shù)膹?fù)仇(Montezuma's Revenge)和瑪雅人的冒險(xiǎn)(Pitfall!)這兩款游戲里,如果有一個(gè)算法能記住游戲里的探索過程,那么這個(gè)算法就能幫助計(jì)算機(jī)和機(jī)器人更好地學(xué)習(xí)和適應(yīng)真實(shí)世界。

由懷俄明大學(xué)的副教授 Jeff Clune 領(lǐng)導(dǎo),來自優(yōu)步在舊金山的人工智能研究團(tuán)隊(duì),提供了一種新型的機(jī)器學(xué)習(xí)算法剛剛攻克了一些對人工智能來說非常困難的電子游戲。

(圖片來源:麻省理工科技評論)

熟悉的人知道,人工智能算法已經(jīng)在古老、優(yōu)雅的策略游戲——圍棋中擊敗了世界上最優(yōu)秀的人類選手,圍棋已經(jīng)是是可以想象到的最困難的游戲之一。但是,來自上個(gè)世紀(jì)的 8 位計(jì)算機(jī)游戲時(shí)代的兩個(gè)經(jīng)典像素游戲——蒙特祖瑪?shù)膹?fù)仇和瑪雅人的冒險(xiǎn),一直困擾著人工智能研究人員。

這看似矛盾的背后其實(shí)是有原因的。蒙特祖瑪?shù)膹?fù)仇和瑪雅人的冒險(xiǎn)雖然看似簡單,但對本來就擅長征服電子游戲的強(qiáng)化學(xué)習(xí)來說仍是一大挑戰(zhàn)。DeepMind 是谷歌母公司 Alphabet 的子公司,專注于人工智能領(lǐng)域,以其算法能夠以專業(yè)玩家的水準(zhǔn)來學(xué)習(xí)幾個(gè)經(jīng)典的電子游戲的而著名。強(qiáng)化學(xué)習(xí)算法在大多數(shù)游戲里效果都不錯(cuò),因?yàn)樗鼈兛梢愿鶕?jù)正反饋(得分升高)調(diào)整他們的行為。強(qiáng)化學(xué)習(xí)的成功使人們產(chǎn)生了希望,認(rèn)為人工智能算法可以自己教會(huì)自己做各種有用的事情,而這目前對機(jī)器來說是不可能做到的。

蒙特祖瑪?shù)膹?fù)仇和瑪雅人的冒險(xiǎn)的問題是所需要的獎(jiǎng)勵(lì)(rewards)信號很少。兩個(gè)游戲都涉及典型場景:主角要探索充滿致命生物和陷阱的方塊世界,在游戲中許多所必需的行為都無助于提高分?jǐn)?shù),只在長時(shí)間完成特定的一系列動(dòng)作之后才會(huì)收到獎(jiǎng)勵(lì)信號。普通的強(qiáng)化學(xué)習(xí)算法甚至過不去蒙特祖瑪?shù)膹?fù)仇和瑪雅人的冒險(xiǎn)的第一關(guān),他們得分完全為零。

但是來自優(yōu)步在舊金山的人工智能研究團(tuán)隊(duì)的算法,在一個(gè)給算法提供線索很少的環(huán)境中展示了一種完全不同的機(jī)器學(xué)習(xí)方法。這種方法引出了一些有趣的實(shí)際應(yīng)用,Clune 和他的團(tuán)隊(duì)在 11 月 26 日發(fā)布的博客文章中寫道,這可能可以應(yīng)用在機(jī)器人學(xué)習(xí)中。這是因?yàn)槲磥淼臋C(jī)器人需要弄清楚在一個(gè)只提供較少的獎(jiǎng)勵(lì)的復(fù)雜的環(huán)境中應(yīng)該做些什么。

Uber 于 2016 年 12 月建立人工智能實(shí)驗(yàn)室,其目標(biāo)是實(shí)現(xiàn)可能對其業(yè)務(wù)有用的基礎(chǔ)性突破。更好的強(qiáng)化學(xué)習(xí)算法最終可用于自動(dòng)駕駛和優(yōu)化車輛路線等項(xiàng)目上。

很多人工智能研究人員經(jīng)常通過指導(dǎo)強(qiáng)化學(xué)習(xí)算法不定時(shí)隨機(jī)探索、同時(shí)為探索過程增加獎(jiǎng)勵(lì)——也就是所謂的”內(nèi)在動(dòng)機(jī)”(intrinsic motivation), 來試圖解決蒙特祖瑪?shù)膹?fù)仇與瑪雅人的冒險(xiǎn)遇到的問題。

但 Uber 的研究人員認(rèn)為,這種方法忽略了人類探索好奇心的一個(gè)重要角度?!拔覀冋J(rèn)為目前的”內(nèi)在動(dòng)機(jī)”算法的一個(gè)主要弱點(diǎn)是 detachment,”他們寫道,“算法忘記了他們訪問過的有價(jià)值的區(qū)域,他們不會(huì)回到那些區(qū)域,看看是否會(huì)產(chǎn)生新的狀態(tài)。”

該團(tuán)隊(duì)設(shè)計(jì)了新的強(qiáng)化學(xué)習(xí)算法,稱為 Go-Explore,這種算法可以記住之前的狀態(tài),并會(huì)在隨后返回特定區(qū)域或重復(fù)特定任務(wù),看看這樣做是否會(huì)使效果變好。研究人員還發(fā)現(xiàn),通過讓人類玩家突出有趣或重要的區(qū)域來增加一些領(lǐng)域信息時(shí),可以大大加快算法的學(xué)習(xí)過程。這一過程非常重要,因?yàn)樵谡鎸?shí)環(huán)境中,有很多情況是需要算法和人一起工作來解決一項(xiàng)艱巨的任務(wù)的。

他們的算法在蒙特祖瑪?shù)膹?fù)仇中平均得分為 400,000 分——比人類玩家的平均值高出一個(gè)數(shù)量級。在瑪雅人的冒險(xiǎn)游戲中,平均得分為 21,000,同樣遠(yuǎn)遠(yuǎn)超過大多數(shù)人類玩家。

“這些結(jié)果令人印象深刻,”研究強(qiáng)化學(xué)習(xí)的斯坦福大學(xué)助理教授 Emma Brunskill 說,“令人驚訝和興奮的是,這些算法產(chǎn)生了如此巨大的優(yōu)勢?!?/p>

其他人工智能研究人員也一直在努力攻克這些電子游戲。10 月,舊金山的非營利組織——OpenAI 的一個(gè)團(tuán)隊(duì),展示了一種能夠在蒙特祖瑪?shù)膹?fù)仇游戲中取得重大進(jìn)展的算法。

就在最近,斯坦福大學(xué)的 Brunskill 小組在瑪雅人的冒險(xiǎn)游戲方面也取得了一些的進(jìn)展,他們使用的方法與 Uber 團(tuán)隊(duì)類似。

現(xiàn)在人工智能算法可以解決這些視頻游戲,真正的挑戰(zhàn)是從街機(jī)游戲中脫離出來,解決現(xiàn)實(shí)問題。

Brunskill 同意這種算法可能對機(jī)器人技術(shù)產(chǎn)生重大影響。但是她表示,在其他現(xiàn)實(shí)世界的情況中,特別是那些涉及人類行為建模的情況,要遠(yuǎn)遠(yuǎn)困難得多。“想看看這種方法對于更復(fù)雜的環(huán)境表現(xiàn)的如何,這將非常有趣,”她說。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31120

    瀏覽量

    222432
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4785

    瀏覽量

    98112
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137005

原文標(biāo)題:Uber公司設(shè)計(jì)新型AI算法,有望對機(jī)器人工作產(chǎn)生巨大影響

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    人工智能機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。
    的頭像 發(fā)表于 02-04 14:44 ?514次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)
    的頭像 發(fā)表于 01-07 15:37 ?215次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    應(yīng)用。 為什么選擇 Neuton 作為開發(fā)人員,在產(chǎn)品中使用邊緣人工智能的兩個(gè)最大障礙是: ML 模型對于您所選微控制器的內(nèi)存來說太大。 創(chuàng)建自定義 ML 模型本質(zhì)上是個(gè)手動(dòng)過程,需要高度的數(shù)據(jù)科學(xué)知識
    發(fā)表于 08-31 20:54

    挖到寶!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    的深度學(xué)習(xí),構(gòu)建起從基礎(chǔ)到前沿的完整知識體系,門實(shí)驗(yàn)箱就能滿足多門課程的學(xué)習(xí)實(shí)踐需求,既節(jié)省經(jīng)費(fèi)又不占地 。 五、代碼全開源,學(xué)習(xí)底層算法
    發(fā)表于 08-07 14:30

    挖到寶!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    的深度學(xué)習(xí),構(gòu)建起從基礎(chǔ)到前沿的完整知識體系,門實(shí)驗(yàn)箱就能滿足多門課程的學(xué)習(xí)實(shí)踐需求,既節(jié)省經(jīng)費(fèi)又不占地 。 五、代碼全開源,學(xué)習(xí)底層算法
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    人工智能在汽車行業(yè)中的應(yīng)用

    ?人工智能(AI)是許多行業(yè)和應(yīng)用領(lǐng)域的熱門話題。但對于汽車行業(yè)而言,這并非個(gè)新概念。人工智能,尤其是機(jī)器學(xué)習(xí)——即通過數(shù)據(jù)讓
    的頭像 發(fā)表于 07-31 11:07 ?2055次閱讀

    人工智能究竟對電子產(chǎn)業(yè)產(chǎn)生哪些的影響?

    人工智能已徹底改變了全球技術(shù)格局,在眾多工業(yè)領(lǐng)域得到廣泛應(yīng)用。在電子產(chǎn)業(yè)中,它正成為實(shí)現(xiàn)新功能、提升效率以及優(yōu)化制造流程的關(guān)鍵推動(dòng)力。例如,嵌入式行業(yè)受益于將人工智能集成到電子設(shè)備中,
    的頭像 發(fā)表于 07-28 18:26 ?1162次閱讀
    <b class='flag-5'>人工智能</b>究竟對<b class='flag-5'>電子</b>產(chǎn)業(yè)產(chǎn)生哪些的影響?

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效
    的頭像 發(fā)表于 07-16 15:34 ?2914次閱讀

    CES Asia 2025蓄勢待發(fā),聚焦低空經(jīng)濟(jì)與AI,引領(lǐng)未來產(chǎn)業(yè)新變革

    、機(jī)器學(xué)習(xí)等技術(shù)不斷取得新的突破,應(yīng)用場景也日益豐富。在智能家居領(lǐng)域,人工智能讓家居設(shè)備更加智能、便捷,實(shí)現(xiàn)
    發(fā)表于 07-09 10:29

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識都已成為新時(shí)代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    人工智能是做什么的

    在當(dāng)今科技日新月異的時(shí)代,人工智能(ArtificialIntelligence,簡稱AI)已成為推動(dòng)社會(huì)進(jìn)步和經(jīng)濟(jì)發(fā)展的重要力量。本文旨在深入探討人工智能的核心功能、應(yīng)用領(lǐng)域,并通過具體實(shí)例解析其
    的頭像 發(fā)表于 05-30 10:04 ?905次閱讀
    <b class='flag-5'>人工智能</b>是做什么的

    一種新型寬帶鞭狀套筒天線

    電子發(fā)燒友網(wǎng)站提供《一種新型寬帶鞭狀套筒天線.pdf》資料免費(fèi)下載
    發(fā)表于 05-28 14:05 ?0次下載

    機(jī)器人主控芯片平臺(tái)有哪些 機(jī)器人主控芯片文搞懂

    AI芯片在人形機(jī)器人中的應(yīng)用越來越廣泛。這些AI芯片專門設(shè)計(jì)用于執(zhí)行人工智能算法,如深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等。
    的頭像 發(fā)表于 04-25 16:26 ?7706次閱讀
    <b class='flag-5'>機(jī)器</b>人主控芯片平臺(tái)有哪些  <b class='flag-5'>機(jī)器</b>人主控芯片<b class='flag-5'>一</b>文搞懂

    維視智造助力高校人工智能機(jī)器視覺課程落地

    人工智能浪潮下,機(jī)器視覺成為未來產(chǎn)業(yè)升級的重點(diǎn)技術(shù),對培養(yǎng)新型創(chuàng)新人才意義重大。
    的頭像 發(fā)表于 04-19 15:37 ?1387次閱讀