91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)領(lǐng)域的強(qiáng)化學(xué)習(xí)技術(shù)有什么用處?

我快閉嘴 ? 來(lái)源:教育新聞網(wǎng) ? 作者:教育新聞網(wǎng) ? 2020-08-12 16:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來(lái)自查爾默斯大學(xué)和哥德堡大學(xué)的跨學(xué)科研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)框架,用于研究語(yǔ)言如何演變?yōu)槊枋鲂睦砀拍畹挠行Чぞ?。在一篇新論文中,他們表明,人工代理可以學(xué)習(xí)如何以類似于人類語(yǔ)言的人工語(yǔ)言進(jìn)行交流。該結(jié)果已發(fā)表在科學(xué)雜志《PLOS ONE》上。

這項(xiàng)研究位于認(rèn)知科學(xué)和機(jī)器學(xué)習(xí)之間的邊界。認(rèn)知科學(xué)家提出了一個(gè)有影響力的建議,即所有人類語(yǔ)言都可以看作是進(jìn)化成為一種以經(jīng)典信息論的意義以接近最優(yōu)的方式傳達(dá)概念的手段。哥德堡研究人員訓(xùn)練人工代理的方法是基于強(qiáng)化學(xué)習(xí)的,強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)領(lǐng)域,代理通過(guò)與環(huán)境交互并獲得反饋逐漸學(xué)習(xí)。在這種情況下,代理人在沒(méi)有任何語(yǔ)言知識(shí)的情況下開(kāi)始學(xué)習(xí),并通過(guò)獲取有關(guān)他們?cè)趥鬟_(dá)思想觀念方面的成功程度的反饋來(lái)學(xué)習(xí)交流。

重建色彩

“在我們的論文中,我們研究了代理商如何通過(guò)打幾輪由發(fā)送者和聽(tīng)者組成的參考游戲來(lái)學(xué)習(xí)命名心理概念和進(jìn)行交流。我們特別關(guān)注了在認(rèn)知科學(xué)中已深入研究的色域。游戲的工作方式如下;發(fā)送方看到一種顏色,并通過(guò)從詞匯表向聽(tīng)眾說(shuō)出一個(gè)單詞來(lái)描述顏色,然后嘗試重建顏色。

根據(jù)收聽(tīng)者重建的精確程度,這兩個(gè)代理都會(huì)收到共享的獎(jiǎng)勵(lì)。詞匯表中的單詞一開(kāi)始就沒(méi)有意義;在游戲的多個(gè)回合中,由代理商決定單詞的含義。我們看到,從信息論的角度來(lái)看,由此產(chǎn)生的人工語(yǔ)言幾乎是最優(yōu)的,并且具有與人類語(yǔ)言相似的特性。” Sleepcycle研究人員MikaelK?geb?ck說(shuō),他在Chalmers的博士學(xué)位論文中包含了一些結(jié)果在論文中提出。

與哥德堡大學(xué)語(yǔ)言理論和概率研究中心(CLASP)計(jì)算機(jī)語(yǔ)言學(xué)研究人員Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起。他是計(jì)算機(jī)科學(xué)與工程系數(shù)據(jù)科學(xué)和AI部門的學(xué)生,現(xiàn)在已經(jīng)發(fā)表了結(jié)果。

Asad Sayeed說(shuō):“從實(shí)際的角度來(lái)看,這項(xiàng)研究提供了開(kāi)發(fā)與人類語(yǔ)言進(jìn)行交流的對(duì)話主體(例如Siri和Alexa)的基本原理?!?/p>

通過(guò)強(qiáng)化學(xué)習(xí)來(lái)學(xué)習(xí)交流的基本思想對(duì)于社會(huì)和文化領(lǐng)域的研究也很有趣,例如,由阿薩德·薩耶德(Asad Sayeed)領(lǐng)導(dǎo)的GRIPES項(xiàng)目,該項(xiàng)目研究狗舌政治。

在將來(lái)的研究中有用

“認(rèn)知實(shí)驗(yàn)非常耗時(shí),因?yàn)槟?jīng)常需要對(duì)人類志愿者進(jìn)行仔細(xì)的實(shí)驗(yàn)。我們的方法提供了一種非常強(qiáng)大,靈活且廉價(jià)的方法來(lái)研究這些基本問(wèn)題。實(shí)驗(yàn)完全在我們的控制之下,可重復(fù)且完全可靠因此,我們的計(jì)算框架為研究認(rèn)知科學(xué),語(yǔ)言和交互作用中的基本問(wèn)題提供了一種有價(jià)值的工具。對(duì)于計(jì)算機(jī)科學(xué)家來(lái)說(shuō),探索各種學(xué)習(xí)機(jī)制的有效性是一個(gè)肥沃的領(lǐng)域?!?Devdatt Dubhashi說(shuō)。

Emil Carlsson說(shuō):“將來(lái),我們要調(diào)查代理商是否也可以在其他領(lǐng)域發(fā)展類似于人類語(yǔ)言的交流。一個(gè)例子就是我們的代理商是否能夠重構(gòu)我們?cè)谌祟愓Z(yǔ)言中觀察到的等級(jí)結(jié)構(gòu)?!?/p>

長(zhǎng)期存在的問(wèn)題

該研究源于認(rèn)知科學(xué)和語(yǔ)言學(xué)一個(gè)長(zhǎng)期存在的中心問(wèn)題:在人類語(yǔ)言的所有巨大多樣性中,是否存在共同的普遍原則。20世紀(jì)的經(jīng)典作品表明,用不同的語(yǔ)言來(lái)描述顏色具有共同的特性。是否有解釋這些共同屬性的基本原則?

認(rèn)知科學(xué)家最近提出的一項(xiàng)有影響力的建議是,從信息論的角度來(lái)看,當(dāng)語(yǔ)言被視為一種交流思想概念,最有效地利用資源的手段時(shí),確實(shí)存在著這樣的普遍通用原則。

麻省理工學(xué)院的特德·吉布森(Ted Gibson)于2016年在CLASP上發(fā)表了一系列演講,他在演講中描述了從世界各地不同社會(huì)和文化中選出的人類受試者的實(shí)驗(yàn)結(jié)果,從而引發(fā)了一個(gè)問(wèn)題:“如果人類受試者被人造計(jì)算機(jī)替代,將會(huì)怎樣代理,他們會(huì)開(kāi)發(fā)一種具有類似通用屬性的語(yǔ)言嗎?”
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7823

    瀏覽量

    93356
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40538

    瀏覽量

    302129
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8559

    瀏覽量

    137129
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    上汽大眾ID. ERA 9X全球首發(fā)搭載Momenta R7強(qiáng)化學(xué)習(xí)世界模型

    3月30日,Momenta R7強(qiáng)化學(xué)習(xí)世界模型全球首發(fā)搭載車型——上汽大眾ID. ERA 9X正式開(kāi)啟預(yù)售。
    的頭像 發(fā)表于 03-31 13:48 ?163次閱讀

    Momenta R6強(qiáng)化學(xué)習(xí)大模型上車東風(fēng)日產(chǎn)NX8

    3月20日,東風(fēng)日產(chǎn)NX8技術(shù)暨預(yù)售發(fā)布會(huì)在廣州舉辦,官宣Momenta R6強(qiáng)化學(xué)習(xí)大模型正式上車東風(fēng)日產(chǎn)新能源SUV——NX8。以全球頂級(jí)大廠合力,融合先鋒科技力量,打造更適配全家出行的智能SUV,開(kāi)啟合資品牌智能化全新賽道。
    的頭像 發(fā)表于 03-24 09:08 ?634次閱讀

    Momenta強(qiáng)化學(xué)習(xí)大模型助力別克至境世家純電版正式上市

    3月17日,別克至境世家純電版正式上市,這是別克與Momenta強(qiáng)化學(xué)習(xí)大模型的又一次深度聯(lián)手。融合別克在MPV市場(chǎng)深耕27年的技術(shù)積淀,以更從容的智慧駕控,重新定義豪華與自在的出行體驗(yàn)。
    的頭像 發(fā)表于 03-18 15:48 ?197次閱讀

    Momenta R7強(qiáng)化學(xué)習(xí)世界模型即將推出

    3月16日,上汽大眾舉辦以“人本科技”為主題的ID. ERA技術(shù)發(fā)布會(huì),首次揭曉了ID. ERA 系列包括智能輔助駕駛在內(nèi)的諸多核心技術(shù)亮點(diǎn)。會(huì)上,Momenta CEO曹旭東正式宣布:Momenta R7強(qiáng)化學(xué)習(xí)世界模型即將推
    的頭像 發(fā)表于 03-17 13:57 ?1082次閱讀

    自動(dòng)駕駛中常提的離線強(qiáng)化學(xué)習(xí)是什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在之前談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),詳細(xì)聊過(guò)強(qiáng)化學(xué)習(xí)的作用,由于強(qiáng)化學(xué)習(xí)能讓大模型通過(guò)交互學(xué)到策略,不需要固定的規(guī)則,從而給自動(dòng)駕駛的落地創(chuàng)造了更多可能。 強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 02-07 09:21 ?287次閱讀
    自動(dòng)駕駛中常提的離線<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>是什么?

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的
    的頭像 發(fā)表于 02-04 14:44 ?598次閱讀

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛大模型訓(xùn)練時(shí),有的技術(shù)方案會(huì)采用模仿學(xué)習(xí),而有些會(huì)采用強(qiáng)化學(xué)習(xí)。同樣作為大模型的訓(xùn)練方式,強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 01-31 09:34 ?744次閱讀
    <b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>會(huì)讓自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    多智能體強(qiáng)化學(xué)習(xí)(MARL)核心概念與算法概覽

    訓(xùn)練單個(gè)RL智能體的過(guò)程非常簡(jiǎn)單,那么我們現(xiàn)在換一個(gè)場(chǎng)景,同時(shí)訓(xùn)練五個(gè)智能體,而且每個(gè)都有自己的目標(biāo)、只能看到部分信息,還能互相幫忙。這就是多智能體強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 01-21 16:21 ?268次閱讀
    多智能體<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>(MARL)核心概念與算法概覽

    上汽別克至境E7首發(fā)搭載Momenta R6強(qiáng)化學(xué)習(xí)大模型

    別克至境家族迎來(lái)新成員——大五座智能SUV別克至境E7首發(fā)。新車將搭載Momenta R6強(qiáng)化學(xué)習(xí)大模型,帶來(lái)全場(chǎng)景的智能出行體驗(yàn)。
    的頭像 發(fā)表于 01-12 16:23 ?419次閱讀

    今日看點(diǎn):智元推出真機(jī)強(qiáng)化學(xué)習(xí);美國(guó)軟件公司SAS退出中國(guó)市場(chǎng)

    智元推出真機(jī)強(qiáng)化學(xué)習(xí),機(jī)器人訓(xùn)練周期從“數(shù)周”減至“數(shù)十分鐘” ? 近日,智元機(jī)器人宣布其研發(fā)的真機(jī)強(qiáng)化學(xué)習(xí)技術(shù),已在與龍旗科技合作的驗(yàn)證產(chǎn)
    發(fā)表于 11-05 09:44 ?1134次閱讀

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛時(shí),有些方案中會(huì)提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡(jiǎn)稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過(guò)試錯(cuò)來(lái)學(xué)會(huì)做決策的技術(shù)。
    的頭像 發(fā)表于 10-23 09:00 ?789次閱讀
    自動(dòng)駕駛中常提的“<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>”是個(gè)啥?

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3001次閱讀

    NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南

    Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開(kāi)源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時(shí)支持模仿學(xué)習(xí)(模仿人類)和強(qiáng)化學(xué)習(xí)(在嘗試和錯(cuò)誤中進(jìn)行學(xué)習(xí)),為所有
    的頭像 發(fā)表于 07-14 15:29 ?2499次閱讀
    NVIDIA Isaac Lab可用環(huán)境與<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>腳本使用指南

    【書籍評(píng)測(cè)活動(dòng)NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘

    的基礎(chǔ)。對(duì) DeepSeek-R1-Zero 的組相對(duì)策略優(yōu)化**(GRPO)算法、獎(jiǎng)勵(lì)模型**等關(guān)鍵技術(shù)的深入剖析,可以幫助讀者了解 DeepSeek 在強(qiáng)化學(xué)習(xí)領(lǐng)域的創(chuàng)新性探索。對(duì)DeepSeek-R1 的訓(xùn)練過(guò)程和推理能力
    發(fā)表于 06-09 14:38

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來(lái)轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過(guò)程,旨在通過(guò)理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?1698次閱讀
    18個(gè)常用的<b class='flag-5'>強(qiáng)化學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論<b class='flag-5'>技術(shù)</b>與代碼實(shí)現(xiàn)