91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind設(shè)置強(qiáng)迫機(jī)制使AI實(shí)現(xiàn)利益最大化

汽車玩家 ? 來(lái)源:大數(shù)據(jù)文摘微信公眾號(hào) ? 作者:趙吉克 ? 2020-03-16 09:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近谷歌DeepMind提出了一種新的強(qiáng)化學(xué)習(xí)技術(shù),這種技術(shù)以一種全新方式來(lái)模擬人類行為。它可能會(huì)比之前發(fā)布的人工智能決策系統(tǒng)更強(qiáng)大,這對(duì)希望通過(guò)自動(dòng)化提高生產(chǎn)率的企業(yè)來(lái)說(shuō)可能是個(gè)福音。

如何解決多方零和博弈中的合作困境?

DeepMind用強(qiáng)化學(xué)習(xí)使AI實(shí)現(xiàn)利益最大化。這是一種基于對(duì)等契約機(jī)制的經(jīng)濟(jì)競(jìng)爭(zhēng)模型,該模型允許在多方博弈中結(jié)盟。這篇論文其中一位作者表示,這種結(jié)盟有單打獨(dú)斗不具有的特殊優(yōu)勢(shì)。

長(zhǎng)期以來(lái),零和游戲以其豐富的策略選擇空間和清晰的策略評(píng)估方式指導(dǎo)著人工智能研究。更重要的是這種競(jìng)爭(zhēng)廣泛存在于生物界、市場(chǎng)經(jīng)濟(jì)甚至是AlphaZero中。

DeepMind科學(xué)家首先尋求數(shù)學(xué)定義形成聯(lián)盟的挑戰(zhàn),關(guān)注聯(lián)盟形成多玩家零和游戲——也就是說(shuō),數(shù)學(xué)表示的情況下,每個(gè)參與者的收益或損失的效用是完全平衡的損失或收益的其他參與者的效用。

什么是多方零和博弈?

DeepMind將之定義為每個(gè)玩家的收益或損失完全由其余玩家的損失或收益提供。在一個(gè)對(duì)稱多方零和博弈中,每個(gè)玩家的行為模式都是一樣的,這往往會(huì)產(chǎn)生社會(huì)困境。(一個(gè)極簡(jiǎn)例子是“囚徒困境”)

零和博弈引入了合作后事情變得很復(fù)雜。緊急情況下,團(tuán)隊(duì)必須內(nèi)部協(xié)調(diào)才能有效地在游戲中競(jìng)爭(zhēng)。合作形成的過(guò)程本身就是一個(gè)社會(huì)困境——從直覺(jué)上看,玩家應(yīng)該合作來(lái)?yè)魯∑渌?,但合作團(tuán)隊(duì)內(nèi)部要求個(gè)體為更廣泛的利益做出妥協(xié),但這種犧牲未必和他們的自身利益一致。此外,決定加入或離開(kāi)哪個(gè)團(tuán)隊(duì)以及團(tuán)隊(duì)策略都是重要問(wèn)題。

DeepMind嘗試了一種“禮物游戲”,在游戲中,AI扮演的玩家從一堆標(biāo)記著自己代表色的數(shù)字籌碼開(kāi)始。在每個(gè)玩家的回合中,他們必須拿出自己對(duì)應(yīng)顏色的籌碼并將其贈(zèng)送給另一名玩家,或?qū)⑵錀壷?。全部玩家都失去自己?duì)應(yīng)顏色的數(shù)字籌碼時(shí)游戲結(jié)束,此時(shí)擁有最多顏色籌碼的玩家獲勝,贏家平分價(jià)值為“1”的籌碼,其他玩家平分價(jià)值為“0”的籌碼。

研究發(fā)現(xiàn),玩家往往表現(xiàn)得很自私,他們囤積籌碼以至于出現(xiàn)了三方平局。但事實(shí)上,如果兩名玩家交換籌碼,回報(bào)會(huì)更好。DeepMind將這種過(guò)程闡述為:盡管合作能帶來(lái)更好的結(jié)果,但人人都想從欺騙行為中獲利,也就是說(shuō)服對(duì)方交換然后食言。

這也就是說(shuō),如果有一種機(jī)制能維護(hù)合作行為存在,那強(qiáng)化學(xué)習(xí)可以適應(yīng)這種博弈。這種機(jī)制就是合同——在游戲中,每個(gè)玩家必須提交一份報(bào)價(jià),首先選擇合作伙伴,然后為該合作伙伴提出行動(dòng)建議,最后玩家承諾采取的行動(dòng)。如果兩個(gè)玩家提供了相同的契約,那么這些契約就具有了約束力,也就是說(shuō)環(huán)境強(qiáng)制執(zhí)行了所承諾的操作。

這種強(qiáng)制性機(jī)制是合作形成的基礎(chǔ)。

這種模型能讓我們?cè)诟鼜V闊的應(yīng)用環(huán)境中思考契約的作用。一個(gè)沒(méi)有強(qiáng)制實(shí)施機(jī)制的契約系統(tǒng)如果可以在多方動(dòng)態(tài)博弈中持續(xù)運(yùn)行將最終產(chǎn)生一個(gè)有價(jià)值的反饋回路,這將使得AI的應(yīng)用走向社會(huì)學(xué)和經(jīng)濟(jì)學(xué)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111450
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39828

    瀏覽量

    301505
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    告別逆流罰款!西格電力防逆流方案,讓光伏并網(wǎng)零風(fēng)險(xiǎn)、收益最大化

    合規(guī)性的管控愈發(fā)嚴(yán)格,違規(guī)逆流不僅面臨經(jīng)濟(jì)處罰,還可能影響項(xiàng)目并網(wǎng)資格。西格電力防逆流柔性控制方案,精準(zhǔn)對(duì)標(biāo)政策要求,從源頭破解痛點(diǎn),實(shí)現(xiàn)光伏并網(wǎng)零合規(guī)風(fēng)險(xiǎn)、發(fā)電收益最大化的雙重目標(biāo)。
    的頭像 發(fā)表于 01-27 16:23 ?1814次閱讀
    告別逆流罰款!西格電力防逆流方案,讓光伏并網(wǎng)零風(fēng)險(xiǎn)、收益<b class='flag-5'>最大化</b>

    谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    FPG推出CheckMax,以AI洞察助力餐飲業(yè)利潤(rùn)最大化

    -FPG推出CheckMax,F(xiàn)rontline Performance Group推出CheckMax,以AI洞察助力餐飲業(yè)利潤(rùn)最大化 更高利潤(rùn)、更優(yōu)服務(wù):CheckMax直擊餐廳頭號(hào)經(jīng)營(yíng)挑戰(zhàn)
    的頭像 發(fā)表于 12-10 19:02 ?1064次閱讀
    FPG推出CheckMax,以<b class='flag-5'>AI</b>洞察助力餐飲業(yè)利潤(rùn)<b class='flag-5'>最大化</b>

    聚飛光電PLM系統(tǒng)升級(jí)推動(dòng)IPD全流程價(jià)值最大化落地

    研發(fā)全流程的規(guī)范化管控與高效協(xié)同,為產(chǎn)品創(chuàng)新提速、市場(chǎng)響應(yīng)提質(zhì)注入核心動(dòng)力,推動(dòng)IPD全流程價(jià)值最大化落地。
    的頭像 發(fā)表于 12-05 09:55 ?849次閱讀
    聚飛光電PLM系統(tǒng)升級(jí)推動(dòng)IPD全流程價(jià)值<b class='flag-5'>最大化</b>落地

    提升PLC數(shù)據(jù)采集效率:性能瓶頸分析與實(shí)踐

    面對(duì)“越快越好”的PLC數(shù)據(jù)采集需求,如何準(zhǔn)確評(píng)估設(shè)備能力瓶頸?又該如何突破極限,實(shí)現(xiàn)采集速度的最大化?本文將系統(tǒng)探討如何科學(xué)評(píng)估PLC的數(shù)據(jù)采集能力極限,并在此基礎(chǔ)上,提供一系列旨在最大化采集速度
    的頭像 發(fā)表于 11-26 11:33 ?349次閱讀
    提升PLC數(shù)據(jù)采集效率:性能瓶頸分析與實(shí)踐

    谷歌AlphaEarth和維智時(shí)空AI大模型的核心差異

    谷歌AlphaEarth和維智時(shí)空AI大模型在技術(shù)理念上存在諸多共性,但兩者在目標(biāo)尺度、數(shù)據(jù)來(lái)源、技術(shù)實(shí)現(xiàn)和應(yīng)用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?895次閱讀

    谷歌AlphaEarth和維智時(shí)空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時(shí)空AI大模型在應(yīng)用場(chǎng)景和技術(shù)實(shí)現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?917次閱讀

    天合光能解決方案如何助力光伏發(fā)電收益最大化

    近日,由天合光能攜手全球權(quán)威光伏媒體PV Magazine舉辦的光伏技術(shù)研討會(huì)于線上舉行。圍繞“電力市場(chǎng)化時(shí)代光伏資產(chǎn)價(jià)值最大化”這一主題,天合光能產(chǎn)品經(jīng)理李子軒同觀眾分享了最新的產(chǎn)品技術(shù)與市場(chǎng)趨勢(shì)
    的頭像 發(fā)表于 10-22 11:36 ?1287次閱讀
    天合光能解決方案如何助力光伏發(fā)電收益<b class='flag-5'>最大化</b>

    AI賦能6G與衛(wèi)星通信:開(kāi)啟智能天網(wǎng)新時(shí)代

    個(gè)。 AI還能實(shí)現(xiàn)自適應(yīng)調(diào)制,根據(jù)實(shí)時(shí)信道條件動(dòng)態(tài)調(diào)整信號(hào)調(diào)制方式。當(dāng)檢測(cè)到信號(hào)干擾較大時(shí),系統(tǒng)會(huì)自動(dòng)切換到更穩(wěn)健的調(diào)制方式;當(dāng)信號(hào)質(zhì)量良好時(shí),則使用高效率的調(diào)制方式,最大化數(shù)據(jù)傳輸速率。 在2025
    發(fā)表于 10-11 16:01

    物流倉(cāng)儲(chǔ)系統(tǒng)中自動(dòng)化設(shè)備與軟件系統(tǒng)的高效協(xié)同策略

    自動(dòng)化設(shè)備與軟件系統(tǒng)的高效協(xié)同,能最大化釋放倉(cāng)儲(chǔ)系統(tǒng)潛力,降低運(yùn)營(yíng)成本。隨著物流需求升級(jí),持續(xù)優(yōu)化協(xié)同機(jī)制,將為倉(cāng)儲(chǔ)行業(yè)實(shí)現(xiàn)更柔性、更智能的發(fā)展提供有力支撐。
    的頭像 發(fā)表于 08-18 11:10 ?539次閱讀
    物流倉(cāng)儲(chǔ)系統(tǒng)中自動(dòng)化設(shè)備與軟件系統(tǒng)的高效協(xié)同策略

    谷歌DeepMind重磅發(fā)布Genie 3,首次實(shí)現(xiàn)世界模型實(shí)時(shí)交互

    電子發(fā)燒友網(wǎng)綜合報(bào)道 當(dāng)?shù)貢r(shí)間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fan譽(yù)為“游戲引擎2.0”的模型,通過(guò)單文本提示即可生成實(shí)時(shí)
    的頭像 發(fā)表于 08-13 08:27 ?6890次閱讀

    借助DFT技術(shù)實(shí)現(xiàn)競(jìng)爭(zhēng)力最大化

    通過(guò)改進(jìn)和優(yōu)化設(shè)計(jì)與制造的各個(gè)方面,半導(dǎo)體行業(yè)已經(jīng)能夠實(shí)現(xiàn) IC 能力的巨大進(jìn)步??蓽y(cè)試性設(shè)計(jì) (DFT)——涵蓋從在 RTL 中插入測(cè)試邏輯,到對(duì)現(xiàn)場(chǎng)退回產(chǎn)品進(jìn)行失效分析等全流程,是半導(dǎo)體企業(yè)獲得
    的頭像 發(fā)表于 05-22 15:16 ?1005次閱讀

    利用NVIDIA Aerial平臺(tái)推動(dòng)AI-RAN與6G研究

    電信行業(yè)正加速采用 AI 技術(shù),以實(shí)現(xiàn)即使在信號(hào)強(qiáng)度不佳的條件下也能夠提供無(wú)縫連接,同時(shí)最大化可持續(xù)性與頻譜效率(單位帶寬內(nèi)可傳輸?shù)男畔⒘浚?/div>
    的頭像 發(fā)表于 03-25 14:55 ?1022次閱讀

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA、Alphabet 和谷歌攜手開(kāi)啟代理式與物理AI的未來(lái)

    聯(lián)合計(jì)劃涵蓋基礎(chǔ)設(shè)施和開(kāi)源模型優(yōu)化,在機(jī)器人、藥物研發(fā)等領(lǐng)域取得巨大進(jìn)展 具有長(zhǎng)期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項(xiàng)新計(jì)劃,旨在推動(dòng) AI 發(fā)展、普及 AI 工具
    的頭像 發(fā)表于 03-21 15:10 ?2039次閱讀
    英偉達(dá)GTC2025亮點(diǎn):NVIDIA、Alphabet 和<b class='flag-5'>谷歌</b>攜手開(kāi)啟代理式與物理<b class='flag-5'>AI</b>的未來(lái)

    強(qiáng)迫換流晶閘管是如何關(guān)斷的?

    晶閘管強(qiáng)迫換相電容換相,在晶閘管導(dǎo)通時(shí),電容下端是直流母線正電壓; 開(kāi)始換相變換,換相全控開(kāi)關(guān)打開(kāi),就算是理想型全控開(kāi)關(guān)那么在此刻晶閘管兩端的電壓應(yīng)該是相等電位的,但是為什么晶閘管能關(guān)斷,不應(yīng)該要求是負(fù)壓關(guān)斷而且實(shí)際也并沒(méi)有關(guān)斷;
    發(fā)表于 03-10 13:42