完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強(qiáng)化學(xué)習(xí)
文章:226個(gè) 瀏覽:11986次 帖子:1個(gè)
MoDem解決了視覺(jué)強(qiáng)化學(xué)習(xí)領(lǐng)域的三個(gè)挑戰(zhàn)
他表示,僅給出5個(gè)演示,MoDem就能在100K交互步驟中解決具有稀疏獎(jiǎng)勵(lì)和高維動(dòng)作空間的具有挑戰(zhàn)性的視覺(jué)運(yùn)動(dòng)控制任務(wù),大大優(yōu)于現(xiàn)有的最先進(jìn)方法。
2023-01-05 標(biāo)簽:解碼器Meta強(qiáng)化學(xué)習(xí) 1.3k 0
強(qiáng)化學(xué)習(xí)正在推進(jìn)AI應(yīng)用
就在幾年前,能夠感知周?chē)h(huán)境、識(shí)別重要細(xì)節(jié)——并忽略其余部分——然后利用這些細(xì)節(jié)來(lái)完成任務(wù)的技術(shù)應(yīng)用似乎還只是科幻小說(shuō)中的內(nèi)容。
2022-12-30 標(biāo)簽:AI機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 939 0
說(shuō)回ChatGPT,例子就不舉了,在網(wǎng)上漫山遍野都是,我們主要從技術(shù)角度來(lái)聊聊。那么,ChatGPT到底是采用了怎樣的技術(shù),才能做到如此超凡脫俗的效果?...
2022-12-07 標(biāo)簽:強(qiáng)化學(xué)習(xí)ai技術(shù)nlp 1.5k 0
ChatGPT能否取代Google、百度等傳統(tǒng)搜索引擎
說(shuō)回ChatGPT,例子就不舉了,在網(wǎng)上漫山遍野都是,我們主要從技術(shù)角度來(lái)聊聊。那么,ChatGPT到底是采用了怎樣的技術(shù),才能做到如此超凡脫俗的效果?...
2022-12-06 標(biāo)簽:引擎模型強(qiáng)化學(xué)習(xí) 1.6k 0
一種利用任何形式的先驗(yàn)策略來(lái)改進(jìn)初始化強(qiáng)化學(xué)習(xí)任務(wù)的探索的方法
由于智能體沒(méi)有收到任何中間獎(jiǎng)勵(lì),它無(wú)法衡量自己離完成任務(wù)有多遠(yuǎn),所以只能在空間里隨機(jī)探索,直至門(mén)被打開(kāi)為止。鑒于這項(xiàng)任務(wù)所需的時(shí)間以及對(duì)其進(jìn)行精準(zhǔn)的控制...
2022-09-06 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)智能體強(qiáng)化學(xué)習(xí) 1.4k 0
人工智能學(xué)習(xí) 遷移學(xué)習(xí)實(shí)戰(zhàn)進(jìn)階
上課時(shí)間安排: 2022年05月27日 — 2022年05月30日 No.1 第一天 一、機(jī)器學(xué)習(xí)簡(jiǎn)介與經(jīng)典機(jī)器學(xué)習(xí)算法介紹 什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)...
2022-04-28 標(biāo)簽:深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)遷移學(xué)習(xí) 2.4k 0
基于遷移深度學(xué)習(xí)的雷達(dá)信號(hào)分選識(shí)別
基于遷移深度學(xué)習(xí)的雷達(dá)信號(hào)分選識(shí)別 ? 來(lái)源:《軟件學(xué)報(bào)》?,作者王功明等 ? 摘要:? 針對(duì)當(dāng)前雷達(dá)信號(hào)分選識(shí)別算法普遍存在的低信噪比下識(shí)別能力差、特...
2022-03-02 標(biāo)簽:大數(shù)據(jù)深度學(xué)習(xí)強(qiáng)化學(xué)習(xí) 2.4k 0
強(qiáng)化學(xué)習(xí)中泛化的對(duì)比性行為相似性嵌入向量
強(qiáng)化學(xué)習(xí) (RL) 是一種順序決策范例,用于訓(xùn)練智能體來(lái)處理復(fù)雜的任務(wù),例如機(jī)器人運(yùn)動(dòng)、玩視頻游戲、放飛平流層氣球以及設(shè)計(jì)硬件芯片等。 放飛平流層氣球 ...
2021-11-02 標(biāo)簽:芯片智能體強(qiáng)化學(xué)習(xí) 2.5k 0
作為一名快樂(lè)的肥宅,玩游戲是居家必備,無(wú)論是王者榮耀、吃雞、原神這些大熱游戲,還是跳一跳、合成大西瓜、2048、這些風(fēng)靡一時(shí)得小游戲,咱都有涉及。但是為...
2021-08-24 標(biāo)簽:AI強(qiáng)化學(xué)習(xí)華為云 2.9k 0
當(dāng)機(jī)器人遇見(jiàn)強(qiáng)化學(xué)習(xí),會(huì)碰出怎樣的火花?
當(dāng)機(jī)器人遇見(jiàn)強(qiáng)化學(xué)習(xí),會(huì)碰出怎樣的火花? 一名叫 Cassie 的機(jī)器人,給出了生動(dòng)演繹。 最近,24 歲的中國(guó)南昌小伙李鐘毓和其所在團(tuán)隊(duì),用強(qiáng)化學(xué)習(xí)教...
2021-04-13 標(biāo)簽:機(jī)器人強(qiáng)化學(xué)習(xí) 3.2k 0
從歷史上看,人工智能使用人工制定的策略來(lái)發(fā)揮決策作用。2019年,蒙特利爾研究所的Mila通過(guò)使用深度學(xué)習(xí)系統(tǒng)取得了勝利。他們基于150000個(gè)人類(lèi)游戲...
2021-03-11 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí)DeepMind 2.1k 0
基于帶約束強(qiáng)化學(xué)習(xí)的 BPP-1 求解
事實(shí)上,人可以根據(jù)即將到來(lái)的幾個(gè)箱子的形狀尺寸,很快地做出決策,并不需要、也無(wú)法做到對(duì)整個(gè)箱子序列的全局規(guī)劃。這種僅僅看到部分箱子序列的裝箱問(wèn)題,稱(chēng)為在...
2021-01-27 標(biāo)簽:機(jī)器人算法強(qiáng)化學(xué)習(xí) 3.7k 0
2021年AI領(lǐng)域的你最應(yīng)該學(xué)的是什么
進(jìn)入到2021年,AI領(lǐng)域的你最應(yīng)該學(xué)的是什么?我覺(jué)得是強(qiáng)化學(xué)習(xí)。 為什么這么說(shuō)?首先要知道什么是強(qiáng)化學(xué)習(xí)。 ? 強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,是一種行為學(xué)...
2021-01-18 標(biāo)簽:AI深度學(xué)習(xí)強(qiáng)化學(xué)習(xí) 2.2k 0
一位機(jī)器學(xué)習(xí)方向博五學(xué)生談?wù)摿怂淖x博經(jīng)歷
發(fā)帖人認(rèn)為我們需要反省教學(xué)方式。顯然,為了高效,博士生需要具備一定程度的特定領(lǐng)域?qū)I(yè)知識(shí),但這不能以想象力作為代價(jià),更不能是尋求新方法的勇氣。99% 的...
2020-12-14 標(biāo)簽:算法機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí) 1.9k 0
適合初學(xué)者的神經(jīng)網(wǎng)絡(luò)理論到實(shí)踐(3):打破概念束縛:什么是強(qiáng)化學(xué)習(xí)?
專(zhuān)欄中《零神經(jīng)網(wǎng)絡(luò)實(shí)戰(zhàn)》系列持續(xù)更新介紹神經(jīng)元怎么工作,最后使用python從0到1不調(diào)用任何依賴(lài)神經(jīng)網(wǎng)絡(luò)框架(不使用tensorflow等框架)...
2020-12-10 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 735 0
強(qiáng)化學(xué)習(xí)在智能對(duì)話上的應(yīng)用介紹
本文主要介紹深度強(qiáng)化學(xué)習(xí)在任務(wù)型對(duì)話上的應(yīng)用,兩者的結(jié)合點(diǎn)主要是將深度強(qiáng)化學(xué)習(xí)應(yīng)用于任務(wù)型對(duì)話的策略學(xué)習(xí)上來(lái)源:騰訊技術(shù)工程微信號(hào)
2020-12-10 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 1.7k 0
DeepMind發(fā)布強(qiáng)化學(xué)習(xí)庫(kù)RLax
RLax(發(fā)音為“ relax”)是建立在JAX之上的庫(kù),它公開(kāi)了用于實(shí)施強(qiáng)化學(xué)習(xí)智能體的有用構(gòu)建塊。。報(bào)道:深度強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室作者:DeepRL ...
2020-12-10 標(biāo)簽:強(qiáng)化學(xué)習(xí)DeepMind 1.5k 0
83篇文獻(xiàn)、萬(wàn)字總結(jié)強(qiáng)化學(xué)習(xí)之路
深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合的產(chǎn)物,它集成了深度學(xué)習(xí)在視覺(jué)等感知問(wèn)題上強(qiáng)大的理解能力,以及強(qiáng)化學(xué)習(xí)的決策能力,實(shí)現(xiàn)了...
2020-12-10 標(biāo)簽:人工智能強(qiáng)化學(xué)習(xí) 1.2k 0
DCloud崔紅保:uni-app和HBuilder背后的男人
MUI,國(guó)內(nèi)?個(gè)接近原?App體驗(yàn)的?性能前端庫(kù),github star數(shù)過(guò)萬(wàn);流應(yīng)?,國(guó)內(nèi)?程序應(yīng)用形態(tài)的最早原型;HBuilder,擁有數(shù)百萬(wàn)前端開(kāi)...
2020-12-08 標(biāo)簽:互聯(lián)網(wǎng)強(qiáng)化學(xué)習(xí) 1.5k 0
PWIL:不依賴(lài)對(duì)抗性的新型模擬學(xué)習(xí)
最前沿的對(duì)抗 IL 方法的運(yùn)作方式與生成對(duì)抗網(wǎng)絡(luò) (GAN) 類(lèi)似:訓(xùn)練生成器(策略)以最大化判別器(獎(jiǎng)勵(lì))的混淆度,以便判別器本身被訓(xùn)練來(lái)區(qū)分智能體的...
2020-10-13 標(biāo)簽:模擬器智能體強(qiáng)化學(xué)習(xí) 3k 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語(yǔ)言教程專(zhuān)題
| 電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無(wú)刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺(jué) | 無(wú)人機(jī) | 三菱電機(jī) | ST |
| 伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國(guó)民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹(shù)莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |