91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

大小:0.88 MB 人氣: 2017-12-27 需要積分:2

  針對(duì)路徑規(guī)劃算法收斂速度慢及效率低的問題,提出了一種基于分層強(qiáng)化學(xué)習(xí)及人工勢(shì)場(chǎng)的多Agent路徑規(guī)劃算法。首先,將多Agent的運(yùn)行環(huán)境虛擬為一個(gè)人工勢(shì)能場(chǎng),根據(jù)先驗(yàn)知識(shí)確定每點(diǎn)的勢(shì)能值,它代表最優(yōu)策略可獲得的最大回報(bào);其次,利用分層強(qiáng)化學(xué)習(xí)方法的無環(huán)境模型學(xué)習(xí)以及局部更新能力將策略更新過程限制在規(guī)模較小的局部空間或維度較低的高層空間上,提高學(xué)習(xí)算法的性能;最后,針對(duì)出租車問題在柵格環(huán)境中對(duì)所提算法進(jìn)行了仿真實(shí)驗(yàn)。為了使算法貼近真實(shí)環(huán)境,增加算法的可移植性,在三維仿真環(huán)境中對(duì)該算法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該算法收斂速度快,收斂過程穩(wěn)定。

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?