資料介紹
本文針對快速、多變量、強非線性的復雜系統(tǒng)的控制問題,在強化學習方式的基礎上,提出一種新的自適應控制方法。該方法在沒有先驗知識的條件下,基于遞歸神經網絡并結合強化學習的自調節(jié)能力,通過自身神經網絡的在線學習,有效控制不穩(wěn)定的非線性系統(tǒng)。本文以一級倒立擺系統(tǒng)為實驗對象,仿真實驗結果表明:所提出的控制方法具有非常好的控制效果和穩(wěn)定精度,抗干擾能力強。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學習方式融入控制
策略,用來解決復雜非線性系統(tǒng)的控制問題。強化學習(Reinforcement Learning)是一種試探學習方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學習如何執(zhí)行恰當?shù)膭幼鳌=陙?,強化學習在算法和應用上已取得了大量的研究成果,如用靜態(tài)神經網絡控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經網絡(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網
絡,是真正的動態(tài)網絡系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領域。本文在強化學習方式的基礎上,提出一種基于遞歸神經網絡的自適應控制方法。該控制方法采用的強化學習學習方式基于“動作網絡/評價網絡”的框架結構。其中,動作網絡部分由BP 神經網絡構成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網絡部由遞歸神經網絡構成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當前的控制效果,產生“獎勵/懲罰”值作為反饋,以進行自適應學習。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學習方式融入控制
策略,用來解決復雜非線性系統(tǒng)的控制問題。強化學習(Reinforcement Learning)是一種試探學習方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學習如何執(zhí)行恰當?shù)膭幼鳌=陙?,強化學習在算法和應用上已取得了大量的研究成果,如用靜態(tài)神經網絡控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經網絡(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網
絡,是真正的動態(tài)網絡系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領域。本文在強化學習方式的基礎上,提出一種基于遞歸神經網絡的自適應控制方法。該控制方法采用的強化學習學習方式基于“動作網絡/評價網絡”的框架結構。其中,動作網絡部分由BP 神經網絡構成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網絡部由遞歸神經網絡構成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當前的控制效果,產生“獎勵/懲罰”值作為反饋,以進行自適應學習。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 神經網絡自適應控制及其發(fā)展應用 11次下載
- 基于不同神經網絡的文本分類方法研究對比 49次下載
- 基于自適應神經網絡的PID控制移相方法 11次下載
- 一種改進的深度神經網絡結構搜索方法 3次下載
- 一種新型的自適應神經網絡遙感場景分類模型 5次下載
- 基于擴展反向傳播神經網絡的自適應控制方法 0次下載
- 基于自適應果蠅算法的神經網絡結構訓練 0次下載
- 基于神經網絡自適應諧波電流抑制方法 14次下載
- 加工過程的神經網絡模型參考自適應控制
- 一種基于自適應模糊神經網絡的VSLMS算法及應用
- 半主動懸架神經網絡自適應控制研究
- 基于神經網絡的拉絲機恒張力自適應控制
- 基于神經網絡PID控制的交流伺服系統(tǒng)
- 一種基于PID神經網絡的解耦控制方法的研究
- 自適應模糊神經網絡研究
- 液態(tài)神經網絡(LNN):時間連續(xù)性與動態(tài)適應性的神經網絡 837次閱讀
- 遞歸神經網絡和循環(huán)神經網絡的模型結構 1.8k次閱讀
- 遞歸神經網絡的實現(xiàn)方法 1.2k次閱讀
- 神經網絡預測模型的構建方法 2.4k次閱讀
- 人工神經網絡的工作原理和基本特征 4k次閱讀
- 電機控制系統(tǒng)的神經網絡優(yōu)化策略 1.8k次閱讀
- 基于神經網絡模型參考自適應實現(xiàn)混合動力汽車電子差速控制系統(tǒng)的設計 4.9k次閱讀
- 一種新型神經網絡結構:膠囊網絡 6.5k次閱讀
- 一種基于FPGA的神經網絡硬件實現(xiàn)方案詳解 1.4w次閱讀
- 一種遞歸神經網絡在FPGA平臺上的實現(xiàn)方案詳解 2.5k次閱讀
- BP神經網絡概述 4.5w次閱讀
- 什么是神經網絡?學習人工智能必會的八大神經網絡盤點 2.8w次閱讀
- 自適應模糊神經網絡的交通燈控制系統(tǒng)的設計 3.7k次閱讀
- 基于FPGA的神經網絡算法的設計 6.1k次閱讀
- 一種基于模糊神經網絡的機器人控制技術 2.2k次閱讀
下載排行
本周
- 1MDD品牌三極管MMBT3906數(shù)據(jù)手冊
- 2.33 MB | 次下載 | 免費
- 2MDD品牌三極管S9012數(shù)據(jù)手冊
- 2.62 MB | 次下載 | 免費
- 3聯(lián)想flex2-14D/15D說明書
- 4.92 MB | 次下載 | 免費
- 4收音環(huán)繞擴音機 AVR-1507手冊
- 2.50 MB | 次下載 | 免費
- 524Pin Type-C連接器設計報告
- 1.06 MB | 次下載 | 免費
- 6新一代網絡可視化(NPB 2.0)
- 3.40 MB | 次下載 | 免費
- 7MS1000TA 超聲波測量模擬前端芯片技術手冊
- 0.60 MB | 次下載 | 免費
- 8MS1022高精度時間測量(TDC)電路數(shù)據(jù)手冊
- 1.81 MB | 次下載 | 免費
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費
- 2PC5502負載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 23次下載 | 免費
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8100W準諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191439次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論