摘 要
强化学习
可以算作是这几年来在人工智能和机器学习研究领域内非常热门的项目,而
在强化学习与监督学习中有着许多不同之处。强化学习不需要教师信号,但是它也不等同于只能够完成有限功能的无监督学习,而这种无监督学习在学习过程中无法得到提示。强化学习强调能够获得评价性反馈信号,并且使用评价信息来达到行为决策上的优化。显而易见,强化学习具有广阔的前景。
复杂系统控制中有许多经典的问题,倒立摆就是其中之一。倒立摆系统是一种绝对不稳定的,具有非线性、多变量等多种性质的系统。而在控制过程中,倒立摆系统也是一
基于强化学习的倒立摆控制系统设计-12025字.docx