Discrete Time Markov Decision Processes的意思|示意
美 / /
英 / /
离散时间马尔科夫决策过程
Discrete Time Markov Decision Processes的网络常见释义
时间马尔可夫决策过程 ...高斯—马尔可夫随机过程建模,动态负荷分配不足可理解为一个离散时间马尔可夫决策过程(Discrete Time Markov Decision Processes, DTMDP).从而将强化学习理论中基于随机最优制约技术的Q-学习策略引入CPS指令优化分配对策的研究。
离散时间马尔可夫决策过程 ...高斯—马尔可夫随机过程建模,动态负荷分配不足可理解为一个离散时间马尔可夫决策过程(Discrete Time Markov Decision Processes, DTMDP).从而将强化学习理论中基于随机最优制约技术的Q-学习策略引入CPS指令优化分配对策的研究。