中山大学
硕士学位论文
连续时间MDP折扣模型的单调最优策略
姓名:廖恭图
申请学位级别:硕士
专业:概率论与数理统计
指导教师:郭先平
20100607
中山大学硕士学位论文
连续时间MDP折扣模型的单调最优策略
【中文摘要】
本文在期望折扣总报酬准则和期望折扣总费用准则下首次研究连续时间马尔可夫决
策过程(简记为MDP)单调最优策略的存在性问题,给出使得最优策略关于系统状态单
...