学位论文 > 优秀研究生学位论文题录展示
部分可观测的随机控制系统及其应用
作 者: 王光臣
导 师: 吴臻
学 校: 山东大学
专 业: 概率论与数理统计
关键词: 部分可观测的随机控制系统 卡尔曼-布西滤波 最大值原理 线性二次非零和微分对策 最优投资组合
分类号: O231.3
类 型: 博士论文
年 份: 2007年
下 载: 285次
引 用: 0次
阅 读: 论文下载
内容摘要
本文研究了部分可观测的随机控制系统及在线性二次最优控制,微分对策和最优投资组合选择等问题中的应用。全文共分为五章。滤波理论在寻找部分可观测的随机控制问题的显式解方面起到重要作用。在第一章,我们将简单介绍滤波理论的发展史和一个重要引理。我们也概述了本文所得到的主要结果。第二章研究了一类由经典的随机最优控制问题产生的正倒向随机系统的卡尔曼-布西滤波问题,同时,研究了这类正倒向随机系统对应的滤波方程的稳定性。作为滤波理论的应用,我们研究了一类部分可观测的递归线性二次最优控制问题。结合分离原理和一种直接构造的方法,我们得到了显式的最优控制,它是状态滤波估计的线性反馈。在本章最后,我们给出了部分可观测的递归最优控制问题的信息价值。在第三章,我们研究了一类部分可观测的递归最优控制问题。结合Girsanov定理和完全可观测信息下处理最优控制问题的经典方法,我们得到了部分可观测的递归最优控制问题的最大值原理。当状态受限时,我们用类似的方法证明了该控制问题的最大值原理。作为最大值原理的应用,我们研究了一类部分可观测的递归线性二次最优控制问题。风险敏感最优控制问题可以用来刻画投资者的风险态度,因此在金融经济理论中有重要应用价值。在第四章,我们将研究一类部分可观测的风险敏感最优控制问题。采用与第三章类似的方法,我们得到了部分可观测的风险敏感最优控制问题的一般随机最大值原理。尽管它在形式上与风险中性情形的最大值原理相似,但是变分不等式和对耦方程明显地依赖风险敏感参数γ,这是与风险中性情形的最大值原理的主要区别之一。作为部分可观测信息的特例,我们给出了完全可观测的风险敏感最优控制问题的一般最大值原理。我们也举出了三个有趣的例子,以展示风险敏感最大值原理的应用。最优投资组合的例子进一步解释了风险敏感一词的含义。在最后一章,我们研究了一类部分可观测的线性二次非零和微分对策问题。结合分离原理和正倒向随机微分方程理论,我们得到了显式的可观测的Nash均衡点。
|
全文目录
中文部分 1-103 中文摘要 6-8 英文摘要 8-10 符号说明 10-11 第一章 绪论 11-16 1.1 预备知识 11-14 1.2 本文的主要结果 14-16 第二章 正倒向随机系统的卡尔曼-布西滤波问题 16-36 2.1 介绍 16-17 2.2 卡尔曼-布西滤波方程 17-22 2.3 卡尔曼-布西滤波方程的稳定性 22-25 2.4 递归最优控制问题 25-34 2.5 计算信息价值 34-36 第三章 部分可观测的随机递归最优控制问题 36-60 3.1 介绍 36-40 3.2 最大值原理 40-51 3.3 状态受限情形的最大值原理 51-59 3.4 与存在结果的比较 59-60 第四章 部分可观测的风险敏感最优控制问题 60-88 4.1 介绍 60-64 4.2 一般随机最大值原理 64-75 4.3 两个有趣的例子 75-81 4.4 完全可观测情形的最大值原理 81-86 4.5 与存在结果的比较 86-88 第五章 部分可观测的线性二次非零和随机微分对策 88-94 5.1 介绍 88 5.2 阐述问题 88-90 5.3 主要结果 90-94 参考文献 94-99 致谢 99-100 作者简介 100-102 学位论文评阅及答辩情况表 102-103 英文部分 103-206 Chinese Abstract 108-110 English Abstract 110-112 Symbols 112-113 Chapter 1 Preliminaries 113-118 1.1 Some Advances on Filtering Theory 113-116 1.2 Main Results Obtained in Our Paper 116-118 Chapter 2 Kalman-Bucy filtering Problems of Forward and Backward Stochastic Systems 118-140 2.1 Introduction 118-120 2.2 Kalman-Bucy Filtering Equations 120-125 2.3 Stability of Kalman-Bucy Filtering Equations 125-128 2.4 Recursive Optimal Control Problems 128-137 2.5 Computing the Value of the Information 137-140 Chapter 3 Partially Observed Stochastic Recursive Optimal Control Problems 140-164 3.1 Introduction 140-144 3.2 Maximum Principle 144-155 3.3 Problems with State Constraints 155-162 3.4 Comparison with Existing Results 162-164 Chapter 4 Partially Observed Risk-Sensitive Optimal Control Problems 164-192 4.1 Introduction 164-168 4.2 General Risk-Sensitive Maximum Principle 168-178 4.3 Two Interesting Examples 178-185 4.4 The Fully Observed Case 185-190 4.5 Comparison with Existing Results 190-192 Chapter 5 Partially Observed Linear Quadratic Non-Zero Sum Stochastic Differential Games 192-199 5.1 Introduction 192 5.2 Formulation of Our Problems 192-194 5.3 Main Results 194-199 References 199-203 Acknowledgement 203-204 Curriculum Vitae 204-206 学位论文评阅及答辩情况表 206
|
相似论文
- B值鞅型序列的性质及鞅方法在金融市场中的应用,F830.9
- 基于潘氏极值原理的边坡稳定性的整体分析法,TU43
- 基于CVaR有交易费用投资组合优化模型及实证研究,F830.59
- 倒向随机Volterra积分方程的终端变分方法,O211.63
- 一类特殊投资群体的谱风险度量及最优投资组合,F830.59
- 线性薛定谔方程最优控制问题的综述,O232
- 带有Beddington-DeAngelis功能性反应的捕食者—食饵系统的生物经济模型,O175
- 最大值原理在单种群捕获模型中的应用,O175
- 基于不同风险度量的最优投资组合研究,O211.67
- 一般效用函数的最优投资消费问题,F830.59
- 离散最优控制理论在货币供应中的应用,F822.0
- 几类高阶微分方程多点边值问题的上下解方法,O175.8
- 具非泊松跳的集体年金模型研究,F842.6
- WTVaR广义凸风险测度及其应用研究,F224
- 统计模拟算法研究及其在金融分析中的应用,F832.5
- 一类连续时间经济增长模型的动态最优化方法,F224
- 中国股市尾部相关风险分析,F832.51
- 带终端限制的一类随机最优控制问题的最大值原理,O232
- 伴随初始和终端状态限制的时间对称的正倒向随机微分方程的最大值原理及其应用,O211.63
- 一类关于通货膨胀影响下的最优投资问题,F830.9
- 投资组合的风险管理,F830.59
中图分类: > 数理科学和化学 > 数学 > 控制论、信息论(数学理论) > 控制论(控制论的数学理论) > 随机控制系统
© 2012 www.xueweilunwen.com
|