@@ -33,16 +33,16 @@ kernelspec:
3333
3434这里是一个目标函数中包含状态和控制交叉项的非随机无折现线性二次动态规划问题。
3535
36- 该问题由矩阵5元组 $(A, B, R, Q, H)$ 定义,其中 $R$ 和 $Q$ 是正定对称矩阵,且
36+ 该问题由矩阵五元组 $(A, B, R, Q, H)$ 定义,其中 $R$ 和 $Q$ 是正定对称矩阵,且
3737$A \sim m \times m, B \sim m \times k, Q \sim k \times k, R \sim m \times m$ 以及 $H \sim k \times m$。
3838
3939问题是选择 $\{ x_ {t+1}, u_t\} _ {t=0}^\infty$ 以最大化
4040
4141$$
42- - \sum_{t=0}^\infty (x_t' R x_t + u_t' Q u_t + 2 u_t H x_t)
42+ - \sum_{t=0}^\infty (x_t' R x_t + u_t' Q u_t + 2 u_t H x_t)
4343$$
4444
45- 受限于线性约束
45+ 满足线性约束条件:
4646
4747$$ x_{t+1} = A x_t + B u_t, \quad t \geq 0 $$
4848
@@ -56,86 +56,86 @@ $$ u_t = -F x_t $$
5656
5757$$ F = -(Q + B'PB)^{-1} B'PA $$
5858
59- 且 $P \sim m \times m $ 是代数矩阵Riccati方程的正定解
59+ 且 $P \sim m \times m$ 是代数矩阵黎卡提方程的正定解
6060
6161$$
6262P = R + A'PA - (A'PB + H')(Q + B'PB)^{-1}(B'PA + H).
6363$$
6464
6565+++
6666
67- 可以验证,一个 ** 等价的 ** 没有状态和控制交叉项的问题可以由矩阵4元组定义: $(A^* , B, R^* , Q)$。
67+ 可以验证,一个与之等价但不含状态与控制交叉项的问题可由矩阵四元组 $(A^* , B, R^* , Q)$ 定义 。
6868
6969省略的矩阵 $H=0$ 表示在等价问题中没有状态和控制之间的交叉项。
7070
7171定义等价问题的矩阵 $(A^* , B, R^* , Q)$ 及其值函数、策略函数矩阵 $P, F^* $ 与定义原始问题的矩阵 $(A, B, R, Q, H)$ 及其值函数、策略函数矩阵 $P, F$ 之间的关系如下:
7272
73- \begin{align* }
73+ $$
74+ \begin{aligned}
7475A^* & = A - B Q^{-1} H, \\
7576R^* & = R - H'Q^{-1} H, \\
7677P & = R^* + {A^*}' P A - ({A^*}' P B) (Q + B' P B)^{-1} B' P A^*, \\
7778F^* & = (Q + B' P B)^{-1} B' P A^*, \\
7879F & = F^* + Q^{-1} H.
79- \end{align* }
80+ \end{aligned}
81+ $$
8082
8183+++
8284
8385## 卡尔曼滤波
8486
85- 线性二次最优控制和卡尔曼滤波问题之间存在的 ** 对偶性 ** 意味着存在一个类似的变换 ,允许我们将状态噪声和测量噪声之间具有非零协方差矩阵的卡尔曼滤波问题转换为一个等价的、状态噪声和测量噪声之间协方差为零的卡尔曼滤波问题。
87+ 线性二次最优控制与卡尔曼滤波问题之间存在一种 ** 对偶 ** 关系。这意味着存在一个类似的变换 ,允许我们将状态噪声和测量噪声之间具有非零协方差矩阵的卡尔曼滤波问题转换为一个等价的、状态噪声和测量噪声之间协方差为零的卡尔曼滤波问题。
8688
8789让我们看看适当的变换。
8890
8991首先,让我们回顾一下具有状态噪声和测量噪声之间协方差的卡尔曼滤波。
9092
9193隐马尔可夫模型为:
9294
93- \begin{align* }
95+ $$
96+ \begin{aligned}
9497x_{t+1} & = A x_t + B w_{t+1}, \\
9598z_{t+1} & = D x_t + F w_{t+1},
96- \end{align* }
99+ \end{aligned}
100+ $$
97101
98- 其中 $A \sim m \times m, B \sim m \times p $ 且 $D \sim k \times m, F \sim k \times p $,
102+ 其中 $A \sim m \times m, B \sim m \times p$ 且 $D \sim k \times m, F \sim k \times p$,
99103且 $w_ {t+1}$ 是一个独立同分布的 $p \times 1$ 正态分布随机向量序列的时间 $t+1$ 分量,其均值向量为零,协方差矩阵等于 $p \times p$ 单位矩阵。
100104
101- 因此,$x_t$ 是 $m \times 1$ 且 $z_t$ 是 $k \times 1$。
105+ 因此,$x_t$ 是 $m \times 1$ 的且 $z_t$ 是 $k \times 1$ 的 。
102106
103107卡尔曼滤波公式为:
104108
105109``` {math}
106110:label: eq:Kalman102
107-
111+ \begin{aligned}
108112K(\Sigma_t) & = (A \Sigma_t D' + BF')(D \Sigma_t D' + FF')^{-1}, \\
109113\Sigma_{t+1}& = A \Sigma_t A' + BB' - (A \Sigma_t D' + BF')(D \Sigma_t D' + FF')^{-1} (D \Sigma_t A' + FB').
114+ \end{aligned}
110115```
111116
112- 定义转换后的矩阵:
113-
114- \begin{align* }
115- A^* & = A - BF' (FF')^{-1} D, \\
116- B^* {B^* }' & = BB' - BF' (FF')^{-1} FB'.
117- \end{align* }
118-
119117### 算法
120118
121- 公式 {eq}` eq:Kalman102 ` 的一个结果是,我们可以使用以下算法来求解涉及状态噪声和信号噪声之间非零协方差的卡尔曼滤波问题 。
119+ 根据公式 {eq}` eq:Kalman102 ` ,我们可以使用以下算法来求解那些状态噪声与观测噪声之间协方差非零的卡尔曼滤波问题 。
122120
123- 首先,使用普通卡尔曼滤波公式计算 $\Sigma, K^* $,其中 $BF' = 0$,即状态随机噪声和测量随机噪声之间的协方差矩阵为零。
121+ 首先,使用标准的卡尔曼滤波公式计算 $\Sigma, K^* $,其中 $BF' = 0$,即状态随机噪声和测量随机噪声之间的协方差矩阵为零。
124122
125123也就是说,计算满足以下条件的 $K^* $ 和 $\Sigma$:
126124
127- \begin{align* }
125+ $$
126+ \begin{aligned}
128127K^* & = (A^* \Sigma D')(D \Sigma D' + FF')^{-1} \\
129128\Sigma & = A^* \Sigma {A^*}' + B^* {B^*}' - (A^* \Sigma D')(D \Sigma D' + FF')^{-1} (D \Sigma {A^*}').
130- \end{align* }
129+ \end{aligned}
130+ $$
131131
132- 原始问题(具有 ** 非零协方差 ** 的状态和测量噪声)的卡尔曼增益为 :
132+ 接着,对于具有 ** 非零状态–观测协方差 ** 的原始问题,其卡尔曼增益为 :
133133
134134$$
135135K = K^* + BF' (FF')^{-1},
136136$$
137137
138- 原始问题的状态重构协方差矩阵 $\Sigma$ 等于转换后问题的状态重构协方差矩阵 。
138+ 原始问题的状态重构协方差矩阵 $\Sigma$ 等于变换后问题的状态重构协方差矩阵 。
139139
140140+++
141141
153153| $F$ | $K'$ |
154154| $P$ | $\Sigma$ |
155155
156- +++
157156
158157
159- ``` {code-cell} ipython3
160158
161- ```
159+
0 commit comments