Skip to content

Commit dd83611

Browse files
authored
Merge pull request #86 from QuantEcon/cross_product_trick
[LQ Cross Products] Update Translations
2 parents 8623f50 + 33bfc27 commit dd83611

File tree

1 file changed

+27
-29
lines changed

1 file changed

+27
-29
lines changed

lectures/cross_product_trick.md

Lines changed: 27 additions & 29 deletions
Original file line numberDiff line numberDiff line change
@@ -33,16 +33,16 @@ kernelspec:
3333

3434
这里是一个目标函数中包含状态和控制交叉项的非随机无折现线性二次动态规划问题。
3535

36-
该问题由矩阵5元组 $(A, B, R, Q, H)$ 定义,其中 $R$ 和 $Q$ 是正定对称矩阵,且
36+
该问题由矩阵五元组 $(A, B, R, Q, H)$ 定义,其中 $R$ 和 $Q$ 是正定对称矩阵,且
3737
$A \sim m \times m, B \sim m \times k, Q \sim k \times k, R \sim m \times m$ 以及 $H \sim k \times m$。
3838

3939
问题是选择 $\{x_{t+1}, u_t\}_{t=0}^\infty$ 以最大化
4040

4141
$$
42-
- \sum_{t=0}^\infty (x_t' R x_t + u_t' Q u_t + 2 u_t H x_t)
42+
-\sum_{t=0}^\infty (x_t' R x_t + u_t' Q u_t + 2 u_t H x_t)
4343
$$
4444

45-
受限于线性约束
45+
满足线性约束条件:
4646

4747
$$ x_{t+1} = A x_t + B u_t, \quad t \geq 0 $$
4848

@@ -56,86 +56,86 @@ $$ u_t = -F x_t $$
5656

5757
$$ F = -(Q + B'PB)^{-1} B'PA $$
5858

59-
且 $P \sim m \times m $ 是代数矩阵Riccati方程的正定解
59+
且 $P \sim m \times m$ 是代数矩阵黎卡提方程的正定解
6060

6161
$$
6262
P = R + A'PA - (A'PB + H')(Q + B'PB)^{-1}(B'PA + H).
6363
$$
6464

6565
+++
6666

67-
可以验证,一个**等价的**没有状态和控制交叉项的问题可以由矩阵4元组定义:$(A^*, B, R^*, Q)$。
67+
可以验证,一个与之等价但不含状态与控制交叉项的问题可由矩阵四元组 $(A^*, B, R^*, Q)$ 定义
6868

6969
省略的矩阵 $H=0$ 表示在等价问题中没有状态和控制之间的交叉项。
7070

7171
定义等价问题的矩阵 $(A^*, B, R^*, Q)$ 及其值函数、策略函数矩阵 $P, F^*$ 与定义原始问题的矩阵 $(A, B, R, Q, H)$ 及其值函数、策略函数矩阵 $P, F$ 之间的关系如下:
7272

73-
\begin{align*}
73+
$$
74+
\begin{aligned}
7475
A^* & = A - B Q^{-1} H, \\
7576
R^* & = R - H'Q^{-1} H, \\
7677
P & = R^* + {A^*}' P A - ({A^*}' P B) (Q + B' P B)^{-1} B' P A^*, \\
7778
F^* & = (Q + B' P B)^{-1} B' P A^*, \\
7879
F & = F^* + Q^{-1} H.
79-
\end{align*}
80+
\end{aligned}
81+
$$
8082

8183
+++
8284

8385
## 卡尔曼滤波
8486

85-
线性二次最优控制和卡尔曼滤波问题之间存在的**对偶性**意味着存在一个类似的变换,允许我们将状态噪声和测量噪声之间具有非零协方差矩阵的卡尔曼滤波问题转换为一个等价的、状态噪声和测量噪声之间协方差为零的卡尔曼滤波问题。
87+
线性二次最优控制与卡尔曼滤波问题之间存在一种**对偶**关系。这意味着存在一个类似的变换,允许我们将状态噪声和测量噪声之间具有非零协方差矩阵的卡尔曼滤波问题转换为一个等价的、状态噪声和测量噪声之间协方差为零的卡尔曼滤波问题。
8688

8789
让我们看看适当的变换。
8890

8991
首先,让我们回顾一下具有状态噪声和测量噪声之间协方差的卡尔曼滤波。
9092

9193
隐马尔可夫模型为:
9294

93-
\begin{align*}
95+
$$
96+
\begin{aligned}
9497
x_{t+1} & = A x_t + B w_{t+1}, \\
9598
z_{t+1} & = D x_t + F w_{t+1},
96-
\end{align*}
99+
\end{aligned}
100+
$$
97101

98-
其中 $A \sim m \times m, B \sim m \times p $ 且 $D \sim k \times m, F \sim k \times p $,
102+
其中 $A \sim m \times m, B \sim m \times p$ 且 $D \sim k \times m, F \sim k \times p$,
99103
且 $w_{t+1}$ 是一个独立同分布的 $p \times 1$ 正态分布随机向量序列的时间 $t+1$ 分量,其均值向量为零,协方差矩阵等于 $p \times p$ 单位矩阵。
100104

101-
因此,$x_t$ 是 $m \times 1$ $z_t$ 是 $k \times 1$。
105+
因此,$x_t$ 是 $m \times 1$ 的且 $z_t$ 是 $k \times 1$
102106

103107
卡尔曼滤波公式为:
104108

105109
```{math}
106110
:label: eq:Kalman102
107-
111+
\begin{aligned}
108112
K(\Sigma_t) & = (A \Sigma_t D' + BF')(D \Sigma_t D' + FF')^{-1}, \\
109113
\Sigma_{t+1}& = A \Sigma_t A' + BB' - (A \Sigma_t D' + BF')(D \Sigma_t D' + FF')^{-1} (D \Sigma_t A' + FB').
114+
\end{aligned}
110115
```
111116

112-
定义转换后的矩阵:
113-
114-
\begin{align*}
115-
A^* & = A - BF' (FF')^{-1} D, \\
116-
B^* {B^*}' & = BB' - BF' (FF')^{-1} FB'.
117-
\end{align*}
118-
119117
### 算法
120118

121-
公式 {eq}`eq:Kalman102` 的一个结果是,我们可以使用以下算法来求解涉及状态噪声和信号噪声之间非零协方差的卡尔曼滤波问题
119+
根据公式 {eq}`eq:Kalman102`,我们可以使用以下算法来求解那些状态噪声与观测噪声之间协方差非零的卡尔曼滤波问题
122120

123-
首先,使用普通卡尔曼滤波公式计算 $\Sigma, K^*$,其中 $BF' = 0$,即状态随机噪声和测量随机噪声之间的协方差矩阵为零。
121+
首先,使用标准的卡尔曼滤波公式计算 $\Sigma, K^*$,其中 $BF' = 0$,即状态随机噪声和测量随机噪声之间的协方差矩阵为零。
124122

125123
也就是说,计算满足以下条件的 $K^*$ 和 $\Sigma$:
126124

127-
\begin{align*}
125+
$$
126+
\begin{aligned}
128127
K^* & = (A^* \Sigma D')(D \Sigma D' + FF')^{-1} \\
129128
\Sigma & = A^* \Sigma {A^*}' + B^* {B^*}' - (A^* \Sigma D')(D \Sigma D' + FF')^{-1} (D \Sigma {A^*}').
130-
\end{align*}
129+
\end{aligned}
130+
$$
131131

132-
原始问题(具有**非零协方差**的状态和测量噪声)的卡尔曼增益为
132+
接着,对于具有**非零状态–观测协方差**的原始问题,其卡尔曼增益为
133133

134134
$$
135135
K = K^* + BF' (FF')^{-1},
136136
$$
137137

138-
原始问题的状态重构协方差矩阵 $\Sigma$ 等于转换后问题的状态重构协方差矩阵
138+
原始问题的状态重构协方差矩阵 $\Sigma$ 等于变换后问题的状态重构协方差矩阵
139139

140140
+++
141141

@@ -153,9 +153,7 @@ $$
153153
| $F$ | $K'$ |
154154
| $P$ | $\Sigma$ |
155155

156-
+++
157156

158157

159-
```{code-cell} ipython3
160158

161-
```
159+

0 commit comments

Comments
 (0)