跳至主要內容

特征值

大约 16 分钟

特征值

参考教程 麻省理工公开课 线性代数open in new window P21~P25

特征值基础

特征值与特征向量的定义

特征值依然以方阵为讨论对象
对于一个 n×nn\times n 的矩阵 AA, 存在某些方向的向量 x\vec{x} 在右乘 AA 后, 得到的结果仍然平行于 x\vec{x}, 将具有这种特性的向量称为特征向量 x\vec{x}, 而称相乘结果 AxA\vec{x} 与原向量 x\vec{x} 之比 λ\lambda 为特征值, 有

Ax=λx A\vec{x}=\lambda\vec{x}

对于一个矩阵 AA 的特征向量 x\vec{x}, 与其同一方向上所有向量均能作为特征向量, 一般仅使用其中一个非零向量代表这个方向

特征值与特征向量的计算

在特征值与特征向量的定义式中, 存在着两个未知变量, 为此需要进行如下变形

Ax=λx(AλI)x=0 \begin{split} A\vec{x}&=\lambda\vec{x}\\ (A-\lambda I)\vec{x}&=\vec{0} \end{split}

此时, 仅当矩阵 AλIA-\lambda I 为不可逆矩阵, 方程 (AλI)x=0(A-\lambda I)\vec{x}=\vec{0} 才会存在非零解
而要当矩阵 AλIA-\lambda I 为不可逆矩阵时, 根据行列式的性质, 有

det(AλI)=0 \det(A-\lambda I)=0

上式可展开为一个关于 λ\lambdann 次方程, 称为特征方程, 因此对于一个 n×nn\times n 方阵, 其共有 nn 个特征值
并且其中可能存在多重根与复根, 因此也存在多重特征值与复数特征值的情况

得到特征值后可得, 对于任意一个特征值 λ\lambda, 其有特征向量 x\vec{x} 有无数多个, 并且这些特征值均来自矩阵 AλIA-\lambda I 的零空间
通常在计算出特征值后, 选择 N(AλI)N(A-\lambda I) 的一组基作为该特征的特定特征向量
注意, N(AλI)N(A-\lambda I) 的维数与 λ\lambda 的重数无关, 因此nn 个特征值不代表有 nn 个不平行的特征向量 x\vec{x}

特征值的特性

  • 将方阵 AA 对角线上的元素之和称为 tr(A)tr(A)
    • 矩阵 AA 的迹等于其特征值之和, 可用该性质寻找最后一个特征值
    • 矩阵的迹的相反数等于其特征方程中的一次项系数
  • 对于方阵 AA 的行列式
    • 矩阵 AA 的行列式等于其特征值之积
    • 矩阵的行列式也等于其特征方程中的常数项
  • 对于矩阵 AA 有特征值 λ\lambda, 则矩阵数乘 kAkA 有特征值 kλk\lambda
  • 对于矩阵 AA 有特征值 λ\lambda, 则矩阵与单位矩阵运算 A+kIA+kI 有特征值 λ+k\lambda+k, 且对应特征值的特征向量相同, 证明如下 (注意对于任意两个矩阵 A,BA,B, 其和与积的特征值不存在特殊性质)

(A+kI)x=λx+kx=(λ+k)x (A+kI)\vec{x}=\lambda\vec{x}+k\vec{x}=(\lambda+k)\vec{x}

  • 矩阵 AA 以及其转置 ATA^T 具有相同的特征值, 该性质由行列式的推论七可得到
  • 矩阵 AA 的逆 A1A^{-1} 的特征值为矩阵 AA 特征值 λi\lambda_i 的倒数 1λi\frac{1}{\lambda_i}
  • 对于矩阵 A,BA,B, 其乘积 ABABBABA 具有相同的特征值, 证明有 (AB)x=λx(BA)(Bx)=λ(Bx)(AB)\vec{x}=\lambda\vec{x}\to(BA)(B\vec{x})=\lambda(B\vec{x}), 更多关于矩阵相乘与特征值的关系间参考资料open in new window

特殊矩阵的特征值

投影矩阵

对于投影矩阵 PP, 根据投影矩阵的性质

  • 对于 xC(P)\vec{x}\in C(P), 此时有 Px=xP\vec{x}=\vec{x}, 因此认为投影矩阵列空间 C(P)C(P) 中的任意向量均为 PP 的特征向量, 且有特征值 λ=1\lambda=1
  • 对于 xC(P)\vec{x}\perp C(P) (与 C(P)C(P) 中的所有向量正交), 此时有 Px=0P\vec{x}=\vec{0}, 即类似不可逆矩阵 SS 的情况, 对于这些向量 xN(P)\vec{x}\in N(P), 也是 PP 的特征向量, 有特征值 λ=0\lambda=0
  • 因此投影矩阵仅有特征值 1100

标准正交矩阵

注意到对于任意向量 x\vec{x} 与标准正交矩阵 QQ

Qx=i=1nxiqi=x \begin{Vmatrix}Q\vec{x}\end{Vmatrix}=\sum_{i=1}^n |x_i|\begin{Vmatrix}\vec{q}_i\end{Vmatrix}=\begin{Vmatrix}\vec{x}\end{Vmatrix}

因此标准正交矩阵不会改变向量的长度, 在求特征值时有 Qx=λxλ=1\begin{Vmatrix}Q\vec{x}\end{Vmatrix}=|\lambda|\begin{Vmatrix}\vec{x}\end{Vmatrix}\to \begin{Vmatrix}\lambda\end{Vmatrix}=1

正交矩阵的特征值 λ\lambda 也可能为复数, 但绝对值必定为 11

对称矩阵

对于对称矩阵, 其特征值全为实数, 且不同特征值的特征向量相互垂直

例如对称矩阵 S=[3113]S=\begin{bmatrix}3&1\\1&3\end{bmatrix}, 其有特征方程

3λ113λ=0(3λ)21=0λ26λ+8=0 \begin{split} \begin{vmatrix}3-\lambda&1\\1&3-\lambda\end{vmatrix}&=0\\ (3-\lambda)^2-1&=0\\ \lambda^2-6\lambda+8&=0 \end{split}

解得其有特征值

  • λ1=2\lambda_{1}=2, 对应特征向量 x1=[11]T\vec{x}_1=\begin{bmatrix}1&-1\end{bmatrix}^T
  • λ2=4\lambda_{2}=4, 对应特征向量 x2=[11]T\vec{x}_2=\begin{bmatrix}1&1\end{bmatrix}^T

反对称矩阵

对于反对称矩阵 (A=ATA=-A^T), 其特征值全为纯虚数

例如对称矩阵 A=[0110]A=\begin{bmatrix}0&-1\\1&0\end{bmatrix} (同时该矩阵也是 90°90\degree 的旋转矩阵), 其有特征方程

λ11λ=0λ2+1=0λ=±i \begin{split} \begin{vmatrix}-\lambda&-1\\1&-\lambda\end{vmatrix}&=0\\ \lambda^2+1&=0\\ \lambda&=\pm i \end{split}

对于一般矩阵, 其特征值介于二者之间, 可能为实数或复数, 且通常越对称, 实数越多

上三角矩阵

对于上三角矩阵, 其对角线上的值即其特征值 (根据行列式的性质易得)

例如上三角矩阵 U=[3103]U=\begin{bmatrix}3&1\\0&3\end{bmatrix}, 其有特征方程

3λ103λ=0(3λ)2=0λ=3 \begin{split} \begin{vmatrix}3-\lambda&1\\0&3-\lambda\end{vmatrix}&=0\\ (3-\lambda)^2&=0\\ \lambda&=3 \end{split}

解得该矩阵有特征根 λ=3\lambda=3, 且为二重特征根
此外, 对于 U3I=[0100]U-3I=\begin{bmatrix}0&1\\0&0\end{bmatrix}, 该矩阵的零空间维数 dim[N(U3I)]=2r=1dim[N(U-3I)]=2-r=1, 因此零空间为一维
这表明该矩阵仅有一个方向的特征向量 x=[10]T\vec{x}=\begin{bmatrix}1&0\end{bmatrix}^T

对角化

对角化分解

对于一个 n×nn\times n 的矩阵 AA, 将其任意 nn 个特征向量 xk\vec{x}_k 组成特征矩阵 SS
根据特征值与特征向量的定义, 矩阵 AA 与其特征矩阵 SS 相乘时有

AS=A[x1x2xn]=[λ1x1λ2x2λnxn]=[x1x2xn][λ10000λ200000λn]=SΛ \begin{split}AS&=A\begin{bmatrix}\vec{x}_1&\vec{x}_2&\dots&\vec{x}_n\end{bmatrix}\\ &=\begin{bmatrix}\lambda_1\vec{x}_1&\lambda_2\vec{x}_2&\dots&\lambda_n\vec{x}_n\end{bmatrix}\\ &=\begin{bmatrix}\vec{x}_1&\vec{x}_2&\dots&\vec{x}_n\end{bmatrix}\begin{bmatrix}\lambda_1&0&0&0\\0&\lambda_2&0&0\\\vdots&&&\vdots\\0&0&0&\lambda_n\end{bmatrix}\\ &=S\Lambda \end{split}

其中矩阵 Λ\Lambda 为一个以 AA 的特征值组成的对角矩阵

当这 nn 个特征向量不平行且非 00 时, 矩阵 SS 可逆, 因此有对角化分解

A=SΛS1 A=S\Lambda S^{-1}

对角化矩阵的条件

易得, 当一个矩阵具有 nn 个不同的特征值 λ\lambda 时, 各个特征值都将对应一个方向的特征向量, 且这些特征向量互相平行, 因此该矩阵能够对角化

但是当一个矩阵的特征值中有重根时, 其重根不一定对应与根的重数相同的, 互不平行的特征向量, 因此有可能无法对角化, 如前文的例子 (注意没有重根仅是可对角化的充分条件, 存在重根时仍有可能可以对角化)

但在一般情况下, 对于绝大部分的矩阵均能对角化, 对于不可对角化的矩阵可参见若尔当定理

矩阵的幂

当矩阵满足对角化条件并对角化后, 对于矩阵的 kk 次幂有

Ak=SΛkS1 A^k=S\Lambda^k S^{-1}

根据对角矩阵的特性, 对于矩阵的任意次幂, 其特征向量不变, 特征值变为原矩阵的 kkλ=λk\lambda'=\lambda^k

当矩阵所有特征值满足 λ<1\begin{Vmatrix}\lambda\end{Vmatrix}<1, 有 limkAk=0\lim_{k\to\infty}A^k=0

状态方程

离散差分状态方程

对于一个具有 nn 个参数的线性系统, 可以使用一个向量 u\vec{u} 表示这些参数, 并以此体现系统的状态
系统中相邻的两个时刻的状态之间满足线性方程组 ui+1=Aui\vec{u}_{i+1}=A\vec{u}_i

因此对于初态为 u0\vec{u}_0 的系统在第 kk 个时刻下, 系统的状态为 uk=Aku0\vec{u}_k=A^k\vec{u}_0

通过求解 u0=Sc\vec{u}_0=S\vec{c} 可得到向量 u0\vec{u}_0 关于特征矩阵各列的分量 c\vec{c}, 此时

uk=Aku0=SΛkSS1c=SΛkc=i=1nxiλikci \vec{u}_k=A^k\vec{u}_0=S\Lambda^kSS^{-1}\vec{c}=S\Lambda^k\vec{c}=\sum_{i=1}^n\vec{x}_i\lambda_i^k c_i

对于 uk\vec{u}_k 的第 jj 个分量 {uk}j\{\vec{u}_k\}_j 有 (ajia_{ji} 为待定系数, 可通过代回状态方程或投影具体求解)

{uk}j=i=1najiλik \{\vec{u}_k\}_j=\sum_{i=1}^n a_{ji}\lambda_i^k

kk\to\infty

  • 对于 λi<1\begin{Vmatrix}\lambda_i\end{Vmatrix}<1, uk\vec{u}_k 中在 xi\vec{x}_i 方向上的分量将逐渐趋近于 00, 而对结果没有影响
  • 对于 λi=1\lambda_i=1, uk\vec{u}_k 中在 xi\vec{x}_i 方向上的分量始终不变
  • 对于 λi=ei2π/n\lambda_i=e^{i2\pi/n}, uk\vec{u}_k 中在 xi\vec{x}_i 方向上的分量可能 nn 为周期变化, 当所有特征值都满足这一特点时, 存在特定次幂 kk 使 Ak=IA^k=I
  • 当所有特征量 λi<1\begin{Vmatrix}\lambda_i\end{Vmatrix}<1, uk\vec{u}_k 将逐渐趋于 00, 系统趋于稳定
    反之, 当存在 λi>1\begin{Vmatrix}\lambda_i\end{Vmatrix}>1, 系统的参数将逐渐发散
  • λi\lambda_i 为特征值中的最大值, 且 λi>1\begin{Vmatrix}\lambda_i\end{Vmatrix}>1, 则认为 kk 时刻下系统的参数 ukxiλikci\vec{u}_{k}\approx \vec{x}_i\lambda_i^k c_i

差分方程求解示例

以斐波那契数列为例展示状态方程的应用
对于斐波那契数列有初始条件 f0=0,f1=1f_0=0,f_1=1
数列中的值满足 fk+2=fk+1+fkf_{k+2}=f_{k+1}+f_{k}
由于方程中存在两个参数, 因此可以令参数向量 u=[fk+1fk]T\vec{u}=\begin{bmatrix}f_{k+1}&f_{k}\end{bmatrix}^T
同时补充方程 fk+1=fk+1f_{k+1}=f_{k+1}, 使参数与方程数相当
此时有状态方程

{fk+2=fk+1+fkfk+1=fk+1uk+1=[1110]uk \begin{cases} f_{k+2}=f_{k+1}+f_{k}\\ f_{k+1}=f_{k+1} \end{cases} \to \vec{u}_{k+1}=\begin{bmatrix}1&1\\1&0\end{bmatrix}\vec{u}_{k}

对于状态方程中的矩阵 A=[1110]A=\begin{bmatrix}1&1\\1&0\end{bmatrix}, 求该矩阵的特征值

1λ11λ=0λ2λ1=0 \begin{split} \begin{vmatrix}1-\lambda&1\\1&-\lambda\end{vmatrix}&=0\\ \lambda^2-\lambda-1&=0 \end{split}

解得

λ1=1+521.618λ2=1520.618 \lambda_1=\frac{1+\sqrt{5}}{2}\approx 1.618\quad\lambda_2=\frac{1-\sqrt{5}}{2}\approx -0.618

其中 λ1>1\begin{Vmatrix}\lambda_1\end{Vmatrix}>1, λ2<1\begin{Vmatrix}\lambda_2\end{Vmatrix}<1, 因此当 kk 足够大时, fkC1.618kf_k\approx C\cdot 1.618^k

通过具体求解可得两个特征值分别对应特征向量

x1=[1+521]x2=[1521] \vec{x}_1=\begin{bmatrix}\frac{1+\sqrt{5}}{2}\\1\end{bmatrix}\quad \vec{x}_2=\begin{bmatrix}\frac{1-\sqrt{5}}{2}\\1\end{bmatrix}

通过 Sc=u0S\vec{c}=\vec{u}_0 求解分量 c\vec{c} 可得, 对于两个特征向量, 有线性组合

u0=15x115x2 \vec{u}_0=\frac{1}{\sqrt{5}}\vec{x}_1-\frac{1}{\sqrt{5}}\vec{x}_2

最终解得数列的通项公式为

fk=15(1+52)k15(152)k f_k=\frac{1}{\sqrt{5}}(\frac{1+\sqrt{5}}{2})^k-\frac{1}{\sqrt{5}}(\frac{1-\sqrt{5}}{2})^k

连续微分状态方程

同样以向量 u\vec{u} 表示系统特定状态下的一组参数
此时系统关于时间连续, 系统各个参数的变化量满足线性微分方程组

dudt=Au \frac{\mathrm{d}\vec{u}}{\mathrm{d}t}=A\vec{u}

注意, 此时 u\vec{u} 是一个关于时间 tt 的函数, 且通常有确定的初态 u(0)\vec{u}(0)
u(t)\vec{u}(t) 投影到特征矩阵 SS 上, 得到投影分量 v(t)\vec{v}(t), 令 u(t)=Sv\vec{u}(t)=S\vec{v}, 此时方程有

dudt=AuSdvdt=SΛS1Sv(t)dvdt=Λv(t) \begin{split}\frac{\mathrm{d}\vec{u}}{\mathrm{d}t}&=A\vec{u}\\ S\frac{\mathrm{d}\vec{v}}{\mathrm{d}t}&=S\Lambda S^{-1} S\vec{v}(t)\\ \frac{\mathrm{d}\vec{v}}{\mathrm{d}t}&=\Lambda\vec{v}(t) \end{split}

通过变形后, 方程各个变量被解耦为 nn 个仅与 vi(t)v_i(t) 有关的一阶微分方程 dvidt=λivi(t)\frac{\mathrm{d}v_i}{\mathrm{d}t}=\lambda_i v_i(t)
对于这类微分方程解的一般形式即 vi(t)=Cieλitv_i(t)=C_ie^{\lambda_i t}
因此方程的解为

u(t)=Sv(t)=i=1nCixieλit \vec{u}(t)=S\vec{v}(t)=\sum_{i=1}^nC_i\vec{x}_ie^{\lambda_i t}

tt\to\infty 时, 认为系统达到稳态

  • 对于 Re[λi]<0Re[\lambda_i]<0, 分量 eλit=eaiteibt=eait10\begin{Vmatrix}e^{\lambda_i t}\end{Vmatrix}=\begin{Vmatrix}e^{-a_i t}\end{Vmatrix}\begin{Vmatrix}e^{ib t}\end{Vmatrix}=\begin{Vmatrix}e^{-a_i t}\end{Vmatrix}\cdot 1\to 0
    该分量的效果会随时间不断减弱, 并在稳态消失
  • 对于 λi=0\lambda_i=0, 其在 u\vec{u} 中为一个不随时间变化的常数项
  • 对于 Re[λ]>0Re[\lambda]>0, 相反此分量将 eλit\begin{Vmatrix}e^{\lambda_i t}\end{Vmatrix}\to\infty
  • 因此仅当矩阵的任意特征值满足 Re[λi]<0Re[\lambda_i]<0λi=0\lambda_i=0, 系统才能收敛于一个有限的状态, 即系统稳定的条件

微分方程求解示例

假设系统参数 u1,u2u_1,u_2 有初态 u(0)=[10]T\vec{u}(0)=\begin{bmatrix}1&0\end{bmatrix}^T
满足以下微分方程

{du1dt=u1+2u2du2dt=u12u2dudt=[1212]u \begin{cases} \frac{\mathrm{d}u_1}{\mathrm{d}t}=-u_1+2u_2\\ \frac{\mathrm{d}u_2}{\mathrm{d}t}=u_1-2u_2 \end{cases} \to \frac{\mathrm{d}\vec{u}}{\mathrm{d}t}= \begin{bmatrix} -1&2\\ 1&-2 \end{bmatrix}\vec{u}

对于状态方程中的矩阵 A=[1212]A=\begin{bmatrix}-1&2\\1&-2\end{bmatrix}, 求该矩阵的特征值

1λ212λ=0λ2+3λ=0 \begin{split} \begin{vmatrix}-1-\lambda&2\\1&-2-\lambda\end{vmatrix}&=0\\ \lambda^2+3\lambda&=0 \end{split}

解得

λ1=0λ2=3 \lambda_1=0\quad\lambda_2=-3

其中 λ1=0\lambda_1=0, λ2<0\lambda_2<0, 因此当 tt 足够大时, λ2\lambda_2 的影响将逐渐消失, 系统将趋近于稳态 C1x1C_1\vec{x}_1

通过具体求解可得两个特征值分别对应特征向量与解的形式

x1=[21]x2=[11]u(t)=C1[21]+C2e3t[11] \begin{split} &\vec{x}_1=\begin{bmatrix}2\\1\end{bmatrix}\quad \vec{x}_2=\begin{bmatrix}1\\-1\end{bmatrix}\\ &\vec{u}(t)=C_1\begin{bmatrix}2\\1\end{bmatrix}+C_2e^{-3t}\begin{bmatrix}1\\-1\end{bmatrix} \end{split}

通过初态条有

C1[21]+C2[11]=[2111][C1C2]=[10]=u(0) C_1\begin{bmatrix}2\\1\end{bmatrix}+C_2\begin{bmatrix}1\\-1\end{bmatrix}=\begin{bmatrix}2&1\\1&-1\end{bmatrix}\begin{bmatrix}C_1\\C_2\end{bmatrix}=\begin{bmatrix}1\\0\end{bmatrix}=\vec{u}(0)

解出待定常数 C1,C2C_1,C_2 可得

u(t)=13[21]+13e3t[11] \vec{u}(t)=\frac{1}{3}\begin{bmatrix}2\\1\end{bmatrix}+\frac{1}{3}e^{-3t}\begin{bmatrix}1\\-1\end{bmatrix}

高阶微分量的处理

类似差分方程中的处理

当连续微分状态方程中出现了高阶微分量如 u1(m)=dmu1dtmu_1^{(m)}=\frac{\mathrm{d}^mu_1}{\mathrm{d}t^m}
可将阶数低于 mm 的微分量视为独立的参数, 并补充方程 ddt[u1(i)]=u1(i+1)\frac{\mathrm{d}}{\mathrm{d}t}[u_1^{(i)}]=u_1^{(i+1)}

例如常系数微分方程 y+ay+by+cy=0y'''+ay''+by''+cy=0 有最高阶微分量 yy''', 因此将剩余参数与微分量视为独立的参数 u3=y  u2=y;u1=yu_3=y\;u_2=y';u_1=y''
此时有状态方程

dudt=[yyy]=[abc100010][yyy] \frac{\mathrm{d}\vec{u}}{\mathrm{d}t}= \begin{bmatrix} y'''\\ y''\\ y' \end{bmatrix}= \begin{bmatrix} -a&-b&-c\\ 1&0&0\\ 0&1&0 \end{bmatrix} \begin{bmatrix} y''\\ y'\\ y \end{bmatrix}

对于多个参数的处理方式相同

系统稳定判据

对于二参数的系统, 有系数矩阵 A=[abcd]A=\begin{bmatrix}a&b\\c&d\end{bmatrix}
根据稳定性的要求有 Re[λ1],Re[λ2]<0Re[\lambda_1],Re[\lambda_2]<0

特征值的特性可得, 此时

{tr(A)=λ1+λ2<0det(A)=λ1λ2>0{tr(A)=a+d<0det(A)=adcb>0 \begin{cases} tr(A)=\lambda_1+\lambda_2<0\\ \det(A)=\lambda_1\lambda_2>0 \end{cases} \to \begin{cases} tr(A)=a+d<0\\ \det(A)=ad-cb>0 \end{cases}

矩阵指数

为了求解连续微分状态方程, 还有另一思路, 即直接计算矩阵指数 eAte^{At}

首先将 eAte^{At} 以泰勒级数的方式展开有 (注意, tt 为一个标量)

eAt=limji=0j(At)ii!=limji=0jSΛiS1tii!=limjS(i=0jΛitii!)S1=SeΛtS1 \begin{split} e^{At}&=\lim_{j\to\infty}\sum_{i=0}^j\frac{(At)^i}{i!}\\ &=\lim_{j\to\infty}\sum_{i=0}^j\frac{S\Lambda^{i} S^{-1}t^i}{i!}\\ &=\lim_{j\to\infty}S\Big(\sum_{i=0}^j\frac{\Lambda^{i}t^i}{i!}\Big)S^{-1}\\ &=Se^{\Lambda t}S^{-1} \end{split}

其中根据对角矩阵的特性, eΛte^{\Lambda t} 满足

SeΛtS1=limjS[i=0j(λ1t)ii!000000i=0j(λnt)ii!]S1=limjS[eλ1t000000eλnt]S1 \begin{split} Se^{\Lambda t}S^{-1}&=\lim_{j\to\infty}S\begin{bmatrix} \sum_{i=0}^j\frac{(\lambda_1t)^i}{i!}&0&\dots&0\\ 0&\ddots&&0\\ \vdots&&\ddots&\vdots\\ 0&0&\dots&\sum_{i=0}^j\frac{(\lambda_n t)^i}{i!} \end{bmatrix} S^{-1}\\ &=\lim_{j\to\infty}S\begin{bmatrix} e^{\lambda_1 t}&0&\dots&0\\ 0&\ddots&&0\\ \vdots&&\ddots&\vdots\\ 0&0&\dots&e^{\lambda_n t} \end{bmatrix} S^{-1} \end{split}

因此连续微分状态方程 dudt=Au\frac{\mathrm{d}\vec{u}}{\mathrm{d}t}=A\vec{u} 的解 u(t)\vec{u}(t) 满足 (使用此处的推导也能得到同样的结果)

u(t)=eAtu(0)=SeΛtS1u(t) \vec{u}(t)=e^{At}\vec{u}(0)=Se^{\Lambda t}S^{-1}\vec{u}(t)

但是注意, 结论 eAt=SeΛtS1e^{At}=Se^{\Lambda t}S^{-1} 仅在 AA 满足对角化的条件下成立

马尔可夫矩阵

马尔科夫矩阵是离散差分状态方程中一类特殊的系数矩阵

定义当 n×nn\times n 的方阵 AA 满足以下条件时, 称之为马尔可夫矩阵

  • 矩阵的各列元素之和等于 11
  • 矩阵的各个元素大于等于 00

马尔可夫矩阵的特征值将具有以下特性

  1. 马尔可夫矩阵的任意特征值满足 λi0\begin{Vmatrix}\lambda_i\end{Vmatrix}\ge 0
  2. 马尔可夫矩阵存在至少一个特征值满足 λk=1\lambda_k=1
  3. 马尔科夫矩阵的任意次幂依然是马尔科夫矩阵

由马尔可夫矩阵的特性与离散差分状态方程稳态与 λ\lambda 的关系可得, 当系统的系数矩阵为马尔科夫矩阵时, 当 kk 足够大, 系统参数将仅与 λi=1\lambda_i=1 对应的特征向量有关
并且马尔科夫矩阵中, 状态参数之和始终不变

现就特性二给出证明
由于矩阵各列元素之和为 11, 因此矩阵 AIA-I 的各列元素之和为 00
这表明矩阵行向量之和为零, 即左零空间 N[(AI)T]N[(A-I)^T] 中存在向量 [111]\begin{bmatrix}1&1&\dots&1\end{bmatrix}
因此矩阵的秩 r<nr<n, 不可逆, 有 det(AI)=0\det(A-I)=0

马尔科夫矩阵示例

基于马尔可夫矩阵的特定, 其往往用于描述一个总和不变的系统中的各个部分随时刻的变化
例如有城市 A,BA,B, 假设两城市总人数不变, 开始时城市人数为 uA=0,uB=1000u_A=0,u_B=1000

  • AA 城每年有 90%90\% 的人口留在 AA 城, 10%10\% 的人口移居到 BB
  • BB 城每年有 80%80\% 的人口留在 BB 城, 20%20\% 的人口移居到 AA

因此有离散状态方程

[uAuB]k+1=[0.90.20.10.8][uAuB]k \begin{bmatrix}u_A\\ u_B\end{bmatrix}_{k+1}=\begin{bmatrix}0.9&0.2\\0.1&0.8\end{bmatrix}\begin{bmatrix}u_A\\ u_B\end{bmatrix}_{k}

最后可以解得

[uAuB]k=10003[21]+20003(0.7)k[11] \begin{bmatrix}u_A\\ u_B\end{bmatrix}_{k}=\frac{1000}{3}\begin{bmatrix}2\\ 1\end{bmatrix}+\frac{2000}{3}(0.7)^k\begin{bmatrix}-1\\ 1\end{bmatrix}