跳至主要內容

正交性

大约 15 分钟

正交性

参考教程 麻省理工公开课 线性代数open in new window P14~P17

正交性的定义 Orthogonal

向量的正交性

对于向量 u,v\vec{u},\vec{v}, 当两个向量满足

uTv=0 \vec{u}^T\cdot\vec{v}=\vec{0}

则称向量 u\vec{u}v\vec{v} 正交

显然

  • 零向量 0\vec{0} 与任何其他向量正交
  • 向量 u,v\vec{u},\vec{v} 均来自向量空间 RnR^n

向量空间的正交性

有向量空间 S,TS,T, 其均为 RnR^n 的子空间
当任意一个来自 SS 的向量与任意一个来自 TT 的向量都满足正交性
则称向量空间 SSTT 正交

显然

  • 当向量空间 S,TS,T 正交时 ST=0S\cap T=\vec{0}

基本子空间的正交性

行空间与零空间正交性证明

对于 m×nm\times n 的矩阵 AA, 其行空间 C(AT)C(A^T) 与零空间 N(A)N(A) 均为向量空间 RnR^n 的子空间

根据零空间的定义可得, 对于任意一个来自零空间 N(A)N(A) 的向量 x\vec{x}

Ax=0[r1Tr2TrmT]x=[000] \begin{split} A\vec{x}&=\vec{0}\\ \begin{bmatrix} \vec{r}_1^T\\ \vec{r}_2^T\\ \vdots\\ \vec{r}_m^T\end{bmatrix} \vec{x}&=\begin{bmatrix} 0\\0\\\vdots\\0 \end{bmatrix} \end{split}

AA 视为一个由行向量 riT\vec{r}_i^T 组成的向量, x\vec{x} 视为一个 n×1n\times 1 的矩阵, 则该等式表明, AA 中的每一行均与 x\vec{x} 正交

由于行空间 C(AT)C(A^T) 的一组基来自 AA 的主元行, 因此上式也表明 x\vec{x} 与行空间的一组基 ak\vec{a}_k 正交, 有 xTak=0\vec{x}^T\vec{a}_k=\vec{0}

因此对于来自行空间的任意向量 a\vec{a}

xTa=xT(c1a1+c2a2++crar)=0 \vec{x}^T\vec{a}=\vec{x}^T(c_1\vec{a}_1+c_2\vec{a}_2+\dots +c_r\vec{a}_r)=\vec{0}

因此对于来自同一矩阵 AA行空间与零空间具有正交性
同理可得, 来自同一矩阵 AA列空间与左零空间具有正交性

正交补

注意到, 行空间的维数 dim[C(AT)]=rdim[C(A^T)]=r, 零空间的维数 dim[N(A)]=nrdim[N(A)]=n-r, 这两个空间均为 RnR^n 的子空间

由于行空间与零空间正交, 因此行空间与零空间分别完全占据了 RnR^n 的两个维度
零空间不仅仅与行空间正交, 而且零空间是与行空间正交的, 维数最大的向量空间
以此定义, 零空间为行空间的正交补

同理, 左零空间为列空间的正交补

由此可得, 对于任意向量 xRn\vec{x}\in R^n, 必定可以分解为 x=a+b\vec{x}=\vec{a}+\vec{b}, 其中 aC(AT),bN(A)\vec{a}\in C(A^T),\vec{b}\in N(A)
xRm\vec{x}\in R^m 同理

投影矩阵

向量投影

以二维空间举例, 现有二维空间中的向量 a,b\vec{a},\vec{b}

a\vec{a} 为基底构成以一个向量空间 C(a)C(\vec{a}), 这个空间在二维平面中即一条过原点的直线
C(a)C(\vec{a}) 中一定有一个向量 p=xa\vec{p}=x\vec{a}, 使 b\vec{b}p\vec{p} 距离最近
以此定义 b\vec{b}a\vec{a} 上的投影p\vec{p}

显然直线 BPBPC(a)C(\vec{a}) 的一条垂线, 向量 e=bp\vec{e}=\vec{b}-\vec{p} 与向量 a\vec{a} 正交, 因此

aT(bp)=0xaTa=aTbx=aTbaTap=aaTbaTa \begin{split} \vec{a}^T(\vec{b}-\vec{p})&=\vec{0}\\ x\vec{a}^T\vec{a}&=\vec{a}^T\vec{b}\\ x&=\frac{\vec{a}^T\vec{b}}{\vec{a}^T\vec{a}}\\ \vec{p}&=\vec{a}\frac{\vec{a}^T\vec{b}}{\vec{a}^T\vec{a}} \end{split}

根据 p\vec{p} 的表达式可知

  1. 即使 a\vec{a} 乘上任意倍数, 投影 p\vec{p} 不变
  2. b\vec{b} 乘上 kk 倍, 则投影 p\vec{p} 也将乘上 kk

向量投影矩阵

在投影向量的推导中, aTa\vec{a}^T\vec{a} 得到一个数, 而 aaT\vec{a}\vec{a}^T 得到一个方阵

p=aaTaTabp=Pb \begin{split} \vec{p}&=\frac{\vec{a}\vec{a}^T}{\vec{a}^T\vec{a}}\vec{b}\\ \vec{p}&=P\vec{b} \end{split}

因此可将获得 b\vec{b}C(a)C(\vec{a}) 上的投影运算使用 b\vec{b} 与投影矩阵 PP 的相乘表示

向量投影矩阵的性质

  1. 投影矩阵来自两个向量相乘, 因此投影矩阵为一个秩一矩阵, 有 r=1r=1
  2. 将向量 a\vec{a} 视为矩阵, 则可以知道, 投影矩阵为一个对称矩阵, 有 P=PTP=P^T
  3. b\vec{b} 投影到 p\vec{p}, 显然向量空间 C(a)C(\vec{a}) 上离 p\vec{p} 最近的点即 p\vec{p} 自身
    因此可以推出投影矩阵满足 P2=PP^2=P

一般投影

RnR^n 空间中有
向量 b\vec{b}, 在 RnR^n 空间中体现为一条直线
向量空间 C(A)C(A)RnR^n 空间中体现为一个多维平面

C(A)C(A) 中一定有一个向量 p=Ax\vec{p}=A\vec{x}, 使 b\vec{b}p\vec{p} 距离最近
以此定义 b\vec{b} 在向量空间 C(A)C(A) 上的投影p\vec{p}
(注意向量 x\vec{x} 为线性组合得到 p\vec{p} 的系数, 因此 x\vec{x} 反映了 b\vec{b} 投影到 C(A)C(A) 各个方向的分量)

显然误差向量 e=bp\vec{e}=\vec{b}-\vec{p} 与向量空间 C(A)C(A) 中的任意向量正交 (直线 BPBP 垂直于多维平面 C(A)C(A))

根据正交补的概念可得, e\vec{e} 必定属于 C(A)C(A) 的正交补 N(AT)N(A^T)
根据左零空间 N(AT)N(A^T) 的性质可得 e\vec{e} 满足

ATe=0AT(bAx)=0ATAx=ATbx=(ATA)1ATbp=A(ATA)1ATb \begin{split} A^T\vec{e}&=\vec{0}\\ A^T(\vec{b}-A\vec{x})&=\vec{0}\\ A^TA\vec{x}&=A^T\vec{b}\\ \vec{x}&=(A^TA)^{-1}A^T\vec{b}\\ \vec{p}&=A(A^TA)^{-1}A^T\vec{b} \end{split}

其中

  • p=A(ATA)1ATb=Pb\vec{p}=A(A^TA)^{-1}A^T\vec{b}=P\vec{b} 可计算向量 b\vec{b} 在列空间 C(A)C(A) 上的投影
  • x=(ATA)1ATb\vec{x}=(A^TA)^{-1}A^T\vec{b} 可计算 PbP\vec{b} 关于矩阵 AA 各列的分量
    (实际上, 如果 b\vec{b} 在向量空间 C(A)C(A) 中时, 仅需求解线性方程组 Ax=bA\vec{x}=\vec{b} 即可得到 b\vec{b} 相对 C(A)C(A) 各列的分量 x\vec{x}, 并不需要投影)

一般投影矩阵

根据高维投影向量 p\vec{p} 的推导可得, 一般情况下的投影矩阵满足

P=A(ATA)1AT P=A(A^TA)^{-1}A^T

对于一般投影矩阵可以得到以下性质

  1. 由于 AA 不一定是可逆矩阵, 因此其中的 (ATA)1(A^TA)^{-1} 不能消去
    但当 AA 为可逆矩阵时, 有 P=IP=I, 表明 b\vec{b}RnR^n 的投影即 b\vec{b} 自身
  2. 投影矩阵 PP 为对称矩阵
  3. 投影矩阵 PP 满足 P2=PP^2=P

注意

  • 矩阵 AA 的各列必须线性无关, 即矩阵应当列满秩 m=rm=r
  • AA 为可逆矩阵时, 必定有 P=IP=I (证明略)
  • AA 为不可逆矩阵, 则应取其中的主元列计算 PP, 而不能直接使用公式

投影矩阵的实际意义

  • 假设 b\vec{b} 垂直于空间 C(A)C(A) (b\vec{b}C(A)C(A) 中的每个向量正交), 因此 bN(AT)\vec{b}\in N(A^T), ATb=0A^T\vec{b}=\vec{0}
    此时 Pb=A(ATA)1ATb=A(ATA)10=0P\vec{b}=A(A^TA)^{-1}A^T\vec{b}=A(A^TA)^{-1}\vec{0}=\vec{0}
    因此 Pb=0P\vec{b}=\vec{0}, b\vec{b}C(A)C(A) 中不存在任何分量

  • 假设 b\vec{b} 在空间 C(A)C(A) , 因此存在 x\vec{x} 满足 Ax=bA\vec{x}=\vec{b}
    此时 Pb=A(ATA)1ATb=A(ATA)1ATAx=bP\vec{b}=A(A^TA)^{-1}A^T\vec{b}=A(A^TA)^{-1}A^TA\vec{x}=\vec{b}
    因此 Pb=bP\vec{b}=\vec{b}, b\vec{b} 的分量均来自 AA

有上可得, 投影矩阵 PP 的本质为去除所有垂直于 C(A)C(A) 的分量, 并保留平行于 C(A)C(A) 的分量
由此也可知, 来自 AA 的投影矩阵的列空间 C(P)C(P)AA 的列空间 C(A)C(A) 相同

由于误差向量满足 e=bp\vec{e}=\vec{b}-\vec{p}, 通过运算, 接受了所有投影到 C(A)C(A) 过程中被剔除的向量
如图所示, 显然 e\vec{e} 也为一个投影, 是 b\vec{b}C(A)C(A)正交补 N(AT)N(A^T) 上的投影
因此 e=Pb=(IP)b\vec{e}=P'\vec{b}=(I-P)\vec{b}P=(IP)P'=(I-P) 是一个投影到空间 N(AT)N(A^T) 的投影矩阵
同样满足一般投影矩阵的性质 (IP)2=(IP)(I-P)^2=(I-P)(IP)T=(IP)T(I-P)^T=(I-P)^T

最小二乘法与正规方程

正规方程

对于线性方程组 Ax=bA\vec{x}=\vec{b}, 其中 AAm×nm\times n 的矩阵

按行来看, 其表明了系统在条件 ai1,ai2,,aina_{i1},a_{i2},\dots,a_{in} 下有测量值 bib_{i}
向量 x\vec{x} 则为系统的参数
以线性系统为例, 对于自变量 tt, 系统满足 f(t)=x2t+x1f(t)=x_2t+x_1
因此此时条件为 ai2=ta_{i2}=t, ai1=1a_{i1}=1 (条件之间可能有关或完全无关)

由于 bib_{i}AA 存在误差, 一般无法通过直接求解方程得到 x\vec{x} (假设测量大于未知参数, m>nm>n)
因此退而求其次, 寻找一个最优解 x^\vec{\hat{x}}
显然, 这个最有解 Ax^=pA\vec{\hat{x}}=\vec{p} 对于各个测量值 b\vec{b} 存在误差 e=bp\vec{e}=\vec{b}-\vec{p}
要求最优解能够使误差的平方和 e2=(bAx^)2\vec{e}^2=(\vec{b}-A\vec{\hat{x}})^2 最小 (也称为最小二乘)

按列来看, 各个同类的参数分别构成了 AA 的各列, 并生成 RmR^m 下的子空间 C(A)C(A)
可以发现, 待求的 p\vec{p}b\vec{b}C(A)C(A) 投影

因此

p=Ax^=PbAx^=A(ATA)1ATbATAx^=ATb \begin{split} \vec{p}=A\vec{\hat{x}}&=P\vec{b}\\ A\vec{\hat{x}}&=A(A^TA)^{-1}A^T\vec{b}\\ A^TA\vec{\hat{x}}&=A^T\vec{b} \end{split}

由此也可得, 对于 m>nm>n, 即方程数大于未知数的无解线性方程, 通过两侧乘上 ATA^T, 即可得到误差平方和最小的最优解 x^\vec{\hat{x}}
也将方程 ATAx^=ATbA^TA\vec{\hat{x}}=A^T\vec{b} 称为正规方程

通过对 f(x)=(bAx^)2f(\vec{x})=(\vec{b}-A\vec{\hat{x}})^2 分别对 xix_i 求偏导并令偏导为 00 可得到相同的结果

最小二乘法举例

现有系统 f(t)f(t), 经测量有 f(1)=1,f(2)=2,f(3)=2f(1)=1,f(2)=2,f(3)=2
假设 f(t)=x1+x2tf(t)=x_1+x_2tx2,x1x_2,x_1

根据题目条件可得 x2,x1x_2,x_1 满足线性方程

[111213][x1x2]=[122] \begin{bmatrix} 1&1\\ 1&2\\ 1&3\\ \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ \end{bmatrix}= \begin{bmatrix} 1\\ 2\\ 2 \end{bmatrix}

显然方程无解, 设系数矩阵 AA, 测量向量 b\vec{b}, 使用最小二乘法求出最优解 x^\vec{\hat{x}}

AT[Ab]=[123111][111122132]=[36561411]x^=[2/31/2] \begin{split} A^T\begin{bmatrix} A\Big|\vec{b} \end{bmatrix}&=\begin{bmatrix} 1&2&3\\ 1&1&1\\ \end{bmatrix} \begin{bmatrix} 1&1&\big|&1\\ 1&2&\big|&2\\ 1&3&\big|&2\\ \end{bmatrix}\\ &=\begin{bmatrix} 3&6&\big|&5\\ 6&14&\big|&11\\ \end{bmatrix}\\ &\to\vec{\hat{x}}= \begin{bmatrix} 2/3\\ 1/2 \end{bmatrix} \end{split}

因此 f^(x)=12t+23\hat{f}(x)=\frac{1}{2}t+\frac{2}{3}

关于投影矩阵的补充说明

注意到, 无论是最小二乘法, 还是投影矩阵 PP 的导出中, 都要求方阵 ATAA^TA 为可逆矩阵

矩阵与其转置之积的秩可得, 为了满足此条件, 要求 AA 的各列线性无关, 仅有在此条件下 ATAA^TA 可逆, 存在投影矩阵 PP

标准正交 Othonormal

标准正交基

对于一系列属于 RmR^m 空间的向量 {q}\{\vec{q}\} 满足

{qiTqj=0,ijqiTqj=1,i=j \begin{cases} \vec{q}_i^T\cdot\vec{q}_j=0,&i\neq j\\ \vec{q}_i^T\cdot\vec{q}_j=1,&i=j \end{cases}

第一行的条件表明, qi\vec{q}_i 与组内的其他向量正交
第二行的条件表明, qi\vec{q}_i 的长度为 11
则称 {q}\{\vec{q}\} 为一组标准正交基

标准正交矩阵

以标准正交基为列, 可得到一个 m×nm\times n 的矩阵 Q=[q1q2qn]Q=\begin{bmatrix}\vec{q}_1&\vec{q}_2&\dots&\vec{q}_n\end{bmatrix}

根据标准正交基的性质可得

QTQ=[q1Tq2TqnT][q1q2qn]=In×n Q^TQ=\begin{bmatrix}\vec{q}_1^T\\\vec{q}_2^T\\\dots\\\vec{q}_n^T\end{bmatrix}\begin{bmatrix}\vec{q}_1&\vec{q}_2&\dots&\vec{q}_n\end{bmatrix}=I_{n\times n}

特别地, 当 n=mn=m, QQ 为一个方阵, 此时称 QQ标准正交矩阵, 简称正交矩阵
可得, 标准正交矩阵有性质: 标准正交矩阵为可逆矩阵且 QT=Q1Q^T=Q^{-1}

对标准正交基的投影

对于以标准正交基为列的 m×nm\times n 矩阵 QQ (注意 QQ 可能是长方形矩阵, 不存在 Q1Q^{-1}, 且没有性质 QQT=IQQ^T=I), 其有投影矩阵

P=Q(QTQ)1QT=Q(I)1QT=QQT P=Q(Q^TQ)^{-1}Q^T=Q(I)^{-1}Q^T=QQ^T

而在正规方程中

QTQx=QTbx=QTb \begin{split} Q^TQ\vec{x}&=Q^T\vec{b}\\ \vec{x}&=Q^T\vec{b} \end{split}

因此仅需计算 QTbQ^T\vec{b}, 即可得到 b\vec{b} 在标准正交基 {q}\{\vec{q}\} 上的分量 x\vec{x}

Gram-Schmidt 正交化

现有矩阵 A=[a1a2an]A=\begin{bmatrix}\vec{a}_1&\vec{a}_2&\dots&\vec{a}_n\end{bmatrix}, 通过 Gram-Schmidt 正交化, 可得到一组标准正交基组成的矩阵 Q=[q1q2qn]Q=\begin{bmatrix}\vec{q}_1&\vec{q}_2&\dots&\vec{q}_n\end{bmatrix}
同时两个矩阵 C(A)=C(Q)C(A)=C(Q) 具有相同的列空间

假定 AA 列满秩, 其各列 ai\vec{a}_i 即子空间 C(A)C(A) 的一组基

正交化过程

首先对向量集 {a}\{\vec{a}\} 进行逐个正交化, 得到相互正交且标准的向量集 {h}\{\vec{h}\}, 然后将 {h}\{\vec{h}\} 标准化, 得到待求的标准正交基 {q}\{\vec{q}\}

  • 为了保证 hi\vec{h}_i 与其余向量正交, 可以令 hi\vec{h}_ih1,,hi1\vec{h}_1,\dots,\vec{h}_{i-1} 正交
  • 为了保证 C(A)=C(H)C(A)=C(H), 可以令 hi\vec{h}_i 来自 a1,,ai\vec{a}_1,\dots,\vec{a}_i 的线性组合, 注意该条件也等价于 hi\vec{h}_i 来自 q1,,qi1\vec{q}_1,\dots,\vec{q}_{i-1}ai\vec{a}_i 的线性组合

对于取出的第一个向量 a1\vec{a}_1
由于此时 {h}\{\vec{h}\} 中没有其他向量, 因此 h1=a1\vec{h}_1=\vec{a}_1

对于取出的第二个向量 a2\vec{a}_2
根据向量投影的特点可以发现, 在获取误差向量 e\vec{e} 的过程中, 误差向量 e\vec{e} 即满足 h2\vec{h}_2 的两个要求 (首先计算 h1Ta2\vec{h}_1^T\vec{a}_2 得到一个数, 使矢量相乘变为数乘, 从而交换向量 h\vec{h} 到右侧)

h2=e=a2h1h1Th1Th1a2=a2h1Ta2h1Th1h1 \vec{h}_2=\vec{e}=\vec{a}_2-\frac{\vec{h}_1\vec{h}_1^T}{\vec{h}_1^T\vec{h}_1}\vec{a}_2=\vec{a}_2-\frac{\vec{h}_1^T\vec{a}_2}{\vec{h}_1^T\vec{h}_1}\vec{h}_1

对于取出的第 kk 个向量 ak\vec{a}_k
根据一般投影的特点可以发现, 在获取误差向量 e\vec{e} 的过程中, 误差向量满足 e\vec{e} 即满足 hi\vec{h}_i 的两个要求
H=[h1h2hk1]H=\begin{bmatrix}\vec{h}_1&\vec{h}_2&\dots&\vec{h}_{k-1}\end{bmatrix}, 根据 h\vec{h} 的正交性, HTHH^TH 将得到一个对角矩阵, 根据对角矩阵矩阵乘法中的叠加法可得

hk=e=akH(HTH)1HTak=aki=1k1hiTakhiThihi \begin{split} \vec{h}_k=\vec{e}&=\vec{a}_k-H(H^TH)^{-1}H^T\vec{a}_k\\ &=\vec{a}_k-\sum_{i=1}^{k-1}\frac{\vec{h}_i^T\vec{a}_k}{\vec{h}_i^T\vec{h}_i}\vec{h}_i \end{split}

最后将计算得到的 {h}\{\vec{h}\} 标准化, 即对每个 hk\vec{h}_k

qk=hhkThk \vec{q}_k=\frac{\vec{h}}{\sqrt{\vec{h}_k^T\vec{h}_k}}

正交化举例

对于一组来自 AA 各列的基, 求空间 C(A)C(A) 的一组标准正交基, 其中 AA 满足

A=[121112211] A=\begin{bmatrix} 1&2&1\\ 1&1&2\\ 2&1&1 \end{bmatrix}

对于第一列向量有 h1=a1\vec{h}_1=\vec{a}_1

对于第二列向量 a2\vec{a}_2

h2=a2h1Ta2h1Th1h1=[211]56[112]=16[714] \begin{split}\vec{h}_2&=\vec{a}_2-\frac{\vec{h}_1^T\vec{a}_2}{\vec{h}_1^T\vec{h}_1}\vec{h}_1\\ &=\begin{bmatrix} 2\\1\\1 \end{bmatrix} -\frac{5}{6} \begin{bmatrix} 1\\1\\2 \end{bmatrix}\\ &=\frac{1}{6} \begin{bmatrix} 7\\1\\-4 \end{bmatrix} \end{split}

对于第三列向量 a3\vec{a}_3 有 (注意到 h2\vec{h}_2 的提出数乘部分对结果没有影响)

h3=a3h1Ta3h1Th1h1h2Ta3h2Th2h2=[121]56[112]566[714]=411[131] \begin{split}\vec{h}_3&=\vec{a}_3-\frac{\vec{h}_1^T\vec{a}_3}{\vec{h}_1^T\vec{h}_1}\vec{h}_1-\frac{\vec{h}_2^T\vec{a}_3}{\vec{h}_2^T\vec{h}_2}\vec{h}_2\\ &=\begin{bmatrix} 1\\2\\1 \end{bmatrix} -\frac{5}{6} \begin{bmatrix} 1\\1\\2 \end{bmatrix}-\cdot\frac{5}{66} \begin{bmatrix} 7\\1\\-4 \end{bmatrix}\\ &=\frac{4}{11} \begin{bmatrix} -1\\3\\-1 \end{bmatrix} \end{split}

因此经标准化后, 有由正交基组成的矩阵 QQ 满足

Q=[167661111616631126466111] Q=\begin{bmatrix} \frac{1}{\sqrt{6}}&\frac{7}{\sqrt{66}}&\frac{-1}{\sqrt{11}}\\ \frac{1}{\sqrt{6}}&\frac{1}{\sqrt{66}}&\frac{3}{\sqrt{11}}\\ \frac{2}{\sqrt{6}}&\frac{-4}{\sqrt{66}}&\frac{-1}{\sqrt{11}} \end{bmatrix}

QR 分解

类似 LULU 分解, 使用矩阵的方式描述 Gram-Schmidt 正交化可得, 正交化的本质即将原矩阵 AA 分解为一个标准正交基组成的矩阵 QQ (注意 AA 不一定是方阵) 与一个变形矩阵 RR
因此也称为 QRQR 分解, 有

A=QR A=QR

根据 Gram-Schmidt 正交化的公式可知, 简单变形后也可视为 ak\vec{a}_k 来自 h1hk\vec{h}_1\dots\vec{h}_k 的线性组合, 将系数提取即可组成矩阵 RR 的各列
因此对于 m×nm\times n 的矩阵 AA, RR 为一个 n×nn\times n 的上三角矩阵满足

R=[h1q1Ta2q1Ta3q1Tan0h2q2Ta3q2Tan00h3q3Tan000hn1qn1Tan0000hn] R=\begin{bmatrix} |\vec{h}_1|&\vec{q}_1^T\vec{a}_2&\vec{q}_1^T\vec{a}_3&\dots&\vec{q}_1^T\vec{a}_n\\ 0&|\vec{h}_2|&\vec{q}_2^T\vec{a}_3&\dots&\vec{q}_2^T\vec{a}_n\\ 0&0&|\vec{h}_3|&\dots&\vec{q}_3^T\vec{a}_n\\ \vdots&&&&\vdots\\ 0&0&0&|\vec{h}_{n-1}|&\vec{q}_{n-1}^T\vec{a}_n\\ 0&0&0&0&|\vec{h}_{n}| \end{bmatrix}

除此之外, 根据以标准正交基构成的矩阵的特点可得

QTA=QTQR=R Q^TA=Q^TQR=R