线性代数:特征值

特征值和特征向量

线性代数:线性空间与线性映射一文可知,一个线性变换在不同基下的表示矩阵是相似的。现在探讨哪类矩阵相似于对角阵,以及如何找到对应的基。

\(\boldsymbol{\varphi}\)是数域\(\mathbb{K}\)上的线性空间\(V\)的线性变换,如果\(\lambda \in \mathbb{K}\)\(\boldsymbol{x} \in V\)\(\boldsymbol{x} \neq \boldsymbol{0}\)满足 \[ \boldsymbol{\varphi}(\boldsymbol{x}) = \lambda\boldsymbol{x} \]

则称\(\lambda\)是线性变换\(\boldsymbol{\varphi}\)的一个特征值\(\boldsymbol{x}\)称为\(\boldsymbol{\varphi}\)关于特征值\(\lambda\)特征向量。从几何上看,该线性变换仅改变了向量的长度。\(\boldsymbol{\varphi}\)属于特征值\(\lambda\)的全体特征向量加上零向量构成\(V\)的一个子空间,记为\(V_{\lambda}\),是\(\boldsymbol{\varphi}\)的不变子空间,也称为特征子空间。如果\(\boldsymbol{\varphi}\)在某组基下的表示矩阵为\(\boldsymbol{A}\),则有 \[ \boldsymbol{A}\boldsymbol{\alpha}=\lambda\boldsymbol{\alpha} \] \[ (\lambda \boldsymbol{I}_n - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0} \]

上面方程的解空间\(V_{\lambda}\)称为\(\boldsymbol{A}\)关于特征值\(\lambda\)的特征子空间。即要求解 \[ \left\vert \lambda\boldsymbol{I}_n - \boldsymbol{A} \right\vert = \boldsymbol{0} \]

该行列式称为\(\boldsymbol{A}\)特征多项式。相似矩阵具有相同的特征多项式和相同的特征值。先解特征方程求出特征值(可能有复根和重根),再将各个特征值代入到方程\((\lambda \boldsymbol{I}_n - \boldsymbol{A})\boldsymbol{\alpha} = \boldsymbol{0}\)中,求出特征值对应的特征向量。

对角化

\(n\)阶方阵\(\boldsymbol{A}\)相似于对角阵的充要条件是\(\boldsymbol{A}\)\(n\)个线性无关的特征向量。类似地,存在一组基使得\(n\)维线性空间\(V\)上的线性变换\(\boldsymbol{\varphi}\)在该组基下的表示矩阵为对角阵的充要条件是\(\boldsymbol{\varphi}\)\(n\)个线性无关的特征向量。

如果\(\boldsymbol{\varphi}\)\(n\)个不同的特征值,则\(\boldsymbol{\varphi}\)可以对角化,原因是属于不同特征值的特征向量是线性无关的。如果特征方程有重根,即特征值有重数,也是可以对角化的。假设\(\boldsymbol{\varphi}\)\(k\)个不同特征值,\(k\leq n\)\(V_i(i=1,2,\cdots,k)\)是特征值\(\lambda_i\)的特征子空间,则\(\boldsymbol{\varphi}\)可以对角化的充要条件是 \[ V = V_1 \oplus V_2 \oplus \cdots \oplus V_k \]

基于上述结论,得到从计算层面上判断可对角化的方法:对于每个特征根\(\lambda_i\),只要其重数与属于\(\lambda_i\)的特征子空间\(V_i\)的维数相等,就可以对角化。简单来说,有重根不可怕,但最后一定要凑齐\(n\)个线性无关的特征向量,所以\(r\)重特征值必须要有\(r\)个线性无关的特征向量。

现假设\(\boldsymbol{A}\)的特征值为\(\lambda_1,\lambda_2,\cdots,\lambda_n\),属于它们的特征向量\(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n\)是线性无关的,根据定义有 \[ \boldsymbol{A}\boldsymbol{\alpha}_i = \lambda_i \boldsymbol{\alpha}_i, \, i=1,2,\cdots,n \] \[ \left( \boldsymbol{A}\boldsymbol{\alpha}_1, \boldsymbol{A}\boldsymbol{\alpha}_2, \cdots, \boldsymbol{A}\boldsymbol{\alpha}_n \right)= \left( \lambda_1\boldsymbol{\alpha}_1, \lambda_1\boldsymbol{\alpha}_2, \cdots, \lambda_n\boldsymbol{\alpha}_n \right) \] \[ \boldsymbol{A} \left( \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n \right)= \left( \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n \right) \left(\begin{matrix} \lambda{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{3}\\ \end{matrix}\right) \]

\(\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)\)\(\boldsymbol{P}\)的列向量分块,\(\boldsymbol{\Lambda}\)\(\lambda_1,\lambda_2,\cdots,\lambda_n\)构成的对角阵,则上面的结果可以写成 \[ \boldsymbol{A}\boldsymbol{P} = \boldsymbol{P}\boldsymbol{\Lambda} \]

所以 \[ \boldsymbol{\Lambda} = \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P} \]

\(\boldsymbol{A}\)与对角阵\(\boldsymbol{\Lambda}\)相似,对角化要求的矩阵\(\boldsymbol{P}\)的求法也一目了然。

极小多项式

数域\(\mathbb{K}\)上的全体\(n \times n\)矩阵组成了\(\mathbb{K}\)上的线性空间,维数为\(n^2\),所以下列\(n^2+1\)个矩阵必然线性相关: \[ \boldsymbol{A}^{n^2},\boldsymbol{A}^{n^2-1},\cdots,\boldsymbol{A},\boldsymbol{I}_n \]

所以存在\(\mathbb{K}\)中不全为零的数\(c_i(i=0,1,2,\cdots,c_{n^2})\),使得 \[ c_{n^2}\boldsymbol{A}^{n^2}+c_{n^2-1}\boldsymbol{A}^{n^2-1}+\cdots+c_1\boldsymbol{A}+c_0\boldsymbol{I}_n=\boldsymbol{O} \]

这表明矩阵\(\boldsymbol{A}\)适合数域\(\mathbb{K}\)上的多项式。所适合的非零多项式中次数最小的,称为极小多项式或最小多项式。任一\(n\)阶矩阵的极小多项式是唯一的。相似的矩阵具有相同的极小多项式。

Cayley-Hamilton定理:设\(\boldsymbol{A}\)是数域\(\mathbb{K}\)上的\(n\)阶矩阵,若\(f(x)\)\(\boldsymbol{A}\)的特征多项式,则\(f(\boldsymbol{A})=\boldsymbol{O}\),该结论对线性变换同样成立。