线性代数:相似标准型

多项式矩阵

相似标准型这部分内容的目的在于,找一类比较简单的矩阵,使任一同阶矩阵均与这类矩阵中的某一个相似。

思路是首先找出相似矩阵的不变量,不仅在相似关系下保持不变,而且足以判断两个矩阵是否相似,这叫做全系不变量;然后找出一类比较简单的矩阵,利用全系不变量判断与这类矩阵中的某个相似。

多项式矩阵,或\(\lambda\)-矩阵,指的是矩阵的元素\(a_{ij}(\lambda)\)是以\(\lambda\)为未定元的数域\(\mathbb{K}\)上的多项式。\(\lambda\)-矩阵的初等行(列)变换有3种,分别是两行(列)对换、某行(列)乘以非零常数\(c\)、某行(列)乘以多项式\(f(\lambda)\)后加到另一行(列)。\(\lambda\)-矩阵经初等变换得到的矩阵与原来矩阵相抵。3种初等变换对应的矩阵称为初等\(\lambda\)-矩阵。左(右)乘初等\(\lambda\)-矩阵等于初等行(列)变换。两个\(\lambda\)-矩阵相乘等于\(\boldsymbol{I}_n\),则互为逆矩阵。

得到重要的结论:数域\(\mathbb{K}\)上的矩阵\(\boldsymbol{A}\)\(\boldsymbol{B}\)相似的充要条件是\(\lambda\)-矩阵\(\lambda\boldsymbol{I}-\boldsymbol{A}\)\(\lambda\boldsymbol{I}-\boldsymbol{B}\)相抵。这里需要再强调下相似相抵的区别,\(\boldsymbol{A}\)\(\boldsymbol{B}\)相似则存在可逆阵\(\boldsymbol{P}\)使得\(\boldsymbol{B}=\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\)\(\lambda\boldsymbol{I}-\boldsymbol{A}\)\(\lambda\boldsymbol{I}-\boldsymbol{B}\)相抵则二者可以通过初等变换得到对方。相抵也可以称为等价。

矩阵的法式

现在求\(\lambda\)-矩阵的相抵标准型。任一\(n\)\(\lambda\)-矩阵\(\boldsymbol{A}(\lambda)\)相抵于对角阵 \[ \mathrm{diag}\{d_1(\lambda),d_2(\lambda),\cdots,d_r(\lambda);0,\cdots,0\}= \left(\begin{matrix} d_1(\lambda) & & & & & &\\ & d_2(\lambda) & & & & &\\ & & \ddots & & & &\\ & & & d_r(\lambda) & & &\\ & & & & 0 & &\\ & & & & & \ddots &\\ & & & & & & 0\\ \end{matrix}\right) \]

其中\(d_i(\lambda)\)是非零首一多项式且\(d_i(\lambda) | d_{i+1}(\lambda)\,(i=1,2,\cdots,r-1)\),这里的\(r\)称为\(\boldsymbol{A}(\lambda)\)的秩。需要注意,\(\lambda\)-矩阵的秩\(r=n\)并不意味着它可逆。上面的对角\(\lambda\)-矩阵称为\(\boldsymbol{A}(\lambda)\)法式相抵标准型

数域\(\mathbb{K}\)上的\(n\)阶矩阵\(\boldsymbol{A}\)的特征矩阵\(\lambda\boldsymbol{I}_n-\boldsymbol{A}\)必相抵于 \[ \mathrm{diag}\{1,\cdots,1,d_1(\lambda),\cdots,d_m(\lambda)\}= \left(\begin{matrix} 1 & & & & &\\ & \ddots & & & &\\ & & 1 & & &\\ & & & d_1(\lambda) & &\\ & & & & \ddots &\\ & & & & & d_m(\lambda)\\ \end{matrix}\right) \]

其中\(d_i(\lambda) | d_{i+1}(\lambda)\,(i=1,2,\cdots,m-1)\)\(\lambda\boldsymbol{I}_n-\boldsymbol{A}\)也是\(\lambda\)-矩阵,这个结论是一个特例。

不变因子

\(n\)\(\lambda\)-矩阵\(\boldsymbol{A}(\lambda)\)的所有\(k\)阶子式的非零最大公因子(它是首一多项式)称为\(\boldsymbol{A}(\lambda)\)\(k\)行列式因子,记为\(D_k(\lambda)\)。例如,下列矩阵 \[ \boldsymbol{A}(\lambda)= \left(\begin{matrix} d_1(\lambda) & & & & &\\ & \ddots & & & &\\ & & d_r(\lambda) & & &\\ & & & 0 & &\\ & & & & \ddots &\\ & & & & & 0\\ \end{matrix}\right) \]

其中\(d_i(\lambda)\)为非零首一多项式且\(d_i(\lambda) | d_{i+1}(\lambda)\,(i=1,2,\cdots,r-1)\),它的非零行列式因子为 \[ D_1(\lambda)=d_1(\lambda),\,D_2(\lambda)=d_1(\lambda)d_2(\lambda),\,\cdots,\,D_r(\lambda)=d_1(\lambda) \cdots d_r(\lambda) \]

容易得到\(D_i(\lambda) | D_{i+1}(\lambda)\,(i=1,2,\cdots,r-1)\),相邻阶行列式因子的比称为\(\boldsymbol{A}(\lambda)\)不变因子。上例中矩阵的不变因子为 \[ d_1(\lambda),d_2(\lambda),\cdots,d_r(\lambda) \]

相抵的\(\lambda\)-矩阵有相同的行列式因子,从而有相同的不变因子。矩阵的法式和不变因子相互唯一确定。两个\(\lambda\)-矩阵相抵当且仅当它们具有相同法式。所以,法式、行列式因子、不变因子都是\(\lambda\)-矩阵相抵的全系不变量。

从前面一系列结论可以推出,数域\(\mathbb{K}\)上的\(n\)阶矩阵\(\boldsymbol{A}\)\(\boldsymbol{B}\)相似的充要条件是它们的特征矩阵\(\lambda\boldsymbol{I}-\boldsymbol{A}\)\(\lambda\boldsymbol{I}-\boldsymbol{B}\)具有相同的行列式因子或不变因子。

有理标准型

根据不变因子,可以构造矩阵的有理标准型或Frobenius标准型,分块对角阵上的每个分块都是个Frobenius块。

初等因子

将不变因子\(d_i(\lambda)\)在数域\(\mathbb{K}\)上分解成不可约因式之积,即可得到初等因子。举个例子,假设9阶矩阵\(\boldsymbol{A}\)的不变因子组为 \[ 1,\cdots,1,(\lambda-1)(\lambda^2+1),(\lambda-1)^2(\lambda^2+1)(\lambda^2+2), \]

\(\boldsymbol{A}\)在有理数域上的初等因子组为 \[ \lambda-1,(\lambda-1)^2,\lambda^2+1,\lambda^2+1,\lambda^2-2, \]

\(\boldsymbol{A}\)在实数域上的初等因子组为 \[ \lambda-1,(\lambda-1)^2,\lambda^2+1,\lambda^2+1,\lambda+\sqrt{2},\lambda-\sqrt{2}, \]

\(\boldsymbol{A}\)在复数域上的初等因子组为 \[ \lambda-1,(\lambda-1)^2,\lambda+i,\lambda+i,\lambda-i,\lambda-i,\lambda+\sqrt{2},\lambda-\sqrt{2}, \]

如果已知上面实数域上这组初等因子组,想得到不变因子组,将多项式分类按降幂排列: \[ \begin{align} & (\lambda-1)^2,\lambda-1;\\ & \lambda^2+1,\lambda^2+1;\\ & \lambda+\sqrt{2};\\ & \lambda-\sqrt{2}.\\ \end{align} \]

分别将各列的元素相乘,得到 \[ d_2(\lambda)=(\lambda-1)^2(\lambda^2+1)(\lambda^2+2),\,d_1(\lambda)=(\lambda-1)(\lambda^2+1) \]

其余的7个全部为\(1\),与前面的结果相符。

利用初等因子组可以得到比有理标准型更精细的标准型,对每个初等因子都可以构造一个初等因子组就是它的简单矩阵,再将所有这样的矩阵拼成一个分块对角阵就得到标准型,这就是后面要介绍的Jordan标准型。

Jordan标准型

复数域上的初等因子都是一次因子的幂,一定具有\((\lambda-\lambda_0)^r\)的形状,\(\lambda_0\)是矩阵的特征值。下列\(r\)阶矩阵 \[ \boldsymbol{J}= \left(\begin{matrix} \lambda_0 & 1 & & &\\ & \lambda_0 & 1 & &\\ & & \ddots & \ddots &\\ & & & \ddots & 1\\ & & & & \lambda_0\\ \end{matrix}\right) \]

的初等因子组为\((\lambda-\lambda_0)^r\)

复数域上的矩阵\(\boldsymbol{A}\)的初等因子组为 \[ (\lambda-\lambda_1)^{r_1},(\lambda-\lambda_2)^{r_2},\cdots,(\lambda-\lambda_k)^{r_k} \]

\(\boldsymbol{A}\)相似于如下分块对角阵(Jordan标准型) \[ \boldsymbol{J}= \left(\begin{matrix} \boldsymbol{J}_1 & & &\\ & \boldsymbol{J}_2 & &\\ & & \ddots &\\ & & & \boldsymbol{J}_k\\ \end{matrix}\right) \]

其中\(\boldsymbol{J}_i\)\(r_i\)阶矩阵,且 \[ \boldsymbol{J}_i= \left(\begin{matrix} \lambda_i & 1 & & &\\ & \lambda_i & 1 & &\\ & & \ddots & \ddots &\\ & & & \ddots & 1\\ & & & & \lambda_i\\ \end{matrix}\right) \]

所以,我们得到了如下重要结论:\(\boldsymbol{\varphi}\)是复数域上线性空间\(V\)上的线性变换,则必存在\(V\)的一组基,使得\(\boldsymbol{\varphi}\)在这组基下的表示矩阵为Jordan标准型。线性代数:特征值一文中的相似于对角矩阵是上面结论的特殊情况,当矩阵的初等因子都是一次多项式或矩阵极小多项式无重根时,则该矩阵可以对角化。

类似地,\(V\)上的线性变换\(\boldsymbol{\varphi}\)可以对角化当且仅当\(\boldsymbol{\varphi}\)的极小多项式无重根,当且仅当\(\boldsymbol{\varphi}\)的初等因子都是一次多项式。也就是说,可以找到一组基,使得线性变换\(\boldsymbol{\varphi}\)在这组基下的表示矩阵为Jordan标准型。