线性代数:二次型与正定性

二次型

二次型是个多项式,其中所有项的次数都是二次的,这里的「型」表示齐次多项式。

\(f\)是数域\(\mathbb{K}\)上的\(n\)元二次齐次多项式 \[ \begin{align} f(x_1,x_2,\cdots,x_n) = & \, a_{11}x_1^2 + 2a_{12} x_1 x_2 + \cdots + 2a_{1n}x_1 x_n\\ & + a_{22}x_2^2 + \cdots + 2a_{2n}x_2 x_n + \cdots + a_{nn}x_n^2 \end{align} \]

\(f\)为数域\(\mathbb{K}\)上的\(n\)元二次型,简称二次型。用矩阵乘法可以写成如下形式 \[ f(x_1,x_2,\cdots,x_n) = \boldsymbol{x}'\boldsymbol{A}\boldsymbol{x} \]

其中 \[ \boldsymbol{A}= \left(\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{matrix}\right),\, \boldsymbol{x}= \left(\begin{array}{c} x_1\\ x_2\\ \vdots\\ x_n\\ \end{array}\right) \]

矩阵\(\boldsymbol{A}\)是对称阵,即\(a_{ij}=a_{ji}\)对一切\(i,j\)成立。

设二次型\(f(x_1,x_2,\cdots,x_n)\)是线性空间\(V\)上的二次函数,\(V\)有两组基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right\}\),向量\(\boldsymbol{x}\)在两组基下的坐标有如下关系 \[ \left(\begin{array}{c} x_1\\ x_2\\ \vdots\\ x_n\\ \end{array}\right) = \left(\begin{matrix} c_{11} & c_{12} & \cdots & c_{1n}\\ c_{21} & c_{22} & \cdots & c_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ c_{n1} & c_{n2} & \cdots & c_{nn}\\ \end{matrix}\right) \left(\begin{array}{c} y_1\\ y_2\\ \vdots\\ y_n\\ \end{array}\right) \] \[ \boldsymbol{x}=\boldsymbol{C}\boldsymbol{y} \]

矩阵\(\boldsymbol{C}=(c_{ij})\)\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right\}\)的过渡矩阵。关于这个矩阵的意义,也可以看成是两组变元\(\boldsymbol{x}\)\(\boldsymbol{y}\)之间的线性关系。将上面的关系代入到\(f(x_1,x_2,\cdots,x_n) = \boldsymbol{x}'\boldsymbol{A}\boldsymbol{x}\)中,得 \[ f(x_1,x_2,\cdots,x_n) = \boldsymbol{y}'\boldsymbol{C}'\boldsymbol{A}\boldsymbol{C}\boldsymbol{y} \]

所以,\(\boldsymbol{y}'\boldsymbol{C}'\boldsymbol{A}\boldsymbol{C}\boldsymbol{y}\)是以\(\boldsymbol{y}\)为变元的二次型,\(\boldsymbol{C}'\boldsymbol{A}\boldsymbol{C}\)也是对称阵。

数域\(\mathbb{K}\)上的矩阵\(\boldsymbol{A}\)\(\boldsymbol{B}\)合同的,若存在\(n\)阶非奇异阵\(\boldsymbol{C}\),使得\(\boldsymbol{B}=\boldsymbol{C}'\boldsymbol{A}\boldsymbol{C}\)。可以证明,只要\(\boldsymbol{A}\)\(n\)阶对称阵,则一定存在这样的非奇异阵\(\boldsymbol{C}\),使\(\boldsymbol{C}'\boldsymbol{A}\boldsymbol{C}\)为对角阵。

惯性定理

先讨论实数域上的二次型,即实二次型。任意一个实对称阵合同于一个对角阵,不妨设实对称矩阵\(\boldsymbol{A}\)已经是对称阵: \[ \boldsymbol{A}=\mathrm{diag}\{d_1,d_2,\cdots,d_r,0,\cdots,0\} \]

任意调换主对角线上的元素得到的矩阵依然与\(\boldsymbol{A}\)合同,可以将零放在一起,正项和负项放在一起,即设 \[ d_1>0,\cdots,d_p>0;d_{p+1}<0,\cdots,d_r<0. \]

做适当的变元替换,可得\(\boldsymbol{A}\)合同于对角阵 \[ \mathrm{diag}\{1,\cdots,1;-1,\cdots,-1;0,\cdots,0\} \]

其中有\(p\)\(1\)\(q=r-p\)\(-1\)\(n-r\)个零。

\(f(x_1,x_2,\cdots,x_n)\)是个\(n\)元实二次型,且\(f\)可化为两个标准型: \[ c_1 y_1^2+\cdots+c_p y_p^2-c_{p+1}y_{p+1}^2-\cdots-c_r y_r^2 \] \[ d_1 z_1^2+\cdots+d_k z_k^2-d_{k+1}z_{k+1}^2-\cdots-d_r z_r^2 \]

其中\(c_i>0,\,d_i>0\),则必有\(p=k\),这就是惯性定理。式中的二次型称为\(f\)的规范标准型,\(r\)是该二次型的\(p\)是它的正惯性指数\(q=r-p\)是它的负惯性指数\(s=p-q\)称为\(f\)符号差。秩与符号差(或正负惯性指数)是实对称阵在合同关系下的全系不变量

再讨论复数域上的二次型,即复二次型。由于复二次型 \[ f(x_1,x_2,\cdots,x_n) = d_1 x_1^2 + d_1 x_2^2 + \cdots + d_r x_r^2 \]

必可以化为\(z_1^2+z_2^2+\cdots+z_r^2\)的形式,所以秩\(r\)是是复对称阵在合同关系下唯一的全系不变量

正定型与正定矩阵

这里讨论的都是实二次型。二次型和矩阵正定负定半正定半负定的定义在这里就不列出来了。有如下结论:

  1. 实二次型\(f(x_1,x_2,\cdots,x_n)\)正定的充要条件是\(f\)的正惯性指数等于\(n\),实对称矩阵\(\boldsymbol{A}\)是正定阵当且仅当它合同于单位阵\(\boldsymbol{I}_n\)
  2. 实二次型\(f(x_1,x_2,\cdots,x_n)\)负定的充要条件是\(f\)的负惯性指数等于\(n\),实对称矩阵\(\boldsymbol{A}\)是负定阵当且仅当它合同于单位阵\(-\boldsymbol{I}_n\)
  3. 实二次型\(f(x_1,x_2,\cdots,x_n)\)半正定的充要条件是\(f\)的正惯性指数等于\(f\)的秩\(r\),实对称矩阵\(\boldsymbol{A}\)是半正定阵当且仅当它合同于对角阵 \[ \left(\begin{matrix} \boldsymbol{I}_r & \boldsymbol{O}\\ \boldsymbol{O} & \boldsymbol{O}\\ \end{matrix}\right) \]
  4. 实二次型\(f(x_1,x_2,\cdots,x_n)\)半负定的充要条件是\(f\)的负惯性指数等于\(f\)的秩\(r\),实对称矩阵\(\boldsymbol{A}\)是半负定阵当且仅当它合同于对角阵 \[ \left(\begin{matrix} -\boldsymbol{I}_r & \boldsymbol{O}\\ \boldsymbol{O} & \boldsymbol{O}\\ \end{matrix}\right) \]

\(n\)阶矩阵\(\boldsymbol{A}=(a_{ij})\)\(n\)个子式 \[ \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1k}\\ a_{21} & a_{22} & \cdots & a_{2k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{k1} & a_{k2} & \cdots & a_{kk}\\ \end{vmatrix} \,(k=1,2,\cdots,n) \]

称为\(\boldsymbol{A}\)顺序主子式\(n\)阶实对称矩阵\(\boldsymbol{A}\)是正定阵的充要条件是它的\(n\)个顺序主子式全大于零。

Hermite型

复数域上有\(n\)个变元的二次齐次函数称为Hermite型: \[ f(x_1,x_2,\cdots,x_n) = \sum_{j=1}^{n}\sum_{i=1}^{n}a_{ij}\overline{x_i}x_j \]

其中\(\overline{a}_{ij}=a_{ji}\)。容易验证,虽然变元和系数都是复数域上的,但函数值却总是实数。当变元和系数都在实数域上,\(f\)就是实二次型。类似地,Hermite型可以写成矩阵相乘的形式 \[ f(x_1,x_2,\cdots,x_n) = \overline{\boldsymbol{x}}'\boldsymbol{A}\boldsymbol{x} \]

而且满足\(\overline{\boldsymbol{A}}'=\boldsymbol{A}\),这样的矩阵称为Hermite矩阵。Hermite矩阵和实对称矩阵特性相似,也有很多类似的结论。