线性代数:线性空间与线性映射
线性空间
定义
空间是数学中常见的概念,我的理解是,空间就是个集合,不同空间的元素有不同的运算,满足不同的性质。
线性空间的定义中提供了一个数域\(\mathbb{K}\)和一个集合\(V\)。集合提供元素,元素之间有加法运算。数域提供一个数,数域和集合之间定义了数乘运算,加法和数乘要满足8条运算规则:加法交换律、加法结合律、加法有零元素、加法有负元素、数乘有单位元素、数乘元素的分配律、数乘乘数的分配律、数乘结合律。线性空间是众多不同研究对象的抽象和概括。
线性关系
线性组合、线性相关和线性无关是向量之间最基本的关系,是线性空间理论中非常重要的内容。向量线性相关的表达式对应一个线性方程组,用Gauss消元法求解线性方程组时,有的方程可以消去,最后剩下的方程对应的行向量线性无关,称为原向量组的极大无关组。极大无关组所含向量的个数称为秩。线性空间的极大无关组是空间的基,所含向量的个数就是空间的维数。
矩阵的秩
矩阵行向量和列向量的秩相等,即矩阵的行秩等于列秩,统称为矩阵的秩。初等变换不改变矩阵的秩,所以秩相等的矩阵是等价的。矩阵通过初等变换可以得到阶梯矩阵,阶梯矩阵非零行的个数就是原矩阵的秩。满秩的方阵经初等变换得到的阶梯矩阵对角线不全为零,行列式不等于零。
同构
在线性空间中引进基后,可以用坐标表示空间中的向量。空间中的向量既可以用基的线性组合(在线性空间\(V\)中)表示,也可以用坐标(在\(n\)维空间\(\mathbb{K}^n\)中)表示,\(V\)与\(\mathbb{K}^n\)之间存在一个映射\(\boldsymbol{\varphi}\)。\(\boldsymbol{\varphi}\)是一一映射,还保持了线性关系,所以\(V\)与\(\mathbb{K}^n\)这两个线性空间同构。可以这么理解,同构的线性空间在本质上是一样的,只是元素的表达形式不同而已。同构有个重要的结论:数域\(\mathbb{K}\)上的有限维空间同构的充要条件是它们的维数相同。所以,我们常常通过研究\(\mathbb{K}^n\)来探讨一般\(n\)维线性空间的性质。
基变换
线性空间的基变化后,坐标也会变化。假设数域\(\mathbb{K}^n\)上线性空间\(V\)的两组基有如下关系: \[ \left\{ \begin{array}{} \boldsymbol{f}_1 = a_{11}\boldsymbol{e}_1 + a_{12}\boldsymbol{e}_2 + \cdots + a_{1n}\boldsymbol{e}_n\\ \boldsymbol{f}_2 = a_{21}\boldsymbol{e}_1 + a_{22}\boldsymbol{e}_2 + \cdots + a_{2n}\boldsymbol{e}_n\\ \cdots \cdots\\ \boldsymbol{f}_n = a_{n1}\boldsymbol{e}_1 + a_{n2}\boldsymbol{e}_2 + \cdots + a_{nn}\boldsymbol{e}_n\\ \end{array} \right. \]
用矩阵乘法表示为 \[ \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right) = \left( \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right) \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{matrix}\right) \]
右边的矩阵称为从基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)到基\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right\}\)的过渡矩阵,是系数矩阵的转置。\(V\)中的向量\(\boldsymbol{\alpha}\)在两组基下有不同的坐标,有 \[ \boldsymbol{\alpha} = \left( \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) = \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right) \left(\begin{array}{c} \mu_1\\ \mu_2\\ \vdots\\ \mu_n\\ \end{array}\right) \]
很容易推出两组基下的坐标之间有如下关系 \[ \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) = \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{matrix}\right) \left(\begin{array}{c} \mu_1\\ \mu_2\\ \vdots\\ \mu_n\\ \end{array}\right) \]
子空间
若线性空间\(V\)的非空子集\(V_0\)中任意向量的线性组合依然在\(V_0\)中,则\(V_0\)是\(V\)的线性子空间。子空间有交与和,而且它们都是\(V\)的子空间。线性空间\(V\)的子集\(S\)中向量所有可能的线性组合可以构成一个子集,它也是\(V\)的子空间,称为由\(S\)生成的子空间或张成的子空间。空间与交空间之间的维数公式为 \[ \dim (V_1 + V_2) = \dim V_1 + \dim V_2 - \dim (V_1 \cap V_2) \]
\(V_1 + V_2\)是直和的充要条件是\(V_1 \cap V_2 = 0\),此时有 \[ \dim (V_1 + V_2) = \dim V_1 + \dim V_2 \]
此时,\(V_0 = V_1 + V_2\)可记作\(V_0 = V_1 \oplus V_2\),充要条件还有:\(V_1\)和\(V_2\)的一组基可以拼成\(V_0\)的一组基,\(V_0\)中的向量表示为\(V_1, V_2\)中的向量之和时其表示唯一。这个概念和相关结论可以推广到多个子空间的直和。
线性映射
线性映射与矩阵
具有线性性质的映射就是线性映射,如果该映射是双射,则称它为线性同构,简称同构。集合到自身的线性映射称为线性变换。列向量空间的线性映射可以用矩阵来定义。
现假设数域\(\mathbb{K}\)上的\(n\)维线性空间\(V\)有一组基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\),数域\(\mathbb{K}\)上的\(m\)维线性空间\(U\)有一组基\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right\}\),\(\boldsymbol{\varphi}\)是\(V \to U\)的线性映射,而且\(V\)的基向量在\(\boldsymbol{\varphi}\)下的像已知,有 \[ \left\{ \begin{array}{} \boldsymbol{\varphi}(\boldsymbol{e}_1) = a_{11}\boldsymbol{f}_1 + a_{12}\boldsymbol{f}_2 + \cdots + a_{1m}\boldsymbol{f}_m\\ \boldsymbol{\varphi}(\boldsymbol{e}_2) = a_{21}\boldsymbol{f}_1 + a_{22}\boldsymbol{f}_2 + \cdots + a_{2m}\boldsymbol{f}_m\\ \cdots \cdots\\ \boldsymbol{\varphi}(\boldsymbol{e}_n) = a_{n1}\boldsymbol{f}_1 + a_{n2}\boldsymbol{f}_2 + \cdots + a_{nm}\boldsymbol{f}_m\\ \end{array} \right. \]
用矩阵乘法形式表示更为紧凑 \[ \left( \boldsymbol{\varphi}(\boldsymbol{e}_1), \boldsymbol{\varphi}(\boldsymbol{e}_2), \cdots, \boldsymbol{\varphi}(\boldsymbol{e}_n) \right) = \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right) \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1m} & a_{2m} & \cdots & a_{nm}\\ \end{matrix}\right) \]
\(V\)中的向量\(\boldsymbol{\alpha}\)的坐标已知 \[ \boldsymbol{\alpha} = \left( \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) \]
那么\(\boldsymbol{\varphi}\)将\(V\)中的\(\boldsymbol{\alpha}\)映射到\(U\)中的\(\boldsymbol{\varphi}(\boldsymbol{\alpha})\),有 \[ \boldsymbol{\varphi}(\boldsymbol{\alpha})= \left( \boldsymbol{\varphi}(\boldsymbol{e}_1), \boldsymbol{\varphi}(\boldsymbol{e}_2), \cdots, \boldsymbol{\varphi}(\boldsymbol{e}_n) \right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) = \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right) \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1m} & a_{2m} & \cdots & a_{nm}\\ \end{matrix}\right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) \]
所以\(\boldsymbol{\varphi}(\boldsymbol{\alpha})\)在\(U\)的基\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right\}\)下的坐标为 \[ \left(\begin{array}{c} \mu_1\\ \mu_2\\ \vdots\\ \mu_n\\ \end{array}\right)= \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1m} & a_{2m} & \cdots & a_{nm}\\ \end{matrix}\right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) \]
上面的这个矩阵称为\(\boldsymbol{\varphi}\)在已给定基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)与\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right\}\)下的表示矩阵。涉及到多个空间之间的映射时,则要多乘几个矩阵。矩阵乘法的几何意义是线性映射的复合,所以可以使用矩阵(代数工具)来研究线性映射(几何对象)。
类似地,要研究同一个线性映射在不同基下的表示矩阵。假设\(V\)在两组基下的表示矩阵分别为\(\boldsymbol{A}\)和\(\boldsymbol{B}\),且两组基之间的过渡矩阵为\(\boldsymbol{P}\),那么有\(\boldsymbol{B}=\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\)。如果\(\boldsymbol{A}\)和\(\boldsymbol{B}\)为方阵,且\(\boldsymbol{P}\)是非奇异阵,则称\(\boldsymbol{A}\)与\(\boldsymbol{B}\)是相似矩阵。方阵表示的线性映射是线性变换,线性变换在不同基下的表示矩阵是相似的。后面会学习到,可以找到一组适当的基,使得线性变换在这组基下的表示矩阵具有简单的形状。
线性映射的像与核
线性映射\(\boldsymbol{\varphi}: V \to U\),\(\boldsymbol{\varphi}\)的全体像元组成\(U\)的子集称为\(\boldsymbol{\varphi}\)的像,记为\(\mathrm{Im} \, \boldsymbol{\varphi}\)。\(V\)中在\(\boldsymbol{\varphi}\)下映射为零向量的全体向量构成\(V\)的子集,称为\(\boldsymbol{\varphi}\)的核,记为\(\mathrm{Ker} \, \boldsymbol{\varphi}\)。像与核分别是值域和定义域的子集,而且都是各自的子空间,即\(\mathrm{Im} \, \boldsymbol{\varphi}\)是\(U\)的子空间,\(\mathrm{Ker} \, \boldsymbol{\varphi}\)是\(V\)的子空间。\(\boldsymbol{\varphi}\)在给定基下的表示矩阵为\(\boldsymbol{A}\),它们的维数有如下结论 \[ \dim \mathrm{Im} \, \boldsymbol{\varphi} = \mathrm{rank}(\boldsymbol{A}), \, \dim \mathrm{Ker} \, \boldsymbol{\varphi} = n - \mathrm{rank}(\boldsymbol{A}) \] \[ \dim \mathrm{Ker} \, \boldsymbol{\varphi} + \dim \mathrm{Im} \, \boldsymbol{\varphi} = \dim V \]
不变子空间
\(\boldsymbol{\varphi}\)是\(V\)上的线性变换,\(U\)是\(V\)的子空间,如果\(\boldsymbol{\varphi}(U) \subseteq U\),则称\(U\)是\(\boldsymbol{\varphi}\)的不变子空间。零子空间、全空间\(V\)、\(\boldsymbol{\varphi}\)的像、\(\boldsymbol{\varphi}\)的核,都是\(\boldsymbol{\varphi}\)的不变子空间。
如果\(V=V_1 \oplus V_2 \oplus \cdots \oplus V_m\),其中每个\(V_i\)都是线性变换\(\boldsymbol{\varphi}\)的不变子空间,那么\(V\)中存在一组基(可由\(V_i\)的基合并而成),使得\(\boldsymbol{\varphi}\)在这组基下的表示矩阵为分块对角矩阵,其中的小分块为\(\boldsymbol{\varphi}\)在各不变子空间下的表示矩阵。如果\(\boldsymbol{\varphi}\)有\(n\)个一维不变子空间,而且直和构成全空间,那么表示矩阵就变成了对角阵。这个结论在标准型理论中很重要。