线性代数：线性空间与线性映射

发表于 2023-08-09 分类于大学课程 Waline：本文字数： 2.5k 阅读时长 ≈ 9 分钟

线性空间

定义

空间是数学中常见的概念，我的理解是，空间就是个集合，不同空间的元素有不同的运算，满足不同的性质。

线性空间的定义中提供了一个数域\(\mathbb{K}\)和一个集合\(V\)。集合提供元素，元素之间有加法运算。数域提供一个数，数域和集合之间定义了数乘运算，加法和数乘要满足8条运算规则：加法交换律、加法结合律、加法有零元素、加法有负元素、数乘有单位元素、数乘元素的分配律、数乘乘数的分配律、数乘结合律。线性空间是众多不同研究对象的抽象和概括。

线性关系

线性组合、线性相关和线性无关是向量之间最基本的关系，是线性空间理论中非常重要的内容。向量线性相关的表达式对应一个线性方程组，用Gauss消元法求解线性方程组时，有的方程可以消去，最后剩下的方程对应的行向量线性无关，称为原向量组的极大无关组。极大无关组所含向量的个数称为秩。线性空间的极大无关组是空间的基，所含向量的个数就是空间的维数。

矩阵的秩

矩阵行向量和列向量的秩相等，即矩阵的行秩等于列秩，统称为矩阵的秩。初等变换不改变矩阵的秩，所以秩相等的矩阵是等价的。矩阵通过初等变换可以得到阶梯矩阵，阶梯矩阵非零行的个数就是原矩阵的秩。满秩的方阵经初等变换得到的阶梯矩阵对角线不全为零，行列式不等于零。

同构

在线性空间中引进基后，可以用坐标表示空间中的向量。空间中的向量既可以用基的线性组合（在线性空间\(V\)中）表示，也可以用坐标（在\(n\)维空间\(\mathbb{K}^n\)中）表示，\(V\)与\(\mathbb{K}^n\)之间存在一个映射\(\boldsymbol{\varphi}\)。\(\boldsymbol{\varphi}\)是一一映射，还保持了线性关系，所以\(V\)与\(\mathbb{K}^n\)这两个线性空间同构。可以这么理解，同构的线性空间在本质上是一样的，只是元素的表达形式不同而已。同构有个重要的结论：数域\(\mathbb{K}\)上的有限维空间同构的充要条件是它们的维数相同。所以，我们常常通过研究\(\mathbb{K}^n\)来探讨一般\(n\)维线性空间的性质。

基变换

线性空间的基变化后，坐标也会变化。假设数域\(\mathbb{K}^n\)上线性空间\(V\)的两组基有如下关系： \[ \left\{ \begin{array}{} \boldsymbol{f}_1 = a_{11}\boldsymbol{e}_1 + a_{12}\boldsymbol{e}_2 + \cdots + a_{1n}\boldsymbol{e}_n\\ \boldsymbol{f}_2 = a_{21}\boldsymbol{e}_1 + a_{22}\boldsymbol{e}_2 + \cdots + a_{2n}\boldsymbol{e}_n\\ \cdots \cdots\\ \boldsymbol{f}_n = a_{n1}\boldsymbol{e}_1 + a_{n2}\boldsymbol{e}_2 + \cdots + a_{nn}\boldsymbol{e}_n\\ \end{array} \right. \]

用矩阵乘法表示为 \[ \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right) = \left( \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right) \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{matrix}\right) \]

右边的矩阵称为从基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)到基\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right\}\)的过渡矩阵，是系数矩阵的转置。\(V\)中的向量\(\boldsymbol{\alpha}\)在两组基下有不同的坐标，有 \[ \boldsymbol{\alpha} = \left( \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) = \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_n \right) \left(\begin{array}{c} \mu_1\\ \mu_2\\ \vdots\\ \mu_n\\ \end{array}\right) \]

很容易推出两组基下的坐标之间有如下关系 \[ \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) = \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{matrix}\right) \left(\begin{array}{c} \mu_1\\ \mu_2\\ \vdots\\ \mu_n\\ \end{array}\right) \]

子空间

若线性空间\(V\)的非空子集\(V_0\)中任意向量的线性组合依然在\(V_0\)中，则\(V_0\)是\(V\)的线性子空间。子空间有交与和，而且它们都是\(V\)的子空间。线性空间\(V\)的子集\(S\)中向量所有可能的线性组合可以构成一个子集，它也是\(V\)的子空间，称为由\(S\)生成的子空间或张成的子空间。空间与交空间之间的维数公式为 \[ \dim (V_1 + V_2) = \dim V_1 + \dim V_2 - \dim (V_1 \cap V_2) \]

\(V_1 + V_2\)是直和的充要条件是\(V_1 \cap V_2 = 0\)，此时有 \[ \dim (V_1 + V_2) = \dim V_1 + \dim V_2 \]

此时，\(V_0 = V_1 + V_2\)可记作\(V_0 = V_1 \oplus V_2\)，充要条件还有：\(V_1\)和\(V_2\)的一组基可以拼成\(V_0\)的一组基，\(V_0\)中的向量表示为\(V_1, V_2\)中的向量之和时其表示唯一。这个概念和相关结论可以推广到多个子空间的直和。

线性映射

线性映射与矩阵

具有线性性质的映射就是线性映射，如果该映射是双射，则称它为线性同构，简称同构。集合到自身的线性映射称为线性变换。列向量空间的线性映射可以用矩阵来定义。

现假设数域\(\mathbb{K}\)上的\(n\)维线性空间\(V\)有一组基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)，数域\(\mathbb{K}\)上的\(m\)维线性空间\(U\)有一组基\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right\}\)，\(\boldsymbol{\varphi}\)是\(V \to U\)的线性映射，而且\(V\)的基向量在\(\boldsymbol{\varphi}\)下的像已知，有 \[ \left\{ \begin{array}{} \boldsymbol{\varphi}(\boldsymbol{e}_1) = a_{11}\boldsymbol{f}_1 + a_{12}\boldsymbol{f}_2 + \cdots + a_{1m}\boldsymbol{f}_m\\ \boldsymbol{\varphi}(\boldsymbol{e}_2) = a_{21}\boldsymbol{f}_1 + a_{22}\boldsymbol{f}_2 + \cdots + a_{2m}\boldsymbol{f}_m\\ \cdots \cdots\\ \boldsymbol{\varphi}(\boldsymbol{e}_n) = a_{n1}\boldsymbol{f}_1 + a_{n2}\boldsymbol{f}_2 + \cdots + a_{nm}\boldsymbol{f}_m\\ \end{array} \right. \]

用矩阵乘法形式表示更为紧凑 \[ \left( \boldsymbol{\varphi}(\boldsymbol{e}_1), \boldsymbol{\varphi}(\boldsymbol{e}_2), \cdots, \boldsymbol{\varphi}(\boldsymbol{e}_n) \right) = \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right) \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1m} & a_{2m} & \cdots & a_{nm}\\ \end{matrix}\right) \]

\(V\)中的向量\(\boldsymbol{\alpha}\)的坐标已知 \[ \boldsymbol{\alpha} = \left( \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) \]

那么\(\boldsymbol{\varphi}\)将\(V\)中的\(\boldsymbol{\alpha}\)映射到\(U\)中的\(\boldsymbol{\varphi}(\boldsymbol{\alpha})\)，有 \[ \boldsymbol{\varphi}(\boldsymbol{\alpha})= \left( \boldsymbol{\varphi}(\boldsymbol{e}_1), \boldsymbol{\varphi}(\boldsymbol{e}_2), \cdots, \boldsymbol{\varphi}(\boldsymbol{e}_n) \right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) = \left( \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right) \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1m} & a_{2m} & \cdots & a_{nm}\\ \end{matrix}\right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) \]

所以\(\boldsymbol{\varphi}(\boldsymbol{\alpha})\)在\(U\)的基\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right\}\)下的坐标为 \[ \left(\begin{array}{c} \mu_1\\ \mu_2\\ \vdots\\ \mu_n\\ \end{array}\right)= \left(\begin{matrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots & \vdots & \ddots & \vdots\\ a_{1m} & a_{2m} & \cdots & a_{nm}\\ \end{matrix}\right) \left(\begin{array}{c} \lambda_1\\ \lambda_2\\ \vdots\\ \lambda_n\\ \end{array}\right) \]

上面的这个矩阵称为\(\boldsymbol{\varphi}\)在已给定基\(\left\{ \boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_n \right\}\)与\(\left\{ \boldsymbol{f}_1, \boldsymbol{f}_2, \cdots, \boldsymbol{f}_m \right\}\)下的表示矩阵。涉及到多个空间之间的映射时，则要多乘几个矩阵。矩阵乘法的几何意义是线性映射的复合，所以可以使用矩阵（代数工具）来研究线性映射（几何对象）。

类似地，要研究同一个线性映射在不同基下的表示矩阵。假设\(V\)在两组基下的表示矩阵分别为\(\boldsymbol{A}\)和\(\boldsymbol{B}\)，且两组基之间的过渡矩阵为\(\boldsymbol{P}\)，那么有\(\boldsymbol{B}=\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\)。如果\(\boldsymbol{A}\)和\(\boldsymbol{B}\)为方阵，且\(\boldsymbol{P}\)是非奇异阵，则称\(\boldsymbol{A}\)与\(\boldsymbol{B}\)是相似矩阵。方阵表示的线性映射是线性变换，线性变换在不同基下的表示矩阵是相似的。后面会学习到，可以找到一组适当的基，使得线性变换在这组基下的表示矩阵具有简单的形状。

线性映射的像与核

线性映射\(\boldsymbol{\varphi}: V \to U\)，\(\boldsymbol{\varphi}\)的全体像元组成\(U\)的子集称为\(\boldsymbol{\varphi}\)的像，记为\(\mathrm{Im} \, \boldsymbol{\varphi}\)。\(V\)中在\(\boldsymbol{\varphi}\)下映射为零向量的全体向量构成\(V\)的子集，称为\(\boldsymbol{\varphi}\)的核，记为\(\mathrm{Ker} \, \boldsymbol{\varphi}\)。像与核分别是值域和定义域的子集，而且都是各自的子空间，即\(\mathrm{Im} \, \boldsymbol{\varphi}\)是\(U\)的子空间，\(\mathrm{Ker} \, \boldsymbol{\varphi}\)是\(V\)的子空间。\(\boldsymbol{\varphi}\)在给定基下的表示矩阵为\(\boldsymbol{A}\)，它们的维数有如下结论 \[ \dim \mathrm{Im} \, \boldsymbol{\varphi} = \mathrm{rank}(\boldsymbol{A}), \, \dim \mathrm{Ker} \, \boldsymbol{\varphi} = n - \mathrm{rank}(\boldsymbol{A}) \] \[ \dim \mathrm{Ker} \, \boldsymbol{\varphi} + \dim \mathrm{Im} \, \boldsymbol{\varphi} = \dim V \]

不变子空间

\(\boldsymbol{\varphi}\)是\(V\)上的线性变换，\(U\)是\(V\)的子空间，如果\(\boldsymbol{\varphi}(U) \subseteq U\)，则称\(U\)是\(\boldsymbol{\varphi}\)的不变子空间。零子空间、全空间\(V\)、\(\boldsymbol{\varphi}\)的像、\(\boldsymbol{\varphi}\)的核，都是\(\boldsymbol{\varphi}\)的不变子空间。

如果\(V=V_1 \oplus V_2 \oplus \cdots \oplus V_m\)，其中每个\(V_i\)都是线性变换\(\boldsymbol{\varphi}\)的不变子空间，那么\(V\)中存在一组基（可由\(V_i\)的基合并而成），使得\(\boldsymbol{\varphi}\)在这组基下的表示矩阵为分块对角矩阵，其中的小分块为\(\boldsymbol{\varphi}\)在各不变子空间下的表示矩阵。如果\(\boldsymbol{\varphi}\)有\(n\)个一维不变子空间，而且直和构成全空间，那么表示矩阵就变成了对角阵。这个结论在标准型理论中很重要。