1.5 矩阵的特征及矩阵

1.5.1 矩阵的特征值与特征向量

​  定义 \(1.5.1\)  设 \(A\) 是数域 \(G\) 上的 \(n\) 级矩阵,如果 \(G^n\) 中有非零列向量 \(| {v}\rangle\) ,使得

\[A|v\rangle=v|v\rangle\text{且}v \in G\]

那么称 \(v\)\(A\) 的一个特征值,称 \(| {v}\rangle\)\(A\) 的属于特征值 \(v\) 的一个特征向量。

注意这里数值 \(v\) 和列向量 \(| {v}\rangle\) 是两个不同的概念,只不过为了突出它们之间的关系,都采用了 \(v\) 这个记号。

由线性代数中行列式及线性方程组的知识可知:

\(v\)\(A\) 的一个特征值, \(| {v}\rangle\)\(A\) 的属于特征值 \(v\) 的一个特征向量

\[\begin{split}\begin{aligned} &\Leftrightarrow A|v\rangle=v|v\rangle,|v\rangle \neq 0, v \in G \\ &\Leftrightarrow(v I-A)|v\rangle=0,|v\rangle \neq 0, v \in G \\ &\Leftrightarrow|v I-A|=0 , |v\rangle \text {是} (v I-A)|v\rangle=0 \text {的一个非零解} v \in G \\ &\Leftrightarrow v \text {是多项式} |\lambda I-A| \text {在} G \text{中的一个根}|v\rangle \text{是} (v I-A)|x\rangle=0 \text{的一个非零解}& \end{aligned}\end{split}\]

\(|\lambda I-A|\) 称为 \(A\) 的特征多项式。 设 \({v}\)\(A\) 的一个特征值,把齐次线性方程组 \((v I-A)|x\rangle=0\) 的解空间称为 \(A\) 的属于 \(v\) 的特征子空间,其中的全部非零向量就是 \(A\) 的属于 \(v\) 的全部特征向量。

​  定义 \(1.5.2\)  如果 \(n\) 能够相似于一个对角矩阵,那么称 \(A\) 可对角化。

​  定理 \(1.5.1\)  数域 \(G\)\(n\) 级矩阵 \(A\) 可对角化的充分必要条件是, \(G^{n}\) 中有 \(n\) 个线性无关的列向量 \(\left|x_{1}\right\rangle,\left|x_{2}\right\rangle, \ldots,\left|x_{n}\right\rangle\) , 以及 \(G\) 中有 \(n\) 个数 \(x_{1}, x_{2}, \ldots, x_{n}\) (它们之中有些可能相等),使得

\[A\left|x_{i}\right\rangle=x_{i}\left|x_{i}\right\rangle, i=1,2, \ldots, n\]

这时, 令 \(P=\left(\left|x_{1}\right\rangle,\left|x_{2}\right\rangle, \ldots,\left|x_{n}\right\rangle\right)\) ,则

\[P^{-1} A P=\text{diag}\left\{x_{1}, x_{2}, \ldots, x_{n}\right\}\]

证明 设 \(A\) 与对角矩阵 \(D=\text{diag}\{x_{1}, x_{2}, \ldots, x_{n}\}\) 相似,其中 \(x_{i} \in G, i=1,2,\ldots,n\) 。这等价于存在 \(G\)\(n\) 级可逆矩阵 \(P=(|x_{1}\rangle,|x_{2}\rangle,\ldots,|x_{n}\rangle)\), 使得 \(P^{-1} A P=D\)\(A P=P D \) 这等价于 \(G^{n}\) 中有 \(n\) 个线性无关的列向量 \(|x_{1}\rangle\) , \(|x_{2}\rangle, \ldots,|x_{n}\rangle\) , 使得

\[A\left|x_{i}\right\rangle=x_{i}\left|x_{i}\right\rangle, i=1,2, \ldots, n\]

证毕。

1.5.2 Hermite矩阵

​  定义 \(1.5.3\)  若矩阵 \(B\) 中的每个元素都是矩阵 \(A\) 中相应元素的共轭,则称矩阵 \(B\) 是矩阵 \(A\) 的共轭矩阵,将 \(B\) 记作 \(A^{*}\)

​  定义 \(1.5.4\)  若矩阵 \(B\) 满足 \(B=\left(A^{*}\right)^{\prime}\) ,则把 \(B\) 记作 \(A^{\dagger}\) 。若 \(A=A^{\dagger}\) ,则称 \(A\) 为Hermite矩阵。如果 \(| {v}\rangle_{\text {是 }}\) 向量, 那么也记 \(\left(|v\rangle^{*}\right)^{\prime}=|v\rangle^{+}:=\langle v|\) 。 易验证Hermite矩阵有如下性质: \(1^{\circ}\) 对于任意的向量 \(|v\rangle,|w\rangle\) 及矩阵 \(A\) ,存在唯一的矩阵 \(A^{\dagger}\) ,使得

\[(|v\rangle, A|w\rangle)=\left(A^{\dagger}|v\rangle,|w\rangle\right)\]
\[2^{\circ}(A B)^{\dagger}=B^{\dagger} A^{\dagger} :math:`,` (A|v\rangle)^{\dagger}=\langle v| A^{\dagger} :math:`,` \left(A^{\dagger}\right)^{\dagger}=A\]

​  定义 \(1.5.5\)  矩阵 \(A\) 称为正规的 (normal),如果 \(A A^{\dagger}=A^{\dagger} A\)

​  定义 \(1.5.6\)  矩阵 \(U\) 称为是酉的 (unitary),如果 \(U^{\dagger}\) \(U=I\) 。 易看出酉矩阵有如下性质:

\[(U|v\rangle, U|w\rangle)=\left\langle v\left|U^{\dagger} U\right| w\right\rangle=\langle v \mid w\rangle\]

​  定理 \(1.5.2\)  酉矩阵的所有特征值的模都是 1 。 证明 设 \(U\) 是酉矩阵, \(v\)\(U\) 的一个特征值, \(|v \rangle\) 是矩阵 \(U\) 的属于特征值 \(v\) 的特征向量, 那么有

\[0 \neq\langle v \mid v\rangle=\left\langle v\left|U^{\dagger} U\right| v\right\rangle=(U|v\rangle)^{\dagger}(U|v\rangle)=(v|v\rangle)^{\dagger}(v|v\rangle)=v^{*} v\langle v \mid v\rangle\]

所以 \(v^*v=1\) ,即 \(v\) 的模为1。

证毕。

1.5.3 对易式与反对易式

​  定义 \(1.5.7\) [6]  设有两个矩阵 \(A, B\) ,称

\[[A, B]:=A B-B A\]

\(A\)\(B\) 之间的对易式 (commutator),若 \([A, B]=0\) ,即 \(A B=B A\) ,则称 \(A\)\(B\) 是对易的。类似 的,两个矩阵的反对易式 (anti-commutator) 定义为

\[\{A, B\}:=A B+B A\]

如果 \({A, B}=0\) ,即 \(A\)\(B\) 反对易。 下面几条性质的证明比较简单,请读者自己思考。

   \(1^{\circ}\)\([A, B]=0,{A, B}=0\) ,且 \(A\) 可逆,则 \(B\) 必为 0 。

\[2^{\circ}[A, B]^{\dagger}=\left[B^{\dagger}, A^{\dagger}\right],[A, B]=-[B, A]\]

   \(3^{\circ}\)\(A\)\(B\) 都是Hermite的,则 \(i[A, B]\) 是Hermite的。

下面不加证明地给出同时对角化定理。里面用到了一些线性代数的概念。 定理 1.5.3 (同时对角化定理) 设 \(A\)\(B\) 是Hermite矩阵, \([A, B]=0\) 当且仅当存在一组标准正交基,使 \(A\)\(B\) 在这组基下是同时对角的。在这种情况下 \(A\)\(B\) 称为可同时对角化。