可对角化矩阵

可对角化矩阵是可化简为对角矩阵方阵。矩阵对角化后大幅降低了某些属性的计算难度,比如其行列式就是对角线上所有数字的乘积,而对角线上的数字就是其特征值

线性代数
向量 · 向量空间 · 基底  · 行列式  · 矩阵

可对角化也使该线性变换的几何意义更直观,因为每个线性变换都可以对应到一个矩阵,所以将矩阵对角化等价于找到一组基底,使的线性变换的作用仅仅是伸缩基底向量而已。类似的,若用对角矩阵表示差分方程组或者微分方程组的系数的话,这样每条等式只含有一个未知函数,这样也大幅度了化简了方程式的难度。

若尔当-谢瓦莱分解表达一个算子为它的对角部分与它的幂零部分的和。

正式定义

定义 —   是一个定义在标量   上的  方阵,若存在一个   阶的可逆方阵   使得

 

对角矩阵,则   就被称为可对角化的。

可对角化的线性映射

定义 —    是定义在同个标量   上,且维度相等的向量空间,若存在   的某基底    的某基底   ,使线性映射   对应的矩阵   是对角的,那线性映射   也会被称为可对角化的。

特征化

关于可对角化映射和矩阵的基本事实可表达为如下:

  • F 上的 n × n 矩阵 A 是可对角化的,当且仅当它的特征空间的和的维度等于 n,它为真当且仅当存在由 A 的特征向量组成的 Fn。如果找到了这样的基,可以形成有基向量作为纵列的矩阵 P,而 P -1AP 将是对角矩阵。这个矩阵的对角元素是 A 的特征值。
  • 线性映射 T : VV 是可对角化的,当且仅当它的特征空间的维度等于 dim(V),它为真当且仅当存在由 T 的特征向量组成的 V 的基。T 关于这个基将表示为对角矩阵。这个矩阵的对角元素是 T 的特征值。

另一个特征化: 矩阵或线性映射在域 F 上可对角化的,当且仅当它的极小多项式F 上有不同的线性因子。

下列充分(但非必要)条件经常是有用的。

  • n × n 矩阵 A 只在域 F 上可对角化的,如果它在 F 中有 n 个不同的特征值,就是说,如果它的特征多项式F 中有 n 个不同的根。
  • 线性映射 T : VV 带有 n=dim(V) 是可对角化的,如果它有 n 个不同的特征值,就是说它的特征多项式在 F 中有 n 个不同的根。

作为经验规则,在复数域 C 上几乎所有矩阵都是可对角化的。更精确地说: 在 C 上不可对角化的复数 n × n 矩阵的集合被当作 Cn×n 的子集,它是关于勒贝格测度零集。也可以说可对角化矩阵形成了关于 扎里斯基拓扑的稠密子集 : 补位于特征多项式的判别式变为零的集合内,后者是超平面。从中得出的还有在平常的(强拓扑)中密度由范数给出。

对于 R 域就不是这样了。随着 n 增长,随机选择的实数矩阵是在 R 上可对角化的可能性越来越小。

例子

可对角化矩阵

  • 对合在实数上(甚至特征不是 2 的任何域)是可对角化的,带有 1 和 -1 在对角线上。
  • 有限阶自同态(包括对合)是在复数,或域的特征不整除自同态的阶的任何代数闭合域(因为单位一的根是不同的)是可对角化的,带有单位根在对角线上。这是循环群的表示理论的一部分。
  • 投影是可对角化的,带有 0 和 1 在对角线上。

非可对角化的矩阵

某些矩阵在任何域上都是不可对角化的,最著名的是幂零矩阵。如果特征值的几何重次代数重次不一致,这会更一般的出现。例如考虑

 

这个矩阵是不可对角化的: 没有矩阵 U 使得   是对角矩阵。实际上,C 有一个特征值(就是零)而这个特征值有代数重次 2 和几何重次 1。

某些实数矩阵在实数上是不可对角化的。例如考虑

 

矩阵 B 没有任何实数特征值,所以没有实数矩阵 Q 使得   是对角矩阵。但是如果允许复数的话 , 仍可以对角化。实际上,如果我们取

 

  是对角的。

矩阵对角化的方法

考虑矩阵

 

这个矩阵有特征值

 

所以 A 是有三个不同特征值的 3 × 3 矩阵,所以它是可对角化的。

如果我们要对角化 A,我们需要计算对应的特征向量。它们是

 

我们可以轻易的验证  

现在,设 P 是由这些特征向量作为纵列的矩阵:

 

P 对角化了 A,简单的计算可验证:

 

注意特征值   出现在对角矩阵中。

应用

对角化可被用来有效的计算矩阵 A 的幂,假如矩阵是可对角化的。比如我们找到了

 

是对角矩阵,因为矩阵的积是结合的,

 

而后者容易计算,因为它只涉及对角矩阵的幂。

在找到线性递归序列比如斐波那契数列的项的闭合形式的表达中这是非常有用的。

特定应用

例如,考虑下列矩阵:

 

计算 M 个各次幂揭示了一个惊人的模式:

 

上面的现象可以通过对角化 M 来解释。要如此我们需要由 M 的特征向量组成的 R2 的基。一个这样的特征向量基给出自

 

这里的 ei 指示 Rn 的标准基。 逆的基变更给出自

 

直接计算证实

 

所以,ab 是分别是对应于 uv 的特征值。 根据矩阵乘法的线性,我们有

 

切换回标准基,我们有

 
 

前面的关系用矩阵形式表达为

 

因此解释了上述现象。

参见

外部链接

引用