如何理解矩阵的迹?

前置阅读:

线性代数中,把方阵的对角线之和称为“迹”:

为什么叫这个名字啊?翻下字典:

确实,“迹”就是线性变换藏在矩阵中痕迹。

上面那幅图还有个有意思的地方,用了金、篆、隶、楷来写“迹”字,虽然各有千秋,却又“相似”,彷佛在暗示,线代中的“迹”反映出矩阵“相似”这个特征。

本文准备如下来讲解:

  • 什么是线性变换?
  • 同一个线性变换在不同基下的矩阵,就是相似矩阵
  • 相似矩阵的“迹”都相等
  • 相似矩阵的“迹”、行列式、特征值的关系
1 什么是线性变换?

函数我们很早就接触了,直观地讲,就是把轴上的点映射到曲线上(下面是函数,把轴上的点映射到了正弦曲线上):

还有的函数,比如,是把轴上的点映射到直线上,我们称为线性函数:

如果我们放宽限制,不再只考虑轴上的点,而是考虑整个平面,把平面上某直线上的点映射到另外一条直线上去(注意,不是把整个平面的所有点映射到同一根直线上去):

这其实也是线性函数,只是一般我们把这称为线性变换。

线性变换虽然说也是函数,但是因为自变量已经不在坐标轴上了,用的形式不好表示了,所以我们用线性变换的独有的表示方式,向量与矩阵:

可见,所谓的矩阵乘法,其实就是线性函数,写成这样子是不是更像函数:

只要回答了下面两个问题,就可以得到这个矩阵(值域、定义域这里就忽略了):

  • 坐标系是什么?这在线性代数里面称为
  • 映射法则是什么?这在线性代数里面称为线性变换

综合上面两点,其实,所谓矩阵就是指定基下的线性变换。

2 同一个线性变换在不同基下的矩阵,就是相似矩阵

之前提到的线性变换,为了示意整个平面的点都被变换了,我用下面的淡蓝色网格来表示这个线性变换(增加一个参考点方便观察):

可见,这就是一个围绕蓝点旋转的线性变换,并且作为文章作者,我可以准确的告诉你,所有的点旋转了弧度(蓝点,即中心点也可以认为旋转了弧度)。

我们来看看不同基下的矩阵是什么样子的。

下面我会给出所有具体的数字,你可以去计算一下,省得说我骗你。

2.1 标准正交基下的矩阵

标准正交基是,它们所张成的线性空间如下(关于这幅图画的解释,可以参考如何理解矩阵乘法?):

旋转矩阵在此基下,旋转弧度:

在标准正交基下,用一个旋转矩阵来表示来表示此线性变换:

2.2 另外一个基下的矩阵

不是一定要在标准正交基下,我们也可以在下表示这个线性变换:

可见淡蓝色网格代表的线性变换是没有发生变化的,只是基不一样了。

矩阵具体计算出来就是:

其中为:

为什么这么计算,就请查看如何理解相似矩阵这篇文章了。

2.3 相似矩阵

淡蓝色网格代表的线性变换,在基下为矩阵,在基下为矩阵

同一个线性变换在不同基下的矩阵,就是相似矩阵,互为相似矩阵。

3 相似矩阵的“迹”都相等

这个线性变换,悄悄在这两个相似矩阵中留下了痕迹,就是它们的主对角线之和相等:

主对角线之和因此称为“迹”。

从另外一个观点来看,我们也可以认为“迹”与坐标无关,也可以说“迹”是相似不变量。

4 相似矩阵的“迹”、行列式、特征值的关系
4.1 行列式

因为代表同一个线性变换,而根据行列式的意义,行列式代表的是线性变换的伸缩比例。

既然是比例,那么也和坐标无关:

行列式又是一个相似不变量。

4.2 特征值

根据特征值分解的定义,特征值矩阵

这里用是为了和之前的进行区别。

可建,也是相似矩阵。

无悬念的,对求特征值矩阵都得到的是同一个(特征向量有所不同,因为在不同的基下):

特征值是两个复数。

根据,我们可以得到迹为:

行列式为:

更一般的可以得到这两个相似不变量分别为:

  • 迹=
  • 行列式=

其中是矩阵的特征值。

你的相貌随着年岁变换,我却还能一眼认出,就是因为其中藏着特征。

什么是特征,不被变换所改变的就是特征。

迹、行列式都是相似变换中的不变量,也就是线性变换的特征,现在全部被特征值表示了出来。看来特征值这个名字名副其实啊。

关注马同学
马同学高等数学
微信公众号:matongxue314