如何理解相似矩阵?

观看一场电影与相似矩阵的关系。

相似矩阵的定义是:

都是阶矩阵,若有可逆矩阵,使

则称的相似矩阵,或说相似。

----《线性代数》同济版

让我们从通俗解释开始。

1 通俗解释

今天《雷神3》上映了,我坐在第一排看电影:

而你坐在最后一排看电影:

我们看的是同一部电影,但是我们各自眼中看到的电影却因为位置不同而有所不同(比如清晰度啊、角度啊),所以说,“第一排看到的电影”和“最后一排看到的电影”是“相似”的。

那么相似矩阵走进的电影院,放映的是哪部电影?也就是说,什么是不变的呢?是线性变换。

2 坐标转换

刚才给的是相对矩阵的通俗解释,从数学角度上看,相似变换就是进行了坐标转换。

坐标转换是数学中的常用伎俩,目的是简化运算。比如常见的,把直角坐标系(坐标系)的圆方程换元为极坐标(坐标系)下:

图像也从左边变为了右边:

换元之后是不是代数式和图像都变简单了。相似变换也是这样的目的。

3 线性变换

什么是线性变换?让我们从函数说起。

3.1 线性函数

函数我们很早就接触了,直观地讲,就是把轴上的点映射到曲线上(下面是函数,把轴上的点映射到了正弦曲线上):

还有的函数,比如,是把轴上的点映射到直线上,我们称为线性函数:

3.2 从线性函数到线性变换

线性函数其实就是线性变换,为了看起来更像是线性变换,我换一种标记法。

比如之前的,我们可以认为是把点映射到点,我们称为线性变换,记作:

不过按照这个写法,作图就有点不一样了:

矩阵的形式很显然如下:

这样做最直接的好处是,我们可以轻易的摆脱轴的限制。

只要替换为平面内所有的点,我们就可以对整个平面做变换,该线性变换记作:

进而可以写作矩阵的形式:

为了示意整个平面的点都被变换了,我用下面的淡蓝色网格来表示这个线性变换(这个变换实际上镜面反转,为了方便观察增加一个参考点以及虚线表示的反转对称轴):

我们记:

我们可以得到更简便的记法(这种形式看起来也更像线性方程):

反正都是指代的平面上所有的点,我们干脆更简化点,认为:

不过是这个的一种特殊情况。

3.3 矩阵与基

慢着!刚才的结论其实是不完整的,我们还少了一个信息。

是基于直角坐标系的,通过这个转换:

得到的也是基于直角坐标系的。

只是在线性变换中,我们不称为直角坐标系,我们叫做标准正交基。

标准正交基是,它们所张成的线性空间如下(关于这幅图画的解释,可以参考可以参看:“从高斯消元法到矩阵乘法”以及“如何理解矩阵乘法?”):

在此基下,完成了镜面反转这个线性变换:

因此,让我们补完之前的结论:

看到这个结论,可能你会想,难道还可以在别的基下?在别的基下是什么情况啊?

好,终于到了我们本文的重点了。

4 相似矩阵

知道了线性变换,让我们回到文章开头就给出的隐喻,看电影。

线性变换就是电影院中播放的电影,不同的基坐在不同的位置观看:

同一部“电影”,不同基“看到”的就是不同的矩阵:

那怎么得到不同基下的矩阵呢?让我们来看看变换的细节。

4.1 细节

先上一张图,说明不同基下的矩阵的变换思路,这个图有点复杂,请参照之后的解释一起来看:

下面是对图的解释:

  • 有两个基:
  • ,可以通过转换
  • ,可以通过转换

整个转换的核心,就是上图正中的文字:

解释下:

  • 下的点
  • 通过变为下的点,即
  • 下,通过矩阵完成线性变换,即
  • 通过从变回下的点,即

综上,我们可以有:

我们可以认为:

那么互为相似矩阵。

那就还有一个细节了,的转换矩阵

这个问题不复杂,只是坐标换来换去的,我尽量讲清楚。

首先我们空间中的一点,比如说点吧:

相信大家可以理解,不论有没有基,这个点都是客观存在的。

然后,我们给出点在的坐标

为了表示下的坐标,我们写成这样:

如果我们知道了下的坐标:

那么有:

此时,实际上点的坐标,已经变到了下的

坐标已经转换了,继续往下推:

所以其实就是:

要记得啊,上面的是在下的坐标。

这里面稍微复杂点的就是,转换的时候要想清楚到底是在哪个基下!

为什么我们需要相似矩阵呢?

4.2 对角矩阵

比如这个矩阵:

可以这样分解:

其中

就是对角矩阵,看上去就很清爽,所以说相似变换就是坐标转换,转换到一个更方便计算的简单坐标系。

关于这方面更多的可以参看,如何理解矩阵特征值和特征向量?

关注马同学
马同学高等数学
微信公众号:matongxue314