Loading [MathJax]/extensions/AssistiveMML.js

如何理解线性微分方程?

线性微分方程为什么有“线性”这两个字?为什么线性微分方程的通解包含e^x?
刚开始学习线性微分方程的时候,我心中有两个疑问:
  • 线性微分方程为什么有“线性”这两个字?
  • 为什么线性微分方程的通解里面有e^x
这篇文章就来回答这两个问题。让我们从什么是线性变换开始。
1 线性变换
先直观感受一下什么是线性变换。
1.1 线性变换的几何意义
直观来说,线性变换就是把直线上的点(向量),变换到另外一根直线上去。关于这个问题更具体的解释,请参看文章如何理解相似矩阵的前半部分。
比如下图,把虚线上的点,变换到实线上去:
或者把整个二维平面上的直线换个位置(下面是一个镜面翻转,为了方便观察,标出一个\vec{x_{}},虚线表示翻转的对称轴):
1.2 微分算子
我们来看一个不一样的向量,对于多项式函数:
f(x)=1+2x+3x^2
我们以\vec{i_{}}=1,\vec{j_{}}=x,\vec{k_{}}=x^2为基(关于多项式的基,可以参看《线性代数应该这样学》这样的高等代数教材),可以把它转为向量:
f(x)=1+2x+3x^2\implies \vec{f_{}}=\begin{pmatrix}1\\2\\3\end{pmatrix}
画出来图来就是(三个坐标轴分别表示1,x,x^2这三个基,当然这里有点不严格,准确来说,三个基并不是两两正交的):
我们定义D为微分算子:
D=\frac{d}{dx}
那么有:
D(f(x))=\frac{df(x)}{dx}=2+6x
还可以把D写成一个矩阵(对于更高次的多项式,D的矩阵是类似的):
D=\begin{pmatrix}0&1&0\\0&0&2\end{pmatrix}
然后通过矩阵来完成求导操作:
D\vec{f_{}}=\begin{pmatrix}0&1&0\\0&0&2\end{pmatrix}\begin{pmatrix}1\\2\\3\end{pmatrix}=\begin{pmatrix}2\\6\end{pmatrix}\implies D(f(x))=2+6x
从图像上看,就是把通过D矩阵把\vec{f_{}}=\begin{pmatrix}1\\2\\3\end{pmatrix}投影到1-x平面:
这样看来,微分算子D也是一个线性变换。
1.3 代数定义
在数学中,只要符合下面两个性质的就是线性变换(T代表变换):
  • 可加性:T(\vec{x_{}}+\vec{y_{}})=T(\vec{x_{}})+T(\vec{y_{}})
  • 齐次性:T(a\vec{x_{}})=aT(\vec{x_{}})
上一节中,通过几何展示的线性变换都符合上述两个性质。
比如,我们有两个多项式函数:
f(x)=1+2x+3x^2\qquad g(x)=2+3x+4x^2
那么容易验证,D是一个线性变换:
  • 可加性:D(f(x)+g(x))=D(f(x))+D(g(x))=5+14x
  • 齐次性:D(af(x))=aD(f(x))=a(2+6x)
进一步的,D的多项式组合:
\mathcal{L}=a_0+a_1D+a_2D^2+\cdots+a_nD^n,a_0,a_1,\cdots,a_n\in\mathbb{C}
也是线性变换,这一点可以自行去验证。
2 线性微分方程
既然D的多项式组合\mathcal{L}是线性变换,那么线性微分方程为什么是“线性”的,答案呼之欲出。
2.1 线性微分方程的定义
定义下式为常系数(因为a_0,a_1,\cdots,a_n是常数)线性微分方程:
\mathcal L(y)=f(x)
如果,f(x)=0,则为常系数齐次线性微分方程:
\mathcal L(y)=0
如果,f(x)\ne0,则为常系数非齐次线性微分方程:
\mathcal L(y)=f(x),f(x)\ne0
如果a_0,a_1,\cdots,a_nx的函数,那么就是变系数线性微分方程。本文不讨论这种情况。
解释一下:
\mathcal{L}(y)=0
可以类比于齐次线性方程:
A\vec{x_{}}=0
所以我们称\mathcal{L}(y)=0为齐次线性微分方程。
不光是可以这么类比,实际上解法都是一样的。我们先来看看齐次线性方程是怎么解的。
2.2 齐次线性方程的解法
对于齐次线性方程:
A\vec{x_{}}=0
我们怎么解?
我们知道,A的特征值和特征向量满足下面这个等式:
A\vec{x_{}}=\lambda\vec{x_{}},\vec{x}\ne 0
那么特征值\lambda=0对应的特征向量\vec{x_{}}必定是A的解。
2.3 \mathcal{L}的特征值、特征向量
那么\mathcal{L}的特征值和特征向量是多少?
根据特征值和特征向量的定义,对于\mathcal{L}=D有:
\mathcal{L}(e^{nx})=D(e^{nx})=ne^{nx}
所以,其特征值为\lambda=n,特征向量为e^{nx}
啊哈,e^{nx}出现了,为什么线性微分方程的通解里面有e^{nx},是因为e^{nx}D的特征向量啊。
同理,对于\mathcal{L}=D^2-2D-8有:
(D^2-2D-8)(e^{nx})=(n^2-2n-8)e^{nx}
所以,其特征值为\lambda=n^2-2n-8,特征向量为e^{nx}
2.4 解常系数齐次线性微分方程
万事具备,我们开始解方程吧。
对于:
D(y)=0
实在太简单了,y=C,C\in\mathbb{R}
对于:
y''-2y'-8y=0 \implies \mathcal{L}(y)=(D^2-2D-8)(y)=0
对于此\mathcal{L},求它的0特征值:
\lambda=n^2-2n-8=0\implies n_1=4,n_2=-2
对应的特征向量为,e^{4x},e^{-2x},这两个特征向量线性无关,因此得到解为:
y=C_1e^{4x}+C_2e^{-2x}
如果得到的特征值相同,那么就需要另外讨论一下。
2.5 解常系数非齐次线性微分方程
对于非齐次线性微分方程:
(D^2-2D-8)(y)=e^{2x}
可以类比线性方程的解的结构:
马同学高等数学
先求出齐次方程的解,然后根据初始条件得到一个特解y^*,得到:
y=C_1e^{4x}+C_2e^{-2x}+y^*
还有一种做法,因为:
\displaystyle(\frac{1}{2}D-1)e^{2x}=0
所以可以得到:
\displaystyle(\frac{1}{2}D-1)\underbrace{(D^2-2D-8)(y)}_{e^{2x}}=0
得到一个新的齐次线性微分方程,然后根据刚才介绍的方法进行求解。不过这样就需要求解三次方程,或许比特解法复杂一些,这里只是展示一下理解了线性微分方程的含义之后,我们可以更灵活的处理。
3 总结
文章开头的两个问题,现在有了答案:
  • 因为\mathcal{L}是线性的,所以线性微分方程是线性
  • 因为e^{nx}\mathcal{L}的特征向量,所以通解里面有e^{nx}
关注马同学
马同学高等数学
微信公众号:matongxue314