牛顿和莱布尼茨的导数
我们想要梳理一下导数发展最初的萌芽概念, 主要内容来自[1].
背景
17 世纪是现代科学发展的革命性时期. 伽利略在 1610 年开始利用最先进的太空望远镜对木星的月球进行研究; 开普勒在 1619 年已经发表了他的关于行星运动的三大定律. 截止世纪末, 牛顿 (Issac Newton, 1642-1727) 用他的力学定律和万有引力定律基本奠定了现代科学的基础.
数学擅长处理一些定义好的静态事物, 但是对物理世界的研究需要一种新的数学理论, 他必须能够处理不断变化的系统. 在此背景下, 微积分学的基本概念开始在欧洲出现. Newton 和 Leibniz 做出了决定性的贡献.
对 Newton 来说, 曲线只是一个运动质点的轨迹. 在他看来, 微积分的基本问题是随后对其速度的计算. 换句话说, 他需要能够从研究质点的位置转变到研究质点的运动方向. Newton 将微积分视为力学和引力分析的重要工具.
不幸的是, 微积分的发现陷入了争议之中 (在许多不同的层面上), Leibniz 也声称自己是微积分的发现者. Leibniz 的方法更为抽象, 他只是试图确定曲线上任意一点的切线斜率.
从现代的观点来看, 两个问题等价为计算函数 \(y=f(x)\) 的导数 \(f'(x)\) 或 \(\frac{dy}{dx}\), 它表示这个函数的瞬时变化率.
两人晚年都为所有权问题争得面红耳赤. 在某种程度上, 由于 Newton 作为皇家学会主席所拥有的巨大权力, 他似乎获得了微积分之父的历史荣誉. 然而, 毫无疑问, Leibniz 的方法和符号一直流传至今, 为我们提供了对导数基本工作原理的更深入的了解.
尽管 Leibniz 的这些术语直到很久以后才被使用, 但他对导数的抽象, 近乎哲学的研究方法是纯粹数学家的方法, 而实用主义的 Newton 可以被称为应用数学家或物理学家. 但是, 两人都没有完全解决导数形式定义的技术问题. 这还需要 150 年的深入分析. 我们将详细研究 Newton 和 Leibniz 的两种不同技术.
Newton 的方法
牛顿将曲线看作是一个质点随时间变化时的移动轨迹: 变量 \(y\) 和 \(x\) 看作是流动的流体. 时间变化率 (速度) \(\dot{x}\) 和 \(\dot{y}\) 称为流数. 假设初始位置在点 \(P(x,y)\), 经过一小段时间 \(O\), 移动到曲线上的点 \(Q(x+O \dot{x},y+O \dot{y})\). 由于 \(P,Q\) 都在曲线上, 因此满足方程:\[ \begin{align*} y&= 5x^2 \\ y+O \dot{y} &= 5(x+O \dot{x})^2. \end{align*}\]通过展开第二个等式并利用第一个等式可得 \(O \dot{y}=10 x O \dot{x} +5(O \dot{x})^2\). 等式两边同时除以 \(O\):\[ \dot{y}=10 x \dot{x} +5O \dot{x}^2 \quad \overbrace{\Rightarrow}^{O \to 0} \quad \dot{y}=10 x \dot{x}\]因此 \(\frac{\dot{y}}{\dot{x}}=10 x\), 这就是切线的梯度.
如果从增量的角度来看: 经过一小段时间后, \(x,y\) 的增量分别是 \(O \dot{x}, O \dot{y}\), 从而割线 \(PQ\) 的梯度为 \(\frac{\dot{y}}{\dot{x}}=\frac{O \dot{y}}{O \dot{x}}=10x+5(O \dot{x})\), 它的极限 (\(Q\) 无限靠近 \(P\)) 就是切线的梯度, 即 \(10x\).
Leibniz 的方法
Leibniz 的方法在任何观点下是和 Newton 的方法相同的, 但是没有利用时间或流数的概念. 从变量增量的观点来看, 设点 \(P(x,y)\) 移动到曲线上的点 \(Q(x+\Delta x,y+\Delta y)\), 割线 \(PQ\) 的梯度为 \(\frac{\Delta y}{\Delta x}\). 因为\[ y+\Delta y = 5 (x+\Delta x)^2,\quad \Delta y = 10x \Delta x+5 (\Delta x)^2,\]可得 \(\frac{\Delta y}{\Delta x}=10x+5 \Delta x\to 10 x\), \(\Delta x \to 0\). 这里 \(\Delta x \to 0\) 是指 \(Q\) 无限靠近 \(P\), 因为此时割线应该与切线重合, 对应的梯度也会相等.
无穷小 (Infinitesimals) 的概念问题
Newton 和 Leibniz 更多地是将无穷小看作是一个方便的符号: 当需要无穷小不是零的时候它可以不是零, 例如当除以无穷小的时候; 当结论需要它是零的时候它又可以趋于零或成为零, 例如梯度上面两个梯度问题的最后一步. 后来他们的同事, 特别是 Bernoulli 兄弟, 坚持认为无穷小是一个游走在零和最开始的正数之间的某个地方的量, 并且认为这也解释了无穷小即是零也不是零这样一个存在问题.
关于无穷小的争议一直持续了 150 年左右才得到解决. 十八世纪, Cauchy 和 Weierstrass 建立起了极限 \(\lim_{x \to x_0} f(x) \) 的严格定义, 无穷小也从神秘未知走向了确定. 得益于此, 函数 \(y=f(x)\) 的导数也有了严格的定义:\[ \frac{dy}{dx} = \lim_{h \to 0} \frac{f(x+h)-f(x)}{h}.\]利用这个定义我们可以得到函数 \(y=5x^2\) 的导数:\[ \begin{align*}\frac{dy}{dx} &= \lim_{h \to 0} \frac{f(x+h)-f(x)}{h}\\ &= \lim_{h \to 0} \frac{5(x+h)^2-5x^2}{h}\\ &= \lim_{h \to 0} \frac{10x h + 5h^2}{h}\\ &= \lim_{h \to 0} 10x+5h \\ &=10x. \end{align*}\]