当前位置:   article > 正文

人工智能数学基础之高等数学_人工智能技术应用专业高等数学

人工智能技术应用专业高等数学

引言

不懂数学是学不好人工智能的,本系列文章就汇总了人工智能所需的数学知识。本文是高等数学篇。

另有线代篇和概率论篇。

函数与极限

函数

y = f ( x ) y = f(x) y=f(x) ,x是函数f的自变量,y是因变量

函数极限

lim ⁡ x → x 0 f ( x ) = A \lim\limits_{x \to x_0} f(x) = A xx0limf(x)=A x x x无限接近于 x 0 x_0 x0时, f ( x ) f(x) f(x)无限接近于常数A。

x x x趋于 x 0 x_0 x0有三种写法:

{ x → x 0 x → x 0 + x → x 0 − {xx0xx+0xx0

xx0xx0+xx0

第一种是 x x x无限趋近于 x 0 x_0 x0,解释是它们相差的绝对值是无穷小的;
第二种是从大于 x 0 x_0 x0的方向趋近(从右侧);
第二种是从小于 x 0 x_0 x0的方向趋近(从左侧);

x → ∞ x \rightarrow \infty x也有三种写法:

{ x → ∞ x → + ∞ x → − ∞ {xx+x

xx+x

第一种表示 ∣ x ∣ |x| x无穷大的,同样也可能是正数或负数;
第二种表示趋向于正无穷大;
第三种表示趋向于负无穷大;

函数极限的定义:

如果 ∀ ϵ > 0 \forall \epsilon > 0 ϵ>0(对于任意的 ϵ \epsilon ϵ大于0), ∃ δ > 0 \exist \delta > 0 δ>0(存在 δ \delta δ大于0),当 0 < ∣ x − x 0 ∣ < δ 0 < | x - x_0| < \delta 0<xx0<δ时,总有 ∣ f ( x ) − A ∣ < ϵ |f(x) - A| < \epsilon f(x)A<ϵ,则称 lim ⁡ x → x 0 f ( x ) = A \lim\limits_{x \to x_0} f(x) = A xx0limf(x)=A

在这里插入图片描述

我们可以通过图形来理解极限,如上图,该函数的极限为0( x → − ∞ x \rightarrow -\infty x x → + ∞ x \rightarrow +\infty x+ ,都趋向于0,因此说 x → ∞ x \rightarrow \infty x 时极限为0 )

该图形对应的代码为:

import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure()
x = np.linspace(-100, 100, 100)
y = 1/x

ax = fig.add_subplot(111)
ax.plot(x, y)
ax.spines['left'].set_position('zero')
ax.spines['right'].set_color('none')
ax.spines['bottom'].set_position('zero')
ax.spines['top'].set_color('none')

# remove the ticks from the top and right edges
ax.xaxis.set_ticks_position('bottom')
ax.yaxis.set_ticks_position('left')

plt.axhline(0,color = 'red',linestyle = '--',alpha = 0.5)

plt.show()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

无穷小与无穷大

无穷小

极限为零的变量称为无穷小。

若有 f ( x ) f(x) f(x),当 x → x 0 x \rightarrow x_0 xx0(或 x → ∞ x \rightarrow \infty x) 极限为零,则称 f ( x ) f(x) f(x) x → x 0 x \rightarrow x_0 xx0(或 x → ∞ x \rightarrow \infty x) 时的无穷小

例如 lim ⁡ x → 0 sin ⁡ x = 0 \lim\limits_{x \to 0} \sin x = 0 x0limsinx=0,函数 sin ⁡ x \sin x sinx是当 x → 0 x \rightarrow 0 x0时的无穷小。

在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure()
x = np.linspace(-np.pi, np.pi, 100)
y = np.sin(x)

ax = fig.add_subplot(111)
ax.plot(x, y)
ax.spines['left'].set_position('zero')
ax.spines['right'].set_color('none')
ax.spines['bottom'].set_position('zero')
ax.spines['top'].set_color('none')

# remove the ticks from the top and right edges
ax.xaxis.set_ticks_position('bottom')
ax.yaxis.set_ticks_position('left')

#plt.axhline(0,color = 'red',linestyle = '--',alpha = 0.5)

plt.show()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

无穷大

若有 f ( x ) f(x) f(x),当 x → x 0 x \rightarrow x_0 xx0(或 x → ∞ x \rightarrow \infty x) f ( x ) f(x) f(x)无限增大,则称 f ( x ) f(x) f(x) x → x 0 x \rightarrow x_0 xx0(或 x → ∞ x \rightarrow \infty x) 时的无穷大

记作 lim ⁡ x → x 0 f ( x ) = ∞ \lim\limits_{x \to x_0} f(x) = \infty xx0limf(x)= lim ⁡ x → ∞ f ( x ) = ∞ \lim\limits_{x \to \infty} f(x) = \infty xlimf(x)=

无穷大和无穷小都是有条件的,即趋于某一点或无穷大时。

在这里插入图片描述

同样是 y = 1 x y = \frac{1}{x} y=x1这个函数,当 x → 0 x \rightarrow 0 x0时(从两个方向), y y y都是无限增大的。

极限的四则运算

lim ⁡ f ( x ) = A \lim f(x) =A limf(x)=A, lim ⁡ g ( x ) = B \lim g(x) = B limg(x)=B,则

  1. lim ⁡ [ f ( x ) ± g ( x ) ] = A ± B \lim [f(x) \pm g(x)] = A \pm B lim[f(x)±g(x)]=A±B
  2. lim ⁡ [ f ( x ) ⋅ g ( x ) ] = A ⋅ B \lim [f(x) \cdot g(x)] = A \cdot B lim[f(x)g(x)]=AB
  3. lim ⁡ f ( x ) g ( x ) = A B \lim \frac{f(x)}{g(x)} = \frac{A}{B} limg(x)f(x)=BA,其中 B B B不等于 0 0 0
  • 两个无穷小的和是无穷小
  • 有界函数和无穷小的乘积是无穷小

常见函数的极限

1.求 lim ⁡ x → 1 x 2 − 1 x − 1 \lim\limits_{x \to 1} \frac{x^2-1}{x-1} x1limx1x21

lim ⁡ x → 1 x 2 − 1 x − 1 = lim ⁡ x → 1 ( x + 1 ) ( x − 1 ) x − 1 = lim ⁡ x → 1 ( x + 1 ) = 2 \lim\limits_{x \to 1} \frac{x^2-1}{x-1} = \lim\limits_{x \to 1} \frac{(x+1)(x-1)}{x-1} = \lim\limits_{x \to 1} (x+1) = 2 x1limx1x21=x1limx1(x+1)(x1)=x1lim(x+1)=2
由于分母的极限为0,不能用法则3,但是可以约分,因此先约分再求极限。
2. lim ⁡ x → ∞ 1 x = 0 \lim\limits_{x \to \infty} \frac{1}{x} = 0 xlimx1=0
3. lim ⁡ x → 0 sin ⁡ x x = 1 \lim\limits_{x \to 0} \frac{\sin x}{x}=1 x0limxsinx=1
4. lim ⁡ x → ∞ ( 1 + 1 x ) x = e \lim\limits_{x \to \infty} (1+ \frac{1}{x})^x=e xlim(1+x1)x=e lim ⁡ x → 0 ( 1 + x ) 1 x = e \lim\limits_{x \to 0} (1+ x)^{\frac{1}{x}}=e x0lim(1+x)x1=e

函数连续

设函数 y = f ( x ) y=f(x) y=f(x),在 x 0 x_0 x0的邻域内有定义,若 lim ⁡ x → x 0 f ( x ) = f ( x 0 ) \lim\limits_{x \to x_0} f(x) = f(x_0) xx0limf(x)=f(x0),则称 f ( x ) f(x) f(x)在点 x 0 x_0 x0处连续。

在这里插入图片描述
上图左边的函数是连续的,而右边的函数不是连续的。

举例

讨论 f ( x ) = { x + 2 , x ≥ 0 x − 2 , x < 0 在 x = 0 处的连续性 讨论 f(x) = {x+2,x0x2,x<0

在 x = 0处的连续性 讨论f(x)={x+2,x0x2,x<0x=0处的连续性

解:
函数在 x = 0 x = 0 x=0处有定义,
lim ⁡ x → 0 + f ( x ) = lim ⁡ x → 0 + ( x + 2 ) \lim\limits_{x \to 0^+} f(x) = \lim\limits_{x \to 0^+} (x+2) x0+limf(x)=x0+lim(x+2) = 2

lim ⁡ x → 0 − f ( x ) = lim ⁡ x → 0 − ( x − 2 ) \lim\limits_{x \to 0^-} f(x) = \lim\limits_{x \to 0^-} (x-2) x0limf(x)=x0lim(x2) = -2
因此极限不存在,该函数在0处不连续。

连续函数的和差积商也是连续的;连续函数的符合函数是连续的;基本初等函数在其定义域内都连续。

导数

在这里插入图片描述
y = f ( x ) y = f(x) y=f(x), x 0 → x 0 + Δ x x_0 \rightarrow x_0 + \Delta x x0x0+Δx,则 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y = f(x_0 + \Delta x) - f(x_0) Δy=f(x0+Δx)f(x0),
lim ⁡ Δ x → 0 Δ y Δ x \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} Δx0limΔxΔy 存在,则称 y = f ( x ) y = f(x) y=f(x)在点 x 0 x_0 x0处可导。

x 0 x_0 x0处的导数值,简称为导数,记作 f ′ ( x 0 ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f ^\prime (x_0) = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim\limits_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} f(x0)=Δx0limΔxΔy=Δx0limΔxf(x0+Δx)f(x0)

导数的理解:

  1. 指的是该点的变化率,可能是变大(导数为正),也可能变小(导数为负)
  2. 从几何意义上,是该点切线的斜率

怎么理解导数是变化率:

  1. 就是如果自变量x继续增加,因变量y的变化。
  2. 如果导数大于0,则y变大;如果导数小于0,则y变小。
  3. 自变量x沿着导数地方向变化,就是沿着因变量y增加的方向变化

可导和连续

先来看一下连续和可导的几何意义

在这里插入图片描述

连续就是不间断, x 0 x_0 x0点左极限等于右极限等于 f ( x 0 ) f(x_0) f(x0)的值;如果自变量增量趋于0时,因变量增量不趋于0,那么也就是说 f ( x ) − lim ⁡ f ( x 0 ) ( x → x 0 ) f(x) - \lim f(x_0) (x \rightarrow x_0) f(x)limf(x0)(xx0)不等于0,那么也就是说在 x 0 x_0 x0点左极限或者右极限不等于 f ( x 0 ) f(x_0) f(x0)那么这种情况只能是间断的,所以自变量趋于0时,因变量一定也要趋于0时,才连续。

连续几何上看就是函数的图形不间断;可导的几何意义是曲线在该点处有斜率且斜率存在。

那么可导和连续的关系,我们可以通过一个图形来理解:

在这里插入图片描述
由于在 x 2 x_2 x2 x 4 x_4 x4处是断开的,不连续,无法做出切线,就没有切线的斜率一说了,因此不可导。
x 3 x_3 x3chu处是连续的,但是图形在 x 3 x_3 x3处不光滑,没有办法做出唯一的切线,因此该点是不可导的。
x 5 x_5 x5处斜率不存在,不可导。

光滑函数:曲线不尖锐,必光滑。连续光滑的曲线,必然处处有切线,这点是必然的,没有切线(或没有唯一的切线)的地方,就不光滑。

由上可知,不连续一定不可导;可导则必然连续;连续不一定可导。

最后以一个图片作为总结:
在这里插入图片描述

导数的四则运算

设函数 u = u ( x ) u = u(x) u=u(x) v = v ( x ) v = v(x) v=v(x)在点 x x x处可导,则其和、差、积、商在 x x x处也可导,有以下法则和推论:

  1. ( u ± v ) ′ = u ′ ± v ′ (u \pm v)^\prime = u^\prime \pm v^\prime (u±v)=u±v
  2. ( u v ) ′ = u ′ v + u v ′ (uv)^\prime = u^\prime v + uv^\prime (uv)=uv+uv (第一项求导乘第二项 加 第一项不动乘第二项的导数)
  3. ( u v ) ′ = u ′ v − u v ′ v 2 (\frac{u}{v})^\prime = \frac{u^\prime v - uv^\prime}{v^2} (vu)=v2uvuv ( v v v ≠ 0)

推论:

  1. ( C u ) ′ = C u ′ (Cu)^\prime = Cu^\prime (Cu)=Cu ( C C C u ′ u\prime u相加)
  2. ( u v w ) ′ = u ′ v w + u v ′ w + u v w ′ (uvw)^\prime = u^\prime vw + uv^\prime w + uvw^\prime (uvw)=uvw+uvw+uvw (第一个函数求导二三函数不动 加第二个函数求导一三不动 加 一二不动第三个函数求导)

我们来利用这些法则求导 ( tan ⁡ x ) ′ (\tan x) ^\prime (tanx)

( tan ⁡ x ) ′ = ( sin ⁡ x cos ⁡ x ) ′ = ( sin ⁡ x ) ′ cos ⁡ x − sin ⁡ x ( cos ⁡ x ) ′ cos ⁡ 2 x (\tan x)^\prime = \Big( \frac{\sin x}{\cos x} \Big)^\prime = \frac{(\sin x)^\prime \cos x - \sin x (\cos x)^\prime}{\cos ^2 x} (tanx)=(cosxsinx)=cos2x(sinx)cosxsinx(cosx)
= cos ⁡ 2 x + sin ⁡ 2 x cos ⁡ 2 x = 1 cos ⁡ 2 x = sec ⁡ 2 x \quad\quad\quad = \frac{\cos ^2 x + \sin ^2 x}{\cos ^2 x} = \frac{1}{\cos^2 x} = \sec^2 x =cos2xcos2x+sin2x=cos2x1=sec2x

复合函数求导法

设函数 y = f ( u ) , u = φ ( x ) y = f(u),u = \varphi (x) y=f(u),u=φ(x)均可导,则复合函数 y = f ( φ ( x ) ) y = f(\varphi (x)) y=f(φ(x))的导数

d y d x = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 Δ y Δ u ⋅ Δ u Δ x \frac{dy}{dx} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta u} \cdot \frac{\Delta u}{\Delta x} dxdy=Δx0limΔxΔy=Δx0limΔuΔyΔxΔu

y = f ( x ) y = f(x) y=f(x) 可导,则 f ( x ) f(x) f(x)连续,则有 lim ⁡ Δ x → 0 Δ y = 0 \lim\limits_{\Delta x \to 0} \Delta y = 0 Δx0limΔy=0 ,可推出 lim ⁡ Δ x → 0 Δ u = 0 \lim\limits_{\Delta x \to 0} \Delta u= 0 Δx0limΔu=0

那么 Δ x → 0 \Delta x \rightarrow 0 Δx0 Δ u → 0 \Delta u \rightarrow 0 Δu0是等效的,上式有:

d y d x = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 Δ y Δ u ⋅ Δ u Δ x = lim ⁡ Δ u → 0 Δ y Δ u ⋅ lim ⁡ Δ x → 0 Δ u Δ x = d y d u ⋅ d u d x \frac{dy}{dx} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta u} \cdot \frac{\Delta u}{\Delta x} = \lim\limits_{\Delta u \to 0} \frac{\Delta y}{\Delta u} \cdot \lim\limits_{\Delta x \to 0} \frac{\Delta u}{\Delta x} = \frac{dy}{du} \cdot \frac{du}{dx} dxdy=Δx0limΔxΔy=Δx0limΔuΔyΔxΔu=Δu0limΔuΔyΔx0limΔxΔu=dudydxdu

由上可得复合函数求导法则

设函数 y = f ( u ) , u = φ ( x ) y = f(u),u = \varphi (x) y=f(u),u=φ(x)均可导,则复合函数 y = f ( φ ( x ) ) y = f(\varphi (x)) y=f(φ(x))也可导,且 d y d x = d y d u ⋅ d u d x \frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx} dxdy=dudydxdu 或写成 y x ′ = y u ′ ⋅ u x ′ y^\prime _x = y^\prime _u \cdot u^\prime _x yx=yuux

高阶导数

定义:如果函数 f ( x ) f(x) f(x)的导数 f ′ ( x ) f ^\prime (x) f(x) x x x点处可导,则称 ( f ′ ( x ) ) ′ (f ^\prime (x))^\prime (f(x))为函数 f ( x ) f(x) f(x) x x x处的二阶导数,记为: y ′ ′ , f ′ ′ ( x ) , d 2 y d x 2 y {^\prime}{^\prime},f {^\prime}{^\prime}(x),\frac{d^2y}{dx^2} y,f(x),dx2d2y

同理,二阶导数的导数称为函数 f ( x ) f(x) f(x)的三阶导数,记为: y ′ ′ ′ , f ′ ′ ′ ( x ) , d 3 y d x 3 y {^\prime}{^\prime}{^\prime},f {^\prime}{^\prime}{^\prime}(x),\frac{d^3y}{dx^3} y,f(x),dx3d3y

n − 1 n-1 n1阶导数的导数称为函数 f ( x ) f(x) f(x) n n n阶导数,记作: y ( n ) , f ( n ) ( x ) , d n y d x n y^{(n)},f^{(n)}(x),\frac{d^ny}{dx^n} y(n),f(n)(x),dxndny

二阶及二阶以上的导数称为高阶导数。

记法说明:

  • d 2 y d x 2 = d d x ( d y d x ) \frac{d^2y}{dx^2} = \frac{d}{dx}(\frac{dy}{dx}) dx2d2y=dxd(dxdy)
  • y ′ ′ , y ′ ′ ′ , y ( 4 ) , . . . , y ( n ) y{^\prime}{^\prime},y{^\prime}{^\prime}{^\prime},y^{(4)},...,y^{(n)} y,y,y(4),...,y(n)

偏导数

要学习偏导数,先要了解二元函数的概念

二元函数

所谓二元函数,即因变量有两个的函数。例如圆柱体体积计算公式为 V = π r 2 h , { ( r , h ) ∣ r > 0 , h > 0 } V = \pi r^2h,\{(r,h)|r > 0, h > 0\} V=πr2h,{(r,h)r>0,h>0}
相应的,n元函数就是有n个因变量的函数。

偏导数的概念

设函数 z = f ( x , y ) z = f(x,y) z=f(x,y)在点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)的某一邻域内有定义,当 y y y固定 y 0 y_0 y0 x x x x 0 x_0 x0处有增量 Δ x \Delta x Δx时,相应地函数有偏增量
Δ x z = f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) \Delta_x z = f(x_0 + \Delta x,y_0) - f(x_0,y_0) Δxz=f(x0+Δx,y0)f(x0,y0),
如果 lim ⁡ Δ x → 0 f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) Δ x \lim\limits_{\Delta x \to 0} \frac{ f(x_0 + \Delta x,y_0) - f(x_0,y_0)}{\Delta x} Δx0limΔxf(x0+Δx,y0)f(x0,y0)存在,则称此极限为函数 z = f ( x , y ) z = f(x,y) z=f(x,y)在点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)处对 x x x偏导数
记为 在这里插入图片描述

z x ∣ y = y 0 x = x 0 = lim ⁡ Δ x → 0 f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) Δ x \left.z_x\right|_{y = y_0}^{x = x_0} = \lim\limits_{\Delta x \to 0} \frac{ f(x_0 + \Delta x,y_0) - f(x_0,y_0)}{\Delta x} zxy=y0x=x0=Δx0limΔxf(x0+Δx,y0)f(x0,y0)

y y y的偏导数同理。

要注意的是, 函数在一点处偏导存在,则函数在这点不一定连续

偏导数的几何意义

在这里插入图片描述

练习一下,我们来求 z = x 2 + 3 x y + y 2 z = x^2 + 3xy + y^2 z=x2+3xy+y2 在点(1,2)处的偏导数.

∂ z ∂ x = 2 x + 3 y \frac{\partial z}{\partial x} = 2x + 3y xz=2x+3y, ∂ z ∂ y = 3 x + 2 y \frac{\partial z}{\partial y} = 3x + 2y yz=3x+2y
∂ z ∂ x = 2 ⋅ 1 + 3 ⋅ 2 = 8 \frac{\partial z}{\partial x} = 2 \cdot 1 + 3\cdot 2 = 8 xz=21+32=8
∂ z ∂ y = 3 ⋅ 1 + 2 ⋅ 2 = 7 \frac{\partial z}{\partial y} = 3 \cdot 1 + 2\cdot 2 = 7 yz=31+22=7

注意,求偏导的时候,把其他因变量看成常量

微分

对于函数 y = f ( x ) , x → x + Δ x y = f(x),x \rightarrow x +\Delta x y=f(x),xx+Δx,
因变量增量为 Δ y = f ( x + Δ x ) − f ( x ) \Delta y = f(x + \Delta x) - f(x) Δy=f(x+Δx)f(x)

导数(变化率)有 f ′ ( x ) = lim ⁡ Δ x → 0 Δ y Δ x ⟹ Δ x → 0 , Δ y Δ x → f ′ ( x ) ⟹ ∣ Δ x ∣ f^\prime (x) = \lim\limits_{\Delta x \to 0} \frac{\Delta y}{\Delta x} \Longrightarrow \Delta x \rightarrow 0,\frac{\Delta y}{\Delta x} \rightarrow f^\prime (x) \Longrightarrow |\Delta x| f(x)=Δx0limΔxΔyΔx0,ΔxΔyf(x)∣Δx充分小时, Δ y Δ x ≈ f ′ ( x ) \frac{\Delta y}{\Delta x} \approx f^\prime (x) ΔxΔyf(x)
也就是说, ∣ Δ x ∣ |\Delta x| ∣Δx充分小时, Δ y ≈ f ′ ( x ) Δ x \Delta y \approx f^\prime (x) \Delta x Δyf(x)Δx

我们称 f ′ ( x ) Δ x f^\prime (x) \Delta x f(x)Δx为函数的微分,记为 d y = f ′ ( x ) Δ x dy = f^\prime (x) \Delta x dy=f(x)Δx

微分的意义是因变量增量的近似值(函数变化的程度)

在这里插入图片描述

∣ Δ x ∣ |\Delta x| ∣Δx充分小时, Δ y ≈ d y \Delta y \approx dy Δydy

微分 d y = f ′ ( x ) Δ x dy = f^\prime (x) \Delta x dy=f(x)Δx d x = ( x ) ′ ⋅ Δ x = Δ x dx = (x)^\prime \cdot \Delta x = \Delta x dx=(x)Δx=Δx
因此,微分也可以表示为 d y = f ′ ( x ) d x dy = f^\prime (x) dx dy=f(x)dx
将两边同除 d x dx dx得:
d y = f ′ ( x ) d x ⟺ d y d x = f ′ ( x ) dy = f^\prime (x) dx \Longleftrightarrow \frac{dy}{dx} = f^\prime(x) dy=f(x)dxdxdy=f(x)
导数从微分的角度看可以表示成因变量的微分比上自变量的微分,所以导数还有个别名叫微商。

由此也可以看出可微和可导是等价的,因此求微分时可以先求导数,再改写为微分。

中值定理

罗尔定理

如果函数 y = f ( x ) y = f(x) y=f(x)满足条件

  1. 在[a,b]上连续;
  2. 在(a,b)内可导;
  3. f ( a ) = f ( b ) f(a) = f(b) f(a)=f(b)

则那么至少存在一点 ξ ( a < ξ < b ) \xi (a < \xi < b) ξ(a<ξ<b),使得 f ′ ( ξ ) = 0 f^\prime (\xi) = 0 f(ξ)=0

在这里插入图片描述

(找不到高清图,只有这种了, c c c就是 ξ \xi ξ)

几何意义:如果连续曲线除端点外处处具有不垂直于x轴的切线,且两个端点处的纵坐标相等,那么其上至少有一点处的切线平行于x轴

其应用是判断方程根的存在性。

拉格朗日中值定理

该定理反反映了可导函数在闭区间上整体的平均变化率与区间内某点的局部变化率的关系。

在这里插入图片描述
从这个函数图形来看,是不是很像罗尔定理的图形旋转了一下。并且可以看出, c c c点处的切线虽然不再平行于x轴,但是平行于AB两点的连线。即它们的斜率是相等的,有:

f ′ ( ξ ) = k A B = f ( b ) − f ( a ) b − a f^\prime (\xi) = k_{AB} = \frac{f(b) - f(a)}{b -a} f(ξ)=kAB=baf(b)f(a)

得到拉格朗日中值定理
如果函数 y = f ( x ) y = f(x) y=f(x)满足条件

  1. 在[a,b]上连续;
  2. 在(a,b)内可导;

则那么至少存在一点 ξ ( a < ξ < b ) \xi (a < \xi < b) ξ(a<ξ<b),使得
f ′ ( ξ ) = f ( b ) − f ( a ) b − a f^\prime (\xi) = \frac{f(b) - f(a)}{b -a} f(ξ)=baf(b)f(a) f ( b ) − f ( a ) = f ′ ( ξ ) ( b − a ) f(b) - f(a) = f^\prime (\xi) (b - a) f(b)f(a)=f(ξ)(ba)

几何意义:如果连续曲线除端点外处处具有不垂直于ox轴的切线,那么其上至少有这样一点存在,在该点处曲线的切线平行于连接两端点的直线,即两者斜率相同。

我们来应用一下吧,用拉格朗日中值定理证明,当 x > 0 x > 0 x>0时, x 1 + x < ln ⁡ ( 1 + x ) < x \frac{x}{1+x} < \ln(1+x) < x 1+xx<ln(1+x)<x

在这里插入图片描述

证明 构造辅助函数 f ( t ) = ln ⁡ ( 1 + t ) f(t) = \ln(1+t) f(t)=ln(1+t)
f ( t ) f(t) f(t)在[0,x]上满足朗格朗日中值定理的条件,那么根据定理,存在点 ξ ( 0 < ξ < x ) \xi(0 < \xi <x) ξ(0<ξ<x),满足
f ( x ) − f ( 0 ) = f ′ ( ξ ) ( x − 0 ) f(x) - f(0) = f^\prime(\xi)(x - 0) f(x)f(0)=f(ξ)(x0)
由于 f ( x ) = ln ⁡ ( 1 + x ) f(x) = \ln(1 + x) f(x)=ln(1+x), f ( 0 ) = 0 f(0) = 0 f(0)=0
f ′ ( t ) = 1 1 + t f^\prime(t) = \frac{1}{1+t} f(t)=1+t1

因此,①式可化为 ln ⁡ ( 1 + x ) − 0 = x 1 + ξ \ln(1+x) - 0 = \frac{x}{1 + \xi} ln(1+x)0=1+ξx
又因为 ( 0 < ξ < x ) (0 < \xi <x) (0<ξ<x)
x 1 + x < x 1 + ξ < x 1 + 0 \frac{x}{1+x} < \frac{x}{1+ \xi} < \frac{x}{1+0} 1+xx<1+ξx<1+0x (分母越大,分数值越小)
x 1 + x < ln ⁡ ( 1 + x ) < x \frac{x}{1+x} < \ln(1+x) < x 1+xx<ln(1+x)<x

柯西中值定理

是拉格朗日中值定理的推广

在拉格朗日中值定理中,若函数由参数方程:

{ X = F ( x ) Y = f ( x ) ( a ≤ x ≤ b , x 为参数 ) {X=F(x)Y=f(x)

(a \leq x \leq b,x为参数) {X=F(x)Y=f(x)(axb,x为参数)

表示,如图所示
在这里插入图片描述

则连接两个端点A,B的直线斜率为

f ( b ) − f ( a ) F ( b ) − F ( a ) \frac{f(b) - f(a)}{F(b) - F(a)} F(b)F(a)f(b)f(a)

而曲线在点 P ( x = ξ ) P(x=\xi) P(x=ξ)处的切线T斜率为

d Y d X = f ′ ( ξ ) F ′ ( ξ ) \frac{dY}{dX} = \frac{f^\prime(\xi)}{F^\prime(\xi)} dXdY=F(ξ)f(ξ)

则由曲线在点P的切线T与直线L平行可知:

f ( b ) − f ( a ) F ( b ) − F ( a ) = f ′ ( ξ ) F ′ ( ξ ) \frac{f(b) - f(a)}{F(b) - F(a)} = \frac{f^\prime(\xi)}{F^\prime(\xi)} F(b)F(a)f(b)f(a)=F(ξ)f(ξ)

得到柯西中值定理
如果函数 f ( x ) f(x) f(x) F ( x ) F(x) F(x)满足

  1. 在[a,b]上连续;
  2. 在(a,b)内可导,且 F ′ ( x ) F^\prime(x) F(x) 0 0 0;

则至少存在一点 ξ ( a < ξ < b ) \xi(a < \xi < b) ξ(a<ξ<b),使得

f ( b ) − f ( a ) F ( b ) − F ( a ) = f ′ ( ξ ) F ′ ( ξ ) \frac{f(b) - f(a)}{F(b) - F(a)} = \frac{f^\prime(\xi)}{F^\prime(\xi)} F(b)F(a)f(b)f(a)=F(ξ)f(ξ)

几何意义:曲线弧AB上至少有一点 P ( F ( ξ ) , f ( ξ ) ) P(F(\xi),f(\xi)) P(F(ξ),f(ξ)),在该点处的切线平行于弦AB.

洛必达法则

设函数 f ( x ) f(x) f(x) g ( x ) g(x) g(x)满足:

  1. lim ⁡ Δ x → a f ( x ) = lim ⁡ Δ x → a g ( x ) = 0 ( 或 ∞ ) \lim\limits_{\Delta x \to a} f(x) = \lim\limits_{\Delta x \to a} g(x) = 0 (或\infty) Δxalimf(x)=Δxalimg(x)=0(); (极限无穷小或无穷大)
  2. U ˚ ( a ) \mathring{U}(a) U˚(a)内, f ′ ( x ) f^\prime(x) f(x) g ′ ( x ) g^\prime(x) g(x)都存在,且 g ′ ( x ) g^\prime(x) g(x) 0 0 0;
  3. lim ⁡ Δ x → a f ′ ( x ) g ′ ( x ) = A ( A 可为实数,也可以是 ∞ ) \lim\limits_{\Delta x \to a} \frac{f^\prime(x)}{g^\prime(x)} = A(A可为实数,也可以是\infty) Δxalimg(x)f(x)=A(A可为实数,也可以是),(求导之后的极限存在)


lim ⁡ Δ x → a f ( x ) g ( x ) = lim ⁡ Δ x → a f ′ ( x ) g ′ ( x ) = A \lim\limits_{\Delta x \to a} \frac{f(x)}{g(x)} =\lim\limits_{\Delta x \to a} \frac{f^\prime(x)}{g^\prime(x)} = A Δxalimg(x)f(x)=Δxalimg(x)f(x)=A

我们称 0 0 \frac{0}{0} 00 ∞ ∞ \frac{\infty}{\infty} 为未定式,而洛必达法则可用于求这种未定式的极限。

泰勒展开式

推荐看这篇文章怎样更好地理解并记忆泰勒展开式?

如果两个连续的曲线想要相同,那么它们在某一点的一阶导数要相同,二阶导数也要相同,…,n阶导数也要相同,这是泰勒展开的核心思想。(曲线的变化率的变化率的变化率…都相同)

假设给定函数 f ( x ) = e x f(x) = e^x f(x)=ex,我们想用一个多项式函数 g ( x ) g(x) g(x)去拟合它。
因为 f ( x ) f(x) f(x)能无限求导 ( e x ) ′ = e x (e^x)^\prime = e^x (ex)=ex,所以我们的拟合函数也要能无限求导,
所以必须要是一个无限多项的多项式:

g ( x ) = a 0 + a 1 x + a 2 x 2 + . . . + a n x n g(x) = a_0 + a_1x + a_2x^2 + ... + a_nx^n g(x)=a0+a1x+a2x2+...+anxn

假设 f ( x ) = g ( x ) f(x) = g(x) f(x)=g(x),我们取 x = 0 x=0 x=0点,
f ( 0 ) = g ( 0 ) = e 0 = 1 f(0)=g(0) = e^0 = 1 f(0)=g(0)=e0=1 得到 a 0 = 1 a_0 = 1 a0=1
f ′ ( 0 ) = g ′ ( 0 ) = 1 f^\prime(0) = g^\prime(0) = 1 f(0)=g(0)=1
f ′ ′ ( 0 ) = g ′ ′ ( 0 ) = 1 f^{\prime\prime}(0) = g^{\prime\prime}(0) = 1 f′′(0)=g′′(0)=1

f n ( 0 ) = g n ( 0 ) f^n(0) = g^n(0) fn(0)=gn(0)

我们再来看 g n ( 0 ) g^n(0) gn(0),它的n阶导数是和它的最高项n有关,前面的小于n项的n阶导数都会变为0。

( a n x n ) (a_nx^n) (anxn)的n阶导数为: n ! a n n!a_n n!an

也就是 g n ( 0 ) = n ! a n g^n(0) = n!a_n gn(0)=n!an得到 a n = f n ( 0 ) n ! a_n = \frac{f^n(0)}{n!} an=n!fn(0)

我们将 a n a_n an带入 ①式:
g ( x ) = f ( 0 ) + f ′ ( 0 ) 1 ! x + f ′ ′ ( 0 ) 2 ! x 2 + f 3 ( 0 ) 3 ! x 3 + . . . + f n ( 0 ) n ! x n g(x) = f(0) + \frac{f^\prime(0)}{1!}x + \frac{f^{\prime\prime}(0)}{2!}x^2 + \frac{f^3(0)}{3!}x^3 + ... + \frac{f^n(0)}{n!}x^n g(x)=f(0)+1!f(0)x+2!f′′(0)x2+3!f3(0)x3+...+n!fn(0)xn

以上是选取 x = 0 x=0 x=0点时的泰勒展开,一般的,我们选取 x = a x=a x=a点的泰勒展开即为:
g ( x ) = f ( a ) + f ′ ( a ) 1 ! ( x − a ) + f ′ ′ ( a ) 2 ! ( x − a ) 2 + f 3 ( a ) 3 ! ( x − a ) 3 + . . . + f n ( a ) n ! ( x − a ) n g(x) = f(a) + \frac{f^\prime(a)}{1!}(x-a) + \frac{f^{\prime\prime}(a)}{2!}(x-a)^2 + \frac{f^3(a)}{3!}(x-a)^3 + ... + \frac{f^n(a)}{n!}(x-a)^n g(x)=f(a)+1!f(a)(xa)+2!f′′(a)(xa)2+3!f3(a)(xa)3+...+n!fn(a)(xa)n

如何理解 x x x变成了 x − a x-a xa了呢?从 0 0 0点改到 a a a点,相当于函数图像向右平移 a a a个单位,即变成了 x − a x-a xa (左右平移是X加或减)

得到泰勒展开式为:
在这里插入图片描述
如果想要等式左右两边相等,光到 n n n项是不够的,后面还有 n + 1 , n + 2 , . . . n+1,n+2,... n+1,n+2,...无穷多项,
n n n后的无穷多项通过 R n ( x ) R_n(x) Rn(x)来表示。

不定积分

原函数:在区间 I I I上函数 F ( x ) F(x) F(x)可导, F ′ ( x ) = f ( x ) F^\prime(x) = f(x) F(x)=f(x) d F ( x ) = f ( x ) d x dF(x) = f(x)dx dF(x)=f(x)dx,那么 F ( x ) F(x) F(x)就是 f ( x ) f(x) f(x)在这个区间上的一个原函数。

连续函数一定有原函数

在区间 I I I上函数 f ( x ) f(x) f(x)的全体原函数 F ( x ) + C F(x) + C F(x)+C称为 f ( x ) f(x) f(x)不定积分,记为 ∫ f ( x ) d x = F ( x ) + C \int f(x)dx = F(x) + C f(x)dx=F(x)+C

不定积分是全体原函数(常数 C C C的导数为0)

∫ \int 积分号, f ( x ) f(x) f(x)被积函数, f ( x ) d x f(x)dx f(x)dx被积表达式, x x x积分变量

微分运算与不定积分运算互为逆运算。

不定积分的性质

  1. ∫ [ f ( x ) ± g ( x ) ] d x = ∫ f ( x ) d x ± ∫ g ( x ) d x \int [f(x) \pm g(x)]dx = \int f(x)dx \pm \int g(x)dx [f(x)±g(x)]dx=f(x)dx±g(x)dx
  2. ∫ k f ( x ) d x = k ∫ f ( x ) d x \int kf(x)dx = k\int f(x)dx kf(x)dx=kf(x)dx ( k k k为常数,且不为零)

定积分

定义 ∫ b a f ( x ) d x = lim ⁡ λ → 0 ∑ i = 1 n f ( ξ i ) Δ x i \int ^a_b f(x)dx = \lim\limits_{\lambda \to 0} \sum_{i=1}^nf(\xi_i)\Delta x_i baf(x)dx=λ0limi=1nf(ξi)Δxi

几何意义:曲边图形的面积 S = ∫ b a f ( x ) d x S=\int ^a_b f(x)dx S=baf(x)dx

在这里插入图片描述

f ( x ) ≥ 0 f(x) \geq 0 f(x)0时,积分 ∫ b a f ( x ) d x \int ^a_b f(x)dx baf(x)dx在集合上表示由 y = f ( x ) y=f(x) y=f(x) x = a x=a x=a x = b x=b x=b x x x轴所围成的曲边梯形的面积;
f ( x ) ≤ 0 f(x) \leq 0 f(x)0时,由 y = f ( x ) y=f(x) y=f(x) x = a x=a x=a x = b x=b x=b x x x轴所围成的曲边梯形位于 x x x轴下方,积分 ∫ b a f ( x ) d x \int ^a_b f(x)dx baf(x)dx在几何上表示上述曲边梯形面积的负值;

如果 f ( x ) f(x) f(x) [ a , b ] [a,b] [a,b]上的连续函数,并且有 F ′ ( x ) = f ( x ) F^′(x)=f(x) F(x)=f(x),那么
∫ b a f ( x ) d x = F ( b ) − F ( a ) \int ^a_b f(x)dx = F(b) - F(a) baf(x)dx=F(b)F(a)

也就是说,一个定积分式的值,就是原函数在上限的值与原函数在下限的值的差。

函数单调性与极值

函数单调性

设函数 y = f ( x ) y=f(x) y=f(x) ( a , b ) (a,b) (a,b)内可导,对 ∀ x ∈ ( a , b ) \forall x \in (a,b) x(a,b)

  1. f ′ ( x ) > 0 ⟹ f ( x ) f^\prime(x) > 0 \Longrightarrow f(x) f(x)>0f(x) ( a , b ) (a,b) (a,b)内单调递增;
  2. f ′ ( x ) < 0 ⟹ f ( x ) f^\prime(x) < 0 \Longrightarrow f(x) f(x)<0f(x) ( a , b ) (a,b) (a,b)内单调递减;

我们来证明第一条:
已知 f ′ ( x ) > 0 , x ∈ ( a , b ) f^\prime(x) > 0,x \in (a,b) f(x)>0x(a,b)
∀ x 1 , x 2 ∈ ( a , b ) \forall x_1,x_2 \in (a,b) x1,x2(a,b),设 x 1 < x 2 x_1 < x_2 x1<x2,
由拉格朗日中值定理可知,存在 ξ ∈ ( a , b ) \xi \in (a,b) ξ(a,b),使得 f ( x 2 ) − f ( x 1 ) = f ′ ( ξ ) ( x 2 − x 1 ) f(x_2) - f(x_1) = f^\prime(\xi) (x_2 - x_1) f(x2)f(x1)=f(ξ)(x2x1)
由已知 f ′ ( x ) > 0 , x 2 − x 1 > 0 f^\prime(x) > 0,x_2 - x_1 > 0 f(x)>0,x2x1>0
可得 f ( x 2 ) > f ( x 1 ) f(x_2) > f(x_1) f(x2)>f(x1)
x 1 , x 2 x_1,x_2 x1,x2的任意性,所以 f ( x ) f(x) f(x) ( a , b ) (a,b) (a,b)内单调递增

函数极值

设函数 y = f ( x ) y=f(x) y=f(x) x 0 x_0 x0的某一邻域 U ( x 0 ) U(x_0) U(x0)内有定义,对于 ∀ x ∈ U ( x 0 ) \forall x \in U(x_0) xU(x0),且 x x x x 0 x_0 x0,均有

  1. f ( x ) < f ( x 0 ) f(x) < f(x_0) f(x)<f(x0),称 f ( x 0 ) f(x_0) f(x0)极大值 x 0 x_0 x0为极大值点
  2. f ( x ) > f ( x 0 ) f(x) > f(x_0) f(x)>f(x0),称 f ( x 0 ) f(x_0) f(x0)极小值 x 0 x_0 x0为极小值点

极大值和极小值统称为极值;极大值点和极小值点统称为极值点。

在这里插入图片描述

要注意是:

  1. 极值是局部性概念
  2. 可以有多个极大值或极小值
  3. 端点不是极值点(极值只在区间内部取得)

极值点处若 f ′ ( x ) = 0 f^\prime(x) = 0 f(x)=0,这样的点称为驻点,若导数不存在,则称为尖点

我们可以注意到,极值点两侧单调性不同,也就是导数符号不同,
根据这点,我们可以得到极值判定第一充分条件:

极值判定(极值判定第一充分条件)
若函数 f ( x ) f(x) f(x)可导, f ′ ( x ) = 0 f^\prime(x) = 0 f(x)=0 ,且 ∃ σ > 0 \exists \sigma > 0 σ>0 ∀ x ∈ ( x 0 − σ , x 0 ) \forall x \in (x_0 - \sigma , x_0) x(x0σ,x0) f ′ ( x ) > 0 f^\prime(x) > 0 f(x)>0(或 f ′ ( x ) < 0 f^\prime(x) < 0 f(x)<0)同时, ∀ x ∈ ( x 0 , x 0 + σ ) \forall x \in (x_0 , x_0 + \sigma ) x(x0,x0+σ) f ′ ( x ) < 0 f^\prime(x) < 0 f(x)<0(或 f ′ ( x ) > 0 f^\prime(x) > 0 f(x)>0 ),则 x 0 x_0 x0 是函数 f ( x ) f(x) f(x) 的极大点(或极小点)。

在这里插入图片描述
我们看上图,大概 x x x取-3点处的函数值是极大值,该点出的切线斜率(导数)为0,左则切线斜率大于0,右侧切线斜率小于0。
也就是说,一阶导数在单调递减,因此二阶导数小于0。得出极值判定第二充分条件:

极值判定(极值判定第二充分条件)
设函数 f ( x ) f(x) f(x) U ( x 0 ) U(x_0) U(x0)二阶可导,且 f ′ ( x ) = 0 f^\prime(x) = 0 f(x)=0

  1. f ′ ′ ( x ) < 0 ⟹ f ( x 0 ) f^{\prime\prime}(x) < 0 \Longrightarrow f(x_0) f′′(x)<0f(x0)极大值
  2. f ′ ′ ( x ) > 0 ⟹ f ( x 0 ) f^{\prime\prime}(x) > 0 \Longrightarrow f(x_0) f′′(x)>0f(x0)极小值
  3. f ′ ′ ( x ) = 0 f^{\prime\prime}(x) = 0 f′′(x)=0,无法判定

曲线的凹凸与拐点

凹凸

设函数 f ( x ) f(x) f(x) ( a , b ) (a,b) (a,b)内可导:

  1. 若曲线 f ( x ) f(x) f(x)上任一点切线位于曲线的下方,则称曲线在 ( a , b ) (a,b) (a,b)内是凹的,区间 ( a , b ) (a,b) (a,b)称为凹区间;
  2. 若曲线 f ( x ) f(x) f(x)上任一点切线位于曲线的上方,则称曲线在 ( a , b ) (a,b) (a,b)内是凸的,区间 ( a , b ) (a,b) (a,b)称为凸区间;

在这里插入图片描述

但是这是在给定了函数图像的情况下,若没有函数图像,我们该如何通过函数表达式来判断呢?

我们在曲线上去取三个点 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3,过这三个点做切线,这些曲线与 x x x轴的夹角依次为 α 1 , α 2 , α 3 \alpha_1,\alpha_2,\alpha_3 α1,α2,α3

在这里插入图片描述

可以看到,导函数 f ′ ( x ) f^\prime(x) f(x)是单调递增的,也就是 f ′ ′ ( x ) ≥ 0 f^{\prime\prime}(x) \geq 0 f′′(x)0

同理,凸函数的二阶导数 f ′ ′ ( x ) ≤ 0 f^{\prime\prime}(x) \leq 0 f′′(x)0

函数的凹凸性判断
如果函数 f ( x ) f(x) f(x) ( a , b ) (a,b) (a,b)具有二阶导数 f ′ ′ ( x ) f^{\prime\prime}(x) f′′(x)

  1. 若在 ( a , b ) (a,b) (a,b) f ′ ′ ( x ) > 0 f^{\prime\prime}(x) > 0 f′′(x)>0,则 f ( x ) f(x) f(x) ( a , b ) (a,b) (a,b)内是凹的;
  2. 若在 ( a , b ) (a,b) (a,b) f ′ ′ ( x ) < 0 f^{\prime\prime}(x) < 0 f′′(x)<0,则 f ( x ) f(x) f(x) ( a , b ) (a,b) (a,b)内是凸的;

拐点

定义:连续曲线上凹弧与凸弧的分界点称为曲线的拐点。

在这里插入图片描述

历经一个月,这篇文章终于更新完了,高数知识暂时告一段落了,后面的学习过程中如果碰到了相关知识会在本文中补充
在人工智能中,向量、矩阵也很重要。这些知识点尽在线性代数

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/1015554
推荐阅读
相关标签
  

闽ICP备14008679号