当前位置:   article > 正文

Python SciPy 插值及其他各种插值法_python matplotlib 插值图

python matplotlib 插值图

SciPy 插值

什么是插值?

在数学的数值分析领域中,插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。

简单来说插值是一种在给定的点之间生成点的方法。

例如:对于两个点 1 和 2,我们可以插值并找到点 1.33 和 1.66。

插值有很多用途,在机器学习中我们经常处理数据缺失的数据,插值通常可用于替换这些值。

这种填充值的方法称为插补。

除了插补,插值经常用于我们需要平滑数据集中离散点的地方。

如何在 SciPy 中实现插值?

SciPy 提供了 scipy.interpolate 模块来处理插值。

一维插值

一维数据的插值运算可以通过方法 interp1d() 完成。

该方法接收两个参数 x 点和 y 点。

返回值是可调用函数,该函数可以用新的 x 调用并返回相应的 y,y = f(x)

对给定的 xs 和 ys 插值,从 2.1、2.2... 到 2.9:

  1. from scipy.interpolate import interp1d
  2. import numpy as np
  3. xs = np.arange(10)
  4. ys = 2*xs + 1
  5. interp_func = interp1d(xs, ys)
  6. newarr = interp_func(np.arange(2.1, 3, 0.1))
  7. print(newarr)

输出结果为:

[5.2  5.4  5.6  5.8  6.   6.2  6.4  6.6  6.8]

注意:新的 xs 应该与旧的 xs 处于相同的范围内,这意味着我们不能使用大于 10 或小于 0 的值调用 interp_func()。

单变量插值

在一维插值中,点是针对单个曲线拟合的,而在样条插值中,点是针对使用多项式分段定义的函数拟合的。

单变量插值使用 UnivariateSpline() 函数,该函数接受 xs 和 ys 并生成一个可调用函数,该函数可以用新的 xs 调用。

分段函数,就是对于自变量 x 的不同的取值范围,有着不同的解析式的函数。

为非线性点找到 2.1、2.2...2.9 的单变量样条插值:

实例
  1. from scipy.interpolate import UnivariateSpline
  2. import numpy as np
  3. xs = np.arange(10)
  4. ys = xs**2 + np.sin(xs) + 1
  5. interp_func = UnivariateSpline(xs, ys)
  6. newarr = interp_func(np.arange(2.1, 3, 0.1))
  7. print(newarr)

输出结果为:

  1. [5.62826474 6.03987348 6.47131994 6.92265019 7.3939103 7.88514634
  2. 8.39640439 8.92773053 9.47917082]

径向基函数插值

径向基函数是对应于固定参考点定义的函数。

曲面插值里我们一般使用径向基函数插值。

Rbf() 函数接受 xs 和 ys 作为参数,并生成一个可调用函数,该函数可以用新的 xs 调用。

实例
  1. from scipy.interpolate import Rbf
  2. import numpy as np
  3. xs = np.arange(10)
  4. ys = xs**2 + np.sin(xs) + 1
  5. interp_func = Rbf(xs, ys)
  6. newarr = interp_func(np.arange(2.1, 3, 0.1))
  7. print(newarr)

输出结果为:

  1. [6.25748981 6.62190817 7.00310702 7.40121814 7.8161443 8.24773402
  2. 8.69590519 9.16070828 9.64233874]

一维插值

插值不同于拟合。插值函数经过样本点,拟合函数一般基于最小二乘法尽量靠近所有样本点穿过。常见插值方法有拉格朗日插值法、分段插值法、样条插值法

  1. 拉格朗日插值多项式:当节点数n较大时,拉格朗日插值多项式的次数较高,可能出现不一致的收敛情况,而且计算复杂。随着样点增加,高次插值会带来误差的震动现象称为龙格现象。

  1. 分段插值:虽然收敛,但光滑性较差。

  1. 样条插值:样条插值是使用一种名为样条的特殊分段多项式进行插值的形式。由于样条插值可以使用低阶多项式样条实现较小的插值误差,这样就避免了使用高阶多项式所出现的龙格现象,所以样条插值得到了流行。

  1. # -*-coding:utf-8 -*-import numpy as np
  2. from scipy import interpolate
  3. import pylab as pl
  4. import numpy as np
  5. x=np.linspace(0,10,11)
  6. #x=[ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
  7. y=np.sin(x)
  8. xnew=np.linspace(0,10,101)
  9. pl.plot(x,y,"ro")
  10. for kind in ["nearest","zero","slinear","quadratic","cubic"]:#插值方式#"nearest","zero"为阶梯插值#slinear 线性插值#"quadratic","cubic" 为2阶、3阶B样条曲线插值
  11. f=interpolate.interp1d(x,y,kind=kind)
  12. # ‘slinear’, ‘quadratic’ and ‘cubic’ refer to a spline interpolation of first, second or third order)
  13. ynew=f(xnew)
  14. pl.plot(xnew,ynew,label=str(kind))
  15. pl.legend(loc="lower right")
  16. pl.show()

结果:

二维插值

方法与一维数据插值类似,为二维样条插值。

  1. # -*- coding: utf-8 -*-"""
  2. # 演示二维插值。
  3. import numpy as np
  4. from scipy import interpolate
  5. import pylab as pl
  6. import matplotlib as mpl
  7. def func(x, y):
  8. return (x+y)*np.exp(-5.0*(x**2 + y**2))
  9. # X-Y轴分为15*15的网格
  10. y,x= np.mgrid[-1:1:15j, -1:1:15j]
  11. fvals = func(x,y) # 计算每个网格点上的函数值 15*15的值print len(fvals[0])
  12. #三次样条二维插值
  13. newfunc = interpolate.interp2d(x, y, fvals, kind='cubic')
  14. # 计算100*100的网格上的插值
  15. xnew = np.linspace(-1,1,100)#x
  16. ynew = np.linspace(-1,1,100)#y
  17. fnew = newfunc(xnew, ynew)#仅仅是y值 100*100的值# 绘图# 为了更明显地比较插值前后的区别,使用关键字参数interpolation='nearest'# 关闭imshow()内置的插值运算。
  18. pl.subplot(121)
  19. im1=pl.imshow(fvals, extent=[-1,1,-1,1], cmap=mpl.cm.hot, interpolation='nearest', origin="lower")#pl.cm.jet#extent=[-1,1,-1,1]为x,y范围 favals为
  20. pl.colorbar(im1)
  21. pl.subplot(122)
  22. im2=pl.imshow(fnew, extent=[-1,1,-1,1], cmap=mpl.cm.hot, interpolation='nearest', origin="lower")
  23. pl.colorbar(im2)
  24. pl.show()

左图为原始数据,右图为二维插值结果图。


二维插值的三维展示方法

  1. # -*- coding: utf-8 -*-"""
  2. # 演示二维插值。
  3. # -*- coding: utf-8 -*-
  4. import numpy as np
  5. from mpl_toolkits.mplot3d import Axes3D
  6. import matplotlib as mpl
  7. from scipy import interpolate
  8. import matplotlib.cm as cm
  9. import matplotlib.pyplot as plt
  10. def func(x, y):
  11. return (x+y)*np.exp(-5.0*(x**2 + y**2))
  12. # X-Y轴分为20*20的网格
  13. x = np.linspace(-1, 1, 20)
  14. y = np.linspace(-1,1,20)
  15. x, y = np.meshgrid(x, y)#20*20的网格数据
  16. fvals = func(x,y) # 计算每个网格点上的函数值 15*15的值
  17. fig = plt.figure(figsize=(9, 6))
  18. #Draw sub-graph1
  19. ax=plt.subplot(1, 2, 1,projection = '3d')
  20. surf = ax.plot_surface(x, y, fvals, rstride=2, cstride=2, cmap=cm.coolwarm,linewidth=0.5, antialiased=True)
  21. ax.set_xlabel('x')
  22. ax.set_ylabel('y')
  23. ax.set_zlabel('f(x, y)')
  24. plt.colorbar(surf, shrink=0.5, aspect=5)#标注#二维插值
  25. newfunc = interpolate.interp2d(x, y, fvals, kind='cubic')#newfunc为一个函数# 计算100*100的网格上的插值
  26. xnew = np.linspace(-1,1,150)#x
  27. ynew = np.linspace(-1,1,150)#y
  28. fnew = newfunc(xnew, ynew)#仅仅是y值 100*100的值 np.shape(fnew) is 100*100
  29. xnew, ynew = np.meshgrid(xnew, ynew)
  30. ax2=plt.subplot(1, 2, 2,projection = '3d')
  31. surf2 = ax2.plot_surface(xnew, ynew, fnew, rstride=2, cstride=2, cmap=cm.coolwarm,linewidth=0.5, antialiased=True)
  32. ax2.set_xlabel('xnew')
  33. ax2.set_ylabel('ynew')
  34. ax2.set_zlabel('fnew(x, y)')
  35. plt.colorbar(surf2, shrink=0.5, aspect=5) #标注
  36. plt.show()

左图的二维数据集的函数值由于样本较少,会显得粗糙。而右图对二维样本数据进行三次样条插值,拟合得到更多数据点的样本值,绘图后图像明显光滑多了。

参考:https://www.runoob.com/scipy/scipy-interpolation.html

https://blog.csdn.net/qq_20011607/article/details/81412985

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/803754
推荐阅读
相关标签
  

闽ICP备14008679号