SciPy函数库在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等。
最小二乘拟合
假设有一组实验数据(x[i],y[i]),我们知道他们之间的函数关系:y=f(x),通过这些已知信息,需要确定函数中的一些参数项。例如:如果f是一个线形函数f(x)=k*x+b,那么参数k和b就是我们需要确定的值。如果将这些参数用p表示的话,那么我们就要找到一组p值使得如下公式的S函数最小:
其中y为原函数,f为拟合函数。拟合函数可通过给定值找出表达式,不要求多精确,之要求能反映数据变化的趋势。
这种算法被称为最小二乘拟合。
scipy中的子函数库optimize已经提供了实现最小二乘拟合算法的函数leastsq。
#-*- coding: utf-8 -*-
import numpy as np
from scipy.optimize import leastsq
import matplotlib.pylab as pl
def func(x,p):
"""数据拟合所用的函数:A*sin(2*pi*k*x+theta)"""
A,k,theta=p
return A*np.sin(2*np.pi*k*x+theta)
def residuals(p,y,x):
"""实验数据x,y和拟合函数之间的差,p为拟合需要找到的系数"""
return y-func(x,p)
#在0~-2*np.pi均匀返回100个数字
x=np.linspace(0,-2*np.pi,100)
A,k,theta=10,0.34,np.pi/6 #真实数据的函数参数
y0=func(x,[A,k,theta])
y1=y0+2*np.random.randn(len(x)) #加入噪声之后的实验数据
p0=[7,0.2,0] #第一次猜测的函数拟合参数
#调用leastsq进行数据拟合
#residuals为计算误差的函数
#p0为拟合参数的初始值
#args为需要拟合的实验数据
plsq=leastsq(residuals,p0,args=(y1,x))
print("Real_parameter:",[A,k,theta])
print("Fitting_parameters" ,plsq[0])
pl.plot(x,y0,label="RealData")
pl.plot(x,y1,label="NoiseData")
pl.plot(x,func(x,plsq[0]),label="FittingData")
pl.legend()
pl.show()
这里我们要拟合的函数是一个正弦波函数,它有参个参数A,k,theta分别对应振幅,频率,相角。假设实验数据是一组包含噪声的数据x,y1,其中y1是在真实数据的基础上加入噪声得到的。
通过leastsq函数对带噪声的实验数据x,y1进行数据拟合,可以找到x和真实数据y0之间的正弦关系的参数:A,k,theta。Real_parameter: [10, 0.34, 0.5235987755982988]
Fitting_parameters [10.72946651 0.34093584 0.58900944]
函数最小值
optimize库提供了几个求函数最小值的算法:fmin,fmin_powell,fmin_cg,fim_bfgs。下面的程序通过求解卷积的逆运算岩石fmin的功能。
对于一个离散的线性时不变系统h,如果他的输入是x,那么其输出也可以用x和h卷积表示,即y=x*h。
现在的问题是如果已知系统的输入x和输出y,如何计算系统的传递函数h;或者如果已知系统的传递函数h和系统的输出y,如何计算系统的输入x。这种运算被称为反卷积运算。
#coding:utf-8
import scipy.optimize as opt
import numpy as np
def test_fmin_convolve(fminfunc,x,h,y,yn,x0):
"""x(*)h=y卷积
yn为在y的基础上添加一些干扰噪声的结果
x0为求解x的初始值
"""
def convolve_func(h):
"""计算yn-x(*)h的power
fmin将通过计算使得此power最小
"""
return np.sum((yn-np.convolve(x,h))**2)
#调用fmin函数,以x0为初始值
h0=fminfunc(convolve_func,x0)
print(fminfunc.__name__)
print("----------------------")
#输出x(*)h0和y之间的相对误差
print("error of y:",float(np.sum(np.convolve(x,h0)-y)**2)/np.sum(y**2))
#输出h0和h之间的相对误差
print("error of h:",float(np.sum((h0-h)**2)/np.sum(h**2)))
print('/n')
def test_n(m,n,nscale):
"""随机产生x,h,y,yn,x0等数列,调用个和宗fmin函数求解b
m为x的长度,n为h的长度,nscale为干扰强度
"""
x=np.random.rand(m)
h=np.random.rand(n)
y=np.convolve(x,h)
yn=y+np.random.rand(len(y))*nscale
x0=np.random.rand(n)
test_fmin_convolve(opt.fmin,x,h,y,yn,x0)
test_fmin_convolve(opt.fmin_powell,x,h,y,yn,x0)
test_fmin_convolve(opt.fmin_cg,x,h,y,yn,x0)
test_fmin_convolve(opt.fmin_bfgs,x,h,y,yn,x0)
if __name__=="__main__":
test_n(200,20,0.1)fmin
----------------------
error of y: 0.03524512840813301
error of h: 0.10872448809534953
/n
Optimization terminated successfully.
Current function value: 0.214475
Iterations: 32
Function evaluations: 5999
fmin_powell
----------------------
error of y: 0.04085253762222568
error of h: 0.00025751019243286225
/n
Optimization terminated successfully.
Current function value: 0.214441
Iterations: 19
Function evaluations: 858
Gradient evaluations: 39
fmin_cg
----------------------
error of y: 0.04084548316927832
error of h: 0.00025921974956644503
/n
Optimization terminated successfully.
Current function value: 0.214441
Iterations: 32
Function evaluations: 1012
Gradient evaluations: 46
fmin_bfgs
----------------------
error of y: 0.0408454823459306
error of h: 0.00025922110838010043
/n
非线性方程组求解
optimize库中的fsolve函数可以用来对非线性方程组进行进行求解。
func(x)是计算方程组误差的函数,它的参数x是一个矢量,表示方程组的各个未知数的一组可能解,func返回将x带入方程组之后得到的误差;x0为未知数矢量的初始值。
实例:
求解
5*x1+3=0
4x0x0-2sin(x1x2)=0
x1*x2-1.5=0#coding:utf-8
from scipy.optimize import fsolve
from math import sin,cos
def f(x):
x0=float(x[0])
x1=float(x[1])
x2=float(x[2])
return [
5*x1+3,
4*x0*x0-2*sin(x1*x2),
x1*x2-1.5
]
result=fsolve(f,[1,1,1]) #输入一组可能解
print(result)
print(f(result)) #返回误差[-0.70622057 -0.6 -2.5 ]
[0.0, -9.126033262418787e-14, 5.329070518200751e-15]
在对方程组进行求解时,fsolve会自动计算方程组的雅可比矩阵,如果方程组中的未知数很多,而与每个方程有关的未知数较少时,传递一个计算雅可比矩阵的函数将能大幅度提高运算速度。
什么是雅可比矩阵?
雅可比矩阵是一阶偏导数以一定方式排列的矩阵,它给出可微分方程与给定点的最优线性逼近,因此类似于多元函数的导数。
使用雅可比矩阵的fsolve,计算雅可比矩阵的函数j通过fprime参数传递给fsolve,函数j和函数f一样,有一个未知数的解矢量参数x,函数j计算非线性方程组在矢量x点上的雅可比矩阵。
#coding:utf-8
from scipy.optimize import fsolve
from math import sin,cos
def f(x):
x0=float(x[0])
x1=float(x[1])
x2=float(x[2])
return [
5*x1+3,
4*x0*x0-2*sin(x1*x2),
x1*x2-1.5
]
def j(x):
x0 = float(x[0])
x1 = float(x[1])
x2 = float(x[2])
#求每个方程的偏导数,生成雅可比矩阵
return [
[0,5,0],
[8*x0, -2*x2*cos(x1*x2), -2*x1*cos(x1*x2)],
[0,x2,x1]
]
#传入生成的雅可比矩阵
result=fsolve(f,[1,1,1],fprime=j) #输入一组可能解
print(result)
print(f(result)) #返回误差
运行可以感觉到效率明显提高。
B-Spline样条曲线
interpolate库提供了许多对数据进行插值运算的函数。下面使用直线和B-Spline对正弦波上的点进行插值。#coding:utf-8
import numpy as np
import matplotlib.pylab as pl
import matplotlib.pyplot as plt
from scipy import interpolate
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
x=np.linspace(0,2*np.pi+np.pi/4,10)
y=np.sin(x)
x_new=np.linspace(0,2*np.pi+np.pi/4,100)
#得到一个新的线性插值函数
f_linear=interpolate.interp1d(x,y)
#计算出B-Spline曲线的参数
tck=interpolate.splrep(x,y)
#将参数传递给splev函数计算出各个取样点的插值结果
y_bspline=interpolate.splev(x_new,tck)
pl.plot(x,y,"o",label="orginallyData")
pl.plot(x_new,f_linear(x_new),label="LineInsert")
pl.plot(x_new,y_bspline,label="B-splineInsert")
pl.legend()
pl.show()
数值积分
数值积分是对定积分的数值求解,例如可以利用数值积分计算某个形状的面积。
实例:
计算半径为1的半圆的面积。
单位半圆曲线可以用下面函数表示。
#coding:utf-8
import numpy as np
def half_circle(x):
return (1-x**2)**0.5
#使用经典的分小矩形计算面积总和,计算出单位面积。
N=1000
x=np.linspace(-1,1,N)
y=half_circle(x)
#使用分割法计算
dx=2.0/N
S=dx*np.sum(y[:-1]+y[1:])
#进行数值积分
S1=np.trapz(y,x) *2
#此函数计算的是以x,y为顶点坐标的折线与X所夹的面积。同样的分割点数,结果更精确
#使用quad函数积分
from scipy import integrate
pi_half,err=integrate.quad(half_circle,-1,1)
S2=pi_half*2
print("Split_run: %s" %S)
print("Trapz: %s" %S1)
print("Quad: %s" %S2)
Split_run: 3.138345831727239
Trapz: 3.141487319046285
Quad: 3.1415926535897967
可以看出quad函数是非常精确的。
多重定积分的求值可以通过多次调用quad函数实现,为了方便,integrate库提供了dblquad函数进行二重积分,tplquad函数进行三重积分。
实例:
计算单位半球体积。
符合x**2+y**2+z**2=1from scipy import integrate
import numpy as np
def half_circle(x):
return (1-x**2)**0.5
def half_sphere(x,y):
return (1-x**2-y**2)**0.5
# X-Y轴平面与此球体交线为一个单位圆,因此积分区间为此单位圆,可以考虑
# 为X轴坐标从-1到1进行积分,而Y轴从-half_circle(x)到half_circle(x)
#进行积分
V=integrate.dblquad(half_sphere,-1,1,
lambda x:-half_circle(x),
lambda x:half_circle(x))
print(V)
#通过球体体积公式计算
print(np.pi*4/3/2)
(2.0943951023931984, 1.0002354500215915e-09)
2.0943951023931953
dblquad函数的调用方式:dblquad(func2d,a,b,gfun,hfun)
对于func2d(x,y)函数进行二重积分,其中a,b为变量x的积分期间。
解常微分方程组
scipy.integrate库提供了数值积分和常微分方程组求解算法odeint。
实例:
计算洛伦兹吸引子的轨迹,洛伦兹吸引子有三个微分方程定义:dx/dt=σ(y-x)
dy/dt=x(ρ-z)-y
dz/dt=xy-βz
这三个方程定义了三维空间中各个坐标点上的速度矢量。从某个坐标开始沿着速度矢量进行积分,就可以计算出无质量点在此空间中的运动轨迹。其中 σ, ρ, β 为三个常数,不同的参数可以计算出不同的
运动轨迹: x(t), y(t), z(t)。 当参数为某些值时,轨迹出现馄饨现象:即微小的初值差别也会显著地影响运动轨迹。下面是洛仑兹吸引子的轨迹计算和绘制程序:#coding:utf-8
from scipy.integrate import odeint
import numpy as np
def lorenz(w,t,p,r,b):
# 给出位置矢量w和三个参数p,r,b计算出
#dx/dtt,dy/dt/dz/dt的值
x,y,z=w
#直接用lorenz的计算公式对应
return np.array([p*(y-x),x*(r-z)-y,x*y-b*z])
t=np.arange(0,30,0.01) #创建时间点
#调用ode对lorenz进行求解,用两个不同的初始值
track1=odeint(lorenz,(0.0,1.00,0.0),t,args=(10.0,28.0,3.0))
track2=odeint(lorenz,(0.0,1.01,0.0),t,args=(10.0,28.0,3.0))
#绘图
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
fig=plt.figure()
ax=Axes3D(fig)
ax.plot(track1[:,0],track1[:,1],track1[:,2])
ax.plot(track2[:,0],track1[:,1],track1[:,2])
plt.show()
在程序中先定义一个lozren函数,它的任务是计算出某个位置的各个方向的微分值,这个计算直接根据洛伦兹吸引子公式得出。但后调用odeint,对微分方程求解:
参数祥解:
lorenz:计算某个位移上的各个方向的速度;
(0.0,1.0,0.0),位移初始值。计算常微分方程所需的各个变量的初始值。
t:表示时间的数组,odeint对于此数组中的每个时间点进行求解,的出所有时间点的位置。
args:这些参数直接传递给lorenz函数,因此他们都是常量。
滤波器设计
scipy.signal库提供了西多信号处理反面的函数。如何利用signal库设计滤波器,查看滤波器的频率响应,以及如何使用滤波器对信号进行滤波。
设计一个带通滤波器:import scipy.signal as signal
b,a=signal.iirdesign([0.2,0.5],[0.1,0.6],2,40)
#参数解析:[0.2,0.5]通带范围
# [0.1,0.6]阻带小于0.1*f0大于0.6*f0
# 通带的最大增益衰减为2dB,阻带的最小增益衰减为40dB,
# 其中f0为1/2的信号取样频率
# iirdesign返回的两个数组b和a,他们分别是IIR滤波器的分子和分母部分的系数.
# 其中a[0]恒等于1
通过调用freqz计算所得到的滤波器的频率响应:w,h=signal.freqz(b,a)
frez返回两个数组w和h,其中w是圆频率数组,通过w/pi*f0可以计算出其对应的实际频率.h是w中的对应频率点的响应.其幅值为滤波器的增益,相角为滤波器的相位特性.
计算h的增益特性,并转换为dB度量,由于h中存在幅值几乎为0的值,因此先用clip函数对其进行裁剪,在调用对数函数,避免计算出错。#绘制出滤波器的增益特性图
pl.plot(w/np.pi*4000,power)
pl.show()
测量未知系统的频率特性
将频率扫描到系统中,观察系统的输出,从而计算其频率特性。# 为了调用chirp函数产生频率扫描波形的数据,首先产生一个等差数组代表取样时间,
#产生2秒钟取样频率为8khz的取样时间数组.
t=np.arange(0,2,1/8000.0)
#调用chirp得到2秒钟的频率扫描波形数据
sweep=signal.chirp(t,f0=0,t1=2,f1=4000.0)
#频率扫描波的开始频率f0为0HZ,结束频率为f1为4kHz,到达4kHz的时间为2秒
#使用数组t作为取样时间点。
#调用lfilter函数计算sweep波形经过带通滤波器值后的效果
out=signal.lfilter(b,a,sweep)
lfilter内部通过如下算是计算IIR滤波器的输出:
数组x代表输入信号,y代表输出信号:y[n]=b[0]x[n]+b[1]x[n-1]+...+b[P]x[n-P]
-a[1]y[n-1]-a[2]y[n-2]-...-a[Q]y[n-Q]
获取输出波形的包络,所以先将输出波形数据转换为能量值:# 为了调用chirp函数产生频率扫描波形的数据,首先产生一个等差数组代表取样时间,
#产生2秒钟取样频率为8khz的取样时间数组.
t=np.arange(0,2,1/8000.0)
#调用chirp得到2秒钟的频率扫描波形数据
sweep=signal.chirp(t,f0=0,t1=2,f1=4000.0)
#频率扫描波的开始频率f0为0HZ,结束频率为f1为4kHz,到达4kHz的时间为2秒
#使用数组t作为取样时间点。
#调用lfilter函数计算sweep波形经过带通滤波器值后的效果
out=signal.lfilter(b,a,sweep)
out=20*np.log10(np.abs(out))
#找到所有能量大于前后两个取样点的下标
index=np.where(np.logical_and(out[1:-1]>out[:-2],out[1:-1]>out[2:]))[0]+1
#将时间转换为对用频率,绘制所有局部最大点的能量值:
pl.plot(t[index]/2.0*4000,out[index])
pl.show()