一、前言
matplotlib【1】是著名的python绘图库,它提供了一整套绘图API,十分适合交互式绘图。本人在工作过程中涉及到股票数据的处理如绘制K线等,因此将matplotlib的使用心得进行整理,与大家共同分享。
另外,在数据处理过程中会用到numpy【2】,matplotlib网站的示例也有不少用到了numpy,读者可以参考这篇文章【3】有基本的了解。
本系列文章主要分为两部分:(1)matplotlib基本使用;(2)结合股票走势、技术指标等信息通过matplotlib进行绘制,学习其用法,个人觉得matplotlib博大精深,二八定理,20%的功能完成80%的图表需求。
最后,matplotlib作者英年早逝,感谢他所做出的贡献。John Hunter will be missed!
二、matplotlib基本使用
matplotlib中通过pyplot模块进行图表的绘制。所绘制的图表称为一个绘图对象,在绘图对象之上绘制各种图形。由于K线图主要是基于日期和股票价格的X-Y坐标轴结构,因此本系列文章也主要针对axes坐标轴绘制进行分析。
通过如下语句导入需要绘图的库:
import matplotlib.pyplot as plt
1. figure对象
figure对象可以看成整个图表。在figure图表之上增加多个子图,然后在子图之上绘制点和线。
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
得到fig对象之后,通过add_subplot增加子图(返回了一个axes坐标轴),该方法需要三个参数,分别为:numrows, numcols, fignum。其中,一共有numrows*numcols个子图,即:将图表分为N行*M列,fignum标识了该子图的顺序,其范围从1到numrows*numcols。在上例中1,1,1表示了该绘图对象仅有1个子图,也就是1*1类型。
2. plot方法绘图
创建子图之后,通过plot方法在子图上绘制。plot方法可以传入两个list,分别表示X和Y坐标,因此x和y的长度要一致。需要注意的是,plot也可以接受一个list参数作为Y坐标的值,默认X坐标的值从0开始到Y的长度。
plt.plot([1,2,3,4])
其中X坐标为0到3,个数与Y坐标值的数目相同。
plt.plot([1,2,3,4], [1,2,3,4])
设置了X坐标的值。然后通过plot.show()显示该图,示例代码如下:
def PlotDemo1():
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.plot([1,2,3,4],[2,3,4,5])
plt.show()
图表如下所示:
上述图表作为基础,以后我们都是围绕这个基础图表不断添加元素,直到达到我们想要的效果。
2.1 增加标题和坐标轴说明
如果需要给绘图对象增加标题,可以通过suptitle方法设置,其中可以设置参数:标题、标题字体大小、字体类型等。代码示例如下:
fig.suptitle('figure title demo', fontsize = 14, fontweight='bold')
如果需要对给定子图的坐标轴设置标题,可以通过刚才返回的axes对象的set_title进行设置,代码示例如下:
ax.set_title("axes title")
如果需要对于X和Y坐标设置标签,可以通过set_xlabel和set_ylabel方法设置。代码示例如下:
ax.set_xlabel("x label") ax.set_ylabel("y label")
图表如下所示:
通过上述的示例,我们绘制了一个基本的X和Y坐标轴,并增加了针对坐标轴的说明。
三、股价基本走势图
股票的K线图(以日K为例)由日期和价格组成,形成X-Y坐标轴,按照前面的绘图方案,需要传入日期数组和价格数组即可。
1.numpy数组
numpy是常用的数据处理库,我将000001.SZ的股价数据(时间范围从20150101到20150930)导入到csv中,然后通过numpy读取得到日期和价格数组。csv文件中包含了两列,日期和价格,分割符号为",",读取过程代码如下:
dates, close = np.loadtxt(filename,delimiter=",", unpack= True, converters={0:mdates.strpdate2num('%Y-%m-%d')})
numpy的loadtxt方法:设定了文件中的分隔符号为“,”,unpack是否将数组拆分,True为拆分,即:得到两个数组分别表示日期和收盘价格,converters是将日期类型的字符串转为数组,因为numpy规定其数组中的类型需要一致。
2.绘制基础走势图
通过numpy得到日期和收盘价格之后,参照先前的示例,通过plot方法进行绘制:
ax1.plot(dates,close)
图表如下所示:
在上图中,x轴通过数值标识,而不是日期类型。因为我们通过numpy构造数组时,日期按照数值类型存储,可以通过如下方法转换为日期类型:
ax1.xaxis.set_major_locator(mdates.DayLocator(bymonthday=range(1,32), interval=15))
ax1.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d"))
for label in ax1.xaxis.get_ticklabels():
label.set_rotation(45)
X-轴设置主要刻度locator为每日刻度,格式为:DateFormatter("%Y-%m-%d"),每日刻度从第1日到第31日,间隔为15日。图表如下所示:
其中,对于X-轴上面的每个ticker标签都向右倾斜45度,这样标签不会重叠在一起便于查看。
也可以按照每月进行显示,X-轴设置主要刻度为每月刻度,格式为:DateFormatter("%Y-%m"),转换代码如下:
ax1.xaxis.set_major_locator(mdates.MonthLocator())
ax1.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m"))
图表如下所示:
3.图形边框调整
细心的读者可能会发现,在上图中底部(bottom)处的日期标签,显示不完整。此时可以点击【configure subplots】按钮,调整左右和上下边框,然后保存即可。图表如下所示:
也可以通过subplots_adjust方法对于边框进行调整:
plt.subplots_adjust(bottom=0.13,top=0.95)
4.绘制价格平均线
在前面的示例中绘制了基本的股票走势图,本节我们利用ta-lib【4】证券技术指标库,绘制5日和10日价格平均线。
ta-lib中提供了方法talib.SMA得到价格简单平均线,timeperiod为时间参数,timeperiod=5为五日均线,基于上图增加五日和十日均线,代码如下:
sma5 = talib.SMA(close, timeperiod = 5)
ax1.plot(dates,sma5)
sma10 = talib.SMA(close, timeperiod = 10)
ax1.plot(dates,sma10)
其中,sma5和sma10均为numpy数组。
图表如下所示:
在坐标轴中有三条曲线,matplotlib会自动改变线条颜色,此时如果没有说明并不方便使用,可以在右上角增加图例,表明各线条所代表的含义,并增加图表的网格效果,代码如下:
plt.legend(('daily', 'SMA5', 'SMA10'))
plt.grid(True)
图表如下所示:
四、总结
本章对于matplotlib的基本使用方法进行了介绍,并绘制了基本的股票价格和均线走势图。在后面的章节中对于上述图表增加成交量、MACD值等数据。
Title为标题。Axis为坐标轴,Label为坐标轴标注。Tick为刻度线,Tick Label为刻度注释。
五、程序
data.csv文件内容如下:
2018-06-19,58
2018-06-20,59
2018-06-21,60
2018-06-22,68
2018-06-23,69
2018-06-24,70
2018-06-25,71
2018-06-26,72
2018-06-27,66
2018-06-28,67
2018-06-29,68
2018-06-30,69
2018-07-1,70
Matplot5.py
# -*- coding: UTF-8 -*-
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.dates as mdates
from matplotlib.dates import bytespdate2num
import pandas as pd
def PlotDemo1():
fig = plt.figure()
fig.suptitle('figure title demo', fontsize = 14, fontweight='bold')
ax = fig.add_subplot(1,1,1)
ax.set_title("axes title")
ax.set_xlabel("x label")
ax.set_ylabel("y label")
dates, close = np.loadtxt('D:\knowledge\language\python\src\data.csv',delimiter=",",usecols=(0,1), unpack= True, converters={0:bytespdate2num('%Y-%m-%d')})
ax.xaxis.set_major_locator(mdates.DayLocator(bymonthday=range(1,32), interval=3))
ax.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d"))
plt.xticks(pd.date_range('2018-06-19','2018-07-1',freq='3D'),rotation=25)
ax.plot(dates,close)
plt.show()
def getData():
dates, close = np.loadtxt('D:\knowledge\language\python\src\data.csv',delimiter=",",usecols=(0,1), unpack= True )
#dates = (2,3,4,55,66)
print( dates )
PlotDemo1()
六、查看函数参考
xx\src>python
Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 16:07:46) [MSC v.1900 32 bit (Intel)]
Type "help", "copyright", "credits" or "license" for more information.
>>> import pandas as pd
>>> help (pd.date_range)