一、前言
matplotlib【1】是著名的python绘图库,它提供了一整套绘图API,十分适合交互式绘图。本人在工作过程中涉及到股票数据的处理如绘制K线等,因此将matplotlib的使用心得进行整理,与大家共同分享。
  另外,在数据处理过程中会用到numpy【2】,matplotlib网站的示例也有不少用到了numpy,读者可以参考这篇文章【3】有基本的了解。
  本系列文章主要分为两部分:(1)matplotlib基本使用;(2)结合股票走势、技术指标等信息通过matplotlib进行绘制,学习其用法,个人觉得matplotlib博大精深,二八定理,20%的功能完成80%的图表需求。
  最后,matplotlib作者英年早逝,感谢他所做出的贡献。John Hunter will be missed!

二、matplotlib基本使用
matplotlib中通过pyplot模块进行图表的绘制。所绘制的图表称为一个绘图对象,在绘图对象之上绘制各种图形。由于K线图主要是基于日期和股票价格的X-Y坐标轴结构,因此本系列文章也主要针对axes坐标轴绘制进行分析。
通过如下语句导入需要绘图的库:

import matplotlib.pyplot as plt

1. figure对象
figure对象可以看成整个图表。在figure图表之上增加多个子图,然后在子图之上绘制点和线。

    fig = plt.figure()  

    ax = fig.add_subplot(1,1,1)

  得到fig对象之后,通过add_subplot增加子图(返回了一个axes坐标轴),该方法需要三个参数,分别为:numrows, numcols, fignum。其中,一共有numrows*numcols个子图,即:将图表分为N行*M列,fignum标识了该子图的顺序,其范围从1到numrows*numcols。在上例中1,1,1表示了该绘图对象仅有1个子图,也就是1*1类型。
2. plot方法绘图
创建子图之后,通过plot方法在子图上绘制。plot方法可以传入两个list,分别表示X和Y坐标,因此x和y的长度要一致。需要注意的是,plot也可以接受一个list参数作为Y坐标的值,默认X坐标的值从0开始到Y的长度。

  plt.plot([1,2,3,4])

  其中X坐标为0到3,个数与Y坐标值的数目相同。

   plt.plot([1,2,3,4], [1,2,3,4])

  设置了X坐标的值。然后通过plot.show()显示该图,示例代码如下:

def PlotDemo1():

 fig  = plt.figure()

 ax = fig.add_subplot(1,1,1)

 ax.plot([1,2,3,4],[2,3,4,5])

 plt.show()

  图表如下所示:

Python基线 python曲线_子图


上述图表作为基础,以后我们都是围绕这个基础图表不断添加元素,直到达到我们想要的效果。

2.1 增加标题和坐标轴说明
如果需要给绘图对象增加标题,可以通过suptitle方法设置,其中可以设置参数:标题、标题字体大小、字体类型等。代码示例如下:

fig.suptitle('figure title demo', fontsize = 14, fontweight='bold')

  如果需要对给定子图的坐标轴设置标题,可以通过刚才返回的axes对象的set_title进行设置,代码示例如下:

  ax.set_title("axes title")

  如果需要对于X和Y坐标设置标签,可以通过set_xlabel和set_ylabel方法设置。代码示例如下:

    ax.set_xlabel("x label")      ax.set_ylabel("y label")

  图表如下所示:

Python基线 python曲线_Python基线_02


通过上述的示例,我们绘制了一个基本的X和Y坐标轴,并增加了针对坐标轴的说明。

三、股价基本走势图

股票的K线图(以日K为例)由日期和价格组成,形成X-Y坐标轴,按照前面的绘图方案,需要传入日期数组和价格数组即可。

1.numpy数组

numpy是常用的数据处理库,我将000001.SZ的股价数据(时间范围从20150101到20150930)导入到csv中,然后通过numpy读取得到日期和价格数组。csv文件中包含了两列,日期和价格,分割符号为",",读取过程代码如下:

dates, close = np.loadtxt(filename,delimiter=",", unpack= True, converters={0:mdates.strpdate2num('%Y-%m-%d')})

numpy的loadtxt方法:设定了文件中的分隔符号为“,”,unpack是否将数组拆分,True为拆分,即:得到两个数组分别表示日期和收盘价格,converters是将日期类型的字符串转为数组,因为numpy规定其数组中的类型需要一致。
2.绘制基础走势图
通过numpy得到日期和收盘价格之后,参照先前的示例,通过plot方法进行绘制:

ax1.plot(dates,close)

  图表如下所示:

Python基线 python曲线_Python基线_03


在上图中,x轴通过数值标识,而不是日期类型。因为我们通过numpy构造数组时,日期按照数值类型存储,可以通过如下方法转换为日期类型:

    ax1.xaxis.set_major_locator(mdates.DayLocator(bymonthday=range(1,32), interval=15))

    ax1.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d"))

      for label in ax1.xaxis.get_ticklabels():   

       label.set_rotation(45)

X-轴设置主要刻度locator为每日刻度,格式为:DateFormatter("%Y-%m-%d"),每日刻度从第1日到第31日,间隔为15日。图表如下所示:

Python基线 python曲线_数组_04


其中,对于X-轴上面的每个ticker标签都向右倾斜45度,这样标签不会重叠在一起便于查看。

也可以按照每月进行显示,X-轴设置主要刻度为每月刻度,格式为:DateFormatter("%Y-%m"),转换代码如下:

    ax1.xaxis.set_major_locator(mdates.MonthLocator())

     ax1.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m"))

  图表如下所示:

Python基线 python曲线_数组_05


3.图形边框调整

细心的读者可能会发现,在上图中底部(bottom)处的日期标签,显示不完整。此时可以点击【configure subplots】按钮,调整左右和上下边框,然后保存即可。图表如下所示:

Python基线 python曲线_坐标轴_06


也可以通过subplots_adjust方法对于边框进行调整:

    plt.subplots_adjust(bottom=0.13,top=0.95)

4.绘制价格平均线
在前面的示例中绘制了基本的股票走势图,本节我们利用ta-lib【4】证券技术指标库,绘制5日和10日价格平均线。
ta-lib中提供了方法talib.SMA得到价格简单平均线,timeperiod为时间参数,timeperiod=5为五日均线,基于上图增加五日和十日均线,代码如下:

    sma5 = talib.SMA(close, timeperiod = 5)

     ax1.plot(dates,sma5)

      sma10 = talib.SMA(close, timeperiod = 10)

     ax1.plot(dates,sma10)

  其中,sma5和sma10均为numpy数组。

图表如下所示:

Python基线 python曲线_Python基线_07


在坐标轴中有三条曲线,matplotlib会自动改变线条颜色,此时如果没有说明并不方便使用,可以在右上角增加图例,表明各线条所代表的含义,并增加图表的网格效果,代码如下:

plt.legend(('daily', 'SMA5', 'SMA10'))

 plt.grid(True)

  图表如下所示:

 

Python基线 python曲线_Python基线_08

四、总结
本章对于matplotlib的基本使用方法进行了介绍,并绘制了基本的股票价格和均线走势图。在后面的章节中对于上述图表增加成交量、MACD值等数据。

Title为标题。Axis为坐标轴,Label为坐标轴标注。Tick为刻度线,Tick Label为刻度注释。

 

Python基线 python曲线_子图_09

五、程序
data.csv文件内容如下:

2018-06-19,58

2018-06-20,59

2018-06-21,60

2018-06-22,68

2018-06-23,69

2018-06-24,70

2018-06-25,71

2018-06-26,72

2018-06-27,66

2018-06-28,67

2018-06-29,68

2018-06-30,69

2018-07-1,70

Matplot5.py

# -*- coding: UTF-8 -*-

 

import matplotlib.pyplot as plt

import numpy as np

import matplotlib.dates as mdates

from matplotlib.dates import bytespdate2num

import pandas as pd

 

def PlotDemo1():

fig  = plt.figure()

fig.suptitle('figure title demo', fontsize = 14, fontweight='bold')

ax = fig.add_subplot(1,1,1)

ax.set_title("axes title")

ax.set_xlabel("x label")      

ax.set_ylabel("y label")

dates, close = np.loadtxt('D:\knowledge\language\python\src\data.csv',delimiter=",",usecols=(0,1), unpack= True, converters={0:bytespdate2num('%Y-%m-%d')})

ax.xaxis.set_major_locator(mdates.DayLocator(bymonthday=range(1,32), interval=3))

ax.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d"))

plt.xticks(pd.date_range('2018-06-19','2018-07-1',freq='3D'),rotation=25)

   

ax.plot(dates,close)

plt.show()

def getData():

dates, close = np.loadtxt('D:\knowledge\language\python\src\data.csv',delimiter=",",usecols=(0,1), unpack= True )

#dates = (2,3,4,55,66)

print( dates )

PlotDemo1()

 

六、查看函数参考
xx\src>python

Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 16:07:46) [MSC v.1900 32 bit (Intel)]

Type "help", "copyright", "credits" or "license" for more information.

>>> import pandas as pd

>>> help (pd.date_range)