在使用Keras搭建验证码识别模型时,需要大量的验证码图片。在这里,使用captcha模块生成验证码图片,验证码图片名称为验证码上显示的字符串。

1 生成单张验证码图片并显示

生成一张验证码的代码如下:

from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np 
import random
import string

#characters为验证码上的字符集,10个数字加26个大写英文字母
#0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ str类型
characters=string.digits+string.ascii_uppercase

width,height,n_len,n_class=170,80,4,len(characters)

#设置验证码图片的宽度widht和高度height
#除此之外还可以设置字体fonts和字体大小font_sizes
generator=ImageCaptcha(width=width,height=height)

#生成随机的4个字符的字符串
random_str=''.join([random.choice(characters) for j in range(4)])

#生成验证码
img=generator.generate_image(random_str)

#显示验证码图片和验证码标题
plt.imshow(img)
plt.title(random_str)
plt.show()

程序运行结果为:

python 验证码模块 python编写验证码_生成

2 验证码图片的显示与保存

上面代码中生成的验证码是PIL图像格式,因此也可以直接使用PIL自带的show方法显示图片,save方法保存图片
如下:

#显示验证码
img.show()

#保存验证码
file_name=random_str+'.jpg'
img.save(file_name)

python 验证码模块 python编写验证码_captcha_02

3 批量生成验证码样本集

当我们在深度学习中,进行验证码进行字符识别,需要大量的图片,因此我们可以批量生成大量的样本。这里以生成一万张样本为例。
代码如下:

from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np 
import random
import string
from PIL import Image

#characters为验证码上的字符集,10个数字加26个大写英文字母
#0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ str类型
characters=string.digits+string.ascii_uppercase

width,height,n_len,n_class=170,80,4,len(characters)

#生成一万张验证码
for i in range(10000):
    generator=ImageCaptcha(width=width,height=height)
    random_str=''.join([random.choice(characters) for j in range(4)])
    img=generator.generate_image(random_str)

    #将图片保存在目录yzm文件夹下
    file_name='./yzm/'+random_str+'_'+str(i)+'.jpg'
    img.save(file_name)

当程序执行完,会在文件夹yzm下生成一万张验证码图片

python 验证码模块 python编写验证码_验证码_03