有个朋友是一个初中老师。嗯,教学行政两手抓的那种初中老师。

一天晚上突然微信问我,怎么把图片转成PDF。懵了一下,这个直接打印成PDF不就可以了?

遂告诉他,结果感觉两个人不是一个世界的:




python 多个list循环进行拼接 python list循环遍历_Python


好不容易教他把图片放Word里面打印,结果发现他的需求并不止于此:


python 多个list循环进行拼接 python list循环遍历_python 遍历list_02


没辙,送佛送到西呗。继续挖他的需求:


python 多个list循环进行拼接 python list循环遍历_缩放_03


还有需要特殊处理的地方:


python 多个list循环进行拼接 python list循环遍历_python 遍历list_04


提炼了一下他的需求:

  1. 有两百多张用手机拍的学生XXX档案资料;
  2. 已经按照每个学生的名字编好了号;
  3. 需要每个学生按照顺序 + 公共的图片,组合成一个新的PDF文件;
  4. 生成的文件体积大小需要在20MB以内;

现状是这样的图片文件:


python 多个list循环进行拼接 python list循环遍历_python 多个list循环进行拼接_05


需要按照一定的图片顺序进行排序并转换PDF。

总结起来,也就是处理文件,将图片拼接组合成PDF。这个小需求,用Python实现起来轻轻松松。

梳理一下这个任务的几个关键点:

缩放图片

因为图片是用手机拍摄的,现有的手机动不动就是几千万的像素。拍一张照片,十几兆的大小是逃不了的。而需求最终每一个PDF的大小不超过20MB,缩放图片是必须要做的。

在 Python 中处理图片很经典的第三方模块是 Pillow,通过它可以对图像进行各种操作,当然也不限于缩小图片。

# 缩放图片dir_list = os.listdir(dir_path)new_path = r"D:DocumentsTencent Files3280350050FileRecvew"for f in dir_list:    if f.endswith('.jpg'):        img = Image.open(dir_path+''+f)        new_size = img.resize((1401,1867))        new_size.save(new_path + '' + f)

上述代码就把图片缩小到了1401*1867像素大小。

图片转PDF

在这个任务里面,核心的需求是把图片转成 PDF 格式的文件。Python 中图片转 PDF 的功能有很多模块可以实现,在此州的先生选用的是 img2pdf。

直接调用img2pdf.convert()方法,将图片路径或图片列表路径作为参数传递进去,就可以得到一个转换好的 PDF 文件对象。

# 新建单个PDF文件with open(new_path+''+'{}_1.pdf'.format(name),'wb') as pdf_file:    a4inpt = (img2pdf.mm_to_pt(210), img2pdf.mm_to_pt(297)) # 创建A4纸格式    layout_fun = img2pdf.get_layout_fun(a4inpt) # 设置A4纸格式    # PDF写入图片    pdf_file.write(        img2pdf.convert(            img_list,            # layout_fun=layout_fun        )    )

其 PyPI 的链接为:https://pypi.org/project/img2pdf/ ,感兴趣的朋友可以详细地了解其使用方法。

图像排列规则

因为需要按照一定的顺序对照片进行排序,然后还有一个特殊的情况,所以在对原始图片进行遍历的时候,需要进行一番处理,最后生成每一个人的图片的列表。

# 生成单个名称的图片列表for name in sorted(name_list,reverse=False):    print(ame)    if name == '***': # 特殊情况学生的名字        img_list = []        for f in dir_list:            print(f)            file_name, file_suffix = f.split('.')            file_sort = int(file_name[-1])            if name == file_name[:-1]:                if file_sort == 3:                    img_list.insert(4, new_path + '' + f)                else:                    img_list.insert(int(file_name[-1]) - 1, new_path + '' + f)        img_list.insert(1, new_path + '' + '公共1.jpg')        img_list.insert(3, new_path + '' + '公共2.jpg')        img_list.insert(9, new_path + '' + '公共4.jpg')        img_list.insert(10, new_path + '' + '公共5.jpg')        img_list.insert(11, new_path + '' + '公共6.jpg')        print(img_list)    else:        img_list = []        for f in dir_list:            print(f)            file_name,file_suffix = f.split('.')            file_sort = int(file_name[-1])            if name == file_name[:-1]:                if file_sort == 3:                    img_list.insert(5,new_path+''+f)                else:                    img_list.insert(int(file_name[-1])-1,new_path+''+f)        img_list.insert(1,new_path+''+'公共1.jpg')        img_list.insert(3, new_path + '' + '公共2.jpg')        img_list.insert(4, new_path + '' + '公共3.jpg')        img_list.insert(9, new_path + '' + '公共4.jpg')        img_list.insert(10, new_path + '' + '公共5.jpg')        img_list.insert(11, new_path + '' + '公共6.jpg')        print(img_list)

完整步骤

在对任务的关键点有了认识之后,我们按照流程,就可以轻松完成这个任务。

  1. 遍历原始图片文件夹,缩小图片,并将其另存到另一个文件夹;
  2. 遍历新图片的文件夹,生成除了公共图片之外的所有学生姓名列表;
  3. 遍历学生姓名列表,按照指定的图片排序规则,生成每个学生的图片列表;
    3.1 生成每个学生的图片列表之后,新建一个文件,将图片列表转为PDF;

以上4步,就完成了这个手工操作浪费时间且令人抓狂的任务。运行代码不出一分钟,所有学生的PDF文件都已生成完成:


python 多个list循环进行拼接 python list循环遍历_python 遍历list_06


算上找模块的时间,花在代码上的时间满打满算20分钟。

瞬间把一个快炸毛的老师:


python 多个list循环进行拼接 python list循环遍历_python 遍历list_07


的毛给顺了下去:


python 多个list循环进行拼接 python list循环遍历_python 遍历list_08