前言
图片压缩应用很广泛,如生成缩略图等。前期我在进行图片处理的过程中碰到了一个问题,就是如何将图片压缩到指定尺寸,此处尺寸指的是生成图片文件的大小。
我使用 opencv 进行图片处理,于是想着直接使用 opencv 进行图片压缩处理, opencv 本身包含了压缩到指定像素大小的方法,奈何寻找了很多方法均不能压缩到指定文件尺寸,于是自己在思考后写出了此方法。本文使用python语言。
一、 opencv 常规使用
opencv 无需多言,做过图片处理的人应该都知道此类库,下面我介绍一些常用方法。
1.1 安装 opencv
首先安装 python ,建议 python3 ,然后执行
:
pip install opencv-python
1.2 读取图片
首先引入 opencv 包:
import cv2 as cv
import cv2 as cv
而后读取图片:
image = cv.imread(path)
image = cv.imread(path)
其中 path 为图片路径, image 为图片数据,是一个 numpy.ndarray 对象,其实就是一个多维数组。目前 opencv 支持几乎所有格式的图片(参考 )。
1.3 保存图片
代码:
cv.imwrite(path, image)
cv.imwrite(path, image)
其中 path 为保存的文件路径, image 为读取或者处理过的图片数据, opencv 根据保存文件的后缀名来写不同格式的图片数据,所以后缀名一定要写正确。
二、图片压缩
2.1 常规压缩
opencv 支持常规压缩,可以将图片压缩到指定的像素尺寸或者按比例缩放。
- 压缩到指定的像素尺寸:
new_image = cv.resize(image, size)
new_image = cv.resize(image, size)
其中 size 是一个二维元组,表示压缩后图片的宽高。
- 按比例缩放:
new_image = cv.resize(image, None, fx, fy)
new_image = cv.resize(image, None, fx, fy)
其中 fx , fy 表示图片在宽和高方向的压缩了比例。
2.2 压缩到指定文档大小
有了上面的基础我们来分析一下如何实现压缩到指定文档大小。
首先我们要读取原始文档的大小,算出原始文档大小和压缩目标值的比例,由于我们要实现的是宽高等比例压缩,于是将其开根号即表示在单边的压缩比例,调用 2.1 节中的按比例压缩。理论上一次就能达到效果,但是由于图片本身存在压缩,所以可能一次无法达到预期,只要对压缩后的图片重复此步骤,直到达到预期即可。
2.2.1 读取文档尺寸
def get_doc_size(path):
try:
size = os.path.getsize(path)
return get_mb_size(size)
except Exception as err:
print(err)
def get_mb_size(bytes):
bytes = float(bytes)
mb = bytes / 1024 / 1024
return mb
def get_doc_size(path):
try:
size = os.path.getsize(path)
return get_mb_size(size)
except Exception as err:
print(err)
def get_mb_size(bytes):
bytes = float(bytes)
mb = bytes / 1024 / 1024
return mb
get_doc_size 函数返回图片的文档大小,单位为 MB 。
2.2.2 删除文件
def delete_file(path):
if file_exist(path):
os.remove(path)
else:
print('no such file:%s' % path)
def file_exist(path):
return os.path.exists(path)
def delete_file(path):
if file_exist(path):
os.remove(path)
else:
print('no such file:%s' % path)
def file_exist(path):
return os.path.exists(path)
由于我们需要删除压缩过程中产生的中间文件,所以需要调用 delete_file 方法删除之。
2.2.3 压缩
size = get_doc_size(path)
delete_file(resize_path)
while size > filesize:
rate = math.ceil((size / filesize) * 10) / 10 + 0.1
rate = math.sqrt(rate)
rate = 1.0 / rate
if file_exist(resize_path):
resize_rate(resize_path, resize_path, rate, rate)
else:
resize_rate(path, resize_path, rate, rate)
size = get_doc_size(resize_path)
size = get_doc_size(path)
delete_file(resize_path)
while size > filesize:
rate = math.ceil((size / filesize) * 10) / 10 + 0.1
rate = math.sqrt(rate)
rate = 1.0 / rate
if file_exist(resize_path):
resize_rate(resize_path, resize_path, rate, rate)
else:
resize_rate(path, resize_path, rate, rate)
size = get_doc_size(resize_path)
其中 filesize 表示压缩目标值, path 表示原始文件路径, resize_path 表示压缩后存放路径, resize_rate 表示上述按比例压缩方法,定义如下:
def resize_rate(path, resize_path, fx, fy):
image = read_image(path)
im_resize = cv.resize(image, None, fx=fx, fy=fy)
delete_file(resize_path)
save_image(resize_path, im_resize)
def save_image(path, image):
cv.imwrite(path, image)
def read_image(path):
return cv.imread(path)
def resize_rate(path, resize_path, fx, fy):
image = read_image(path)
im_resize = cv.resize(image, None, fx=fx, fy=fy)
delete_file(resize_path)
save_image(resize_path, im_resize)
def save_image(path, image):
cv.imwrite(path, image)
def read_image(path):
return cv.imread(path)
当然此处为了效果更好,我做了一些优化。
首先在获取压缩比例的时候我做了下述操作:
rate = math.ceil((size / filesize) * 10) / 10 + 0.1
rate = math.ceil((size / filesize) * 10) / 10 + 0.1
理论情况应当是直接返回 size / filesize 即可,但是在实际测试过程中为了加速收敛,我采用上述方式,将一个小数先乘以 10 对其向上取整,这样就表示精度保留到原始数值小数后 1 位,即如果是 3.14 将得到 32 ,而后将此结果再除以 10 , 即得到 3.2 ,所以最终结果就是对小数后第二位进行向上进位,最后结果又加了 0.1 以更快速的收敛,当然你也可以去掉。
实际测试发现,一般重复执行两次即可得到理想的压缩效果,并且结果值与理想压缩尺寸相差无几。
三、结论
本文简单介绍了如何使用 opencv 将图片压缩到指定文件尺寸,当然你也可以选择其他文件处理类库而不是 opencv ,这个完全可以根据用户自己的兴趣而来,并且也可以优化最终的循环算法,以达到更佳的效果,或者更快的收敛。