OpenCV中提供了非常多处理图片的强大函数,能够对非常多格式的图片 加特效。有点实现Photoshop里的工具的感觉。 以下先介绍一些简单和常见的特效。

二值化(Image Threshold)

參考这里:Image Processing

二值化仅仅能处理灰度图。而所谓的灰度图。就是一幅仅仅用 0-255 这个范围来表示每个像素点的图像。灰度图没有色彩信息,看起来灰萌灰萌哒;可是又不全然仅仅有黑白两种颜色。

二值化,顾名思义,就是把灰度图的0-255的范围,映射到 0 和 1 两个值上。最简单的做法,便是先设置一个阈值(threshold),比方叫 t 好了。当灰度图完毕了的像素值 g < t。则赋值为 1,否则为 0. 这样就完毕了二值化。

二值化的效果,是能够将物体和背景切割出来,原理是让物体和背景的像素间方差最大。


Threshold函数

简单的全局二值化函数,使用方法例如以下

ret, thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

參数

  • img 是要二值化的图片
  • 127 表示阈值。这里我们用中位数表示。
  • 255 表示大于阈值。便给该像素赋这个值。
  • cv2.THRESH_BINARY 表示要用的二值化方法。取值例如以下
  • cv2.THRESH_BINARY
  • cv2.THRESH_BINARY_INV
  • cv2.THRESH_TRUNC
  • cv2.THRESH_TOZERO
  • cv2.THRESH_TOZERO_INV

返回值

  • ret 貌似会返回127。不知道有什么用
  • thresh 二值化以后的图片

AdaptiveThreshold函数

前面的全局二值化函数,用的阈值仅仅有一个。可是这样往往效果不是非常好,所以有了自适应的局部二值化算法。

adaptive = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
    cv2.THRESH_BINARY, 11, 2)

參数

  • img 要处理的灰度图
  • 255 大于阈值后要赋的值
  • cv2.ADAPTIVE_THRESH_GAUSSIAN_C 要用的自适应二值化方法
  • cv2.ADAPTIVE_THRESH_GAUSSIAN_C 高斯法
  • cv2.ADAPTIVE_THRESH_MEAN_C 平均法
  • cv2.THRESH_BINARY 表示阈值类型。仅仅能取以下两种
  • cv2.THRESH_BINARY
  • cv2.THRESH_BINARY_INV
  • 11 是blocksize。奇数
  • 2 常数C。用于从平均值或带权重的平均值中减去这个值

返回值

  • adaptive 返回二值化后的图片

模糊和平滑(Blur & Smoothing)

中文官方解释见这里:【图像平滑】

在图片的自适应局部二值化之前,一般先要进行图片的平滑处理,以过滤掉那些 噪点 。原理是让待处理图片和一个低通滤波器的 核(low-pass filter kernel)。事实上就是一个矩阵,做卷积运算。

所谓滤波。就是过滤掉信号中,高频或者低频,或者中间(即带通滤波)的部分。而低通的效果是 模糊,高通的效果是 锐化。

CSDN博主【浅墨】的这篇文章讲的非常好,事实上。整个将OpenCV的系列都非常深入浅出,适合刚開始学习的人。他也出了本书。有空能够关注一下。

举个栗子

img = cv2.imread('./lena.jpg')

# 方框滤波
boxBlur = cv2.boxblur(img, -1, (5, 5))

# 均值滤波
blur = cv2.blur(img, (5, 5))

# 高斯滤波,(5,5)是Kernel的大小
gBlur = cv2.GaussianBlur(img, (5, 5), 0)

# 中值滤波
mBlur = cv2.medianBlur(img, 5) 

# 双边滤波
bBlur = cv2.bilateralFilter(img, 9, 75, 75)

前面的方框滤波,均值滤波,高斯滤波,都是属于 线性滤波, 而中值滤波和双边滤波都是非线性的。非线性的滤波。效果一般好一点,可是也相对会速度较慢。

对了,均值滤波事实上就是归一化的方框滤波,即

blur = cv2.boxblur(img, -1, (5, 5), True)
blur2 = blur(img, (5, 5))

两行代码事实上是一样的。


滑动条

一般我们用一些OpenCV中的函数,常常要动态地调一个參数。有了滑动条就会方便非常多,直接拖动就改变对应的參数,就像手机上放大音量那样简单。

比起前面。滑动条的响应函数要自定义。

def refresh(x):
    print x

cv2.createTrackbar("value: ", "window title", 0, 255, refresh)

參数

  • “value: ” 滑动条上的显示字符串
  • “window title”,要显示在的窗体名
  • 0 默认值
  • 255 最大值
  • 响应函数名

注意: 1. 这里的refresh函数中。变量x是必须的,否则取不了值 2. 创建滑动条。要在创建窗体代码的后面


样例和完整代码

综合上面讲的函数,我们写一个完整的样例,依次展示:原图,灰度图,高斯平滑,二值化,自适应高斯二值化五张图片。

import cv2

title_ori = "binary"
title_ada = "adaptive"
title_trackbar = "threshold value"

# when value changed, refresh the picture
def refresh(x):
    ret, thres = cv2.threshold(blur, x, 255, cv2.THRESH_BINARY)
    cv2.imshow(title_ori, thres)

img = cv2.imread("./lena.jpg")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (5, 5), 0)

# create window
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.namedWindow("gray", cv2.WINDOW_NORMAL)
cv2.namedWindow("blur", cv2.WINDOW_NORMAL)

# show origin image, gray image and blur image
cv2.imshow("img", img)
cv2.imshow("gray", gray)
cv2.imshow("blur", blur)

# create window and trackbar for binary image
cv2.namedWindow(title_ori, cv2.WINDOW_NORMAL)
cv2.createTrackbar(title_trackbar, title_ori, 0, 255, refresh)
cv2.imshow(title_ori, img)

# create and show adaptive threshold
adaptive = cv2.adaptiveThreshold(blur, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
cv2.namedWindow(title_ada, cv2.WINDOW_NORMAL)
cv2.imshow(title_ada, adaptive)

cv2.waitKey(0)
cv2.destroyAllWindows()

OpenCV中提供了非常多处理图片的强大函数,能够对非常多格式的图片 加特效。有点实现Photoshop里的工具的感觉。 以下先介绍一些简单和常见的特效。

二值化(Image Threshold)

參考这里:Image Processing

二值化仅仅能处理灰度图。而所谓的灰度图。就是一幅仅仅用 0-255 这个范围来表示每个像素点的图像。灰度图没有色彩信息,看起来灰萌灰萌哒;可是又不全然仅仅有黑白两种颜色。

二值化,顾名思义,就是把灰度图的0-255的范围,映射到 0 和 1 两个值上。最简单的做法,便是先设置一个阈值(threshold),比方叫 t 好了。当灰度图完毕了的像素值 g < t。则赋值为 1,否则为 0. 这样就完毕了二值化。

二值化的效果,是能够将物体和背景切割出来,原理是让物体和背景的像素间方差最大。


Threshold函数

简单的全局二值化函数,使用方法例如以下

ret, thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

參数

  • img 是要二值化的图片
  • 127 表示阈值。这里我们用中位数表示。
  • 255 表示大于阈值。便给该像素赋这个值。
  • cv2.THRESH_BINARY 表示要用的二值化方法。取值例如以下
  • cv2.THRESH_BINARY
  • cv2.THRESH_BINARY_INV
  • cv2.THRESH_TRUNC
  • cv2.THRESH_TOZERO
  • cv2.THRESH_TOZERO_INV

返回值

  • ret 貌似会返回127。不知道有什么用
  • thresh 二值化以后的图片

AdaptiveThreshold函数

前面的全局二值化函数,用的阈值仅仅有一个。可是这样往往效果不是非常好,所以有了自适应的局部二值化算法。

adaptive = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
    cv2.THRESH_BINARY, 11, 2)

參数

  • img 要处理的灰度图
  • 255 大于阈值后要赋的值
  • cv2.ADAPTIVE_THRESH_GAUSSIAN_C 要用的自适应二值化方法
  • cv2.ADAPTIVE_THRESH_GAUSSIAN_C 高斯法
  • cv2.ADAPTIVE_THRESH_MEAN_C 平均法
  • cv2.THRESH_BINARY 表示阈值类型。仅仅能取以下两种
  • cv2.THRESH_BINARY
  • cv2.THRESH_BINARY_INV
  • 11 是blocksize。奇数
  • 2 常数C。用于从平均值或带权重的平均值中减去这个值

返回值

  • adaptive 返回二值化后的图片

模糊和平滑(Blur & Smoothing)

中文官方解释见这里:【图像平滑】

在图片的自适应局部二值化之前,一般先要进行图片的平滑处理,以过滤掉那些 噪点 。原理是让待处理图片和一个低通滤波器的 核(low-pass filter kernel)。事实上就是一个矩阵,做卷积运算。

所谓滤波。就是过滤掉信号中,高频或者低频,或者中间(即带通滤波)的部分。而低通的效果是 模糊,高通的效果是 锐化。

CSDN博主【浅墨】的这篇文章讲的非常好,事实上。整个将OpenCV的系列都非常深入浅出,适合刚開始学习的人。他也出了本书。有空能够关注一下。

举个栗子

img = cv2.imread('./lena.jpg')

# 方框滤波
boxBlur = cv2.boxblur(img, -1, (5, 5))

# 均值滤波
blur = cv2.blur(img, (5, 5))

# 高斯滤波,(5,5)是Kernel的大小
gBlur = cv2.GaussianBlur(img, (5, 5), 0)

# 中值滤波
mBlur = cv2.medianBlur(img, 5) 

# 双边滤波
bBlur = cv2.bilateralFilter(img, 9, 75, 75)

前面的方框滤波,均值滤波,高斯滤波,都是属于 线性滤波, 而中值滤波和双边滤波都是非线性的。非线性的滤波。效果一般好一点,可是也相对会速度较慢。

对了,均值滤波事实上就是归一化的方框滤波,即

blur = cv2.boxblur(img, -1, (5, 5), True)
blur2 = blur(img, (5, 5))

两行代码事实上是一样的。


滑动条

一般我们用一些OpenCV中的函数,常常要动态地调一个參数。有了滑动条就会方便非常多,直接拖动就改变对应的參数,就像手机上放大音量那样简单。

比起前面。滑动条的响应函数要自定义。

def refresh(x):
    print x

cv2.createTrackbar("value: ", "window title", 0, 255, refresh)

參数

  • “value: ” 滑动条上的显示字符串
  • “window title”,要显示在的窗体名
  • 0 默认值
  • 255 最大值
  • 响应函数名

注意: 1. 这里的refresh函数中。变量x是必须的,否则取不了值 2. 创建滑动条。要在创建窗体代码的后面


样例和完整代码

综合上面讲的函数,我们写一个完整的样例,依次展示:原图,灰度图,高斯平滑,二值化,自适应高斯二值化五张图片。

import cv2

title_ori = "binary"
title_ada = "adaptive"
title_trackbar = "threshold value"

# when value changed, refresh the picture
def refresh(x):
    ret, thres = cv2.threshold(blur, x, 255, cv2.THRESH_BINARY)
    cv2.imshow(title_ori, thres)

img = cv2.imread("./lena.jpg")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (5, 5), 0)

# create window
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.namedWindow("gray", cv2.WINDOW_NORMAL)
cv2.namedWindow("blur", cv2.WINDOW_NORMAL)

# show origin image, gray image and blur image
cv2.imshow("img", img)
cv2.imshow("gray", gray)
cv2.imshow("blur", blur)

# create window and trackbar for binary image
cv2.namedWindow(title_ori, cv2.WINDOW_NORMAL)
cv2.createTrackbar(title_trackbar, title_ori, 0, 255, refresh)
cv2.imshow(title_ori, img)

# create and show adaptive threshold
adaptive = cv2.adaptiveThreshold(blur, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
cv2.namedWindow(title_ada, cv2.WINDOW_NORMAL)
cv2.imshow(title_ada, adaptive)

cv2.waitKey(0)
cv2.destroyAllWindows()