内容:
OpenCV 是从事CV方向工作的基础课程,以OpenCV基础,介绍传统的图像处理算法,为图像处理算法工作打下坚实的基础。
图像处理方法:
包括基本的图像处理方法:几何变换,形态学变换,图像平滑(去噪),直方图操作(灰度直方图),模板匹配,霍夫变换(检测圆形、椭圆)等
特征提取和描述方法(使用算法提取特征、描述):理解角点特征,Harris和Shi-Tomas算法,SIFT/SURF算法,Fast算法,ORB算法等;
OpenCV在视频操作(目标追踪)中的应用,最后的案例是使用OpenCV进行人脸检测。
声音OpenCV识别不了,可以用其他库
图像
图像是人类视觉的基础,是自然景物的客观反映,是人类认识世界和人类本身的重要源泉。
图是物体反射或透射光的分布,"像"是人的视觉系统所接受的图在人脑中所形成的印象或认识,照片、绘画等都是图像。
数字图像和模拟图像
图像起源于1826年前后法国科学家Joseph Nicéphore Niépce发明的第一张可永久保存的照片,属于模拟图像。模拟图像又称连续图像,它通过某种物理量(如光、电等)的强弱变化来记录图像亮度信息,所以是连续变换的。模拟信号的特点是容易受干扰,如今已经基本全面被数字图像替代。
在第一次世界大战后,1921年美国科学家发明了Bartlane System,并从伦敦传到纽约传输了第一幅数字图像,其亮度用离散数值表示,将图片编码成5个灰度级,通过海底电缆进行传输。在发送端图片被编码并使用打孔带记录,通过系统传输后在接收方使用特殊的打印机恢复成图像。
数字图像表示
计算机采用0/1编码的系统,数字图像也是利用0/1来记录信息,我们平常接触的图像都是8位数图像,包含0~255灰度,其中0,代表最黑,1,表示最白
二值图像:
一幅二值图像的二维矩阵仅由0、1两个值构成,“0”代表黑色,“1”代白色。由于每一像素(矩阵中每一元素)取值仅有0、1两种可能,所以计算机中二值图像的数据类型通常为1个二进制位。二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
灰度图:
每个像素只有一个采样颜色的图像,这类图像通常显示为从最暗黑色到最亮的白色的灰度,尽管理论上这个采样可以任何颜色的不同深浅,甚至可以是不同亮度上的不同颜色。灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑色与白色两种颜色;但是,灰度图像在黑色与白色之间还有许多级的颜色深度。灰度图像经常是在单个电磁波频谱如可见光内测量每个像素的亮度得到的,用于显示的灰度图像通常用每个采样像素8位的非线性尺度来保存,这样可以有256级灰度(如果用16位,则有65536级)。
彩色图:
每个像素通常是由红(R)、绿(G)、蓝(B)三个分量来表示的,分量介于(0,255)。RGB图像与索引图像一样都可以用来表示彩色图像。与索引图像一样,它分别用红(R)、绿(G)、蓝(B)三原色的组合来表示每个像素的颜色。但与索引图像不同的是,RGB图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中,由于每一像素的颜色需由R、G、B三个分量来表示,M、N分别表示图像的行列数,三个M x N的二维矩阵分别表示各个像素的R、G、B三个颜色分量。RGB图像的数据类型一般为8位无符号整形,通常用于表示和存放真彩色图像。
OpenCV
计算机视觉处理开源软件库,支持与计算机视觉和机器学习相关的众多算法
OpenCV的优势
跨平台
活跃的开发团队
丰富的API
完善的传统计算机视觉算法,涵盖主流的机器学习算法,同时添加了对深度学习的支持。
OpenCV-Python使用Numpy(所以在安装OpenCV前要安装Numpy),这是一个高度优化的数据库操作库,具有MATLAB风格的语法。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。
安装OpenCV之前需要先安装numpy, matplotlib
创建Python虚拟环境cv(之前学的,就是虚拟环境嘛,忘了……之前学的是PyCharm中的解释器的配置,提到在基础课的学习中用不到虚拟环境,那么现在学习一下怎么弄
Python3 创建虚拟环境
PyCharm Win10 3.8版本以上
PyCharm中也可以创建虚拟环境(cmd中创建的没学,用到再说)
确保是这个文件夹
(安装库的办法 pip install 名字)
下边的这个 Terminal(终端)中类似于cmd指令进去 可以安装
试了一下,在里边numpy已经有了,测试的requests也能用。但是matplotlib没有,所以要先安装这个。
这样安装不上,为啥跟视频里不一样
venv就是所说的虚拟环境,虚拟环境安装
再按照视频里试试
python -m venv venv
怎么样才能使用虚拟环境
先配置一下解释器 新建环境 虚拟环境 刚才建的文件夹下的 vene就可了
Pip 在终端安装 版本会提醒更新 复制给的指令就行了
虚拟环境创建好了,现在cmd的不学
提示pycharm中的git没有了,查了一下好像是远程传输项目什么的,现在用不上,先不管了
OpenCV顺利安装成功 但是是最新版本的 跟课程中不太一样
“
Python创建虚拟环境的三种方式:1、 Virtualenv(之前在PyCharm中学的就是这个)2. Pipenv 3. Conda
为什么用虚拟环境
在使用Python语言时,通过pip(pip3)来安装第三方包,但是由于pip的特性,系统中只能安装每个包的一个版本。但是在实际项目开发中,不同项目可能需要第三方包的不同版本,迫使我们需要根据实际需求不断进行更新或卸载相应的包,而如果我们直接使用本地的Python环境,会导致整体的开发环境相当混乱而不易管理(现在理解为这个文件夹里随便倒腾,不怕出问题,实在不行就再建一个 ),这时候我们就需要开辟一个独立干净的空间进行开发和部署,虚拟环境就孕育而生。”
invalid syntax 无效语法
先安装OpenCV-Python, 由于一些经典的算法被申请了版权,新版本有很大的限制,所以选用3.4.3以下的版本。
测试是否安装成功,运行以下代码无报错则说明安装成功。
import cv2
# 读一个图片并进行显示(图片路径需自己指定)
lena=cv2.imread("1.jpg")
cv2.imshow("image",lena)
cv2.waitKey(0)
能打开,但是把图片放到这个项目所在的文件夹才可以打开(我在MATLAB也有这个问题)
F://BaiduNetdiskDownload//ps//ps//202.4.12.jpg" 这样加个路径就可以读取任意一个地方的了 但是,直接复制的单斜杠复制了不能用,上边双斜杠可以
如果我们要利用SIFT和SURF等进行特征提取时,还需要安装:
pip install opencv-contrib-python==3.4.2.17(尚未安装)
模块
其中core、highgui、imgproc是最基础的模块分别介绍如下:
core模块实现了最核心的数据结构及其基本运算,如绘图函数、数组操作相关函数等。
highgui模块实现了视频与图像的读取、显示、存储等接口。
imgproc模块实现了图像处理的基础方法,包括图像滤波、图像的几何变换、平滑、阈值分割、形态学处理、边缘检测、目标检测、运动分析和对象跟踪等。
对于图像处理其他更高层次的方向及应用,OpenCV也有相关的模块实现
features2d模块用于提取图像特征以及特征匹配,nonfree模块实现了一些专利算法,如sift特征。
objdetect模块实现了一些目标检测的功能,经典的基于Haar、LBP特征的人脸检测,基于HOG的行人、汽车等目标检测,分类器使用Cascade Classification(级联分类)和Latent SVM等。
stitching模块实现了图像拼接功能。
FLANN模块(Fast Library for Approximate Nearest Neighbors),包含快速近似最近邻搜索FLANN 和聚类Clustering算法。
ml模块机器学习模块(SVM,决策树,Boosting等等)。
photo模块包含图像修复和图像去噪两部分。
video模块针对视频处理,如背景分离,前景检测、对象跟踪等。
calib3d模块即Calibration(校准)3D,这个模块主要是相机校准和三维重建相关的内容。包含了基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。
G-API模块包含超高效的图像处理pipeline引擎