基础知识
- 一、计算机视觉概念
- 1、定义
- 2、计算机视觉与机器视觉的区别
- 3、应用
- 二、数据
- 1、图像
- 2、视频
- 三、摄像机
- 1、摄像机的分类
- 四、运算处理器
- 1、CPU
- 2、GPU
- 3、NPU
- 4、其他
- 五、学科关系
- 1、关系图
- 六、理论基础
- 七、开发语言与环境
- 参考
一、计算机视觉概念
1、定义
- 简单说就是在机器上实现人类的视觉功能。
- 主要任务就是通过对采集的图片或视频进行处理以获得相应场景信息。
2、计算机视觉与机器视觉的区别
分类 | 机器视觉 | 计算机视觉 |
输入 | 成像环境可控 | 成像环境非可控 |
输出 | 定义的有效信息,包括动作(机械臂,舵机) | 定义的有效信息 |
举例 | 工厂生产线 | 人脸识别、安防、无人驾驶 |
处理 | CPU、GPU、VPU、Movidius、 | |
交集 | 图像处理、成像设备(即视觉传感器) |
3、应用
- 无人驾驶
- 无人安防
- 人脸识别
- 文字识别
- 车辆车牌识别
- 以图搜图
- VR/AR
- 3D重构
- 医学图像分析
- 无人机
- 其他
二、数据
1、图像
图片包含了:维数、高度、宽度、深度、通道数、颜色格式、数据首地址、结束地址、数据量等,此外,图像深度、图像压缩格式和图像的通道数。
2、视频
原始视频=图片序列,视频中的每张有序图片成为“帧(frame)”。压缩后的视频,会采取各种算法减少数据的容量,其中IPB就是最常见的。码率、帧率、分辨率、清晰度、带宽。
三、摄像机
1、摄像机的分类
(1)监控摄像机(网络摄像机和模拟摄像机)
(2)不同行业需求的摄像机(超宽动态摄像机、红外摄像机、热成像摄像机等)
(3)智能摄像机
(4)工业摄像机(高精密仪器检测)
四、运算处理器
1、CPU
2、GPU
3、NPU
4、其他
五、学科关系
1、关系图
六、理论基础
待加
七、开发语言与环境
- 语言:Python、C/C++、Matlab、Java
- 系统:Win32、Unix
- 架构:x86、arm
- IDE:G++类、VS、Qt等
参考
1、机器视觉维基百科 2、计算机视觉维基百科 3、计算机视觉入门live笔记