- 课程主要内容:
- 是什么,有什么用
- 怎么做
- 设计、实现与评估好坏
- 参考书:《模式识别》,《PR & ML》
- 基础知识:
- 学科:高数,现代,概率,统计学
- 相关学科:图像处理,ML
- 程序:Py
- 成绩:平时成绩50%(考勤,课堂表现,作业)+期末成绩50%(闭卷考试:基本概念和技术)
模式识别的基本概念
- 模式识别学科:研究用计算机来实现人类模式识别的能力。
- 模式是什么:
- 模式:
- 广义定义:模式是一些供模仿用的、完美无缺的标本,是对某一类事物的高度概括和精确刻画。
- 本课定义:所见到的某类具体事物
- 直观特性:可观察性,可区分性,相似性
- 模式类:模式归属的类别
- 模式识别的过程:对象空间(客观世界) 模式空间(测量空间) 特征空间类型空间(类别空间)
- 模式识别系统的构成:
- 1. 信息获取:利用传感器从对象空间采集模式的信息
- 信息形式:一维波形(心电图、地震波),二维图像(人脸、指纹、遥感图像),三位信息(三维人脸),其他
- 2. 预处理:利用图像处理或信号处理等技术去除采集到的原始模式信息中的噪声、恢复与加强有用信息(去噪增强)
- 预处理方法:A\D转换,二值化;图像平滑、滤波、增强、复原、变换等
- 3. 特征提取与选择:利用图像处理或信号处理、计算机视觉、机器学习等技术对原始数据进行变换和选择,得到最能反映分类本质的特征(寻找有判别性的特征)
- 高维的测量空间(原始数据)
- 模式在特征空间中的表示:
- 定量描述:由一组特征值构成的向量数据描述
- 结构性描述:由一组基元描述
- 4. 分类器设计(训练):利用一定数量的训练样本确定出一套分类判别规则,使得按这套分类判别规则对待识别样本进行分类造成的错误识别率最小或引起的损失最小
- 分类方法(识别规则):
- 参数方法:判别函数法
- 无参方法:最近邻分类法
- 5. 分类决策(测试):利用训练好的分类判别规则对待识别样本进行分类判别,输出分类结果
- 模式识别方法的发展历史:
- 统计模式识别:统计分类理论(30年代)
- 结构模式识别:形式语言理论(50年代)
- 模糊模式识别:模糊集理论(60年代)
- 人工神经网络模式识别:神经网络模型(80年代)
- 支持向量机:小样本学习理论(90年代)
- 模式分类器的获取和评测:
- 数据采集
- 特征选取
- 模型选择
- 训练和测试:
- 训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器
- 测试集:在设计识别和分类系统时没有用过的独立样本集
- 系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试
- 系统评价指标:识别率、时间和空间复杂度
- 计算结果和复杂度分析
- 反馈
- 模式识别的应用:生物,天文,经济,医学,工程,军事,安全
- 实例:
- 待识别的模式类:性别(男或女)
- 测量的特征:身高和体重
- 训练样本:15名已知性别的样本特征
- 目标:希望借助于训练样本的特征建立判别函数(即数学模型),从而对未知样本作出识别(分类)