一、挖掘内容
多媒体数据:多维的,非结构化或者半结构化的数据
多媒体数据库:数据量大,数据结构复杂,模式多样
细分领域:图像挖掘、视频挖掘、音频挖掘、web挖掘、多媒体综合挖掘
二、挖掘定义
多媒体数据挖掘:多媒体信息处理技术和数据挖掘技术结合,综合分析视听特性和语义,发现隐含的、有效的、可理解的模式,得出时间的趋向和关联
三、多媒体数据挖掘系统模型
1、多媒体数据库
元数据:对媒体对象信息和内容的解释
2、数据预处理器
识别和纠正或消除冲突、不完整数据以及组合数据库所共有的不兼容性
数据清理:填写缺失值、光滑噪声数据、识别删除离群点,消除脏数据
数据集成:将来自不同数据源的的数据整合成一致的数据存储,元数据、相关分析、数据冲突检测和语义异构性的解决在于此步骤
数据变换:将数据库中的原始数据转换成适合数据挖掘的数据形式,
数据归约:用数据立方体聚集,属性子集选择、维度归约、数值归约和离散化得到数据的归约表示,降低信息内容的损失。
3、挖掘引擎
一组算法:分类、聚类、关联规则、趋势分析
4、数据挖掘界面
四、多媒体数据挖掘的方法
、数据立方体
一般是多维的,
通过上卷、下钻、切片和切块、旋转进行强有力的分析
、聚类算法
无监督学习
、分类算法
监督学习
转载于:https://blog.51cto.com/1750256/1047016