数据分析挖掘实验报告及算法源码

四个实验21面,帮助你学习参考使用,帮助你取得更好成绩

数据挖掘技术课程 期末课程设计报告Apriori算法 数据挖掘期末实验报告_关联规则

1、Apriori关联规则算法

必修 实验类型 设计

Python3.7运行环境、VS Code1.62 编译器、win10操作系统

1、实现Apriori关联规则算法的算法设计
2、熟悉Apriori关联规则算法的算法原理
Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于进行决策。如果某个项集是频繁的,那么它的所有子集也是频繁的。如果某一个项集是非频繁的,那么它的所有超集(包含该集合的集合)也是非频繁的。
Apriori算法的实现过程分为两步:训练算法找到频繁项集和使用频繁项集生成关联规则

2、ID3决策树分类算法

实验性质 必修 实验类型 设计
实验仪器设备以及实验软硬件要求
Python3.7运行环境、VS Code1.62 编译器、win10操作系统
实验目的:
1、实现ID3决策树分类算法的算法设计
2、熟悉ID3决策树分类算法的算法原理
ID3决策树分类算法基于信息熵来选择最佳的测试属性。通过选择当前样本集中具有最大信息增益值的属性做为测试属性,用信息增益值度量不确定性:信息增益越大不确定性越小。因此ID3算法在每个非叶子节点选择信息增益最大的属性最为测试属性,这样可以得到当前情况下最纯的分析,从而得到较小的决策树。

3、K-Meas划分聚类算法

实验性质 必修 实验类型 设计
实验仪器设备以及实验软硬件要求
Python3.7运行环境、VS Code1.62 编译器、win10操作系统
实验目的
1、实现ID3决策树分类算法的算法设计
2、熟悉ID3决策树分类算法的算法原理
K-Meas划分聚类算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的K个类,且每个类的中心是根据类中所有数值的均值得到的,每个类的中心用聚类中心来描述。对于给定的一个(包含n个一维以及一维以上的数据点的)数据集X以及要得到的类别数量K,选取欧式距离作为相似度指标,聚类目标实施的个类的聚类平反和最小即最小化:

4、PageRank Web页面分级算法

实验性质 选修 实验类型 设计
实验仪器设备以及实验软硬件要求 Python3.7运行环境、VS Code1.62 编译器、win10操作系统
实验目的
1、实现PageRank Web页面分级算法的算法设计
2、熟悉PageRank Web页面分级算法的算法原理
PageRank 通过网络浩瀚的超链接关系来确定一个页面的等级。Google 把从 A 页面到 B 页面的链接解释为A页面给B页面投票, Google 根据投票来源(甚至来源的来源, 即链接到A页面的页面)和投票目标的等级来决定新的等级。上图反映了PageRank 算法的思想。简单的说,一个高等级的页面可以使其他低等级页面的等级提升。

报告内容:

数据挖掘技术课程 期末课程设计报告Apriori算法 数据挖掘期末实验报告_关联规则_02

数据挖掘技术课程 期末课程设计报告Apriori算法 数据挖掘期末实验报告_决策树_03