实验1数据线性回归与分类分析

  • 一、高尔顿数据集(一元)线性回归分析
  • 1. 首先下载高尔顿数据集excel文件
  • 2. 选择数据>>排序(在这里查了下资料M代表男,F代表女)
  • 3. 数据分析>>回归
  • 4. 选择Y/X输入区域(这里Y为孩子身高,X为父亲身高),其他的勾上对应你想要的数据
  • 5. 出现结果(我这里已经调整好线性回归图,分别为父子身高关系线性回归图和母子身高关系线性回归图)
  • 6.由图可知(ss为方差)
  • 7.由父子线性回归图,相关系数为0.1531,方差为492.1,P值为2.64*10^-26,此回归方程不成立。
  • 8.若新家庭父亲身高75英寸,儿子身高应为71.8英寸
  • 9.下面是二元线性回归图
  • 二、 Anscombe四重奏(一元)线性回归分析


一、高尔顿数据集(一元)线性回归分析

1. 首先下载高尔顿数据集excel文件

下载高尔顿数据集excel文件并打开

有序回归 求导 有序回归分析步骤_数据

2. 选择数据>>排序(在这里查了下资料M代表男,F代表女)

有序回归 求导 有序回归分析步骤_数据集_02

3. 数据分析>>回归

有序回归 求导 有序回归分析步骤_线性回归_03

4. 选择Y/X输入区域(这里Y为孩子身高,X为父亲身高),其他的勾上对应你想要的数据

有序回归 求导 有序回归分析步骤_数据集_04

5. 出现结果(我这里已经调整好线性回归图,分别为父子身高关系线性回归图和母子身高关系线性回归图)

有序回归 求导 有序回归分析步骤_数据_05


有序回归 求导 有序回归分析步骤_线性回归_06

6.由图可知(ss为方差)

有序回归 求导 有序回归分析步骤_线性回归_07


有序回归 求导 有序回归分析步骤_数据_08

7.由父子线性回归图,相关系数为0.1531,方差为492.1,P值为2.64*10^-26,此回归方程不成立。

8.若新家庭父亲身高75英寸,儿子身高应为71.8英寸

9.下面是二元线性回归图

有序回归 求导 有序回归分析步骤_数据集_09


有序回归 求导 有序回归分析步骤_数据_10

二、 Anscombe四重奏(一元)线性回归分析

操作和上面一样就不复述了,直接上图

有序回归 求导 有序回归分析步骤_数据集_11


有序回归 求导 有序回归分析步骤_线性回归_12


有序回归 求导 有序回归分析步骤_数据_13


有序回归 求导 有序回归分析步骤_线性回归_14


由上面四个图,四组数据描绘在图表中,是四种完全不同的情况。第一组数据是貌似最正常的一组数据;第二组数据所反映的事实上是一个精确的二次函数关系,只是在错误地应用了线性模型后,各项统计数字与第一组数据恰好都相同;第三组数据描述的是一个精确的线性关系,只是这里面有一个异常值,它导致了上述各个统计数字,尤其是相关度值的偏差;第四组数据则是一个更极端的例子,其异常值导致了平均数、方差、相关度、线性回归线等所有统计数字全部发生偏差。

由此可知四个回归方程都不成立。