本文写于研究生数模竞赛之前,为清风老师课程部分笔记(时间不够,我挑的一些),部分自己补充。


1 算法

相关系数
(1)皮尔逊系数:前提是确定两个变量有线性相关关系
(2)显著性标记:0.5 ; 0.5* (90%) ; 0.5**(95%) ; 0.5***(99%)
(3)皮尔逊假设检验相关系数条件:数据要来自正态分布的总体。
(4)检验是否符合正态分布:①JB检验(matlab;大样本)②夏皮洛-威尔克检验(SPSS;小样本)③Q-Q图(matlab;qqplot;大样本;判断是否位于一条直线;偏离大,不推荐)
(5)斯皮尔曼相关系数的假设检验:①小样本(n<30),直接查临界值表②大样本,皮尔逊检验的在R语言代码 皮尔逊检验怎么做_皮尔逊检验的在R语言代码
(6)①连续、正态、线性用皮尔逊系数;②上述三个条件有一个不满足就用斯皮尔曼系数;③定序数据之间也用斯皮尔曼系数
(7)显著水平,就是P值。这是首要的,因为如果不显著,相关系数再高也没用,可能只是因为偶然因素引起的,那么多少才算显著,一般p值小于0.05就是显著了(置信水平95%);如果小于0.01就更显著(置信水平99%)。


2 论文

(1)拿到excel数据可以先做描述性统计(最小值、最大值、均值、中位数、偏度、峰度、标准差),matlab/excel(数据–>数据分析)/spss(分析–>描述统计–>描述)都可,然后将表格插入论文

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_学习_02

(2)excel 开始 -->条件格式–>色阶

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_数据_03

3 作图

3.1 EXCEL(作图之前先排序

可以先将图表在excel中粘贴为图片,再复制到需要的地方,直接复制颜色会改变

3.1.1 饼图

(1)单列数据

(2)饼图使用时,对象是全集,不是时最好加上其他

(3)复合饼图

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_数据_04

3.1.2 柱状图

(1)堆积柱状图可用于比较同类别各变量和不同类别变量总和差异

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_皮尔逊检验的在R语言代码_05

(2)百分比堆积柱状图适合展示同类别的每个变量的比例

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_皮尔逊检验的在R语言代码_06

(3)柱状图可视化回归结果

  • 先将原始数据的P值按照色阶(开始–>条件格式)功能分出显著和不显著的
  • 皮尔逊检验的在R语言代码 皮尔逊检验怎么做_学习_07

  • 再将回归系数分为两列
  • 皮尔逊检验的在R语言代码 皮尔逊检验怎么做_学习_08

  • 最后选中三列,插入堆积柱形图(簇型柱形图有偏移,不美观),并写出文字说明
  • 皮尔逊检验的在R语言代码 皮尔逊检验怎么做_直方图_09

3.1.3 条形图

(1)就是横过来的柱形图

(2)类别数过多时,如果要加入数据标签,那么使用条形图比较合适

柱状图的数看起来有点拥挤

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_数据_10

(3)双向条形图

  • 效果图
  • 操作步骤
    自定义文本类型:#,##0.00_);#,##0.00

3.1.4 直方图
(1)频数直方图可以直接画,但是频域直方图不能直接画

  • 频率直方图画法:
    1)先列出分点位置,再使用数据分析里的直方图进行统计,再算出频率
  • 皮尔逊检验的在R语言代码 皮尔逊检验怎么做_皮尔逊检验的在R语言代码_11

  • 2) 根据下图统计数据,再使用柱状图画出频率直方图
  • 皮尔逊检验的在R语言代码 皮尔逊检验怎么做_数据_12

  • 直方图和柱状图的区别
    1)直方图展示数据的分布,柱状图比较数据的大小。
    2)直方图X轴为定量数据,柱状图X轴为分类数据。
    3)直方图y轴要么为数据的频数,要么为数据的频率,柱状图y轴为数据实际大小。

3.1.5 折线图

(1)超长坐标轴折线图,可以通过规定纵坐标范,达到放大效果

(2)双坐标折线图,可以分主次坐标轴,此处要注意y轴以及对应折线的颜色统一协调

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_直方图_13

次坐标轴一般在上层显示

(3)柱形图顶端的折线图,折线过多、颜色太乱、不好分辨时考虑绘制此图,效果图如下:

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_柱状图_14

  • 绘制方法:
    (1)先将数据排在一列(在原始表格基础上,先右拉,再下拉。最后将第一列的0清除再使用),不同类别之间空两格,然后绘制普通折线图。

    (2)重复添加一遍相同的数据,并更改其中一组数据显示为面积图
    (3)添加一组和标签数量相等的空白内容,然后编辑他的标签名
    (4)把空白数据的坐标显示到右侧次坐标轴上,并让上方次坐标轴显示出来(5)点击右侧坐标轴,坐标轴选项中选择自动,使上方的坐标转到下面。然后隐藏原本下方和右侧的坐标轴

3.1.6 散点图

(1)散点图:主要描述两组变量之间的关系

(2)带标识的散点图:例如直接将体重按照男女分成两列,再进行绘图

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_数据_15

3.1.7 箱线图

(1)箱线图用于反映一组或多组连续型定量数据分布的中心位置和散布范围。

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_柱状图_16


注意:箱线图粘贴为图片的时候有Bug,图例显示的不正确

3.2 MATLAB

皮尔逊检验的在R语言代码 皮尔逊检验怎么做_数据_17