绪论

什么是统计学?
根据《兰登书屋大学字典》 (The Random House College Dictionary)定义,统计学是“对用数字表示事实或数据进行收集、分类、分析以及解释的科学”。概括来说,统计学就是数据的科学。

什么是R?
R是进行统计分析、给图以及统计编程的平台,是进行统计分析的重要工具,是现今最受欢迎的数据分析和可视化软件。

统计学的基本要素
1.总体与样本

  • 总体(population):称研究对象的全体,通常用一个随机变量(例如X)表示总体。
  • 个体(individual):组成总体的每个基本单元 。
  • 抽样:从总体X中随机抽取一部分个体X1,…Xn,称X1,…,Xn为取自总体X的样本容量(sample size)为n的样本。
  • 样本(sample): 若X1,…,Xn相互独立,且每个Xi与X同分布,则称X1,…,Xn为简单随机样本(simple random sample),简称样本。

2.参数与统计量

  • 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征。
  • 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的量。
    易混点:样本是随机的,因此,统计量是样本的函数,而不是一个统计量。
    统计推断的任务是从样本统计量推断出总体参数。

3. 变量

  • 在研究总体和样本的过程中,会专注于总体试验中一个或多个人们感兴趣的特征或性质,统计学称这些特征为变量。
  • 随机变量:随着抽样结果而改变的变量。

4. 推断的可靠性

  • 可靠性度量是关于统计推断不确定程度的一个陈述,通常 是定量的。

数据的分类
1.定量数据:表示事物的数量或个数,用数值标度度量。
(1)计量数据:属于 连续型变量,它们的取值可以为某个区间内的任 意一个实数。
(2) 计数数据:离散型变量,它们在整数范围内取值,大部分还仅在非负整数范围内取值。

2.定性数据:定性数据没有量的解释,它们只能是分类或顺序。

(1)名义数据:当观察值不是数,而是事物属性时,也可以用数值来表示,但这些数只起一个名义作用,因此,称其为名义数据。它们之间没有大小关系,也不能进行运算。

(2)有序数据:描述事物属性的顺序关系的数据称为有序定性数据, 简称有序数据. 这些数只起到一个顺序作用,数字之间不能进行运算。

R语言与医学统计分析 r语言统计学基础_数据