1引言《概率论》是一门理工科大学生必修课程,学统计学的同学们更是绕不开这门课程以
转载
2022-06-07 14:03:10
301阅读
应用统计学数据的概括性度量集中趋势Mode众数是唯一描述无序类别数据,由图可知众数便是图形中的峰。 对于类别变量,众数就是某一种类别。中位数和平均数都可能不是样本中的值。中位数不受极值影响,对于类别数据来说,中位数是某一类别(同mode),各变量值与中位数的离差绝对值之和最小,与均数不同。 平均数的求法,令函数等于各变量值与平均数的离差平方之和,该函数表
本文用Python统计模拟的方法,介绍四种常用的统计分布,包括离散分布:二项分布和泊松分布,以及连续分布:指数分布和正态分布,最后查看人群的身高和体重数据所符合的分布
# 导入相关模块import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns
%matplotlib inlin
1.小概率标准在概率论中我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件...一般多采用0.01、0.05两个值即事件发生的概率在0.01以下或0.05以下的事件称为小概率事件这两个值称为小概率标准2、准确度和误差准确度:指分析结果接近真值的程度,用平均值的误差表示。误差:表示测定值与真值的差异。平均值的误差就是平均值与真值的误差,可用
原创
2021-05-20 22:21:07
268阅读
knitr::opts_chunk$set(echo = TRUE)总结统计学中基础知识,以原理叙述为主。 数据度量集中趋势的度量分类
原创
2022-08-04 17:31:36
467阅读
文章目录为什么要学习统计学图表的玄机被混淆的因果关系打破权威数据分析必备统计小百科概率和机会变量和常量断.
原创
2023-10-12 16:34:07
0阅读
## Spark 统计学入门指南
作为一名刚入行的开发者,学习如何使用 Apache Spark 进行统计分析是一个非常重要的技能。本文将为你提供一个详细的流程,以及在每一步需要使用的代码示例和相关注释。我们将通过一个表格展示整个过程,并包含代码示例来帮助你理解。
### 整体流程
以下是进行 Spark 统计分析的基本流程:
| 步骤 | 描述
1.小概率标准在概率论中我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件...一般
原创
2022-04-11 10:26:44
7344阅读
零、什么是统计学统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据内在的数量规律,以达到对客观事物的科学认识。统计学研究的是随机对象,以推断为特征,“由部分推及全体”的思想贯穿始终。一、统计学分类描述统计学研究如何取得反应客观现象的数据,并通过图表的形式对所收集的数据进行加工处理和显示,进而通过综合概括和分析得出反应客观现象的规律性现象特征。推断统计学研究如何根据样本数据去推断总体数
原创
2018-08-27 14:28:44
516阅读
零、数据描述的数值方法集中趋势给出一组数据,具体向谁靠拢,分布在谁的附近具体指标:均值中位数众数离散程度数据的分布情况,是松散分布的,还是紧密分布的具体指标:极差方差分布的形状数据大概的形状具体指标:偏度蜂度一、集中趋势一组数据向其中心值靠拢的倾向和程度集中趋势测度:寻找数据的水平代表值或中心值具体指标均值是指在一组数据中所有数据之和再除以数据的个数,是反映数据集中趋势的一项指标数学表达式:1.p
原创
2018-08-27 14:29:40
1191阅读
一、何为统计学?统计学: 研究对象:统计学是通过数据认识客观现象,认识客观现象数量规律性的方法论科学。 分类:数理统计、经济统计、金融统计、生物统计、政府统计等 本质:关于不确定性数据的一种科学,既是科学,也是艺术。明天是否下雨,股市是否上涨。 数据: 数据(狭义上的数据):数字,比如人的身高,体重,温度,股市的指数,每天微信运动的步数等 数据(维基百科):数据
文章目录1 基本配置1.1 基本模块1.2 绘图设置2 基本统计量3 基本分布3.1 离散型分布3.2 离散型分布示例3.2.1 伯努利分布3.2.2 二项分布3.2.3 泊松分布3.3 连续型分布3.4 连续型分布示例3.4.1 正态分布3.4.2 均匀分布3.4.3 指数分布3.4.4 t分布3.4.5 卡方分布3.4.6 F分布3.4.7 对数正态分布3.4.8 韦伯分布 1 基本配置1.
转载
2023-07-02 15:47:48
159阅读
使用python进行描述统计:多变量包含多个变量的数据叫做多变量数据。单变量和多变量的数据的处理是不同的。3-2-1整洁数据整洁数据是指便于用于数据分析的表格形式的数据 具有以下4个性质: 1.每个单元格代表一个数值 2.每个变量构成一列 3.每项观察构成一列 4.每种类型的观察单元构成一个表格 数值↔单元格 变量↔列 观察↔行鱼的种类鱼的体长A2A3A4B7B8B9列为变量名,只有鱼的种类和鱼的
转载
2023-07-07 17:03:01
221阅读
k
k
近邻法。kk近邻法(k-nearest neighbor,k-NN)是一种基本分类与回归方法,输入为实例的特征向量,对应于特征空间中的点,输出为实例的类别,可以取多类。k
k
近邻法不具有显示的学习过程,它实际上利用训练集对特征向量空间进行划分,并作为其分类的模型。k
神经网络学习-初探卷积神经网络方法初步理解卷积神经网络 在之前的文章中,我们介绍过最简单的神经网络,当没有非线性激活函数的时候,这种神经网络其实就是多层感知机,或者说就是一个线性模型。而在后面也介绍了BP神经网络,这种神经网络加入了非线性的激活函数以及负反馈的机制,从而使得神经网络的预测准确性提升了一个档次。在本文中,我们将会初步介绍卷积神经网络,也
前言 本科期间已经系统的学习过线性回归模型,奈何本菜鸡记性太差,每次用到还要重新找资料。。。近期,由于研究需要,又重新把线性回归模型学了一遍,也有了更深的理解,借此机会,系统性的总结一遍,免得用的时候又到处找资料。 文章目录一元线性回归模型模型及基本假设最小二乘法OLS估计量的性质残差项的正交性判定系数假设检验估计和预测多元线性回归模型模型及古典模型假设OLS估计量OLS的小样本性质小样本下的统计
统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学,被广泛的应用在各门学科之上,从自然科学和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。下图是我根据所查资料结合自己的理解做的,并非严格意义上的统计学分支体系(最下层涉及一些统计学方法),主要是使初学者了解各统计方法所属的统计学分支,便于整体掌握。橙色部分是学习的重点,将在后面的博文
原创
2021-05-20 22:21:06
888阅读
统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学,被广泛的应用在各门学科之上,从自然科学和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。下图是我根据所查资料结合自己的理解做的,并非严格意义上
原创
2022-04-11 10:27:54
10000+阅读
《赤裸裸的统计学》,作者[美]查尔斯·韦兰,2013年出版,豆瓣评分8.1分,可以作为统计学入门读物很好的一本书,知识点浅显易懂,对小白非常友好,有统计专业知识的人可能会觉得干货略少。总的来说,值得一读,推荐指数4颗星。文章末尾有关于这本书的知识图谱。一、统计学是大数据时代最炙手可热的学问第一章开头提出了几个有意思的问题:基尼系数是否是衡量社会分配公平程度最完美的指标?(描述性统计学)视频网站是如
原创
2021-01-19 21:47:09
2168阅读
使用python进行描述统计:单变量3-1-1统计分析与scipyimport scipy as sp3-1-2单变量的操作只有一种类型的数据import scipy as sp
import numpy as np
fish_data = np.array([2,3,3,4,4,4,4,5,5,6])
print(fish_data)
#[2 3 3 4 4 4 4 5 5 6]3-1-
转载
2023-11-11 23:49:26
142阅读