第二章 随机变量及其分布

第一章种学习了随机现象、随机试验、随机事件等概念,讨论了随机事件的关系、运算以及概率;且只考虑了个别事件下的频率问题。接下来,进一步第需要建立随机试验结果与实数的对应关系,这类似于函数的映射,我们称之为随机变量,以便使用高等数学的方法来研究随机试验。

1 离散型随机变量

1.1 随机变量的概念

随机变量的数学定义:

定义1:设E为随机试验,Ω为其样本空间,若对于每一个结果(样本点)ω∈Ω,都有一个实数X(ω)与之对应;这样就得到一个定义在Ω上的实值函数X=X(ω),称为随机变量;随机变量通常用、、X、Y、Z或者X1,X2,...来表示。

注意:对于一个随机试验可以有与之关联的多个随机变量,而不是仅有一个;随着不同研究的需要,我们可以定义不同的随机变量。

我们可以试验随机变量描述事件,例如:在掷硬币试验中{X=1}表示"出现正面",{X=0}表示"出现反面"且P{X=1}=12。

当然:、{X=1}、{X=0}只是习惯的、相对较为普遍的用法并不是唯一的用法;我们使用{X=100}表示"出现正面",{X=200}表示"出现反面"是完全没有问题且正确的,只是不那么习惯而已。

在掷骰子试验中,我们可以使用{X=6}表示"出现6点",P{X=6}=16;使用{X≥4}表示"出现4/5/6点",{X≥4}={X=4,5,6},P{X≥4}=12。

1.2 离散型随机变量及其分布律

随机变量的取值可能是有限个,也可能是无限个。

定义2:若随机变量X只取有限多个或可列的无限多个值(可以枚举表示的),则称X为离散型随机变量

大白话就是值是一个个的,颗粒状的,不连续的。

定义 设X为离散型随机变量,可能的取值为X1,X2,...,Xk,...,且P{X=xk}=Pk,  k=1,2,3,...,则称其为X的分布律分布列或者概率分布

分布律也可以使用表格形式表达:

X

X1

X2

X3

...

Xk

...

P

p1

p2

p3

...

pk

...

分布律{pk}具有以下性质:

(1) pk,   k=1,2,...; # pk是概率嘛

(2) ∑k=1∞pk=1; # {X=Xk},  k=1,2,...之间是互不相容的事件,且∪k=1∞{X=Xk}=Ω。

反之,若某数列{pk}具有以上两条性质,则他们必可作为某随机变量的分布律。

例1:设离散型随机变量X的分布律为:

X

0

1

2

P

0.2

c

0.5

求常数c。

解:由分布律的性质知:0.2+c+0.5=1;    ∴c=0.3。

例2:掷一枚质地均匀的骰子,这X为出现的点数,求X的分布律。

解:X全部可能的取值为"1, 2, 3, 4, 5, 6",且pk=p{X=k}=16,    k=1,2,3,4,5,6;则X的分布律为:

X

1

2

3

4

5

6

P

16

16

16

16

16

16

技巧:首先找出随机变量所有可能的取值,然后求出每个取值对应的概率,做成表格即可。

★★例3:袋中由编号1~5的5个球,从中取3个,这X为取出的球中的最大编号,求X的分布律。

解:X全部可能的取值为"3, 4, 5";用古典概型计算概率:

P{X=3}=C22C53=110 # 分母:全部5个球中取3个;分子:如果最大球是3,3已经确定取出,只有从1,2这2球中取另外2个。

P{X=4}=C32C53=310

P{X=5}=C42C53=610

因此X的分布律如下:

X

3

4

5

P

110

310

610

★★例4:已知一批零件10个,其中3个不合格,今任取一个,若取到不合格的就丢掉,再重新取一个,如此下去,试求取到合格零件之前取出的不合格零件个数X的分布律。

解:X可能的取值是:"0, 1, 2, 3";设Ai表示"第i次取出的零件不合格,i=1,2,3,4"。

P{X=0}=P(A1―)=710

P{X=1}=P(A1A2―)=P(A1)P(A2―|A1)=310×79=730

P{X=2}=P(A1A3A3―)=P(A1)P(A2|A1)P(A3―|A1A2)=310×29×78=7120

P{X=3}=P(A1A2A3A4―)=P(A1)P(A2|A1)P(A3|A1A2)P(A4―|A1A2A3)=310×29×18×77=1120

故X的分布律为:

X

0

1

2

3

P

710

730

7120

1120

若需要求X满足某一条件这样的事件概率,例如例2中要求掷出的点数是奇数的概率,则应将满足条件的所有X对应的概率相加即可。

1.3 0-1分布与二项分布

下面介绍三种重要的常用离散型随机变量,它们是:0−1分布、二项分布和泊松分布。

定义4:若随机变量X只取两个可能的值0,1;且P{X=1}=p,  P{X=0}=q,其中0<p<1,  q=1−p;则称X服从0−1分布;X的分布律为:

X

0

1

P

q

p

在n重伯努利试验中,每轮试验只观察A是否发生,定义随机变量X:

当发生当不发生X={0,当A发生1,当A不发生

大白话:任何只有两种结果是试验,或者说我们研究的结果只有两种的试验;比如:掷硬币,研究结果的正反面;掷骰子,但只研究结果的奇数还是偶数等。

定义5:若随机变量X的可能值为0,1,...,n;n为正整数,而X的分布律为:pk=P{X=k}=Cnkpkqn−k,  k=0,1,...,n;其中,0<p<1, q=1−p,则称X服从参数为n,p的二项分布<u>记作:X∼B(n,p)</u>。

显然,当n=1时,X服从0−1分布,即X∼B(1,p);【满足0−1分布每次试验都只可能有0、1两个结果,p并不一定非要是1/2】;即0−1分布是二项分布的一种特例

但是满足二项分布的每次试验结果不止2个。这是本质区别!!

在n重伯努利试验中,令X代表A的发生次数,则P{X=k}=Pn(k)=Cnkpkqn−k,  k=0,1,2,...,n;即X服从参数为n,p的二项分布。

这里特别特别要注意:"随机变量X的可能值为0,1,...,n;n为正整数"中X的取值个数从0开始计算一共有n+1个;注意这里不要犯迷糊,n代表的是"最大可能取值个数-1"!!

二项分布名称的由来:(补充下数学知识!!)

二项式(p+q)n的展开式中:

(p+q)n=Cn0q0pn+Cn1q1pn−1+Cn2q2pn−2+...+Cnnqnp0=∑k=0nCnkqkpn−k

由于p+q=q+p;因此上述的二项式展开式等价于:(而且:Cnk=Cnn−k的)

(p+q)n=(q+p)n=Cn0p0qn+Cn1p1qn−1+Cn2p2qn−2+...+Cnnpnq0=∑k=0nCnkpkqn−k

其中的第k+1项(Cn0p0qn是第1项)恰好是Cnkpkqn−k,这与P{X=k}正好相同,因此称为符合二项分布。

因为P{X=k}=Cnkpkqn−k,  k=0,1,...,n的所有取值的概率之和为1,即∑k=0npk=∑k=0nP{X=k}=∑k=0nCnkpkqn−k=(p+q)n=1,这满足分布律的基本性质。

大白话:由以上描述可见,任何有确定个数结果的试验,都可以视为满足二项分布。这就包含的范围非常广泛了!!

无限个可能结果的试验,我们先不考虑!!

对于任意的正整数n,(a+b)n=∑k=0nCnkanbn−k,其中Cnk称为二项式系数;Cnk=n!k!(n−k)!。

★★例5:某特效药临床有效率为0.95,今10人服用,问至少有8人被治愈的概率?

解:设X为"10人中治愈的人数",由题目知X∼B(10,0.95) ## X可能的值有10个,每次独立试验的有效率0.95

这里再次特别提醒,不要嫌我啰嗦;这个n=10是指X可能取值为"有0,1,2,3,4,5,6,7,8,9,10个人被治愈"的11个可能值中的最后一个值,因为从0开始计数,千万不要把n理解为11了!!!

P{X≥8}=P{X=8}+P{X=9}+P{X=10}=C108(0.95)8(0.05)2+C109(0.95)9(0.05)1+C1010(0.95)10(0.05)0=0.9885

★★例6:设X∼B(2,p), Y∼B(3,p);设p{X≥1}=59,求P{Y≥1}。

解:由P{X≥1}=59知X可能的取值有"0,1,2"三种可能,因此,P{X=0}=1−P{X≥1}=49;

∴ P{X=0}=C20p0(1−p)2=49; 又∵C20=1;  p0=1 ;

∴ (1−p)2=49;

∴ p=13

由Y∼B(3,p)可知Y可能的取值有"0,1,2,3"四种可能,因此,P{Y≥1}=1−P{Y=0}=1−C30p0(1−p)3=1−827=1927。

由此可见,二项分布的计算很繁琐,尤其是出现例如:n=1000, p=0.05时;C100010(0.05)10(0.95)990这类的计算,因此,需要寻求近似计算的方法;下面给给出一个n很大,p很小的近似计算公式,这就是著名的二项分布的泊松逼近

泊松(Possion)定理:设λ>0是常数,n为任意正整数,在n重伯努利试验中,假设事件A在一次试验中发生的概率是pn,当n→+∞时,有npn→λ,则对于任意取定的非负整数k,有:limn→+∞Cnkpnk(1−pk)n−k=λkk!e−λ。

这里只给出结论,不给出证明过程;有兴趣的可以查阅相关资料。

由泊松定理知,当n很大,p很小时由近似公式:

其中,Cnkpkqn−k≈λkk!e−λ,  其中,λ=np,q=1−p。

在实际中,当n≥20, p≤0.05时使用该近似公式的效果更佳。

λkk!e−λ的值可以通过泊松表查询;泊松表给出了已知λ和k值对应的∑k+∞λkk!e−λ值查询。 ## 特别注意:表里的值是从k开始到+∞的累加和哦,下线不一定是0,但上限一定是+∞

例7:一个工厂的产品废品率为0.005,任取1000件,计算:

(1) 至少有2件废品的概率

(2) 不超过5件废品的概率

解:设X表示"取出1000件中包含的废品总数",则X∼B(1000,0.005);利用近似公式:λ=np=5;

(1) P{X≥2}=1−P{X=0}−P{X=1}=1−C10000(0.005)0(0.995)1000−C10001(0.005)1(0.995)999

≈1−λ00!e−λ−λ11!e−λ=1−500!e−5−511!e−5=0.9596

(2) P{X≤5}=∑k=05P{X=k}=∑k=05C1000k(0.005)k(0.995)1000−k

≈∑k=05λkk!e−λ=1−∑k=6∞λkk!e−λ ## 这里有个转换关系需要特别注意。转换后才可以查泊松表,按照λ=5,k=6查询!!

=0.6160

1.4 泊松分布

定义6:随机变量X的可能取值"0,1,2,...,n,...";而X的分布律为:

pk=P{X=k}=λkk!e−λ,    k=0,1,2,...

其中,λ>0,则称X服从参数为λ的泊松分布,简记为:X∼P(λ)。

大白话,与二项分布相比,S的取值变成的无限个(当然仍旧是离散型的);因此n→∞;导致符合泊松定理的近似计算公式,从而产生常数λ=np;使得概率仅与和λ和k有关。

由∑k=0∞pk=∑k=0∞λkk!e−λ=e−λ∑k=0∞λkk!=e−λeλ=1可知{pk}满足分布律的基本性质。

泊松分布是二项分布的极限分布(n→∞的情况下),非常重要!!

例8:设随机变量X服从参数为5的泊松分布,求:

(1) P{X=10}

(2) P{X≤10}

解:(1) 查询泊松表,找列行λ=5列, X=10行对应的值;和列行λ=5列, X=11行对应的值:

P{X=10}=P{X≥10}−P{X≥11}=∑k=10∞λkk!e−λ−∑k=11∞λkk!e−λ≈0.018133

(2) P{X≤10}=1−P{X≥11}=1−∑k=11∞λkk!e−λ≈0.986305

例9:设X服从泊松分布,且已知P{X=1}=P{X=2};求P{X=4}。

解:设参数为λ,则:

P{X=1}=λ11!e−λ=λe−λ

P{X=2}=λ22!e−λ=λ22e−λ

由题目知:P{X=1}=P{X=2} 得 λ=2

∴ P{X=4}=λ44!e−λ=244!e−2=23e−2

2 随机变量的分布函数

2.1 分布函数的概念

对于非离散型得随机变量就无法用分布律来描述它了。

首先,我们不能将其所有可能的取值一一地列举出来,如连续型随机变量的取值可充满数轴的一个区间(a,b),甚至是n个区间,也可以是无穷区间;其次,对于连续型随机变量X,任取一指定实数值x的概率是0,即P{X=x}=0。

我解释下,因为连续型随机变量X的取值在某个或很多个区间内,那取值的个数就是无限个,在无限个可能中x仅仅是其中一个,因此,仅仅这一个取值对应的概率就是0。

于是,如何刻画一般的随机变量的统计规律就成了我们的首要问题。

在实际应用中,如测量某物理量的误差ξ,测量灯泡寿命τ等这样的随机变量,我们并不会对误差或寿命的某一特定值的概率感兴趣,而是考虑误差落在某个区间的概率,寿命大于某个数的概率之类的。

对于随机变量X,我们关心诸如事件{X≤x}, {X>x}, {x1<X≤x2}等的概率,但是由于x1≤x2,且{X≤x1}⊂{X≤x2};所以:{x1<X≤x2}={X≤x2}−{X≤x1}。

又因{X>x}的对立事件为{X≤x},所以:P{X>x}=1−P{X≤x}。

因此,{X≤x}的概率P{X≤x}成了关键的角色,我们记F(x)=P{X≤x},任意给定的x∈(−∞,+∞),对应的F(x)是一个概率。P{X≤x}∈[0,1],说明F(x)是定义在(−∞,+∞)上的普通实值函数,从而引出随机变量分布函数的定义。

解释下,上面任何不等式中和≤和<、和≥和>是分别等价的;因为=对应值的概率是0,所以有没有=并不影响计算结果。

定义7:设X为随机变量,称函数F(x)=P{X≤x},  x∈(−∞,+∞)为X的分布函数

注意:随机变量的分布函数定义适用于任意随机变量,包括离散型随机变量;因此,离散型随机变量既有分布律又有分布函数

当X为离散型随机变量时,设X的分布律为:pk=P{X=k},  k=0,1,2,...。

由于{X≤x}=∪xk≤x{X=xk},由概率性质知:F(x)=P{X≤x}=∑xk≤x{X=xk}=∑xk≤xpk即:F(x)=∑xk≤xpk。

这是在微观上将连续型的取值看作时更小颗粒度的离散装的取值,从而得出的结论。底层逻辑是:为什么连续?因为颗粒度足够小。

例1:离散型随机变量X的分布律为:

X

-1

0

1

2

P

0.2

0.1

0.3

0.4

求X的分布函数。

解:当x<−1时F(x)=P{X≤x}=0

当−1≤x<0时F(x)=P{X≤x}=P{X=−1}=0.2

当0≤x<1时F(x)=P{X≤x}=P{X=−1}+P{X=0}=0.2+0.1=0.3

当1≤x<2时F(x)=P{X≤x}=P{X=−1}+P{X=0}+P{X=1}=0.2+0.1+0.3=0.6

当x≥2时F(x)=P{X≤x}=P{X=−1}+P{X=0}+P{X=1}+P{X=2}=0.2+0.1+0.3+0.4=1

特别注意,看清F(x)作为分布函数的定义;无论何时它都代表X≤x的概率,只不过x是由定义域的变量而已。

还需要注意,对于离散型随机变量的分布函数要特别关注取值边界,特别关注=敌营的取值是否被包含。

因此,X的分布函数为:

F(x)={0,x<10.2,−1≤x<00.3,0≤x<10.6,1≤x<21,x≥2

其图像为:

【概率论与数理统计】第二章 随机变量及其分布_离散型

2.2 分布函数的性质

① 0≤F(x)≤1

② F(x)不是减函数,即对于任意x1<x2都有F(x1)≤F(x2);

③ F(−∞)=0, F(+∞)=1即limx→−∞F(x)=0, limx→−∞F(x)=1;

④ F(x)右连续,即limΔx→0+F(x+Δx)=F(x)。

例2:设随机变量X的分布函数为:

F(x)={a+be−λx,x>00,x≤0

其中,λ>0为常数,求常数a和b的值。

解:由题意有:F(+∞)=limx→+∞F(x)=limx→+∞(a+be−λx)=a

由分布函数性质F(+∞)=1得a=1

由F(x)的右连接性得:F(0+0)=limΔx→0+F(x)=limΔx→0(a+be−λ0)=a+b=0 # 从x=0左侧不断逼近0出的极限值与x=0处的值相同(不中断)!

所以:b=−1

因此:a=1, b=−1。

补充下数学知识:自然常数,符号e,为数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.718281828459045。它是自然对数函数的底数。有时称它为欧拉数,以瑞士数学家欧拉命名。

e作为数学常数,它的其中一个定义是:e=limx→∞(1+1x)x。

同时:e=∑n=0∞1n!=10!+11!+12!+13!+...。 注意:0!=1, 1!=1。

在已知X的分布函数F(x)情况下,我们可知以下重要事件的概率:

① P{X≤b}=F(b)

② P{a<X≤b}=F(b)−F(a)

③ P{X>b}=1−P{X≤b}=1−F(b)

例3:设随机变量X的分布函数为:

F(x)={0,x<0x3,0≤x<1x2,1≤x<21,x≥2

求:(1) P{12<X≤32} (2) P{X>12} (3) P{X>32}

解:(1) P{12<x≤32}=F(32)−F(12)=34−16=712

(2) P{X>12}=1−F(12)=1−16=56

(3) P{X>32}=1−F(32)=1−34=14

3 连续型随机变量及其概率密度

3.1 连续型随机变量及其概率密度

前面已经多次提到连续型随机变量,下面给出定义:

定义8:对于随机变量X的分布函数F(x),存在非负数f(x)使得对于任意实数x有:F(x)=∫−∞xf(t)dt;则称X为连续型随机变量,并称f(x)是X的概率密度函数,简称概率密度

补充高等数学知识:F(x)=∫−∞xf(t)dt的计算方法:

1.找到f(t)对应的原函数g(t),即的导函数g(t)的导函数g′(t)=f(t);

2.根据积分∫−∞x给出的积分上限x和积分下限−∞带入g(t);并计算g(x)−g(−∞);

3.计算结果即为F(x)。

上述积分等式,我们通过高等数学的知识,当f(x)可积时,连续型随机变量的分布函数F(x)是连续函数,进一步,对任意的实数x,Δx>0有:0≤P{X=x}≤P{x−Δx<X≤x}=F(x)−F(x−Δx)

由于F(x)为连续函数,令Δ→0,则P{X=x}=0;即连续型随机变量得某一指定点取值的概率为0.

有定义8和分布函数的性质可得下列概率密度的性质:

(1) f(x)≥0

(2) ∫−∞+∞f(x)dx=1

且满足以上两条性质的函数一定是某个连续型随机变量的概率密度。

(3) P{a<X≤b}=F(b)−F(a)=∫abf(x)dx

(4) 设x是f(x)的连续点,则F′(x)存在,且:F′(x)=f(x) ★★★★★

根据积分的几何意义,性质(2)意为介于曲线y=f(x)与x轴之间的面积为1;

由性质(3)知X落在区间(a,b]的概率P{a<x<b}就是由曲线y=f(x), x=a, x=b围成的曲边梯形的面积,如图阴影部分所示:

【概率论与数理统计】第二章 随机变量及其分布_夏明亮_02

由性质(4),在f(x)的连续点x处有:

f(x)=limΔx→0+F(x+Δx)−F(x)Δx=limΔx→0+P{x<X≤x+Δx}Δx

即f(x)为X落在区间(x,x+Δx]的概率与区间长度的比值。

从这里我们可以看到概率密度的定义与物理学中线密度的定义相似,这就是为什么称f(x)为概率密度的原因。

★★★★★例1:设随机变量X的概率密度为:

其他f(x)={ax,0≤x≤10,其他

求:(1) 常数a; (2) 分布函数F(x); (3) P{|X|≤12}。

解:(1)由概率密度的性质∫−∞+∞f(x)dx=1,得:

∫−∞+∞f(x)dx=∫−∞00dx+∫01axdx+∫1+∞0dx=1

的一个原函数为∵ ax的一个原函数为a2x2

即∫01axdx=a2x2|01=a212−a202=a2=1

∴ a=2

(2) 当x<0时,F(x)=∫−∞xf(t)dt=0,  (t∈x)

当0≤x≤1时,F(x)=∫−∞xf(t)dt=∫−∞00dt+∫0xatdt=∫0x2tdt=x2|0x=x2

当x>1时,F(x)=∫−∞xf(t)dt=∫−∞00dt+∫01atdt+∫1x0dt=∫012tdt=t2|01=1

这里教材上的积分下限为+∞是错误的!!!

即X的分布函数为:

F(x)={0,x<0x2,0≤x≤11,x>1

(3) P{|X|≤12}=P{−12≤X≤12}=F(12)−F(−12)=14−0=14

或者P{|X|≤12}=∫−1212f(x)dx=∫−120f(x)dx+∫012f(x)dx=∫−1200dx+∫012axdx=∫0122xdx=x2|012=14

例2:设随机变量X的概率密度为:

其他f(x)={x,0≤x<12−x,1≤x<20,其他

求X的分布函数F(x)。

解:当x<0时,即其他F(x)=∫−∞xf(t)dt=∫−∞00dt=0,  t∈(x<0,即其他)

当0≤x<1时,F(x)=∫−∞xf(t)dt=∫−∞00dt+∫0xtdt=∫0xtdt=t22|0x=x22

当1≤x<2时,F(x)=∫−∞xf(t)dt=∫−∞00dt+∫01tdt+∫1x(2−t)dt=t22|01+(2t−12t2)|1x=−12x2+2x+1

当x≥2时,F(x)=∫−∞xf(x)dx=∫−∞00dt+∫01tdt+∫12(2−t)dt+∫2x0dt=0+t22|01+(2t−12t2)|12+0=0+12+12+0=1

即X的分布函数为:

F(x)={0,x<0x22,0≤x<1−12x2+2x+1,1≤x<21,x≥2

再啰嗦一句:无论哪个区间F(x)=∫−∞xf(t)dt;这是定义!!!!

例3:设连续随机变量X的分布函数为:

F(x)={0,x≤0x2,0<x<11,x≥1

求:(1) X的概率密度f(x); (2) X落入(0.3,0.7)的概率密度。

解:(1) 根据分布函数与概率密度函数的关系知:

其他f(x)=F′(x)={2x,0<x<10,其他

(2) 有两种解法:

P{0.3<X<0.7}=F(0.7)−F(0.3)=0.72−0.32=0.4

或者:

P{0.3<X<0.7}=∫0.30.7f(x)dx=∫0.30.72xdx=x2|0.30.7=0.4

★★★★★例4:设某型号电子元件的寿命X(单位:h)具有以下概率密度:

其他f(x)={1000x2,x≥10000,其他

现有以下批次的此种元件(元件工作相互独立),问:

(1) 任取一只元件,求其寿命大于1500h的概率?

(2) 任取4只元件,其中恰好有2只元件的寿命大于1500h的概率?

(3) 任取4只元件,其中至少有1只元件的寿命大于1500h的概率?

解:(1) P{X>1500}=∫1500+∞1000x2dx=(−1000x)|1500+∞=23

(2) 各元件工作独立,可以看作是进行4重伯努利试验,令Y表示"4个元件中寿命大于1500h的元件个数",则Y∼B(4,23);所有概率P{Y=2}=C42(23)2(13)2=827

(3) 所求概率为P{Y≥1}=1−P{Y=0}=1−C40(23)0(13)4=8081

3.2 均匀分布与指数分布

最常用的连续型概率分布有:均匀分布、指数分布和正态分布

定义9:若随机变量X的概率密度为:

其他f(x)={1b−a,a≤x≤b0,其他

称X服从区间[a,b]上的均匀分布,简记:X∼U(a,b)

容易求得分布函数:

F(x)={0,x<ax−ab−a,a≤x≤b1,x>b

我这里还是补充下证明过程:

当x<a时;F(x)=∫−∞xf(t)dt=0|−∞x=0 ;

当a≤x≤b时;F(x)=∫−∞xf(t)dt=∫−∞a0dt+∫ax(1b−a)dt=0|−∞a+1b−at|ax=xb−a−ab−a=x−1b−a

当x>b时;F(x)=∫−∞xf(t)dt=∫−∞a0dt+∫ab(1b−a)dt+∫bx0dt=(1b−at)|ab=1

均匀分布的概率密度f(x)与分布函数F(x)的图像如下:

【概率论与数理统计】第二章 随机变量及其分布_分布_03

【概率论与数理统计】第二章 随机变量及其分布_分布_04

均匀分布的概率计算中有一个概率公式: ★★★★★

设X∼U(a,b),  a≤c<d≤b即[c,d]⊂[a,b],则:P{c≤X≤d}=d−cb−a。

使用这个公式计算均匀分布概率很方便,例如X∼U(0,3)则P{1≤X≤2}=2−13−0=13

均匀分布可能是实际问题中最常见的了。

★★★★★

例5:公共汽车站每个5分钟有一辆车通过,乘客再5分钟内任一时刻到达车站是等可能的,求乘客候车时间在1-3分钟内的概率。

解:设X表示乘客的候车时间;则X∼U(0,5),其概率密度为:

其他f(x)={15,0≤x≤50,其他

所求概率为:P{1≤x≤3}=3−15−0=23

定义10:若随机变量X的概率密度为:

f(x)={λe−λx,x>00,x≤0

其中λ>0是常数,则称X服从参数为λ的指数分布;简记:X∼E(λ);其分布函数为:

F(x)={1−e−λx,x>00,x≤0

f(x)与F(x)的图像为:

【概率论与数理统计】第二章 随机变量及其分布_夏明亮_05

指数分布常用作各种"寿命"相关的分布,有广泛的应用。

例6:设X服从λ=1的指数分布,求P{X>1}。

解:X的概率密度为为:

f(x)={e−x,x>00,x≤0

方法一:P{X>1}=∫1+∞f(t)dt;因为时,x>0时,fx()=e−x,因此:

P{X>1}=∫1+∞f(t)dt=∫1+∞e−tdt=−e−t|1+∞=e−1。

方法二:P{X>1}=1−P{X≤1};根据定义7:分布函数的定义得

P{X>1}=1−P{X≤1}=1−F(1)=1−[∫−∞0f(t)dt+∫01f(t)dt]=1−[0+(−e−t)|01]=1−(−e−1−(−e−0))=e−1

特别地啰嗦下:

方法一直接通过积分计算 概率密度</u>与区间长度乘积的积分,积分上下限就根据X的取值范围即可。

方法二,辗转通过 概率函数的方法,再通过概率概率函数的性质来计算,那么积分就必须从−∞积到边界线x=1。为什么是积到边界线而不是继续从边界线x=1继续积到x→+∞呢?因为,继续从边界线x=1继续积到x→+∞呢有概率密度计算概率函数F(x)的计算步骤,而这里已经确定x=1了,因此不用再继续积下去。

==========关于积分上下限的说明==========

3.3 正态分布

定义11:若随机变量X的概率密度为:

f(x)=12πσe−(x−μ)22σ2    ,    −∞<x<+∞

其中μ, σ2为常数,−∞<μ<+∞, μ>0,则称X服从参数为μ, σ2的正态分布,简记X∼N(μ,σ2)

f(x)的图形如下:

【概率论与数理统计】第二章 随机变量及其分布_连续型_06

习惯上,称服从正态分布的随机变量为正态随机变量;又称正态分布的概率密度曲线为正态分布曲线,它有以下性质:

(1) 曲线关于之直线x=μ对称,这表明对于任何h>0,都有【概率论与数理统计】第二章 随机变量及其分布_夏明亮_07

(2) 当x=μ时,取最大值f(μ)=【概率论与数理统计】第二章 随机变量及其分布_离散型_08,在x=μ±σ处曲线有拐点;曲线以x轴为渐近线。

(3) 当σ给定,【概率论与数理统计】第二章 随机变量及其分布_连续型_09时;

【概率论与数理统计】第二章 随机变量及其分布_夏明亮_10

其图像为:

【概率论与数理统计】第二章 随机变量及其分布_连续型_11

实际上,两条曲线可沿着x轴平移而得,不改变其形状,可见正态分布曲线的位置完全由μ决定,μ是正态分布的中心

(4) 当μ给定且σ1<σ2时;

f3(x)=12πσ1e−(x−μ)22σ12    ,    f4(x)=12πσ2e−(x−μ)22σ22

其图像为:

【概率论与数理统计】第二章 随机变量及其分布_连续型_12

可见σ越小,图形越尖,σ越大,图形越平缓;正态分布曲线中σ的值刻画了正态随机变量取值的分散程度,σ越小,分散程度越小,σ越大,分散程度越大。

设X∼N(μ, σ2),则X的分布函数为:F(x)=∫−∞x12πσe−(x−μ)22σ2dt;它的图形为:

【概率论与数理统计】第二章 随机变量及其分布_连续型_13

特别地,当μ=0,σ=1时,正态分布称为标准正态分布N(0, 1)。为了区别,标准正态分布的密度和分布函数分别记为φ(x), Φ(x),即:

φ(x)=12πe−x22,    −∞<x<+∞

Φ(x)=12π∫−∞xe−t22dt,    −∞<x<+∞

其中,φ(x)的图像为:

【概率论与数理统计】第二章 随机变量及其分布_离散型_14

显然,φ(x)是关于y轴对称的,且在x=0时取最大值12π。

对于标准正态分布函数Φ(x),它有下列性质:

(1) Φ(−x)=1−Φ(x) ;这根据前面的知识时显而易见的;

(2) Φ(0)=12;Φ(x)的值可以通过查询标准正态分布表获取;

下列公式揭示了一般正态分布函数F(x)与标准正态分布函数Φ(x)的关系:

(1) 设X∼N(μ, σ2),其分布函数为F(x),则:F(x)=P{X≤x}=Φ(x−μσ);证明过程:

因为:F(x)=12πσ∫−∞xe−(t−μ)22σ2dt;作为代换,我们令u=t−μσ,则∵u′=dudt  ∴du=1σdt  ∴dt=σdu;

代换后:F(x)=12πσ∫−∞x−μσe−12u2σdu=Φ(x−μσ) # 注意,这里因为使用了代换量,积分上下界也要跟随变化!!

(2) P{a<x≤b}=P{a≤x<b}=P{a≤x≤b}=P{a<x<b}=F(b)−F(a)=Φ(b−μσ)−Φ(a−μσ)

(3) P{x>a}=P{X≥a}=1−P{x≤a}=1−F(a)=1−Φ(a−μσ)

例7:设X∼N(0,1),证明:对于任意的h>0,有P{|x|≤h}=2Φ(h)−1。

证明:P{|X|≤h}=P{−h≤X≤h}=Φ(h)−Φ(−h)=Φ(h)−[1−Φ(h)]=2Φ(h)−1

例8:设X∼N(0,1)求:

(1) P{X<2.35}

(2) P{X<−3.03}

(3) P{|X|<1.54}

解:(1) P{X<2.35}=Φ(2.35)=0.9906 (直接查表) # 找到行头为2.3,列头为5表格对应的值。

(2) P{X<−3.03}=Φ(−3.03)=1−Φ(3.03)=1−0.9995=0.0005 (查表)

(3) P{|X|<1.54}=P{−1.54<X<1.54}=2Φ(1.54)−1=2×0.9382−1=0.8764

例9:设X∼N(1.5,4)求:

(1) P{X<3.5}

(2) P{1.5<X<3.5}

(3) P{|X|≥3}

解:由题目知μ=1.5, σ=2,记F(x)为X的分布函数:

(1) P{X<3.5}=F(3.5)=Φ(x−μσ)=Φ(3.5−1.52)=Φ(1)=0.8413

(2) P{1.5<X<3.5}=F(3.5)−F(1.5)=F(1)−F(0)=0.8413−0.5=0.3413

(3) P{X≥3}=P{X≤−3}+P{X≥3}=F(−3)+(1−F(3))

=Φ(−3−1.52)+1−Φ(3−1.52)=Φ(−2.25)−Φ(0.75)+1=1−Φ(2.25)+1−varPhi(0.75)=1−0.9878+1−0.7734=0.2388

★★★易错点提醒:F(−x)不一定等于1−F(3);只有在标准正态分布下Φ(−x)=1−Φ(x)才成立!!!

同时,也可以利用P{|X|≥3}=1−P{|X|<3}=1−P{−3<X<3}来计算!

例10:设X∼N(μ,σ2)求X落在区间[μ−kσ,μ+kσ]的概率,其中k=1,2,...

解:P{μ−kσ≤Xμ+kσ}=F(μ+kσ)−F(μ−kσ)=Φ((μ+kσ)−μσ)−Φ((μ−kσ)−μσ)=Φ(k)−Φ(−k)=2Φ(k)−1 ;则:

k=1;  P{μ−σ≤X≤μ+σ}=2Φ(1)−1=0.6826

k=2;  P{μ−2σ≤X≤μ+2σ}=2Φ(2)−1=0.9544

k=3;  P{μ−3σ≤X≤μ+3σ}=2Φ(3)−1=0.9973

★★★由此可以看出:尽管正态随机变量取值范围为(−∞,+∞),但他的值落在[μ−3σ,μ+3σ]的概率为0.9973,很接近100%这个性质被称为正态分布的3σ规则

大家应该都听过六西格玛质量管理模式,实际上也与此有关,大家有兴趣可以算算:6σ:[μ−3σ,μ+3σ]的概率。

定义12:设X∼N(0,1),若μα满足条件:P{X>μα}=α,  0<α<1;则称点μα为标准正态分布的上侧α分位数,简称α分位数。见图:

【概率论与数理统计】第二章 随机变量及其分布_分布_15

常见的上侧分位数:

μ0.1=1.282,    μ0.05=1.645,    μ0.025=1.960

μ0.01=2.326,    μ0.005=2.567

μ0.0001=3.090

4 随机变量函数的概率分布

4.1 离散型随机变量函数的概率分布

有时候我们所关心的随机变量不能直接测量得到,而他确是某个能直接测量的随机变量的函数。(可以某个简单函数的符合函数,大概就是这么个意思)

例如:我们能测量圆的直径X,而关心的却是其面接Y=π(X2)2=π4X2;这里随机变量Y就是随机变量X的函数。

设g(x)是一个给定的连续函数,称Y=g(X)为随机变量X的一个函数,Y也是一个随机变量;当X取值x时,Y取值为Y=g(x)。

接下来我们将讨论如何由已知的随机变量X的概率分布去求函数Y=g(X)的概率分布。

首先,讨论X为离散型随机变量,设其分布律为:

X

x1

x2

...

xk

...

P

p1

p2

...

pk

...

由于X的取值可能为x1, x2, ..., xk, ...;所以Y的可能取值为g(x1), g(x2), ..., g(xk), ...;可见Y只取有限多个或者可列的无限多个值,故Y也是一个离散型随机变量

注意:g(x1), g(x2), ..., g(xk), ...之间可能存在相等的情况。

我们关注的是如何求Y的分布律,先看一个例子:

例1:设随机变量X的分布律为:

X

-1

0

1

2

P

0.2

0.1

0.3

0.4

求:(1)Y=X3的分布律; (2)Z=X2的分布律。

解:(1)Y可能的取值有:−1, 0, 1, 8;且由于:

P{Y=−1}=P{X3=−1}=P{X=−1}=0.2

P{Y=0}=P{X3=0}=P{X=0}=0.1

P{Y=1}=P{X3=1}=P{X=1}=0.3

P{Y=8}=P{X3=8}=P{X=2}=0.4

从而,Y的分布律为:

X

-1

0

1

8

P

0.2

0.1

0.3

0.4

(2)Z可能的取值为:,,0,1,4;且由于:

P{Z=0}=P{X2=0}=P{X=0}=0.1

P{Z=1}=P{X2=1}=P{X=−1}+P{X=1}=0.2+0.3=0.5

P{Z=4}=P{X2=2}=P{X=2}=0.4 # X=−2的情况对于X来说概率是0

从而,Z的分布律为:

X

0

1

4

P

0.1

0.5

0.4

★★★从此例可以看出,g(x1), g(x2), ..., g(xk),...中的值可能互不相等,也可能有相等的情况,对于g(xk)相等的那些xk所对应的概率应改相加作为g(xk)的概率。

例2:设X∼B(3, 0.4),令Y=X(3−X)2,求P{Y=1}。

解:有题目知:

P{Y=1}=P{X(3−X)2=1}=P{X=1}+P{X=2}=C31(0.4)1(0.6)2+C32(0.4)2(0.6)1=0.72

4.2 连续型随机变量函数的概率分布

设X为连续型随机变量,其概率密度为f(x),要求Y=g(X)的概率密度fY(y),我们可以利用如下定理的结论。

定理1:设X为连续型随机变量,其概率密度为fX(x),设g(x)是一个严格单调可导的函数,其值域为(α, β)且g′(x)≠0;记x=h(y)为y=g(x)的反函数,则Y=g(X)的概率密度为:

其他fY(y)={fX(h(y))|h′(y)|,    α<y<β0,    其他

特别地,当α=−∞, β=+∞时:

fY(y)=fX(h(y))|h′(y)|,     −∞<y<+∞ 。

例3:设连续性随机变量X的概率密度为fX(x),令Y=aX+b,其中a, b为常数a≠0,求Y的概率密度。

解:由题目知,设:y=g(x)=ax+b则:

x=h(y)=y−ba,  h′(y)=1a

fY(y)=fX(h(y))⋅|h′(y)|=fX(y−ba)⋅|1a|

例4:X∼N(μ,σ2)求:(1)Y=X−μσ的概率密度;(2)Y=aX+b的概率密度。

解:由题目知X的概率密度为:fX(x)=12πσe−(x−μ)22σ2

(1)Y=X−μσ=1aX+(−μa)

x=h(y)=σy+μ,  h′(y)=σ

fY(y)=fX(h(y))⋅|h′(y)|=fX(σy+μ)⋅σ=12πσe−(σy+μ−μ)22σ2⋅σ=12πe−y22

即:Y∼N(0, 1)。

(2)由例3中的结论fY(y)=fX(y−ba)⋅|1a|=1|a|⋅12πσe−(y−ba−μ)22σ2=12πσ|a|e−(y−b−aμ)22(σa)2

即:Y∼N(b+aμ,a2σ2)

★★★本示例说明了两个重要的结论:当X∼N(μ,σ2)时Y=X−μσ∼N(0, 1)且随机变量X−μσ称为X的标准化。另外,正态随机变量的线性变换Y=aX+b仍旧是正态随机变量,即aX+b∼N(b+aμ, a2σ2)。

例5:设X∼U(−π2, π2),令Y=tan⁡X,求Y的概率密度fY(y)。

解:由题目知,X服从均匀分布,其概率密度为:

其他fX(x)={1π,  −π2≤x≤π20,  其他

令y=g(x)=tan⁡x,其值域为(−∞,+∞);

其反函数:x=h(y)=arctan⁡y;反函数的倒数:h′(y)=11+y2

因此:fY(y)=fX(h(y))⋅|h′(y)|,    arctan⁡y∈(−π2, π2)

又因:fX(h(y))=1π;又因:|11+y2|=11+y2

∴fY(y)=1π⋅11+y2

这一概率分布也称为柯西(cauthy)分布

tan⁡x、cot⁡x的图像:

【概率论与数理统计】第二章 随机变量及其分布_离散型_16

①(sin⁡x)′=cos⁡x;即正弦的导数是余弦.

②(cos⁡x)′=−sin⁡x;即余弦的导数是正弦的相反数.

③(tan⁡x)′=(sec⁡x)2;即正切的导数是正割的平方.

④(cot⁡x)′=−(csc⁡x)2;即余切的导数是余割平方的相反数.

⑤(sec⁡x)′=sec⁡xtan⁡x;即正割的导数是正割和正切的积.

⑥(csc⁡x)′=−csc⁡xcot⁡x;即余割的导数是余割和余切的积的相反数.

⑦(arcsin⁡x)′=1(1−x2)

⑧(arccos⁡x)′=−1(1−x2)

⑨(arctan⁡x)′=1(1+x2)

⑩(arccot⁡x)′=−1(1+x2)

例6:设X∼N(μ,σ2),求Y=eX的概率分布fY(y)。

解:令y=g(x)=ex;其值域为(0,+∞)

其反函数为:x=h(y)=ln⁡y;反函数的倒数为:h′(y)=1y则:

fY(y)={fX(h(y))⋅|h′(y)|,  y>00,  y≤0={12πσye−(ln⁡y−μ)22σ2,       y>00,  y≤0

此分布为"对数正态分布"

以上例子中使用公式求解,因此也叫"公式"法;注意:公式要求y=g(x)为单调函数,若不是单调函数则不能使用公式法求解

例7:设随机变量X的概率密度为:

其他fX(x)={x8,  0<x<40, 其他

求:Y=2X+8的概率密度。

解:设Y的分布函数为FY(y),则:

FY(y)=P{Y≤y}=P{2X+8≤Y}=P{X≤y−82}=FX(y−82) 其中FX(x)是X的分布函数;故:

其他课本里此处错误其他fY(y)=FY′(y)=[FX(y−82)]′=FX′(y−82)⋅12=fX(y−82)={18⋅(y−82⋅12),  0<y−82<40, 其他={y−832,8<y<16#课本里此处错误0, 其他

注意:这里的FY′(y)=[FX(y−82)]′=FX′(y−82)⋅(y−82)′=FX′(y−82)⋅12是复合函数求导的方法!!

这种解法叫"直接变换法",它可以适用于非单调性随机变量的情况,但本例中Y=2X+8是单调函数(切线的斜率或者导数不会更改正负号的函数),因此即可以使用前面的"公式法",也可以使用"直接变换法"。

例8:设X的概率密度为fX(x),求Y=X2的概率密度fY(y),特别地,当X∼N(0,1)时,求Y=X2的概率密度。

明显Y=X2不是单调函数了。

解:当y≤0时,Y的分布函数为:FY(y)=P{Y≤y}=P{X2≤y}=0 #这是常识判断的,因为不存在实数的平方是负数的情况。

因此:fY(y)=0

当y>0时,Y的分布函数为:FY(y)=P{Y≤y}=P{X2≤y}=P{−y≤x≤y}=FX(y)−FX(−y)

其中,FX(x)时X的分布函数,则:

fY(y)=FY′(y)=(FX(y)−FX(−y))′=12y⋅FX′(y)+12y⋅FX′(−y)=12y(fX(y)+fX(−y)) # 注意F和f的变化。

根据题目知:X∼N(0,1),则:fX(x)=12πe−x22 可得:

fY(y)=12y(12πe−y2+12πe−y2)=12πye−y2

综上:

其他fY(y)={12πye−y2,  y>00,  其他

X∼N(0,1)则Y=X2为χ2分布,其自由度为1,记作:Y∼χ2(1)。将在后面的章节详细讲解。



吐槽:51cto对markdow尤其是涉及LaTex的支持真的很烂,粘贴进来大量公式语法变形错误,后台反应也没有回应。

目前先放在这没后续有时间逐步修改吧,有需要的朋友可以找找我CSDN和博客园的Post,本文会有大量的公式错误,(lll¬ω¬)!!!