论文常用来指进行各个学术领域的研究和描述学术研究成果的文章,简称之为论文。它既是探讨问题进行学术研究的一种手段,又是描述学术研究成果进行学术交流的一种工具。它包括学年论文、毕业论文、学位论文、科技论文、成果论文等。这次帅气的小编为您整理了二项分布及其应用【通用7篇】,您的肯定与分享是对小编最大的鼓励。
设随机变量X示n重伯努利试验中事件A发生的次数,其概率函数为:
p(x)=P(X=x)=Cxnpxqn-x x=0,1,…,n
则称设随机变量X服从参数为n和p的二项分布,记为X~B(n,p),也称广义贝努里试验。
2.1二项分布与“0-1”分布间的关系
进行一次试验,其结果要么“成功”,要么“失败”,记X=1成功0失败,即随机变量X表示一次试验中成功的次数,且p(x)=P(X=x)=pxq1-x(x=0,1)则称随机变量X~“0-1”分布,p为试验结果“成功”发生的概率。该试验也称为贝努里试验。
X~“0-1”分布,其期望、平方的期望、方差及特征函数容易得到:
E(X)=0×(1-p)+1×p=p
E(X2)=02×(1-p)+12×p=p
D(X)=E(X2)-E2(X)=p-p2=p(1-p)
φ(t)=E(eitX)=eit?o×(1-p)+eit?1×p=1-p+peit
将贝努里试验在相同条件下独立进行n次,并以随机变量Y表示n次试验中“成功”的次数,则Y~B(n,p)。若以Xi表示第i次试验中成功的次数,则X1,X2…Xn,独立同“0-1”分布(i=1,2…n)且Y=∑ni=1Xi。则二项分布的期望、方差及特征函数可由二项分布和“0-1”分布间的函数关系得到:
E(Y)=E(∑ni=1Xi)=∑ni=1E(Xi)=np
D(Y)=D(∑ni=1Xi)=∑ni=1D(Xi)=np(1-p)
φY(t)=E(eitY)=E(eit∑ni=1Xi)=∏ni=1E(eitXk)=∏ni=1(1-p+peit)=(1-p+peit)n
易见,在教学中利用二项分布和“0-1”分布的关系,使二项分布的上述特征数更容易计算和理解。
2.2二项分布与超几何分布的关系
从含有M件次品的N件产品中任取n件(每次任意取出一个,取后不放回,连续取n次),设随机变量X表示n件产品中出现的次品数,则X~H(n,M,N),概率函数为:
p(x)=P(X=x)=CxMCn-xN-MCnN=p(x,n,M,N)x=0,1,…,n
若将上述取件方式变为每次任意取出一个,取后放回,连续取n次,则易知其中所含的次品数X~B(n,p),其中p=MN。这里有放回的抽样使得每次抽取时的次品率保持不变,
且各次抽取结果相互独立。
而当产品总数N很大时,抽取样品的`个数n相对于N较小时(一般来说nN≤0.1),不放回抽样可近似看成每次抽样结果是相互独立的有放回抽样。据此现实意义,可帮助我们理解二项分布与超几何分布的近似关系:
limN→∞CxMCn-xN-MCMN=Cxnpxqn-x x=0,1,…,n
其中,p=MN,q=1-MN=MN-M,一般要求nN≤0.1。证明见文献[1]。
超几何分布是一种重要的、应用广泛的概率模型。据此关系在合适的条件下可将服从超几何分布的随机变量的概率值的计算近似为服从二项分布的随机变量的概率值进行计算。
2.3二项分布和泊松分布间的关系
若随机变量X表示某个交通路口单位时间内发生交通事故的次数,设所观察的这段时间为[0,1],取一个很大的自然数n,把这段时间分为等长的n段
l1=0,1n,l2=1n,2n,…li=in,i+1n,…ln=n-1n,1
假定:(1)在每段li内,恰好发生一次交通事故的概率与时段长度成正比,可取为λn;
(2)由于n很大,故每段时间间隔很小,认为在这么小的时段内发生两次或更多次的交通事故是不可能的。故在每个时段内不发生交通事故的概率为1-λn;
(3)li各时间段内是否发生交通事故是独立的。
因此,在[0,1]时段内要么发生一次交通事故,其概率为λn,要么不发生交通事故,其概率为1-λn,而各时间段内是否发生交通事故是独立的。故[0,1]时段内发生交通事故的次数X服从二项分布B(n,λn),其概率函数为:
P(X=x)=Cxn(λn)x(1-λn)n-x x=0,1,…,n
严格的说,上式只是近似成立,当n→∞时,limn→∞Cxnpxqn-x=λxx!e-λ其中λ=np。一般要求p≤0.1。证明见文献[1]。在教学中可利用此关系使学生自然的理解泊松分布的特性,它常用来描述大量随机试验中稀有事件出现的次数。
2.4二项分布和正态分布的关系
据棣莫弗――拉普拉斯定理[2]:设Yn~B(n,p)n=1,2,…则对z有:
limn→∞P(Yn-npnpq≤z)=12π∫z-∞e-t22dt
由此可知,当n充分大时,服从二项分布的随机变量Yn近似的服从正态分布N(np,npq)。这里是用一个连续型的正态分布来近似离散型的二项分布,应用时p应满足0.1 在教学中可利用此关系说明二项分布以正态分布为极限分布,并且,当n充分大时
P(m1≤Yn≤m2)≈Φ(m2-npnpq)-Φ(m1-npnpq)
也就是说可利用标准正态分布表来解决较难计算的二项分布的概率计算问题。
二项分布是一种常见的离散型随机变量的概率模型,在概率教学中占有重要地位。本文从二项分布的定义入手,重点分析和阐述了二项分布和“0-1”分布、超几何分布、泊松分布、正态分布的近似关系及基于这些关系所带来的计算上的便利。以期在教学中能使学生更全面深入的理解和认识二项分布。
二项分布 “0-1”分布 超几何分布 泊松分布 正态分布 近似
二项分布:
一般地,在n次独立重复的试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则,k=0,1,2,…n,
此时称随机变量X服从二项分布,记作X~B(n,p),并记。
独立重复试验:
(1)独立重复试验的意义:做n次试验,如果它们是完全同样的一个试验的重复,且它们相互独立,那么这类试验叫做独立重复试验。
(2)一般地,在n次独立重复试验中,设事件A发生的次数为X,在每件试验中事件A发生的概率为p,那么在n次独立重复试验中,高考数学,事件A恰好发生k次的概率为此时称随机变量X服从二项分布,记作 并称p为成功概率。
(3)独立重复试验:若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
(4)独立重复试验概率公式的特点:是n次独立重复试验中某 事件A恰好发生k次的概率。其中,n是重复试验的次数,p是一次试验中某事件A发生的概率,k是在n次独立重复试验中事件A恰好发生的次数,需要弄清公式中n,p,k的。意义,才能正确运用公式。
二项分布的判断与应用:
(1)二项分布,实际是对n次独立重复试验从概率分布的角度作出的阐述,判断二项分布,关键是看某一事件是否是进行n次独立重复试验,且每次试验只有两种结果,如果不满足这两个条件,随机变量就不服从二项分布。
(2)当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果时,我们可以把它看作独立重复试验,利用二项分布求其分布列。
求独立重复试验的概率:
(1)在n次独立重复试验中,“在相同条件下”等价于各次试验的结果不会受其他试验的影响,即2,…,n)是第i次试验的结果。
(2)独立重复试验是相互独立事件的特例,只要有“恰好”“恰有”字样的用独立重复试验的概率公式计算更简单,要弄清n,p,k的意义。
求二项分布:
二项分布是概率分布的一种,与独立重复试验密切相关,解题时要注意结合二项式定理与组合数等性质。
综上所述,二项分布B(n,p)可看成n个独立同“0-1”分布的随机变量的和,从而利用和函数的关系易于计算二项分布的某些特征值;在产品抽样中,若产品总数N很大,抽取的样品个数n相对于N较小时(nN≤0.1),所抽取的次品数所服从的超几何分布可用二项分布近似;当n很大,p较小,一般要求p≤0.1,λ=np适中时可用泊松分布近似二项分布;当n充分大。
[1]沈恒范。概率论与数理统计教程第5版[M]。北京:高等教育出版社,2011.6:55-63.
[2]李裕奇。概率论与数理统计[M]。北京:国防工业出版社,2001.8:193-195.
[3]魏振军。概率论与数理统计三十三讲[M]。北京:中国统计出版社,2005.