概率统计论 浅谈泊松分布
班级:XXX 姓名:XXX 学号:XXX
浅谈泊松分布
摘要:泊松分布-—概率统计中常用的一种离散型概率分布,在实际生活中有很广泛的应用.当一个随机事件,以固定的平均瞬时速率(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布P().泊松分布对概率分布的分析与估计有着很重要的应用。 关键词:泊松分布 二项分布 概率统计 1。泊松分布由来 1。1什么是泊松分布 Poisson分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散机率分布(discrete probability distribution),由法国数学家西莫恩·德尼·泊松(Siméon—Denis Poisson)在1838年时发表。 泊松分布是概率论中常用的一种离散型概率分布。 若随机变量X的分布列 P(Xk)kek! 则称X服从参数为的泊松分布,并用记号X~P()表示。 这个分布是S。—D。泊松研究二项分布的渐近公式是时提出来的。泊松分布P (λ)中只有一个参数λ ,这个参数λ是单位时间(或单位面积)内随机事件的平均发生率,它既是泊松分布的均值,也是泊松分布的方差。在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率 λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布。因此泊松分布在管理科学,运筹学以及自然科学的某些问题中都占有重要的地位。 1。2泊松分布与二项分布的关系 如果做一件事情成功的概率是 p 的话,那么独立尝试做这件事情 n 次,成功次数的分布就符合二项分布。展开来说,在做的 n 次中,成功次数有可能是 0 次、1 次 …… n次。成功 i 次的概率是: inip(1p)( n 中选出 i 项的组合数) - 1 -
以上公式很容易推导,用一点概率学最基本的知识就够了。因为每一特定事件成功的概率是 p ,不成功的概率是 1-p 。i 次成功的事件可以任意分布在总共的 n 次尝试中。把它们乘起来就是恰好成功 i 次的概率。 当我们把二项分布推而广之后,就可以得到泊松分布。可以这样考虑,在一个特定时间内,某件事情会在任意时刻随机发生(前提是,每次发生都是独立的,且跟时间无关)。当我们把这个时间段分成非常小的时间片构成时,可以认为,每个时间片内,该事件可能发生,也可能不发生.几乎可以不考虑发生多于一次的情况(因为时间片可被分的足够小)。当时间片分的越小,该时间片内发生这个事件的概率 p 就会成正比的减少。即:特定时间段被分成的时间片数量 n 与每个时间片内事件发生的概率 p 的乘积np为一个常数。这个常数表示了该事件在指定时间段发生的频度。 回过头来再来看这段时间内,指定事件恰好发生 i 次的概率是多少?代入上面推导出来的公式得到: n(n1)(ni1)ip(1p)nii! 1np(npp)(npipp)((1p)p)np ii!(1p)当 n 趋向无穷大时,p 趋向 0 。而此时 (1p)布了。 二项概率的泊松逼近
如果n1p 趋向 e 。这个关于 i 的分布就是著名的泊松分,p0使得np保持为正常数,则
kCnpk(1p)nkkk!e
对k = 0,1,2,…一致地成立。 关于以上用到的一个极限的推导: (1p)1p当 p趋向于0时,为什么它的值趋向 e ? 我们可知lnx的导数是1,由导数的定义可知 x - 2 -
1lnxlnxlim xxxxx令 xx1 ( n 趋向无穷大) 代到上式中, 并用对数计算法则化简得到 n11nlim(1) xnnx再令 z1,并再一次用对数运算法则化简可得 xzzzlimln(1)n,两边取指数函数,可变化为ezlim(1)n nnnnz当 z = 1 时,我们可以得到特例:elim(1) nn回头再来看式子 (1p)变形为: 1p,令 n11 ,因为 p趋向于0,所以 n趋向无穷大。前式可pp(11n1),当 n 趋向无穷大的时候,跟 (1)n 有相同的极限 e。 n1n2。泊松分布的特征 1). 泊松分布是一种描述和分析稀有事件的概率分布,要观察到这类事件,样本含量n必须很大。 2).是泊松分布所依赖的唯一参数。其值越大,分布越偏,随着的增大,分布趋于对称。 3). 当20时泊松分布接近于正态分布;当50时,可以认为泊松分布呈正态分布.在实际工作中,当20时就可以用正态分布来近似地处理泊松分布的问题。 2.1泊松分布使用范围
泊松分布主要用于描述在单位时间(空间)中稀有事件的发生数。 即需满足以下四个条件: 1. 给定区域内的特定事件产生的次数,可以是根据时间,长度,面积来定义; 2. 各段相等区域内的特定事件产生的概率是一样的; 3。 各区域内,事件发生的概率是相互独立的;
- 3 -
4。 当给定区域变得非常小时,两次以上事件发生的概率趋向于0。 2.2泊松分布的性质
1。 泊松分布的均数与方差相等,即2.泊松分布的可加性
如果x1,x2,x3…xk相互独立,且它们分别服从以1,2,3…k为参数的泊松分布,则
2m
TX1X2X3Xk也服从泊松分布,其参数为123k。
3。泊松分布的应用
泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时
间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等。 观察事物平均发生m次的条件下,实际发生x次的概率P(x)可用下式表示: mxmP(x)e x! P(0)em 3。1泊松分布在细菌分布统计上的应用 例如采用0.05J/m紫外线照射大肠杆菌时,每个基因组(~4×106核苷酸对)平均产生3个嘧啶二体。实际上每个基因组二体的分布是服从泊松分布的,将取如下形式: 2P(0)e30.05; P(1)33e0.15; 1!323P(2)e0.22; 2!P(3)0.22; P(4)0.17;…… P(0)是未产生二体的菌的存在概率,实际上其值的5%与采用0.05J/m2照射时的大肠杆菌uvrA-株,recA-株(除去既不能修复又不能重组修复的二重突变)的生存率是一致的。由于该菌株每个基因组
- 4 -
有一个二体就是致死量,因此P(1),P(2)……就意味着全部死亡的概率。 3。2泊松分布在医学统计上的应用
在遗传学上,计算遗传图距的基本方法是建立在重组率基础上的,根据重组率的大小作出有关基因间的距离,绘制线性基因图;可是当研究的两个基因间的距离相对较远,在它们之间可能发生双交换、三交换、四交换甚至更高数目的交换,而形成的配子总有一半是非重组型的。若简单的把重组率看作交换率,显然交换率降低了,图距也随之缩小。这里可以用泊松分布原理来描述减数分裂过程中染色体上某区段交换的分布。在图距计算中,x表示交换数,m表示对总样本来说每进行一次减数分裂两基因间
m0meem,基因间至少发生一次交换的概率的平均交换数,而基因间不发生交换的概率为P(0)0!为P1P(0)1em。由此可计算两基因间的交换率和重组率。进而可更科学的作出遗传图。
3。3 泊松分布在交通运输上的应用
道路是行驶各种车辆的通道.为了给编制交通建设规划提供可靠的依据和保证道路上的车能安全而有效地通行, 道路工作者必须对道路上的车流进行实地调查和统计分析以便掌握车流的变化规律。数理统计方法是对交通流分布进行研究的有效而实际可行的方法。通常把在单位时间内通过道路上某一地点的车辆叫做交通流。对于时间间隔极短,并非是高密度的交通流的分布状态, 它常常是服从“概率论\" 中的“ 泊松分布” 规律的。
如用简单例子表示,取通过某一地点车辆的时间作为时间数轴, 在数轴上划出给定时间间隔和该时间间隔内通过的车辆数目,譬如, 以20秒的时间间隔的数轴为例, 在0~20秒内,一辆车也没有通过, 在20~40秒间隔内,有二辆车通过, 在40~60秒间隔内, 有一辆车通过, 等等。这样在实地进行大量观测就可以的到某一时间间隔内的随机来车数目和该时间间隔内出现该车辆数的次数, 从而按泊松分布公式求算在给定时间间隔内在某一地点通过辆车的概率P()。 参考文献
1. 戴维 M。 莱文等。《以EXCEL为决策工具的商务统计》.机械工业出版社,2009
2.庄军、林奇英《泊松分布在生物学中的应用》.激光生物学报。2007年第16卷第5期. 3.薛珊荣 《“泊松分布”在交通工程中的应用》。湖南大学学报.1995年第8卷第2期.
- 5 -
因篇幅问题不能全部显示,请点此查看更多更全内容