超几何分布和二项分布【中阶高阶辅导】

news/2024/7/2 16:27:50

前言

二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.

一、概念辨析

  • 超几何分布

一般的,在含有\(M\)件次品的\(N\)件产品中,任取\(n\)件,其中恰有\(X\)件次品,则事件\(\{X=k\}\)发生的概率为\(P(X=k)=\cfrac{C_M^k\cdot C_{N-M}^{n-k}}{C_N^n}\),(\(k=0,1,2,\cdots,m\)),其中\(m=min\{M,n\}\),且\(n\leq N\)\(M\leq N\)\(n\)\(M\)\(N\in N^*\),称这样的分布列为超几何分布列,如果随机变量\(X\)的分布列具有下表的形式,则称随机变量\(X\)服从超几何分布。

992978-20190318111447520-520882369.jpg

如果\(X\)服从参数为\(n\)\(M\)\(N\)的超几何分布,记作\(X\sim H(n,M,N)\),其数学期望\(E(X)=\cfrac{nM}{N}\)

  • 二项分布

一般的,在\(n\)次独立重复试验中,设事件\(A\)发生的次数为\(X\),每次试验中事件\(A\)发生的概率为\(p\),则事件\(A\)恰好发生\(k\)次的概率为\(P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k}\),(\(k=0,1,2,\cdots,n\)),此时称随机变量\(X\)服从二项分布,记为\(X\sim B(n,p)\),并称\(p\)为成功概率,称\(1-p\)为失败概率,当然成功和失败只是抽象的说法。

解释:二项展开式\([p+(1-p)]^n=1^n=1\)中,事件\(A\)发生\(k\)次,即对应展开式中的含\(p^k\)的项,其为\(C_n^k\cdot p^k\cdot C_{n-k}^{n-k}\cdot (1-p)^{n-k}\),即\(P(X=k)=C_n^k\cdot p^k\cdot (1-p)^{n-k}\)

若随机变量\(X\)服从二项分布,记为\(X\sim B(n,p)\),则\(E(X)=np\)\(D(X)=np(1-p)\)

二、案例剖析

引例

袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:

(1)有放回抽样时,取到黑球的个数\(X\)的分布列;

(2)不放回抽样时,取到黑球的个数\(Y\)的分布列.

解:(1)有放回抽样时,取到的黑球数\(X\)可能的取值为0,1,2,3.

又由于每次取到黑球的概率均为\(\cfrac{2}{10}=\cfrac{1}{5}\),3次取球可以看成3次独立重复试验,

故随机变量服从二项分布\(X\sim B\left(3,\cfrac{1}{5}\right)\),则有

\(P(X=0)=C_3^0(\cfrac{1}{5})^0(\cfrac{4}{5})^3=\cfrac{64}{125}\)

\(P(X=1)=C_3^1(\cfrac{1}{5})^1(\cfrac{4}{5})^2=\cfrac{48}{125}\)

\(P(X=2)=C_3^2(\cfrac{1}{5})^2(\cfrac{4}{5})^1=\cfrac{12}{125}\)

\(P(X=3)=C_3^3(\cfrac{1}{5})^3(\cfrac{4}{5})^0=\cfrac{1}{125}\)

则随机变量\(X\)的分布列如图所示。

992978-20180403162251168-1958930523.png

(2)不放回抽样时,取到的黑球数\(Y\)可能的取值为0,1,2.

且有\(Y\sim H\left(10,3,2\right)\) \(\hspace{2cm}\) \(Y\sim H\left(N,n,M\right)\)

\(P(Y=0)=\cfrac{C_2^0C_8^3}{C_{10}^3}=\cfrac{7}{15}\)

\(P(Y=1)=\cfrac{C_2^1C_8^2}{C_{10}^3}=\cfrac{7}{15}\)

\(P(Y=2)=\cfrac{C_2^2C_8^1}{C_{10}^3}=\cfrac{1}{15}\)

则随机变量\(Y\)的分布列如图所示。

992978-20180403162333982-1853042235.png

【感悟反思】:1、注意这两个概率模型的区别和联系,二项分布的典型例子就是一个熟练射手的\(n\)次射击;超几何分布的典型例子就是抽次品。

2、通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.

三、如何区分

  • 超几何分布的特征:

①考查对象分两类,当然在具体题目中可能需要我们将数据人为分为两类。

②已知各类对象的个数;

③从中抽取若干个个体,考查某类个体的个数\(X\)的概率分布;

④主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型。

  • 二项分布的特征:

①每次试验中,事件发生的概率是相同的;

②各次试验中的事件是相互独立的;

③每次试验只有两种结果:事件要么发生,要么不发生;

④随机变量是这\(n\)次独立重复试验中事件发生的次数。

区别:①超几何分布需要知道总体的容量,而二项分布不需要;

②超几何分布是不放回抽取,而二项分布是有放回抽取(独立重复);

③由解题的实际经验可得,题目中给定了概率的,基于概率计算的往往是二项分布;题目中给定了数字,基于数字计算概率的往往是超几何分布。

联系: 超几何分布和二项分布都是离散型分布,当总体的容量非常大时,超几何分布近似于二项分布。

四、实例总结

  • 超几何分布的常见实例

①10件产品中含有3件次品,从中任意取4件产品,所取出的次品件数服从超几何分布;

②袋中有8红球4白球,从中任意摸出5个球,摸出红球个数服从超几何分布;

③某班45个学生,女生20人,现从中选7人做代表,代表中所含女生的人数服从超几何分布;

④15张卡片中含有5件写有“奖”字,从中任意取3件产品,所取出的卡片中含有奖字的卡片张数服从超几何分布;

⑤10位代表中有5位支持候选人\(A\),随机采访3人,其中支持候选人\(A\)的人数服从超几何分布;

⑥盘中装有10个粽子,豆沙粽2个,肉粽3个,白粽5个,从中任选3个,取到的豆沙粽的个数服从超几何分布;

注意:在具体题目中,可能需要将上述的三类数据转化为两类数据:豆沙粽子和非豆沙粽子。

  • 二项分布的常见实例

①一个狙击手连续射击10次,每次中10环的概率都是0.98,则其击中10环的次数服从二项分布;

②10个狙击手各射击1次,每人击中10环的概率都是0.95,则其击中10环的人数服从二项分布;

③抛掷\(n\)枚相同的骰子,\(X\)为出现点数为1的骰子数;则\(X\sim B(n,\cfrac{1}{6})\)

\(n\)个新生婴儿,\(X\)为男婴的个数,则\(X\sim B(n,\cfrac{1}{2})\)

⑤某产品的次品率为\(p\)\(X\)\(n\)个产品中的次品数,\(X\sim B(n,p)\)

⑥女性患色盲的概率为\(0.25\%\)\(X\)为任取\(n\)个女人中患色盲的人数,\(X\sim B(n,0.25\%)\)

⑦吊灯上并联着5个灯泡,每个正常工作的概率都是0.7,则正常工作的灯泡数\(X\sim B(5,0.7)\)

⑧用户购买100件某产品,该产品的质量指标值位于\((187.7,212.2)\)之间的概率都是\(0.6826\)\(X\)表示质量指标值位于\((187.7,212.2)\)之间的产品件数,则\(X\sim (100,0.6826)\)

⑨从该市学生中随机选取5名学生,记\(\xi\)为身高在\((1.50,1.70)\)的学生人数,且身高在\((1.50,1.70)\)的频率为\(0.7\),则\(\xi\sim (5,0.7)\)

五、典例剖析

例01【2018陕西省第三次质量检测数学理科第19题】

2018年春节期间,为了解市民对西安地铁运营状况的满意度,分别从不同地铁站点随机抽取若干市民对其评分(满分为100分,评分均为整数),绘制频率分布直方图,并将分数从低到高分为四个等级:

992978-20190319212016972-1759442376.jpg

(1)若市民的满意度评分相互独立,以满意度样本估计全市市民满意度。现从全市市民中随机抽取了4人,估计这4人中至少有2人非常满意的概率;

(2)在等级为不满意市民中,老年人占比\(\cfrac{1}{3}\),现从该等级市民中按年龄分层抽取了15人了解不满意的原因,并从中选取3人担任整改督导员,记\(X\)为老年督导员的人数,求\(X\)的分布列和数学期望\(E(X)\).

992978-20190319212021706-51260662.jpg

(3)相关部门对西安地铁运营状况进行评估,评估的硬指标是:市民对西安地铁运营状况的满意指数不低于0.8,否则需要整改,根据你所学的统计知识,判断地铁运营状况能否通过评估,并说明理由。

(备注:满意指数=\(\cfrac{满意程度的平均分}{100}\))

【分析】:(1)首先由频率分布直方图计算得到\(a=0.025\),市民非常满意的概率为\(0.025\times 10=0.25=\cfrac{1}{4}\)

注解:由题目可知市民的满意度评分相互独立,随机抽取4人做调查,到此我们就可以理解相当于做了4次独立重复试验,每次试验满意概率为\(\cfrac{1}{4}\),不满意概率为\(\cfrac{3}{4}\),这样就只能考虑二项分布而不是超几何分布了。

令满意人数为\(X\),则\(X\sim B(4,\cfrac{1}{4})\),且\(P(X=k)=C_4^k\cdot (\cfrac{1}{4})^k\cdot (\cfrac{3}{4})^{4-k}\)\(k=0,1,2,3,4\)

故所求的概率即\(P=P(X=2)+P(X=3)+P(X=4)=\cfrac{67}{256}\)

\(P=1-P(X=0)-P(X=1)=1-C_4^0\cdot (\cfrac{1}{4})^0\cdot (\cfrac{3}{4})^{4}-C_4^1\cdot (\cfrac{1}{4})^1\cdot (\cfrac{3}{4})^{3}=\cfrac{67}{256}\).

(2)抽取的15中,老年人占\(15\times \cfrac{1}{3}=5\),其他人占10人,从中抽取3人担任督导员,是无放回抽取,故容易理解是超几何分布。

\(X\sim H\left(15,5,3\right)\)\(P(X=k)=\cfrac{C_5^kC_{10}^{3-k}}{C_{15}^3},k=0,1,2,3\)

\(P(X=0)=\cfrac{C_5^0C_{10}^{3}}{C_{15}^3}=\cfrac{24}{91}\)\(P(X=1)=\cfrac{C_5^1C_{10}^{2}}{C_{15}^3}=\cfrac{45}{91}\)

\(P(X=2)=\cfrac{C_5^2C_{10}^{1}}{C_{15}^3}=\cfrac{20}{91}\)\(P(X=3)=\cfrac{C_5^3C_{10}^{0}}{C_{15}^3}=\cfrac{2}{91}\)

分布列从略。

\(EX=0\times \cfrac{24}{91}+1\times\cfrac{45}{91}+2\times\cfrac{20}{91}+3\times\cfrac{2}{91}=1\)

(3)由频率分布直方图求平均数,得到,

\((45\times 0.002+55\times 0.004+65\times 0.014+75\times 0.02+85\times 0.035+95\times 0.025)\times 10=80.7\)

即市民满意度的平均分为\(80.7\),满意度指数为\(\cfrac{80.7}{100}=0.807>0.8\)

即地铁运营状况能够通过验收。

例02【2019届凤中理科月考1第18题】

高一某班有\(6\)\(4\)女参加心理社,在这\(10\)名同学中,有\(4\)名同学初中毕业于同一个学校,其余\(6\)名同学都毕业于其他\(6\)所不同的学校,现从这\(10\)名同学中随机抽取\(4\)名同学参加某活动(每位同学被选到的概率都相同)。

(1)求选出的\(4\)名同学初中毕业于不同学校的概率;

分析:从\(10\)名同学中任取\(4\)名同学,共有\(C_{10}^4\)种等可能的结果,故属于古典概型,

令“选出的4人初中毕业于不同学校”为事件\(A\)

【法1】直接法,从正面求解,选出的4人的毕业学校全不相同,

\(P(A)=\cfrac{C_{4}^0 \cdot C_{6}^4+C_{4}^1 \cdot C_{6}^3 }{C_{10}^4}=\cfrac{80+15}{210}=\cfrac{19}{42}\)

【法2】间接法,从反面求解,选出的4人的毕业学校不全相同,

\(P(A)=1-\cfrac{C_{4}^4 \cdot C_{6}^0+C_{4}^3 \cdot C_{6}^1+C_{4}^2 \cdot C_{6}^2 }{C_{10}^4}=\cfrac{19}{42}\)

(2)设\(X\)为选出的\(4\)名同学中的女同学,求随机变量\(X\)的分布列和数学期望;

分析:随机变量\(X\)的所有可能取值为\(0,1,2,3,4\),则其服从超结合分布,

\(P(X=k)=\cfrac{C_{4}^k \cdot C_{6}^{4-k}}{C_{10}^4}\),(\(k=0,1,2,3,4\))

则有\(P(X=0)=\cfrac{C_{4}^0 \cdot C_{6}^4}{C_{10}^4}=\cfrac{15}{210}=\cfrac{1}{14}\)

\(P(X=1)=\cfrac{C_{4}^1 \cdot C_{6}^3}{C_{10}^4}=\cfrac{4\times 20}{210}=\cfrac{8}{21}\)

\(P(X=2)=\cfrac{C_{4}^2 \cdot C_{6}^2}{C_{10}^4}=\cfrac{6\times 15}{210}=\cfrac{3}{7}\)

\(P(X=3)=\cfrac{C_{4}^3 \cdot C_{6}^1}{C_{10}^4}=\cfrac{24}{210}=\cfrac{4}{35}\)

\(P(X=4)=\cfrac{C_{4}^4 \cdot C_{6}^0}{C_{10}^4}=\cfrac{1}{210}\)

故分布列如下,现略;

期望\(EX=0\times \cfrac{1}{14}+1\times \cfrac{8}{21}+2\times \cfrac{3}{7}+3\times \cfrac{4}{35}+4\times \cfrac{1}{210}=\cfrac{8}{5}\)

转载于:https://www.cnblogs.com/wanghai0666/p/9429147.html


http://www.niftyadmin.cn/n/1978421.html

相关文章

Cisco *** 完全配置指南-连载-详解路由器的站点到站点IPSec ***连接问题(1)

Cisco *** 完全配置指南-连载-详解路由器的站点到站点IPSec ***连接问题(1)详细内容见附件

骚操作之ELK日志分析系统

文章目录前言一、ELK日志分析系统简介1、日志处理的步骤2、ELK日志分析系统三部分3、日志服务器二、Elasticsearch介绍1、Elasticsearch概述2、Elasticsearch的概念3、采用分片4、开启分片副本的主要原因三、Logstash介绍1、Logstash概述2、Logstash主要组件四、Kibana介绍1、K…

nginx+lua(openresty) lua-mongodb 安装及使用(四)

前言 前章已经讲述 ua-protobuf 安装及使用 这章主要讲述 openresty 环境下 lua-mongodb 安装及使用 1:环境 ubuntu16(18) mongodb 3.6 2:安装mongodb 3.6 sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 2930ADAE8CAF5059EE73BB4B58712A2291FA4AD5 #创…

apahce启用http2

2019独角兽企业重金招聘Python工程师标准>>> 需要前置条件传送门 其实前置做完了,h2是很简单的事 1.apache启用http2_module 2.打开apche的配置文件,写上 Protocols h2 http/1.1 3.重启apache,打开浏览器看看吧 转载于:https://my.oschina.net/u/3470006/blog/20560…

Docker骚操作五十四话之docker基本介绍

文章目录前言一、虚拟化二、KVM虚拟化三、Docker1、docker是什么?2、docker的使用场景3、使用docker有什么意义4、docker的使用场景四、docker引擎五、docker和虚拟机的区别六、docker的核心概念1、镜像2、容器3、仓库前言 以linux而言,linux操作系统会…

手动关闭危险端口

我们手动关闭一些危险端口包括 3389 445 135 139 禁用NETBIOS 以下关闭关口方式是通过修改注册表来完成关闭445端口-----445端口是一个毁誉参半的端口,他和139端口一起是IPC$***的主要通道。有了它我们可以在局域网中轻松访问各种共享文件夹或共享打印机&#xff0c…

创建https服务

1. 安装tomcat 在有jdk的基础上,安装一个新的tomcat(这一步看个人习惯) 2. 申请免费证书 keytool -genkey -alias tomcat -keyalg RSA -keystore /root/apache-tomcat-8.5.24-wechat/conf/.keystore #使用证书 申请免费SSL证书&#xff0c…

Docker骚操作五十五话之docker安装部署

文章目录前言一、全虚和半虚二、docker安装部署1、关闭防火墙2、安装依赖包3、安装docker-ce社区版4、开启docker5、设置镜像加速6、网络优化7、相关命令8、用于显示docker的系统级信息,比如内核,镜像数,容器数9、这里引申一些配置文件的内容…