高三数学备考冲刺140分问题42实际应用中的统计解答题(含解析)

问题42实际应用中的统计解答题 一、考情分析 概率统计在高考中扮演着很重要的角色,概率统计解答题是全国卷及多数省市高考数学必考内容,内容主要涉及古典概型、相互独立事件的概率、条件概率、二项分布、正态分布、频率分布直方图、回归分析、离散型随机变量的分布列、期望与方差的实际应用等.回顾近几年的高考试题,可以看出概率统计解答题,大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.该类问题阅读量一般比较大,但难度多为中等或中等偏易. 二、经验分享 1明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1. 利用分布列中各概率之和为1可求参数的值,此时要注意检验,以保证每个概率值均为非负数.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据. 2随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定. 3解决正态分布问题有三个关键点1对称轴x=μ;
2标准差σ;
3分布区间.利用对称性可求指定范围内的概率值;
由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0. 4判定两个变量正、负相关性的方法 ①画散点图点的分布从左下角到右上角,两个变量正相关;
点的分布从左上角到右下角,两个变量负相关. ②相关系数r0时,正相关;
r0时,正相关;

0时,负相关. 5 回归分析是处理变量相关关系的一种数学方法.主要解决①确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;
② 根据一组观测值,预测变量的取值及判断变量取值的变化趋势;
③ 求出线性回归方程.线性回归分析问题的类型及解题方法 ①求线性回归方程 利用公式,求出回归系数,或待定系数法利用回归直线过样本点的中心求系数. ②利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. ③利用回归直线判断正、负相关;
决定正相关还是负相关的是系数. 6回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强. 7比较几个分类变量有关联的可能性大小的方法 ①通过计算K2的大小判断K2越大,两变量有关联的可能性越大. ②通过计算|ad-bc|的大小判断|ad-bc|越大,两变量有关联的可能性越大. 8独立性检验的一般步骤 ①根据样本数据制成22列联表. ②根据公式计算K2的观测值k. ③比较k与临界值的大小关系,作统计推断. 三、知识拓展 四、题型分析 一 期望与方差的应用 数学期望反应的是随机变量取值的平均水平,而方差则是反应随机变量取值在其平均值附近的离散程度.现代实际生活中,越来越多的决策需要应用数学期望与方差这思想来对事件发生大小的可能性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.品种的优劣、仪器的好坏、预报的准确与否等很多问题都与这两个特征两量有关. 1若我们希望实际的平均水平较理想,则先求随机变量的期望,当时,不应认为它们一定一样好,需要用来比较这两个随机变量的方差,确定它们的偏离程度. 2若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近. 【例1】例3.7(2018新课标I卷理20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立. (1)记20件产品中恰有2件不合格品的概率为,求的最大值点. (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验 【分析】 利用独立重复实验成功次数对应的概率,求得,之后对其求导,利用导数确定其单调性,再求最大值点,注意;

2先根据第一问的条件,确定出,在解(i)的时候,先求件数对应的期望,之后应用变量之间的关系,求得赔偿费用的期望;
在解(ii)的时候,就通过比较两个期望的大小,得到结果. 【解析】 (1)20件产品中恰有2件不合格品的概率为.因此 . 令,得.当时,;
当时,. 所以的最大值点为. (2)由(1)知,. (i)令表示余下的180件产品中的不合格品件数,依题意知,,即.所以. (ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元. 由于,故应该对余下的产品作检验. 【点评】随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定. 【小试牛刀】【广东省江门市2019届第一次模拟】甲、乙两家外卖公司,其送餐员的日工资方案如下甲公司的底薪元,每单提成元;
乙公司无底薪,单以内(含单)的部分每单提成元,大于单的部分每单提成元,假设同一公司送餐员一天的送餐单数相同,现从两家公司各随机抽取一名送餐员,并分别记录其天的送餐单数,得到如下频数表 甲公司送餐员送餐单数频数表 乙公司送餐员送餐单数频数表 (1)若将大于单的工作日称为“繁忙日”,根据以上频数表能否在犯错误的概率不超过的前提下认为“繁忙日”与公司有关 (2)若将频率视为概率,回答下列两个问题①记乙公司送餐员日工资为(单位元),求的分布列和数学期望;
②小王打算到甲、乙两家公司中的一家应聘,你会推荐小王去哪家为什么 参考公式和数据 【解析】 (1)依题意得,公司与“繁忙日”列联表 , ,所以,能在犯错误的概率不超过的前提下认为“繁忙日”与公司有关 . (2)①设乙公司送餐员送餐单数为,则当时,,当时,,当时,,当时,,当时, . 所以,的所有可能取值为、、、、,的分布列为 . ②依题意,甲公司送餐员日平均送餐单数为 , 所以甲公司送餐员日平均工资为(元), 因为,故从更高收入角度考虑推荐小王去乙公司应聘;
因为乙公司比甲公司繁忙,故从工作闲适角度考虑推荐小王去甲公司应聘. 二正态分布的应用 正态分布随处可见,处处显现着他神秘的身影.对于某一件事或者某个要达到的目标,很多很多的个体发挥出来的水平大致上服从正态分布.也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中”束缚着整体的状态.对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的效果,不管是机器、工具还是我们人本身有的时候,超水平发挥了;
有的时候正常发挥;
有的时候又会发挥失常.这种东西应该也可以抽象为围绕期望水平的正态分布.而对于若干数据,包括发挥水平、排位情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去估计其他的分布情况.这是反向推导的过程.生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述.例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;
同一种生物体的身长、体重等指标;
同一种种子的重量;
测量同一物体的误差;
弹着点沿某一方向的偏差;
某个地区的年降水量;
以及理想气体分子的速度分量,等等. 【例2】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取个零件,并测量其尺寸(单位).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布. (1)假设生产状态正常,记表示一天内抽取的个零件中其尺寸在之外的零件数,求及的数学期望;

(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性;

(ⅱ)下面是检验员在一天内抽取的个零件的尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得,,其中为抽取的第个零件的尺寸,. 用样本平均数作为的估计值,用样本标准差作为的估计值,利用估计值判断是否需对当天的生产过程进行检查剔除之外的数据,用剩下的数据估计和(精确到). 附若随机变量服从正态分布,则,,. 【分析】 1先确定,再利用求期望;
(2)(i)判断监控生产过程的方法是否合理,可通过一天内抽取的个零件中,尺寸落之外概率的大小判断,(ii)剔除异常数据,在利用公式求和. 【解析】(1)由题可知尺寸落在之内的概率为,落在之外的概率为., , 由题可知,所以. (2)(i)尺寸落在之外的概率为,由正态分布知尺寸落之外为小概率事件,因此上述监控生产过程的方法合理. (ii),, ,因为, 所以需对当天的生产过程检查. 因此剔除,剔除数据之后. . 所以. 【点评】正态分布是概率统计中相对较独立的一个考点,且已经从冷点转化为热点,求解此类问题,一般从入手,对于应用问题,要注意从较大的阅读量中提取有用的信息.以下两类问题是正态分布中的基本问题 1利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1. 2利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于μ-σ,μ+σ,μ-2σ,μ+2σ,μ-3σ,μ+3σ中的哪一个. 【小试牛刀】【山东省济宁市2019届高三第一次模拟】某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组第一组[45,50,第二组[50,55,,第六组[70,75,得到如下图1所示的频率分布直方图,并发现这100人中,其体重低于55公斤的有15人,这15人体重数据的茎叶图如图2所示,以样本的频率作为总体的概率. I求频率分布直方图中的值;

II从全校学生中随机抽取3名学生,记X为体重在[55,65的人数,求X的概率分布列和数学期望;

III由频率分布直方图可以认为,该校学生的体重近似服从正态分布,其中若,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常并说明理由. 【解析】 解Ⅰ由图(2)知,100名样本中体重低于50公斤的有2人, 用样本的频率估计总体的概率,可得体重低于50公斤的概率为, 则, 在上有13人,该组的频率为0.13,则, 所以,即c0.07. Ⅱ用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在的概率为0.07100.7,随机抽取3人,相当于三次独立重复试验,随机变量X服从二项分布, 则, , , , 所以,X的概率分