2019-2020年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用例题与探究新人教A版选修.doc

2019-2020年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用例题与探究新人教A版选修 典题精讲 【例1】下列关于三维柱形图和二维条形图的叙述正确的是 A.从三维柱形图可以精确地看出两个分类变量是否有关系 B.从二维条形图中可以看出两个变量频数的相对大小,而从三维柱形图中无法看出相对频数的大小 C.从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 思路解析三维柱形图和二维条形图都是反映两个变量频数大小的图形,从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系. 答案C 绿色通道三维柱形图和二维条形图是列联表的直观反映,从中可以看出两个分类变量频数的相对大小,进而粗略地看出两个变量是否有关系,再进行证明并分析它们之间有关系的可信度,这就是独立性检验的基本思路. 变式训练 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H1即两个分类变量有关系成立的可能性就__________________________. 思路解析主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H1成立的可能性就越大. 答案越大 【例2】在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示 分数段 午休的考生成绩 不午休的考生成绩 2940 23 17 4150 47 51 5159 30 67 6070 21 15 7180 14 30 8190 31 17 91100 14 3 1请根据上述表格完成列联表. 及格人数 不及格人数 总计 午休 不午休 总计 2根据列联表可以得出什么样的结论对今后的复习有什么指导意义 思路分析要正确给出列联表,首先要把表中的数据进行统计,分别计算出午休和不午休时对应的及格及不及格人数,然后填入相应表格即可;根据列联表可以粗略判断出变量之间是否有关系. 解1根据表中数据可以得出列联表中的数据如下 及格人数 不及格人数 总计 午休 80 100 180 不午休 65 135 200 总计 145 235 380 2计算可知,午休的考生及格率为P1,不午休的考生及格率为P2,显然P1>P2. 因此,可以粗略判断午休对考生考试及格有关系,并且午休的及格率高,所以,在以后的复习中考生应尽量适当午休,以保持最佳的学习状态. 绿色通道列联表是对数据的一种简单统计,也是对数据的一种整理,在列联表中可以看出每种变量对应的数据的频数和总计数量,进而可以计算对应变量的频率,再用频率代替概率,可以粗略估计两个分类变量是否有关系. 黑色陷阱列联表是对相应数据频数的统计,在判断两个分类变量是否有关系时不是看频数的大小,而是要结合列联表计算出频率,再对变量的关系进行估计,否则可能得出错误的结论;根据列联表进行的判断只是对两个变量之间的粗略估计,有时候可能是错误的,所以,还要进一步判断,否则也可能得出错误的结论. 变式训练 用A和B两种药物各治疗9个病人,结果如下 痊愈 未愈 合计 A药 7 2 9 B药 2 7 9 合计 9 9 18 问两种药物的疗效有无显著差别并判断它们之间在多大程度上有差别. 思路分析首先从列联表观察可以看出A药的治愈率要高些,所以,可以粗略估计两种药物的疗效有区别,然后根据独立性检验的方法进行证明,并验证多大程度上存在差别. 解根据列联表可以看出,使用A药的9个人中痊愈了7个,而使用B药的9个人中痊愈了2个,因此使用A药痊愈的概率高于B药,所以,可以粗略估计两种药是有区别的. 为了估计这两种药的区别程度,用字母代替列联表中的数据,可得关于字母的列联表 痊愈 未愈 合计 A药 a b ab B药 c d cd 合计 ac bd abcd 构造随机变量K2, 其中nabcd, 把数据代入可得K2≈5.56,查表可知,PK2≥5.0240.025,也即认为这两种药有区别的可信度为1-0.0250.975,即可信度为97.5. 【例3】为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表 患病 未患病 合计 服用药 10 45 55 未服用药 20 30 50 合计 30 75 105 试用三维柱形图分析服用药和患病之间是否有关系 思路分析首先根据条件画出三维柱形图,再根据柱形图所具有的特点即可进行判断. 解根据列联表所给出的数据可得对应的三维柱形图如下图所示 主对角线上两个柱形的高a与d的乘积ad1030300与副对角线上两个柱形的高b与c的乘积bc2045900相差很大,因而服用药和未服用药对患病有很大的影响. 绿色通道在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形高度的乘积相差越大,H1即两个分类变量有关系成立的可能性就越大.这是根据三维柱形图判断两个分类变量的重要依据,但是这只能粗略判断它们之间有关系,具体有多大把握是不能判断的. 变式训练 请把变式训练2的列联表转化成对应的条形图包括痊愈、未愈及总计内容. 思路解析对应的条形图可以采用直接描绘的方法,也可以借助EXCEL软件进行绘图. 答案结果如下 问题探究 问题1列联表、三维柱形图及二维条形图是对数据直观描述的三种方法,那么,它们分别具有什么特点,各反映了数据之间的哪些特征 导思列联表、三维柱形图及二维条形图是根据数据绘制的三种不同图表,可以从不同的侧面加强对数据的认识,通常把这几种图表结合起来更能加深对数据特征的认识. 探究列联表是两个分类变量的频数表,通过列联表可以粗略估计两个变量数据的差异性;而三维柱形图和二维条形图是在列联表的基础上对数据的整理,它们能从直观上更清晰地反映两个分类变量各个频数的相对大小,三维柱形图从不同侧面都可以看出两个分类变量所占比例的大小,加强对比例关系的进一步认识,二维条形图相对来说比三维柱形图要简单些,但是三维柱形图也可以更详细地表示分类变量对应数据所占比例,为了更清晰地表示分类变量之间的关系,还可以绘制数据的等高条形图,通过颜色深浅的不同可以使人们从心理上加深对两种变量关系的认识,从心理上理解两个分类变量可能具有的某种关系.通常把这几种图表结合起来才能深刻认识两个分类变量之间的关系. 问题2独立性检验中有一个重要的步骤就是设随机变量,那么,随机变量的作用是什么设随机变量的基本原则是什么 导思独立性检验实际上体现了对分类变量关系从感性到理性认识的过程,而对随机变量的分析就是从感性到理性的一种过渡,通过随机变量概率的计算可以从数的角度加深对我们得出的结论可信度的认识. 探究数据的列联表和三维柱形图及二维条形图可以从直观上显示两个分类变量之间的某种关系,但是这个关系缺少理论依据,是一种简单的统计结果,这种统计结果是一种不确定的结果,有时候甚至可能是一种错误的结论,因此就需要对这种关系的确定性进一步判断,这就需要设随机变量,通过对随机变量的概率进行计算和对比理解这种关系的可能性,从而实现从感性认识到理性认识的飞跃,这就是设随机变量的作用. 设随机变量首先把列联表所提供的数据进行抽象,抽象成字母,这些字母分别表示两个分类变量的频数,进而计算相应的频率,用频率近似代表概率,得出概率的近似值,建立相应的关系式,通过统一的评判标准使用随机变量对应的概率值建立相应的关系式,通过关系式判断这种关系存在的可能性的大小.