2020届高考数学一轮复习讲解与练习,10.3变量间的相关关系与统计案例理,新人教A版.docx

2020届高考数学一轮复习讲解与练习 10.3变量间的相关关系与统计案例理 新人教A版 [备考方向要明了] 考 什 么怎 么 考1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验只要求22列联表的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.高考对本节内容的考查主要是线性回归分析和独立性检验的统计分析方法,三种题型都有可能出现,难度中档,如2020年湖南T4,辽宁T19等. [归纳知识整合] 1.两个变量的线性相关 1正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. 2负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. 3线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. [探究] 相关关系和函数关系有何异同点 提示1相同点两者均是指两个变量的关系. 2不同点函数关系是一种确定的关系,而相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 2.回归方程 1最小二乘法 求回归直线使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. 2回归方程 方程=x+是两个具有线性相关关系的变量的一组数据x1,y1,x2,y2,,xn,yn的回归方程,其中,是待定参数. 3.残差分析 1残差对于样本点x1,y1,x2,y2,,xn,yn,它们的随机误差为ei=yi-bxi-a,i=1,2,,n,其估计值为i=yi-i=yi-xi-,i=1,2,,n,i称为相应于点xi,yi的残差. 2相关指数R2=1-, R2越大,意味着残差平方和越小,即模型的拟合效果越好;
R2越小,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好. 4.独立性检验 1分类变量变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. 2列联表列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表称为22列联表为 22列联表 y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=其中n=a+b+c+d为样本容量,则利用独立性检验判断表来判断“X与Y的关系”. [自测牛刀小试] 1.下列结论正确的是 函数关系是一种确定性关系;

相关关系是一种非确定性关系;

回归分析是对具有函数关系的两个变量进行统计分析的一种方法;

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A. B. C. D. 解析选C 由回归分析的方法及概念判断. 2.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y=0.95x+a,则a= x0134y2.24.34.86.7A.3.25 B.2.6 C.2.2 D.0 解析选B =2,=4.5,因为回归方程经过点,,所以a=4.5-0.952=2.6. 3.工人月工资y元关于劳动生产率x千元的回归方程为y=650+80 x,下列说法中正确的个数是 劳动生产率为1 000元时,工资为730元;

劳动生产率提高1 000元,则工资提高80元;

劳动生产率提高1 000元,则工资提高730元;

当月工资为810元时,劳动生产率约为2 000元. A.1 B.2 C.3 D.4 解析选C 将数据代入方程计算可判断正确. 4.一位母亲记录了自己儿子3~9岁的身高数据略,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是 A.身高一定是145.83 cm B.身高在145.83 cm以上 C.身高在145.83 cm左右 D.身高在145.83 cm以下 解析选C 用回归模型=7.19x+73.93,只能作预测,其结果不一定是一个确定值. 5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 A.若K2的观测值为k=6.635,我们有99的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病 B.从独立性检验可知,有99的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99的可能患有肺病 C.若从统计量中求出有95的把握认为吸烟与患肺病有关系,是指有5的可能性使得推断出现错误 D.以上三种说法都不正确 解析选C 根据独立性检验的思想知. 相关关系的判断 [例1] 在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表 身高cm143156159172165体重kg4149617968身高cm171177161164160体重kg6974696854根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系. [自主解答] 以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示. 由散点图可知,两者之间具有相关关系,且为正相关. 利用散点图判断相关关系的技巧 1在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量间的关系,即变量之间具有函数关系. 2如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系. 3如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 1.变量X与Y相对应的一组数据为10,1,11.3,2,11.8,3,12.5,4,13,5;
变量U与V相对应的一组数据为10,5,11.3,4,11.8,3,12.5,2,13,1.r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则 A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1 解析选C 对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r10;
对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,所以有r206.635. 有99的把握认为“两个年级学生对紧急避险常识的了解有差异”. 1种求法相关关系的判定和线性回归方程的求法 1函数关系一种理想的关系模型,而相关关系是一种更为一般的情况. 2如果两个变量不具有线性相关关系,即使求出回归直线方程也毫无意义,而且用其进行估计和预测也是不可信的. 3回归直线方程只适用于我们所研究的样本的总体.样本的取值范围一般不超过回归直线方程的适用范围,否则就没有实用价值. 1个难点独立性检验思想的理解 独立性检验的思想类似于反证法,即要确定“两个变量X和Y有关系”这一结论成立的可信度,首先假设结论不成立,即它们之间没关系,也就是它们是相互独立的,利用概率的乘法公式可推知,ad-bc接近于零,也就是随机变量K2=应该很小,如果计算出的K2的观测值k不是很小,通过查表PK2≥k0的概率很小.又根据小概率事件不可能发生,由此判断假设不成立,从而可以肯定地断言X与Y之间有关系. 答题模板概率与统计的综合问题 [典例] 2020辽宁高考改编满分12分电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性. 1根据已知条件完成下面的22列联表,并据此资料判断是否有95的把握认为“体育迷”与性别有关 非体育迷体育迷合计男女合计 2将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率. 附K2=, PK2≥k0.050.01k3.8416.635 [快速规范审题] 第1问 1.审条件,挖解题信息 观察条件100名观众收看节目时间的频率分布直方图及日均收看时间不低于40分钟的观众称为体育迷,女体育迷10名非体育迷及体育迷人数 2.审结论,明确解题方向 观察所求结论完成22列联表并判断“体育迷”与性别的相关性确定a,b,c,d及K2的值 3.建联系,找解题突破口 由直方图及条件确定体育迷与非体育迷人数→完成列联表→计算K2可判断结论 第2问 1.审条件,挖解题信息 观察条件→确定“超级体育迷”标准且有2名女性“超级体育迷”确定“超级体育迷”的人数 2.审结论,明确解题方向 观察结论→从“超级体育迷”中任取2人求至少有1名女性观众的概率1名女性观众或两名女性观众 3.建联系,找解题突破口 由频率分布直方图确定“超级体育迷”的人数所有基本事件并计数为n和至少有1名女性的基本事件,计数为m求概率[准确规范答题] 1由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成22列联表如下 非体育迷体育迷合计男301545女451055合计7525100忽视直方图纵轴表示为导致每组人数计算失误.3分 K2的计算不准确、导致结果判断出错.将22列联表中的数据代入公式计算,得K2==≈3.030.因为3.030<3.841,所以我们没有95的把握认为“体育迷”与性别有关.6分 1.“超级体育迷”人数计算错误导致失误. 2.由5人中任取2人列举出所有可能结果时重复或遗漏某一情况导致失误.2由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件为a1,a2,a1,a3,a2,a3,a1,b1,a1,b2,a2,b1,a2,b2,a3,b1,a3,b2,b1,b2,其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.9分 由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A为a1,b1,a1,b2,a2,b1,a2,b2,a3,b1,a3,b2,b1,b2,11分 由7个基本事件组成,因而PA=.12分 [答题模板速成] 解决概率与统计的综合问题的一般步骤 第一步第二步第三步第四步第五步第六步理清题意,理解问题中的条件和结论.尤其是直方图中给定的信息,找关键量由直方图确定所需的数据,列出22列联表利用独立性检验的步骤进行判断确定基本事件总数及所求事件所含基本事件的个数利用概率公式求事件的概率反思回顾、检查关键点易错点及答题规范 一、选择题本大题共6小题,每小题5分,共30分 1.下列关系中,是相关关系的为 学生的学习态度与学习成绩之间的关系;

教师的执教水平与学生的学习成绩之间的关系;

学生的身高与学生的学习