spss卡方检验与相关分析ppt课件

第五章相关分析与检验 相关分析之一 有关与无关 寻找变量间的关系是科学研究的首要目的 变量间的关系最简单的划分即 有关与无关 在统计学上 我们通常这样判断变量之间是否有关 如果一个变量的取值发生变化 另外一个变量的取值也相应发生变化 则这两个变量有关 如果一个变量的变化不引起另一个变量的变化则二者无关 性别与四级英语考试通过率的相关统计 表述 统计结果显示 当性别取值不同时 通过率变量的取值并未发生变化 因此性别与考试通过率无关 自变量的不同取值在因变量上无差异 两变量无关 自变量的不同取值在因变量上有差异 两变量有关 统计结果显示 当性别取值不同时 收入变量的取值发生了变化 因此性别与月收入有关 变量关系的统计类型 相关分析之二 关系强度 变量关系强度的含义 指两个变量相关程度的高低 统计学中是以准实验的思想来分析变量相关的 通常从以下的角度分析 A 两变量是否相互独立 B 两变量是否有共变趋势 C 一变量的变化多大程度上能由另一变量的变化来解释 变量关系强度测量的主要指标 相关分析之三 关系性质 直线相关与曲线相关正相关与负相关完全相关与完全不相关 一 列联相关 第四章已讲 一 列联分析的基本原理自变量发生变化 因变量取值是否也发生变化 比较边缘百分比和条件百分比的差别 卡方测量用来考察两变量是否独立 无关 二 相关分析 Correlate 一 简介 相关分析用于描述两个变量间联系的密切程度 其特点是变量不分主次 被置于同等的地位 检验的原假设为相关系数为0 可选择是单尾检验还是双尾检验 在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令Bivariate过程 二变量相关分析 Partial过程 偏相关分析 Distances过程 距离分析 二 相关分析类型 Bivariate过程用于进行两个或多个变量间的相关分析 如为多个变量 给出两两相关的分析结果 Partial过程 当进行相关分析的两个变量的取值都受到其他变量的影响时 就可以利用偏相关分析对其他变量进行控制 输出控制其他变量影响后的相关系数 Distances过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析 一般不单独使用 而作为因子分析等的预分析 三 Bivariate相关分析 在进行相关分析时 散点图是重要的工具 分析前应先做散点图 以初步确定两个变量间是否存在相关趋势 该趋势是否为直线趋势 以及数据中是否存在异常点 否则可能得出错误结论 Bivariate相关分析的步骤 输入数据后 依次单击Analyze Correlate Bivariate 打开BivariateCorrelations对话框 BivariateCorrelations对话框 Pearson复选框选择进行积差相关分析 即最常用的相关分析 其计算连续变量或等间隔测度变量间的相关系数 计算该相关系数时 不仅要求两相关变量均为正态变量 而且样本数 N 一般不应少于30 Kendall stau b复选框计算Kendall s等级相关系数 其计算定序变量间的线性相关关系 有打结现象时 Spearman复选框计算Spearman相关系数 也是计算等级相关系数 定序与定序 最常用的非参数相关分析 秩相关 适用于连续等级资料 无打结现象 以上三种相关分析可以选择其中之一 也可以同时多选 如果参与分析的变量是连续变量 选择Kendall stau b或Spearman相关 则系统自动对连续变量的值先求秩 再计算其秩分数间的相关系数 Flagsignificantcorrelations用于确定是否在结果中用星号标记有统计学意义的相关系数 一般选中 此时P 0 05的系数值旁会标记一个 P 0 01的则标记两个 Options对话框 对每一个变量输出均值 标准差和无缺省值的观测数 对每一个变量输出交叉距阵和协方差距阵 计算某个统计量时 在这一对变量中排除有缺省值的观测值 对于任何分析 有缺省值的观测值都会被排除 一般 如果r的绝对值大于0 8 则认为两变量之间具有较强的线性相关关系 如果r小于0 3 则认为两变量之间具有较弱的线性相关关系 当然 相关关系的程度与样本的容量大小也有很大的关系 例1 为研究高等院校人文社会科学研究中立项课题数会受哪些因素影响 收集1999年31个省市自治区部分高校有关社科方面的数据 研究立项课题数 当年 与投入的具有高级职称的人年数 上年 发表论文数 上年 之间是否具有较强的线性关系 可以画散点图先进行判断 Graphs legacy scatter Analyze correlate Brivariate 例2 定序变量的Spearman分析实例为了研究集团迫使个人顺从的效应 一些研究者用量表和为测量地位欲而设计的一种量表对12名大学生进行调查 欲知道对权威主义的评分之间相关的信息 数据如下 权威主义和地位欲评秩 1 输入数据 依次单击Analyze Correlate Bivariate 打开BivariateCorrelations对话框2 选择power和position变量进入Variables框中 3 在CorrelationCoefficients栏内选择Spearman 4 在TestofSignificance栏选择Two tailed 5 选择Flagsignificantcorrelation 6 单击Options按钮 选择Meanandstandarddeviations Cross productdeviationsandcovariances Excludecasespairise选项 7 单击OK 分析步骤 从表中可看出 权威主义和地位欲的相关系数为0 818 这表明权威主义越高的人地位欲也越高 权威主义与地位欲不相关的假设检验值为0 001 否定假设 即权威主义与地位欲是相关的 结果分析 例3 定序变量的Kendall分析实例 仍用前例中的数据 数据文件 权威 Spearman相关 sav 操作过程相同 只是在第3 步在CorrelationCoefficients栏内选择Kendall s选项 结果如下 权威主义和地位欲的相关系数为0 667 这表明权威主义越高的人地位欲也越高 权威主义与地位欲不相关的假设检验值为0 003 否定假设 即权威主义与地位欲是相关的 结果类似于Spearman分析 四 Partial过程 相关分析计算两个变量间的相关系数 分析两个变量间线性关系的程度 但是往往因为第三个变量的作用 使相关系数不能真正反映两个变量间线性程度 例如 可以控制年龄和工作经验两个变量的影响 估计工资收入与受教育程度之间的相关程度 这就是偏相关分析 例 立项课题数与发表论文数之间的净相关系数研究 立项课题数与发表论文数之间有较强的正线性相关系数 但是 这种关系可能掺入了投入高级职称的人年数的影响 投入高职称的人年数与论文数 上年发表 立项课题数的简单相关系数分别为0 953和0 944 因此 可以把这个变量控制起来 研究立项课题数与发表论文数之间的净相关系数 进行偏相关分析 Variables框 用于选入需要进行偏相关分析的变量 至少需要选入两个 可多选 Controllingfor框 用于选择需要在偏相关分析时进行控制的协变量 如果不选入 则进行的就是普通的相关分析 Displayactualsignificincelevel复选框 用于确定是否在结果中给出确切的P值 一般选中 Options钮 Zero ordercorrelations给出包括协变量在内所有变量的相关方阵 说明 上年发表的论文数对当年的立项课题数的线性影响非常弱 前面的是属于虚假相关 上机作业五 1 以实验3中保存的 数据8 sav 为例 完成以下任务 求出性别与工资等级的列联表 要求按性别输出百分比 求出相关系数 并进行卡方检验 理解所得结果 2 对居民储蓄数据中的多选项进行列联表分析 要求先定义多选项变量集 用分类法做频数分析 再选择一个变量 做列联表分析 3 试以spss自带的某一个数据文件为例 建议使用1991U S GeneralSocialSurvey数据 进行分析 了解变量是否相关 发掘数据中变量间的规律性