学习任务1.了解2×2列联表、随机变量χ2的意义.(数学抽象)2.理解独立性检验中P(χ2≥xα)的具体含义.(数学抽象)3.掌握独立性检验的方法和步骤.(数据分析)4.通过典型案例,学习统计方法,并能用这些方法解决一些实际问题.(数学建模、数据分析)
必备知识·情境导学探新知01
任意抽取某市的一名学生,记A:喜欢长跑;B:是女生.(1)你能得出P(A),P(B),P(AB)这三者的准确值吗?(2)如果要判断A与B是否独立,该怎么办?
知识点1 数值变量与分类变量数值变量:数值变量的取值为____,其大小和运算都有实际含义.分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为________,分类变量的取值可以用____表示.实数分类变量实数
知识点2 列联表与等高堆积条形图(1)2×2列联表①定义:列出的两个分类变量的______,称为列联表.②2×2列联表,一般地,假设有两个分类变量X和Y,它们的取值分别为{0,1},其样本频数列联表为:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d频数表
最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n为样本容量.
(2)等高堆积条形图等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的____特征,依据______________的原理,我们可以推断结果.频率频率稳定于概率提醒 2×2列联表用于研究两类变量之间是否相互独立,它适用于分析两类变量之间的关系,是对两类变量进行独立性检验的基础.
知识点3 独立性检验(1)零假设:设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互为对立事件,故要判断事件{X=1}和{Y=1)之间是否有关联,需要判断假定关系H0:___________________________是否成立.P(Y=1|X=0)=P(Y=1|X=1)
(2)独立性检验的公式χ2=,其中n=__________,用随机变量χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.(3)临界值:对任何小概率值α,可以找到相应的正实数xα,使P(χ2≥xα)=α.称xα为α的临界值.临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大. a+b+c+d
(4)小概率值α的检验
2023-2024学年湘教版高中数学必修第二册 列联表与独立性检验..分类变量与列联表..独立性检验 课件