文本描述
卡方检验( Chi-square-Test )
Define
Measure
Analyze
Improve
Control
Step 8- Data 分析
Step 9- Vital Few X’的选定
Multi Vari
Central limit
Hypothesis testing
Confidence interval
ANOVA, T-test
Chi-square
Correlation,regression
Step 7- Data 收集
路径位置
目 标
介绍无关性Χ2 -检验的基本概念
把无关性Χ2 -检验和 MAIC 路径联系起来
记住这个例题?
人事部想调查人的年龄(年老和年轻)和被雇佣与否之间是否有关联
什么是 Y ? _____________ 数据类型 ? ___________
什么是 X ? _____________ 数据类型 ? ______________
你将采用什么类型的工具 ? ________________________
被雇佣
未被雇佣
年老
30
45
150
230
数据
年轻
合计
合计
75
380
455
275
180
在此你如何做出判断?
Ho: 数据是无关的 (没有关联)Ha: 数据是相关的 (有关联)
假设
根据无关性Χ2-检验, 统计学家假设在现实生活中绝大部分变量之间是无关的,因此:
如果 P 值 <0.05 , 就推翻 Ho
理论
让我们查看一下我们的例子….
假设我们要决定 年龄 和 雇佣实际 相关或不相关,(独立或不独立)因而我们的假设描述如下...
Ho: 年龄 和雇佣实际 不相关(独立)
Ha: 年龄 和 雇佣实际 相关(不独立)
我们必须建立一个观察频率表,把我们的两个变量分
成两个等级。
年龄: 年老 & 年轻
雇佣实际: 雇佣 &不雇佣
然后我们收集数据来进行分析.
被雇佣
未被雇佣
年老
30
45
150
230
年轻
步骤#1
计算列和行的合计
被雇佣
未被雇佣
年老
30
45
150
230
年轻
步骤#2
被雇佣
未被雇佣
年老
年轻
步骤#3
建立一个 观察频率表.也就是说, 如果这2个因素真的不相关,
这个表会显示出什么?
我们应该怎么做?
步骤 #3 (继续)
建立一个 期望频率表. 也就是说, 如果这2个因素真的不相关,
这个表会显示出什么?
被雇佣
未被雇佣
年老
= 29.6
___
___
___
年轻
合计
合计
75
380
455
275
180
75
x 180
455
步骤 #3 (继续)
被雇佣
未被雇佣
年老
29.6
___
___
___
年轻
合计
合计
75
380
455
275
180
如果这两个因素真的不相关,29.6 正是我们所期望的
你做完了这个表格!
150.3
45.3
229.7
步骤 #4
被雇佣
未被雇佣
年老
___
___
___
年轻
合计
合计
75
380
455
275
180
从观察值中减去期望值
(O-E)
你做完了这个表格!
30-29.6=.4
-0.3
-0.3
0.3
步骤 #5
被雇佣
未被雇佣
年老
___
___
___
年轻
合计
合计
75
380
455
275
180
将差值平方
(O-E)^2
你做完了这个表格!
(.4)*(.4)=.16
.09
.09
.09
步骤#6
被雇佣
未被雇佣
年老
___
___
___
年轻
合计
合计
75
380
455
275
180
计算相对的差值的平方
(O-E)^2 / E
你做完了这个表格!
.16 / 29.6 = .005
.0006
.002
.0004
所以怎么样?
相对的方差的和是一个Χ2分布!
如果不相关,我们期望这个差值接近于0。随着我们做得越来越深入,这两个变量看起来就越像相关了。为了帮助我们作出这个判断,我们将依靠P值。
Χ2 无关性检验
分析路径
收集数据
运行 Minitab
表格 卡方检验 命令
评价 P 值
检查偶然性
表格
作出结论
用 Minitab 分析数据
卡方检验: Hired, Not
在观测计数下方给出的是期望计数
在期望计数下方给出的是卡方贡献
Hired Not 合计
1 30 150 180
29.67 150.33
0.004 0.001
2 45 230 275
45.33 229.67
0.002 0.000
合计 75 380 455
卡方 = 0.007, DF = 1, P 值 = 0.932
用 Minitab 分析数据
注意:
观测值和期望值与刚才的计算结果是相同的
你将做出什么样的判断?
一个 P-值 !
另外一个例子 . . .
你将作出什么判断?
被雇佣
未被雇佣
年老
45
45
135
230
年轻