文本描述
六西格玛统计工具介绍(二)
——2014年2月
精益六西格玛理论体系全景图
客户
流程描述
控制计划
测量系统
控制
过程能力
分析
多变量
分析
实验设计
VoC分析
失效模式分析
流程图
(I/O)
因果矩阵
统计过程
控制
定性分析
定量分析
头脑风暴+KJ
失效树
鱼骨图
Why-Why分析
PFMEA
对标分析
访谈
现场调研
流程观察
……
回归分析
软件使用
项目管理
精益六西格玛意识
统计基础
精益工具
基本图表
精益六西格玛持续改进体系
精益六西格玛推行综合管理
课程大纲
假设检验概述
相关与回归
统计基础-数据类型
计数型数据(离散型数据,属性型数据):通常表示事物的分类
不良品数量/不良率
缺陷品数量/缺陷率
机器 A, 机器 B, 机器 C
白班/中班/夜班
计量型数据 (连续型数据):通常是通过测量仪器测量得到的数据
压力
时间
长度
重量
目录
假设检验相关基础概念
总体参数及样本统计量
推定
置信区间
假设检验介绍
目的与意义
假设检验概念介绍
假设检验原理
假设检验步骤
假设检验常见路径
双样本T 与配对T的区别
讨论及问答
假设检验相关基础概念
总体参数与样本统计量
s
= 样本标准差
X
= 样本平均值
?
?
参数 估计 统计量
= 总体平均值
= 总体标准差
抽样(Sampling)
A
A
B
D
D
D
C
C
C
C
B
标本
估计的概念
点估计:通过抽样用一个具体的值估计总体的参数
举例:通过抽样调查中秋月饼的保质期是3个月
点估计的种类:平均的估计、标准差、方差的估计、比率的估计等
区间估计:通过抽样用一个具体的值估计总体的参数
举例:通过抽样调查中秋的月饼的保质期是1-6个月
置信区间
置信区间的概念(Confidence Interval)
误差是α,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1- α )%
置信水平(Confidence Level)
是指区间估计时,能够包含总体参数的能力水平,即1- α 。
置信区间
90%的置信区间举例如下图
如下图总体平均为μ,连续抽取10个样本,其中有一个样本不包含总体平均
95%置信区间的解释:
大约100个置信区间中有95个会包含总体参数, 或者
我们有95%的把握确定总体参数在置信区间内
通常我们计算95%的置信区间
置信区间
置信区间的计算
通用公式:
置信区间C.I.=统计量±K*S(标准偏差)
统计量=平均值、方差、Cp等
K=统计分布常数
正态分布的置信区间公式( σ 知道的时候):
样本的置信区间公式(σ不知道,只能计算S):
样本的平均遵循t分布
置信区间
Minitab中置信区间的计算
这些都可以计算出置信区间
假设检验
假设检验的目的
假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。
是为了解决选择的困难性
假设检验的意义
用统计的方法,通过数据进行客观的判断
把我决策的风险,提高决策水准
假设检验是我们政府部门最需要的工具之一。
假设检验
假设检验的概念
对观测的样本欧亿·体育(中国)有限公司分析后对总体差异的估计
是作出选择与否判断的统计性方法
假设检验术语
假设设定:对要进行判断的情况进行假设设定
H0 -Null Hypothesis:说明没有变化或者差异的设定
Ha- Alternative Hypothesis:说明有变化或者差异的设定
假设设定练习:
为了确认小学生男女身高是否有差异
为了确认小学生男生比女生高
为了确认小学生身高和性别是否有相关性
假设检验
假设检验的种类
单边检验 One-sided hypothesis
双边检验 Two-sided hypothesis
假设检验的两种错误
第1种 错误 (TypeⅠError, α-风险)
不顾Null Hypothesis 真实. Null Hypothesis放弃的错误
把良品判断为不良的时候(误判)
既, 可以说生产者危险
1-α 就是置信区间
第2种 错误 ( TypeⅡError, β-风险) :
不顾Null Hypothesis 假的. Null Hypothesis接受的错误
不良品当成良品的时候( 漏失 )
即, 可以说顾客危险
1-β 是检定力,即检出能力
假设检验的两种错误说明
假设检验的两种错误举例
陪审团的判决
他无罪
事实
实际清白
他有罪
实际有罪
正确
正确
清白的人进监狱
罪犯逍遥法外
I类错误
(α-风险)
II 类错误
(β-风险)
假设检验
假设检验原理
假设检验其实是个比较的过程
两种假设的比较,是A还是B?
我们总是用H0 来说话
我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0
放弃H0 的决策不会总是正确的 ,任何决定都会有风险
但风险的高低及严重度,会影响我们决策
于是我们很急切的指导,我们做出放弃H0 的决策的风险有多大?
于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险的大小就是我们长见的 P值(P-value)
假设检验
假设检验原理(续)
知道了做出放弃H0 的决策的风险的大小,那么风险小于多少时我们才敢于做出放弃H0 的决策呢?
于是我们需要提前设定一个风险判断标准α 而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01 、0.05、0.1 等
但我们通常设定α 为0.05
这也就是我们通常拿P值和0.05 进行大小比较的原因。
如果P>0.05 接受H0; P<0.05 放弃H0 (P Low H0 Go)
理解练习
为什么正态检验,等方差检验P要大于0.05?