何为组间差异检验,即组间的差异分析以及显著性检验,应用统计学上的假设检验方法,检验组间是否有差异及其差异程度。根据数据类型可分为参数检验和非参数检验,但不管是参数检验还是非参数检验,都要基于特定的分布(t-分布,卡方分布,F-分布)来做假设检验。在分析前,我们先要检验数据是否符合该类型的分布,如果数据无法满足检验假设的情况不符合分布情况,则可以考虑选择使用非参数检验。
一般来讲我们的实验数据(生化环材)绝大多数服从正态分布,即使它并不严格服从正态分布,也可当做正态分布处理(我们可对数据进行正态性检验,判断是否服从正态分布)。这也就是说大部分人用的最多的还是参数检验,那么我们进行数据组间差异检验时,其方法可分为t检验、方差分析和卡方检验。本文内容也只局限于参数检验,关于非参数检验可自行查询资料如何理解非参数检验?。
t检验
t检验是一种适合小样本数据的统计分析方法,通过比较不同数据的均值,研究两组数据之间是否存在差异。
1. 单样本t检验
单样本t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布、总体标准差未知且样本量小于30时,样本平均数与总体平均数的离差(即差量)统计量呈t分布。
目的:①单个变量的均值与指定的检验值之间是否存在显著性差异;②样本均值与总体均值之间的差异显著性检验。
条件:①样本量n<15时,数据必须服从正态分布;②15≤n≤40时,只要数据不是呈现强偏态分布即可;③n>40时,均可适用。
基本用不上,操作很简单,具体流程详细参考SPSS中的单样本T检验
2. 独立样本t检验
独立样本t检验,检验两个独立样本的平均数与其各自所代表的总体的差异是否显著。
条件:服从正态分布;满足方差齐性;只适用两组数据间的比较,多组用方差分析
实例:研究超声和干燥的前处理方式对某活性成分提取率的影响。
步骤:分组导入数据,点击分析→比较平均值→独立样本t检验→定义分组变量→确定。
结论:不同前处理方式对活性成分提取率有显著影响。
详细步骤可参考(SPSS)独立样本的t检验 和三种T检验的详细区分
3. 配对样本t检验
配对样本t检验,用于检验匹配而成的两组被试获得的数据,或同组被试在不同条件下所获得的数据的差异性。这里的两组样本数据是匹配的,存在关联的(实验组与对照组的关系),并且两组样本量要相等。配对样本t检验可视为单样本t检验的扩展。
实例:为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表。试用数据处理软件分析电渗处理对草莓钙离子含量是否有显著影响?
步骤:首先对两组数据的差值进行正态性检验,然后进行配对样本t检验,点击分析→比较均值→成对样本t检验,转入配对变量→确定。
结论:电渗处理对草莓钙离子含量有显著影响。
具体操作请参考做配对样本T检验时,两组数据相关不显著怎么处理?和SPSS配对样本T检验步骤及结果分析(成对样本T检验)
方差分析
单因素方差分析/单因素ANOVA(【如何写论文系列之 SPSS数据分析】单因素方差分析 )
注:等重复和不等重复的单因素方差分析操作步骤相同
目的:分析研究对象的某项定量数据(因变量)在一个因素的多个水平下(三个及三个以上)是否存在差异性。
条件:单因素,多水平;服从正态分布;满足方差齐性。
实例:在一个化工过程中,预研究温度对产量的影响,将温度取5个水平,50℃、60℃、70℃、80℃、90℃,每个水平做三次试验,其数据如表所示,分析。
步骤:将温度和产量分两列导入spss中,点击分析→比较平均值→单因素ANOVA检验→选择因变量与自变量→选项中勾选“描述统计”和“方差齐性检验”,“事后比较“勾选邓肯→确定 or 分析→一般线性模型→单变量→选择因变量与自变量→选项中勾选“描述统计”和“方差齐性检验”→确定。
结论:单因素方差分析结果显示不同温度水平对产量有显著影响。
双因素方差分析
1. 双因素无重复方差分析
目的:分析两个独立因素对试验结果(因变量)的影响。
条件:两独立因素,至少两水平;服从正态分布;满足方差齐性。
实例:某厂现有化验员3人,担任该厂牛奶酸度(°T)的检验。每天从牛奶中抽样一次进行检验,连续10天的检验分析结果见表。试用软件分析3名化验员的化验技术有无差异,以及每天的原料牛奶酸度有无差异。
步骤:将数据导入SPSS,自变量A为一列(1,2,3, ...1,2,3...编号),B为一列(1,1,1;2,2,2;3,3,3...编号),因变量Y为一列。在变量视图中可更改变量的名称、值标签等。一般线性模型→单变量→选择因变量与自变量→模型中选择构建项,类型选择主效应→选项中勾选“描述统计”和“方差齐性检验”,“图“”将A,B选入水平轴和单独的线条,“EM平均值”→确定。
注:勾选描述统计可获得因子的“标准偏差”与“总和”,勾选方差齐性检验则可判断因子是否满足方差齐性,勾选事后比较或者EM平均值则能判断因子中各水平的差异,“图”则能直观判断因素间的交互作用。
结论:3名化验员的化验技术无显著差异,每天的原料牛奶酸度存在显著差异。
2. 可重复双因素方差分析
目的:分析两个因素及其交互作用对试验结果(因变量)的影响。
条件:两因素,至少两水平;服从正态分布;满足方差齐性。
实例:研究一个化学过程中反应浓度高低和是否用催化剂对于转化作用(产率)的影响。反应浓度是因子A,有15%和25%两个水平,催化剂设计使用与不使用两个水平,共有4个组合(A1B1,A1B2,A2B1,A2B2),每个组合作3次重复试验,试验结果见表,分析A、B、A×B的影响。
步骤:分三列(A,B,产率)输入数据,点击分析→一般线性模型→单变量→选择因变量与自变量→模型中选择全因子→选项中勾选“描述统计”和“方差齐性检验”,“图“”将A,B选入水平轴和单独的线条,“EM平均值”选入因素A,B→确定。
结论:反应浓度(A)高低和是否使用催化剂(B)对产率具有显著影响,但两者的交互作用对产率的影响不显著。
注:又分为等重复的双因素方差分析和不等重复的方差分析,spss操作相同。
3. 双因素重复测量方差分析(混合实验方差分析)
目的:指同一研究对象在不同条件下对同一观察指标进行多次重复观察或测量的设计方法,重复测量设计能收集更多的信息,还能有效地控制个体变异,提高效率,减少样本量。
条件:单因变量且为连续型变量,每个研究对象有2个以上的测量值;服从正态分布;满足方差齐性。
实操详见SPSS第十讲 | 两因素重复测量的方差分析(史上最全,做实验的看过来)和双因素重复测量的方差分析,写得很好了。
多因素方差分析
根据观测变量(即因变量)的数目,可以把多因素方差分析分为:单变量多因素方差分析(也叫一元多因素方差分析)与多变量多因素方差分析(即多元多因素方差分析)。
多因素方差分析,用于研究一个因变量是否受到多个因素的影响,它检验多个因素取值水平的不同组合之间,因变量的均值之间是否存在显著的差异。多因素方差分析既可以分析单个因素的作用(主效应),也可以分析因素之间的交互作用(交互效应),还可以进行协方差分析,以及各个因素变量与协变量的交互作用。
一元多因素方差分析
目的:考察多个自变量对该因变量的影响
条件:一个因变量,多个因素,至少两水平;服从正态分布;满足方差齐性。
实例:在一个压力容器中生产某种化学产品。研究因子对产品的过滤速度的影响。因子包括温度A、压力B、反应物浓度C和搅拌速度D,每个因子取两个水平,每个组合做一次试验。分析各因子以及两两互作对试验的影响。
步骤:分五列输入因素和因变量数据,点击分析→一般线性模型→单变量→选择因变量与自变量→模型中选择全因子→选项中勾选“描述统计”和“方差齐性检验”,“图“”将A,B,C,D选入水平轴和单独的线条,“EM平均值”选入因素A,B,C,D→确定。
结论:因子A、D及交互作用AC、AD对试验结果影响极显著,因子C影响显著,其余因子及交互作用影响不显著。由于B因子及其互作影响小,对于此情况可以考虑将B因子舍弃,只考虑因子A、C、D及其互作,原来B的两个水平下的观察值可以看成是两次重复观察,2^4设计变成2^3设计(带重复)。由于因子A、C、D及交互作用AC、AD对试验结果影响显著,所以有必要分析ACD之间交互作用对试验的影响。
多元多因素方差分析(多元方差分析)
研究多个自变量对多个数值型因变量的影响,适用于自变量对同时对两个或两个以上的因变量产生影响的情况,用来分析自变量取不同水平时这些因变量的均值是否存在显著性差异。
这个比较复杂,感兴趣的可以参考SPSS超详细操作:两因素多元方差分析(Two-way Manova) 和多元方差分析和多因素方差分析的区别 spss多元方差分析图怎么做,还有单因素多元方差分析可以参考SPSS教程:单因素多元方差分析(One-way MANOVA) 和SPSS单因素多元方差分析
注意
如果样本不满足正态性和方差齐性,怎么来分析组间差异性?
两种方法,一是选择非参数检验(独立样本)的Kruskal-Wallis 单因素ANOVA(成对比较)分析,或者使用校正了的F检验(welch、Games-Howell多重比较)。
详细参考方差不齐怎么办?还能不能做方差分析了?SPSS非参数检验 | Kruskal-Wallis 单因素分析
多重比较的方法的选择(使用条件和方差分析一致)
农林类试验一般选择Duncan法,组别较少的情况下(小于5组)各种方法区别很小,详细参考【温习统计学】均数间的多重比较的方法的选择
卡方检验
目的:卡方检验用于分析定类数据与定类数据之间的差异关系。
条件:两组或多组定类数据(独立样本四格表卡方检验较为常见),SPSS中默认使用pearson卡方,要求总样本量≥40,所有期望值的频率≥5。注意:当数据不符合时,需要使用yates或者Fisher校正卡方。
实例:有一调查以研究消费者对“有机”食品和常规食品的态度。在超级市场随机选择50个男性和50个女性消费者,问他们更偏爱哪类食品,结果见表。是分析消费者对“有机”及常规食品的态度与性别是否有关?
步骤:导入数据后点击数据→加权个案→将因变量转入频率变量→确定→关掉输出文档→再点击分析→描述统计→交叉表→将行、列、数据分别转入对应格内→统计量→勾选卡方检验→继续→确定。
结论:当最小期望计数>5,看第一个数;1-5,看第二个数;<1,看第三个数。本案例中最小期望计数为15.00>5,应该看第一个数,所以P值为0.029<0.05,表示男女消费者对两类食品有不同的态度。
评论 (0)