第五讲 Minitab在方差分析中的应用
董占山
(中国农科院棉花所,河南安阳455112)
这一讲我们首先学习几个MINITAB的方差分析命令,然后举例说明各种试验结果的模型确定方法、方差分析的MINITAB程序及计算结果解释。
一、方差分析命令
(一)单向分组资料的方差分析
1.AOVONEWAY
用法: AOVONEWAY C,...,C
功能: 对单向分组资料进行方差分析(AOV,
Analysis of Variance)。
说明:每个处理水平的资料占一列,至少应当有两列数据。该命令和ONEWAYAOV一样,只是资料的输入格式不一样。AOVONEWAY
可以作样本不相等资料的方差分析。
2.ONEWAYAOV
用法: ONEWAYAOV C, SUBS C [ RESIDUAL IN C [FITS
IN C]]
功能: 对单向分组资料进行方差分析(AOV,
Analysis of Variance)。
说明: ONEWAYAOV和AOVONEWAY的功能是一样的,它要求所有的试验数据放在一列中,在另一列中存放试验的处理水平。并且可以把残差和拟合值存储到指定的列中,其中拟合值为组内平均数,残差为观察值和组内平均值之差。
(二)两向分组资料的方差分析
用法: TWOWAYAOV C, C(行), C(列)
TWOWAYAOV C, SUBS C, C [RESIDUALS C [FITS C]]
子命令: ADDITIVE, MEAN
功能:
进行平衡设计的两向分组资料的方差分析。
说明:如果每个处理只有一个观察值或者使用了ADDITIVE子命令,
那么只计算因子的主效应,而忽略交互项,否则将包括主效应和交互效应。该命令的输出结果只包括方差分析表。子命令MEAN用来指出输出那个因子的平均数,每个MEAN子命令只能有一个参数。
(三)多因素方差分析
用法: ANOVA 模型
常用子命令: RANDOM, MEANS
功能:
进行多因素平衡设计或单因素的不平衡设计的方差分析。
说明:ANOVA可以估计所有的方差组成,计算均方值和进行F测验,也可以输出各因子和因子组合的平均值,由MEANS子命令后根因子及其组合列表来完成。
在ANOVA命令中可以使用如下的模型:
三因子交互式: ANOVA Y=A B C A*B A*C B*C A*B*C
三因子巢式: ANOVA Y=A B(A) C(A B)
交互和巢式: ANOVA Y=A B(A) C A*C B*C(A)
在上面的命令中,等号后面为选用的模型,因素的交互作用以“*”号说明,如A*B为A和B两因素的交互;以括号说明巢式,如B(A)为B包括在A内,C(A
B)为C包括在A和B中。模型的每个项目之间以空格分开。
在说明模型时,可以用竖线“|”简化交互式说明,如A|B代表A和B的主效应和其交互效应三项;用减号“-”表示删除某项。例如:
ANOVA Y=A B|C E 等效于 ANOVA Y=A B C B*C E
ANOVA Y=A|B|C - A*B 等效于 ANOVA Y=A B C A*C B*C
A*B*C
ANCOVA Y=A|B(A)|C 等效于 ANCOVA Y=A B(A) C A*C
B*C(A)
在ANOV中,可以包括多个因变量,如ANOVA Y1
Y2 Y3 = A B是有效的,它分别对Y1、Y2和Y3做方差分析。
二、单向分组组内样本数相等资料的方差分析
〖例1〗 用盆栽试验研究不同氮肥用量对小麦的效应,每种氮肥用量种4盆,完全随机试验设计,成熟时测定每盆小麦籽粒重(g),列于表5-1。试分析氮肥的效应。
表5-1 5种不同的氮肥用量对小麦籽粒产量的影响
N1 |
N2 |
N3 |
N4 |
N5 |
22 |
22 |
24 |
24 |
22 |
23 |
24 |
25 |
27 |
23 |
20 |
22 |
23 |
24 |
21 |
20 |
20 |
22 |
23 |
21 |
1、MINITAB程序
# 单向分组组内样本数相等
READ C1-C5
22 22 24 24 22
23 24 25 27 23
20 22 23 24 21
20 20 22 23 21
END
AOVO C1-C5
LET K1 = 2.1
LET K2=SQRT(K1/N(C1))
# End
2、MINITAB计算结果:
ANALYSIS OF VARIANCE
SOURCE DF SS MS F P
FACTOR 4 29.30 7.32 3.49 0.033
ERROR 15 31.50 2.10
TOTAL 19 60.80
INDIVIDUAL 95 PCT CI'S FOR MEAN
BASED ON POOLED STDEV
LEVEL N MEAN STDEV --+---------+---------+---------+----
C1 4 21.250 1.500 (------*-------)
C2 4 22.000 1.633 (-------*-------)
C3 4 23.500 1.291 (------*-------)
C4 4 24.500 1.732 (------*-------)
C5 4 21.750 0.957 (-------*------)
--+---------+---------+---------+----<
POOLED STDEV = 1.449 20.0 22.0 24.0 26.0
K1 2.10000
K2 0.724569 (S)
结果表明:不同氮肥用量小麦籽粒产量间的F=3.49,其概率值为0.033,小于0.05,所以施氮处理间存在着显著差异。由方差分析之后的各处理产量的平均值及其区间估计结果,初步可以看出处理4的产量显著地高于处理1、处理5的产量。
三、单向分组组内样本数不相等的方差分析
〖例2〗 随机取样调查4个棉花品种的单株结铃数,列于表5-2。试进行统计分析。
表5-2 棉花品种的单株结铃数(个)
品种 |
观察值 |
A1 |
12 10 14 16 12 18 14
12 18 |
A2 |
8 10 12 14 12 16 |
A3 |
14 16 13 16 10 15 14 |
A4 |
16 18 20 16 14 16 18
18 |
1、MINITAB程序:
# 单向分组组内样本数不相等
SET C1 # 品种A1
12 10 14 16 12 18 14 12 18
END
SET C2 # 品种A2
8 10 12 14 12 16
END
SET C3 # 品种A3
14 16 13 16 10 15 14
END
SET C4 # 品种A4
16 18 20 16 14 16 18 18
END
AOVO C1-C4
LET K1=N(C1)+N(C2)+N(C3)+N(C4)
LET K2=N(C1)**2+N(C2)**2+N(C3)**2+N(C4)**2
LET K3=(K1*2-K2)/K1/3
PRINT K3 # 联合自由度
LET K4=SQRT(5.92/K3)
PRINT K4 # 联合标准误
# End
2、MINITAB计算结果:
由于篇幅的限制,以后只列出新出现的或十分重要的计算结果,并照例给出结果的分析,以便读者练习时参照,检查自己的计算结果。
结果表明:不同棉花品种单株结铃数之间的F=5.13,其概率值为0.006,小于0.01,所以品种间存在着显著差异。
四、单向分组组内又分亚组资料的统计分析
〖例3〗 研究促麦黄不同浓度对小麦籽粒蛋白质含量的影响,共有4种处理:清水(CK)、0.5%、1.0%、1.5%(分别以A1,A2,A3,A4表示),小麦成熟时每处理从3个各不相同的小区取两个样本,分析籽粒蛋白质含量,其结果列于表5-3。试进行统计分析。
表5-3 促麦黄对小麦籽粒蛋白质含量(%)的影响
促麦黄浓度 |
小区 |
观察值 |
清水(CK)A1 |
1 |
10.3 |
11.2 |
2 |
11.2 |
10.5 |
3 |
9.8 |
9.2 |
0.5%A2 |
1 |
10.4 |
10.3 |
2 |
10.5 |
9.2 |
3 |
8.9 |
9.5 |
1.0%A3 |
1 |
8.8 |
8.2 |
2 |
8.2 |
9.4 |
3 |
8.3 |
8.0 |
1.5%A4 |
1 |
8.2 |
8.5 |
2 |
8.0 |
8.2 |
3 |
7.8 |
8.0 |
MINITAB程序:
# 单向分组组内又分亚组资料
SET C1
10.3 11.2
11.2 10.5
9.8 9.2
10.4 10.3
10.5 9.2
8.9 9.5
8.8 8.2
8.2 9.4
8.3 8.0
8.2 8.5
8.0 8.2
7.8 8.0
END
SET C2 # 小区编码
4(1:3)2
END
SET C3 # 处理编码
(1:4)6
END
ANOV C1=C3 C2(C3);
RAND C2.
# End
由于本试验中只有处理的区别,每个处理中小区是随机设置的,且完全包含在每个处理内部,所以选用了“处理
小区(处理)”的巢式模型,并设小区为固定因子。
请读者细心体会上面程序中,处理和小区的编码方式和输入格式,这对进行高效率的方差分析是致关重要的。在后面的许多程序中都会出现这种编码格式,通过多次的练习和细心体会,相信你能够掌握这一技巧。值得注意的是:所有的编码均是依据试验结果的输入顺序而定的,而非独立存在的。不同的结果输入顺序,编码的格式也不同。本例中,按程序中试验结果的输入顺序,处理的编码为1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4,采用简写格式为“(1:4)6”。
2、MINITAB计算结果:
FACTOR TYPE LEVELS VALUES
C3 FIXED 4 1 2 3 4
C2(C3) RANDOM 3 1 2 3
ANALYSIS OF VARIANCE FOR C1
SOURCE DF SS MS F P
C3 3 20.4483 6.8161 12.92 0.002
C2(C3) 8 4.2200 0.5275 2.19 0.107
ERROR 12 2.8900 0.2408
TOTAL 23 27.5583
ANOV命令不再自动给出每个因子的各个处理的平均值和区间估计,若希望获得这些数据,可以使用ANOV命令的子命令MEAN指定输出哪个因子的各处理的平均值。
结果表明:试验各处理之间的F=12.92,其概率值为0.002,小于0.01,说明促麦黄各处理水平之间籽粒蛋白质含量的差异已达到了极显著水平。
五、两向分组组合内有重复观察值资料的统计分析
〖例4〗 4个棉花品种、3种种植密度,每处理组合有2个观察值,其皮棉产量(斤/亩)列于表5-4所示。试进行统计分析。
表5-4
棉花品种与密度试验的皮棉产量结果(斤/亩)
品种 |
密度(株/亩) |
| |
3000 |
4000 |
5000 |
A1 |
102 |
140 |
180 |
130 |
162 |
172 |
A2 |
130 |
120 |
100 |
140 |
110 |
105 |
A3 |
105 |
120 |
125 |
92 |
115 |
135 |
A4 |
180 |
150 |
160 |
160 |
170 |
140 |
1、MINITAB程序:
# 两向分组组合内有重复观察值资料
SET C1
102 140 180
130 162 172
130 120 100
140 110 105
105 120 125
92 115 135
180 150 160
160 170 140
END
SET C2 # 品种编码
(1:4)6
END
SET C3 # 密度编码
8(1:3)
END
ANOV C1=C2|C3
# End
2、MINITAB计算结果:
结果表明:在该试验中,对皮棉产量而言,4个棉花品种之间存在极显著的差异(F=23.26,P=0.000),3个密度之间差异较小,未达到显著水平(F=1.52,P=0.258),但品种与密度之间的交互作用存在极显著的差异(F=7.51,P=0.002),说明一些品种适于密植,另一些品种适于稀植。
六、无次级样本的随机区组试验结果的统计分析
〖例5〗 有一个小麦品种比较试验,共有A1,A2(CK),A3,A4,A5,A6,A7,A8等8个品种,采用随机区组设计,重复3次,小区计产面积200平方尺,其产量结果见表5-5。试进行统计分析。
表5-5 小麦品种比较试验的产量结果(斤)
品种 |
区组 |
Ⅰ |
Ⅱ |
Ⅲ |
A1 |
10.8 |
12.3 |
13.5 |
A2(CK) |
12.8 |
11.8 |
12.9 |
A3 |
11.3 |
13.2 |
15.3 |
A4 |
10.1 |
9.8 |
12.2 |
A5 |
12.8 |
15.2 |
17.5 |
A6 |
11.1 |
12.1 |
8.9 |
A7 |
9.4 |
8.9 |
13.1 |
A8 |
10.5 |
12.3 |
10.8 |
1、MINITAB程序:
# 无次级样本的随机区组试验结果分析
SET C1
10.8 12.3 13.5
12.8 11.8 12.9
11.3 13.2 15.3
10.1 9.8 12.2
12.8 15.2 17.5
11.1 12.1 8.9
9.4 8.9 13.1
10.5 12.3 10.8
END
SET C2 # 品种编码
(1:8)3
END
SET C3 # 区组编码
8(1:3)
END
ANOV C1=C3 C2;
RAND C3.
# End
2、MINITAB计算结果:
结果表明:对该品种比较试验而言,品种间产量差异达到了显著水平(F=3.69,P=0.018),区组间差异不显著(F=3.51,P=0.058),但F值已经十分接近0.05显著水平,说明在该试验中区组对地力差异的控制作用还是比较有效的。
七、有次级样本的随机区组试验结果的统计分析
〖例6〗 有一甘薯品种比较试验,共有A1,A2,A3,A4等4个品种,其中A2为对照品种,采用随机区组试验设计,重复3次,收获时,每小区随机抽取两个样本测定其出丝率(%),结果见表5-6所示。试进行统计分析。
表5-6 不同甘薯品种的出丝率(%)
品种 |
区组 |
Ⅰ |
Ⅱ |
Ⅲ |
A1 |
23 |
21 |
23 |
22 |
22 |
24 |
A2 |
20 |
22 |
18 |
21 |
20 |
21 |
A3 |
24 |
23 |
22 |
22 |
20 |
25 |
A4 |
20 |
19 |
17 |
19 |
21 |
19 |
1、MINITAB程序:
# 有次级样本的随机区组试验结果分析
SET C1
23 21 23
22 22 24
20 22 18
21 20 21
24 23 22
22 20 25
20 19 17
19 21 19
END
SET C2 # 品种编码
(1:4)6
END
SET C3 # 区组编码
8(1:3)
END
ANOV C1=C3|C2;
RAND C3.
# End
2、MINITAB计算结果:
结果表明:对参加试验的4个甘薯品种的出丝率而言,品种间存在显著的差异(F=7.26,P=0.02),区组及品种与区组的互作均无显著差异。
|