编程技术、软件应用与系统模拟

(Programming, Applicaiton and Simulation)



本站目录

 

首页
ASP/Access/IIS
DELPHI/PASCAL
PASCAL高级编程
C语言编程实例
WORD
Excel
MATLAB
MINITAB讲座
Windows
DOS
SAS
生物系统模拟
土壤水分剖析器
其他



镜像站点

 

主站
北美镜象站
欧洲镜象站(1)
欧洲镜象站(2)

本站 Google

[搜索]  [站内导航]
座右铭:
只做有益人类的事
不做有害人类的事


第九讲 MINITAB在非参数测验中的应用

董占山

(中国农科院棉花所,河南安阳,455112)

通常的统计方法,如t测验、F测验等,其总体的分布或者已知,或者可以假定为近似正态分布。但是,如果所研究的总体的分布未知也不能假定为正态分布,就不能用常规的统计方法,这种情况下就要用非参数测验方法。一般来说,非参数测验包括符号测验、秩和测验和游程测验。下面先介绍MINITAB的非参数测验命令及其具体应用实例。

一、命令介绍

(一)符号测验命令

1 假设测验

用法:STEST [中位数=K] C,...,C

子命令:ALTERNATIVE

功能:对每列进行无效假设为H0:中位数μ=K的符号测验。

说明:如果没有指明K值,那么假定K=0;如果不使用ALTERNATIVE子命令,被择假设为HA:μ≠K。如果ALTERNATIVE = -1,那么被择假设为μ<K;如果ALTERNATIVE=1,那么被择假设为μ>K。在这两种情况下,均进行一尾测验。

2 区间估计

用法:SINTERVAL [置信概率K] C,...,C

功能:计算每列数据的符号测验的置信区间;

说明:如果没有指明K值,使用95%的置信区间。

3 多组数据的符号测验

用法:MOOD C(数据),C(数据指标) [(残差)C [(拟合)C]]

功能:测验多组数据具有相同的中位数的无效假设,与ONEWAY命令相似。

说明:该命令假设各个样本是来自同一个总体的随机样本。第一列含有所有的观察数据,第二列中指明每个数据属于哪一组,在该命令中还可以给出附加列,用来存储残差和拟合值。

(二)秩和测验命令

1 WTEST

用法:WTEST [中心值K] C,...,C

子命令:ALTERNATIVE

功能:对每列做单样本Wilcoxon秩和测验。

说明:无效假设H0:中心值=K,被择假设为HA:中心值≠K。如果K值没有给定,那么假定K=0。如果ALTERNATIVE=-1,那么被择假设为中心值<K;如果ALTERNATIVE=1,那么被择假设为中心值>K。在后两种情况下,均进行一尾测验。

2 WINT

用法:WINTERVAL [置信度K] C,...,C

功能:对每列做单样本置信区间估计。

说明:与它相关的命令是WTEST。

3 MANN-WHITNEY

用法:MANN-WHITNEY [置信度K] C and C

子命令:ALTERNATIVE

功能:进行成组数据样本中位数差数的秩和测验(也叫Mann-Whitney-Wilcoxon测验)。

说明:这条命令同时进行置信区间的估计。

4 KRUSKAL-WALLIS

用法:KRUSKAL-WALLIS C, C

功能:Kruskal-Wallis测验是Mann-Whitney-Wilcoxon测验的进一步推广,可以进行多个样本的秩和测验。

说明:第一列数据包含所有的观察值,第二列数据包含有观察值所属的样本号。该命令和单因素方差分析命令ONEWAY相似。

5 FRIEDMAN

用法:FRIEDMAN C, C, C [残差C [拟合C]]

功能:进行随机区组试验结果的秩和测验;

说明:第一列数据为试验观察值,第二列数据为处理号,第三列数据为区组数,您还可以加两列,用来存放残差和拟合值。该命令与TWOWAY命令类似,它假设处理效应无效。Minitab给出的概率值是用分布来近似的。

(三)随机性分析命令

用法:RUNS [中位数K] C,...,C

功能:对所给数据进行两尾游程测验。

说明:用这条命令可以测验数据的随机性。

(四)分类命令

1 SORT

用法:SORT C,...,C C,...,C

子命令:BY,DESCENDING

功能:对给定列或列组的数据进行分类,以升序或者降序进行排列。如果没有给定子命令BY,那么排序的依据是第一列中的数据,否则以BY子命令指定的列进行排序。该命令还可以处理字符串数据。

2 RANK

用法:RANK C(待求秩次的列) C(第一列的秩次)

功能:给最小的数据赋予1,仅比最小值大的数据赋予2,依次类推。当两个或更多个数据相等时,取它们的平均值。

二、符号测验

符号测验是最简单的非参数测验方法。它测验观察值与总体中位数差数的正负符号数是否符合1:1的比例关系。

(一)已知中位数的符号测验

〖例1〗工艺上要求棉花纤维的断裂强力为5.5克,现对一新品系的断裂强力测定8次,得结果为5.8,4.4,4.9,5.4,5.3,5.3,5.6,5.1(克)。问此新品系的断裂强力是否符合工艺要求?

该例中假设新品系的断裂强力的分布中心为5.5g,即H0,对HA(不符合工艺要求),需进行一尾测验。

1 MINITAB程序

# Example 9-1
SET C1
5.8 4.4 4.9 5.4 5.3 5.3 5.6 5.1
END
LET K1=5.5
STEST K1 C1
ALTER -1.
# END

2 MINITAB计算结果

SIGN TEST OF MEDIAN = 5.500 VERSUS L.T. 5.500
N BELOW EQUAL ABOVE P-VALUE MEDIAN
C1 8 6 0 2 0.1445 5.300

结果表明:由于,故推断新品系的断裂强力与工艺要求尚无显著差异。

(二)成对数据的符号测验

〖例2〗小麦品种A和B在12个试验地点的抽穗期(以3月31日为0)列于表9-1,试测验两品种出穗期的差异显著性。

表9-1 小麦品种A和B在12个地点的抽穗期

地点

1

2

3

4

5

6

7

8

9

10

11

12

A

28

19

24

21

22

25

26

19

24

23

26

25

B

29

24

22

22

25

25

28

23

25

25

29

26

假设两品种的抽穗期为同分布,即H0,对HA,进行两尾测验。也就是对H0,对HA进行测验。

1 MINITAB程序

# Example 9-2
SET C1
28 19 24 21 22 25 26 19 24 23 26 25
END
SET C2
29 24 22 22 25 25 28 23 25 25 29 26
END
LET C3=C1-C2
STEST C3
# END

2 MINITAB计算结果

SIGN TEST OF MEDIAN = 0.00000 VERSUS N.E. 0.00000
N BELOW EQUAL ABOVE P-VALUE MEDIAN
C3 12 10 1 1 0.0117 -1.500

结果表明:由于,故可以推断A、B两品种的抽穗期具有显著差异。

(三)多组数据的中数测验

〖例3〗三个玉米品种的自交系产量比较试验的结果列于表9-2,试测验这三个自交系的产量是否有显著差异?

表9-2 三个玉米自交系的产量

自交系

产量(斤/小区)

金黄后

77 54 52 40 56 47 73 81

二郎早

96 78 96 77 82 73 113 95 88 84 68

南京黄

43 84 66 49 58 76 37

假设这三个品种具有相同的中位数,即H0,对HA不相等。

1 MINITAB程序

# Example 9-3
SET C1
77 54 52 40 56 47 73 81 # VARIETY I
96 78 96 77 82 73 113 95 88 84 68 # VARIETY II
43 84 66 49 58 76 37 # VARIETY III
END
SET C2
(1)8 (2)11 (3)7
END
MOOD C1 C2
# END

2 MINITAB计算结果

Chisquare = 7.74 df = 2 p = 0.021
Overall median = 74.5

结果表明:由于,可以推断三个自交系的产量之间具有显著差异。

三、秩和测验

秩和测验是F.Wilcoxon于1945年提出的。对于正态总体符合t测验的条件,秩和测验的效率约为t测验的86.4~95.5%;如果总体分布明显不属于正态分布的,则秩和测验的效率超过了100%。70年代以来,秩和测验已得到较为广泛的应用。

(一)成对数据比较的秩和测验

〖例4〗福建省福安和霞浦两测报站测得1963~1974年间第一代三化螟始盛期至第二代始盛期的期距(天数)于表9-3,试测验两地的期距有无显著差异。

表9-3 第一代三化螟始盛期至第二代始盛期的期距(天数)

年份

福安

霞浦

1963

58

49

1964

58

59

1965

57

58

1966

57

57

1967

61

50

1968

51

53

1969

56

45

1970

51

32

1971

50

48

1972

57

44

1973

54

58

1974

53

46

假设两地的期距为同一分布,即H0,对HA,进行两尾测验。也就是对H0,对HA进行测验。

1 MINITAB程序

# Example 9-4
SET C1
58 58 57 57 61 51 56 51 50 57 54 53
END
SET C2
49 59 58 57 50 53 45 32 48 44 58 46
END
LET C3=C1-C2
WTEST C3
# End

2 MINITAB计算结果

TEST OF MEDIAN = 0.000000 VERSUS MEDIAN N.E. 0.000000
N FOR WILCOXON ESTIMATED
N TEST STATISTIC P-VALUE MEDIAN
C3 12 11 54.5 0.062 5.000

结果表明:2,可以推断两地的期距没有显著差异。

(二)成组数据比较的秩和测验

〖例5〗测定两个马铃薯品种的淀粉含量(%)各5次,得A品种为12.6,12.4,11.9,12.8,13.0;B品种为13.4,13.1,13.5,12.7,13.6。试测验两品种淀粉含量的差异显著性。

假设两品种的淀粉含量为同一分布,即进行H0,对HA的测验。

1 MINITAB程序

# Example 9-5
SET C1
12.6 12.4 11.9 12.8 13.0
END
SET C2
13.4 13.1 13.5 12.7 13.6
END
MANN-WHITNEY C1 C2
# END

2 MINITAB计算结果

MANN-WHITNEY CONFIDENCE INTERVAL AND TEST
C1 N = 5 MEDIAN = 12.600
C2 N = 5 MEDIAN = 13.400
POINT ESTIMATE FOR ETA1-ETA2 IS -0.700
96.3 PCT C.I. FOR ETA1-ETA2 IS (-1.500,-0.100)
W = 17.0
TEST OF ETA1 = ETA2 VS. ETA1 N.E. ETA2 IS SIGNIFICANT AT 0.0367
结果表明:由于,可以推断A、B两品种的淀粉含量存在显著差异。

(三)几组数据的秩和测验

〖例6〗试用秩和测验的方法分析表9-2的资料。

1 MINITAB程序

SET C1
77 54 52 40 56 47 73 81 # VARIETY I
96 78 96 77 82 73 113 95 88 84 68 # VARIETY II
43 84 66 49 58 76 37 # VARIETY III
END
SET C2
(1)8 (2)11 (3)7
END
KRUS C1 C2
# END

2 MINITAB计算结果

LEVEL NOBS MEDIAN AVE. RANK Z VALUE
1 8 55.00 9.1 -1.94
2 11 84.00 19.6 3.48
3 7 58.00 8.9 -1.85
OVERALL 26 13.5
H = 12.09 d.f. = 2 p = 0.002
结果表明:由于
,可以推断这三个自交系的产量之间存在极显著的差异。

(四)单因素随机区组试验资料的秩和测验

〖例7〗小麦种子处理试验包括五种处理及五次重复,试验结果列于表9-4,试用秩和测验的方法测验处理之间的差异是否显著?

表9-4 小麦种子处理小区产量

重复

处理

 

1

2

3

4

5

72

65

37

57

64

24

42

25

62

83

49

20

42

24

44

52

33

27

72

35

38

17

45

44

40

1 MINITAB程序

# Example 9-7
SET C1
72 65 37 57 64 24 42 25 62 83 49 20 42 24 44 52 33 27 72 35 38 17 45 44 40
END
SET C2
(1:5)5
END
SET C3
5(1:5)
END
FRIED C1 C3 C2
# END

2 MINITAB计算结果

FRIEDMAN TEST OF C1 BY C3 BLOCKED BY C2
S = 3.36 D.F. = 4 P = 0.500

结果表明:由于,可以推断处理之间没有显著差异。

四、随机性测验

(一)用游程分析进行变数的随机性测验

〖例8〗在一个铁罐里装入相同数目的黄豆和黑豆子粒若干,从这个罐内每次取出一粒豆子,记载其颜色,放回罐内,然后再取。假定我们抽取1个样本,其容量均为20,豆粒出现的颜色先后为1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1 1 1 -1 1 -1 -1 -1,其中1代表黄粒,-1代表黑粒。试测验这个样本的随机性。

1 MINITAB程序

# Example 9-8
SET C1
1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1 1 1 -1 1 -1 -1 -1
END
RUNS C1
# END

2 MINITAB计算结果

K = 0.0000
THE OBSERVED NO. OF RUNS = 12
THE EXPECTED NO. OF RUNS = 11.0000
10 OBSERVATIONS ABOVE K 10 BELOW
* N SMALL--FOLLOWING APPROX. MAY BE INVALID
THE TEST IS SIGNIFICANT AT 0.6460
CANNOT REJECT AT ALPHA = 0.05

结果表明:抽取的样本出现的游程数为12,其出现的概率为0.646,所以推断抽取的样本为随机样本。

(二)用游程分析进行两个样本分布的测验

〖例9〗有一个小麦新品种试验,新品种与对照品种各播10个小区,小区产量结果如表9-6所示,试问这两个品种的产量是否有差异?

表9-6 小麦品种产量

品种

观察值

新品种

285 300 288 253 284 265 272 293 262 275

对照

263 286 254 292 276 256 264 277 282 290

1 MINITAB程序

# Example 9-9
SET C1
285 300 288 253 284 265 272 293 262 275
END
SET C2
263 286 254 292 276 256 264 277 282 290
END
LET K1=N(C1)
LET K2=N(C3)
SET C2
(-1)K1
END
SET C4
(1)K2
END
STACK C1 C3 C5
STACK C2 C4 C6
SORT C5 C6 C7 C8
BY C5.
RUNS C8
# END

2 MINITAB计算结果

K = 0.0000
THE OBSERVED NO. OF RUNS = 11
THE EXPECTED NO. OF RUNS = 11.0000
10 OBSERVATIONS ABOVE K 10 BELOW
* N SMALL--FOLLOWING APPROX. MAY BE INVALID
THE TEST IS SIGNIFICANT AT 1.0000
CANNOT REJECT AT ALPHA = 0.05

结果表明:两个品种的游程数为11,其出现的概率为1.0,所以推断两个品种的产量之间没有显著差异。


© 1998-, 董占山, 版权所有。
转载文章请注明出处(www.sunfinedata.com/articles)。