编程技术、软件应用与系统模拟

(Programming, Applicaiton and Simulation)



本站目录

 

首页
ASP/Access/IIS
DELPHI/PASCAL
PASCAL高级编程
C语言编程实例
WORD
Excel
MATLAB
MINITAB讲座
Windows
DOS
SAS
生物系统模拟
土壤水分剖析器
其他



镜像站点

 

主站
北美镜象站
欧洲镜象站(1)
欧洲镜象站(2)

本站 Google

[搜索]  [站内导航]
座右铭:
只做有益人类的事
不做有害人类的事


第四讲 Minitab的基本统计命令与假设测验

董占山

(中国农科院棉花所,河南安阳,455112)

本讲介绍了MINITAB的基本统计命令,包括变数的统计描述、单个平均数的统计推断、两个平均数的假设测验等,并给出了具体实例的MINITAB程序和计算结果的分析。

一、变量的统计描述

(一)命令

Minitab提供了专门用来计算变量的各种统计量的命令Describe,简写为Desc,其用法和有关的说明如下:

用法:DESCRIBE C,...,C

功能:输出每列的样本数N,缺失值个数NMISS,平均值MEAN,中位数MEDIAN,截尾平均数TRMEAN,标准差STDEV,样本平均数的标准误SEMEAN,最大值MAX,最小值MIN,四分之三值Q3,四分之一值Q1。

说明:将一列的数据由小到大排列,Q3为3(N+1)/4位置的值,Q1为(N+1)/4位置的值。

(二)实例

〖例1〗测定10个“金皇后”玉米果穗的重量(克),得结果为150,170,160,162,170,168,171,162,151,160。试计算它的平均数、标准差、变异系数等统计量。

1 MINITAB程序

# Example 4-1
SET C1
150 170 160 162 170 168 171 162 151 160
END
DESC C1
#
计算变异系数
LET K1=STDEV(C1)/MEAN(C1)*100
PRINT K1
# 以下演示计算几何平均数和调和平均数的方法

# 使用时,可以根据具体情况处理
# 计算几何平均数
LET C2=LOG(C1)
LET K2=SUM(C2)/N(C2)
LET K2=K99**K2 # k99为自然对数的底e
PRINT K2
#
计算调和平均数
LET C3=1/C1
LET K3=N(C3)/SUM(C3)
PRINT K3
# end

2 MINITAB计算结果

N MEAN MEDIAN TRMEAN STDEV SEMEAN
C1 10 162.40 162.00 162.88 7.57 2.40
MIN MAX Q1 Q3
C1 150.00 171.00 157.75 170.00
K1 4.66429 变异系数
K2 162.239 几何平均数
K3 162.075
调和平均数

结果表明,“金皇后”玉米果穗的重量平均为162.4克,标准差为7.57克,变异系数为4.7%。

二、单个平均数的假设测验

(一)命令

在Minitab中,有4个命令用来完成单个平均数的假设测验和置信区间的估计,简介如下:

1.已知总体方差的假设测验

用法:ZTEST [μ=K] σ=K C,...,C

功能:在σ已知时,用正态分布推断样本平均数是否属于已知的总体。

说明:如果总体平均数μ缺省,那么假定μ=0;σ为总体的标准差。如果不使用子命令,那么使用两尾测验。

子命令:ALTERNATIVE=K

如果ALTERNATIVE=-1,那么被择假设为μ<K;如果ALTERNATIVE=1,那么被择假设为μ>K。在这两种情况下,均进行一尾测验。

例子:ZTEST 6 2 C1 (检验C1列中的数据是否来自N(6,2)的总体)

2.已知总体方差的置信区间的估计

用法:ZINTERVAL [置信水平=K%] σ=K, C,...,C

功能:估计已知总体方差的置信区间。

说明:第一个K为置信概率,第二个K为总体方差。如果置信概率没有指明,那么缺省值为95;如果此值小于1,那么将乘以100。

例子:ZINTERVAL 90 .3 C1 (按总体方差σ=0.3估计C1列数据的90%的置信区间)

3.未知总体方差的假设测验

用法:TTEST [μ=K] C,...,C

功能:对每列数据执行t测验。

说明:如果没有指明K,那么使用μ=0;如果没有使用子命令,执行两尾测验。

子命令:ALTERNATIVE=K(意义同上)

4.未知总体方差的置信区间的估计

用法:TINTERVAL [置信水平=K%] C,...,C

功能:用t分布估计样本平均数的置信区间。

说明:其中K为置信概率,如果置信概率没有指明,那么缺省值为95;如果此值小于1,那么将乘以100。

例子:TINTERVAL 90 C1 (按t分布估计C1列数据的90%的置信区间)

(二)实例

〖例2〗某蔗糖自动打包机在正常工作状态时的每包蔗糖重量符合N(100,2)分布。某日抽样调查10包,得结果为100.5、99.8、101.5、102.2、102.7、100.3、101.1、101.6、100.4、100.9、100.7、102.1(=101)公斤。问该打包机是否仍处于正常工作状态?

1 MINITAB程序

# Example 4-2
Set c1
100.5,99.8,101.5,102.2,102.7,100.3,101.1,101.6,100.4,100.9
end
Ztest 100 2 c1
# End

2 MINITAB输出结果

TEST OF MU = 100.000 VS MU N.E. 100.000
THE ASSUMED SIGMA = 2.00
N MEAN STDEV SE MEAN Z P VALUE
C1 12 101.150 0.881 0.577 1.99 0.047

结果表明:当Z=1.99时,其概率值P小于0.05,说明该打包机在当前工作状态下与在正常工作状态下的差异已经达到了0.05的显著水平,故该打包机已经处于不正常工作状态。

说明:Z代表正态分布值,P VALUE为其概率值,用以说明Z的显著性。

〖例3〗测定某棉田的地表光强4次,得结果为:3.4,2.8,3.5,4.1(千勒克斯),试测验该结果与根据BEER-LAMBERT定律推出的理论值μ0=3.0是否有显著差异。

1 MINITAB程序:

# Example 4-3
SET C1
3.4 2.8 3.5 4.1
END
TTEST MU=3.0 C1
# end

2 MINITAB输出结果:

TEST OF MU = 3.000 VS MU N.E. 3.000
N MEAN STDEV SE MEAN T P VALUE
C1 4 3.450 0.532 0.266 1.69 0.19

结果表明:当t=1.69时,其概率值为0.19,大于0.05,故推断实测结果与理论值相符合。

说明:在MINITAB中,大多数显著性测验,无论是正态分布、t分布、F分布,当给出分布值时,均给出相应的发生概率,因此,可以直接根据概率值的大小来推断测验结果的显著性,而不必去查分布函数的概率表。当P<0.05时,达显著水平;当P<0.01时,达极显著水平。

三、成组数据的比较

(一)命令

有两个Minitab命令可以用于成组数据的比较,即TWOSAMPLE和TWOT,用法如下:

1.TWOSAMPLE

用法:TWOSAMPLE [置信水平K%] C C

子命令:ALTERNATIVE,POOLED

功能: 作无效假设H0:(μ1=μ2)的t测验,并估计(μ1-μ2)的置信区间;

说明: 第一列包含来自总体1的样本,第二列包含来自总体2的样本;如果未用子命令POOLED,TWOSAMPLE假定两个总体的方差不相等,反之,如果两个总体的方差相等,就需要使用这个子命令;如果置信水平没有指明,假定置信水平为95%;如果没有ALTERNATIVE子命令,做两尾测验;如果ALTERNATIVE=-1,作被择假设μ1<μ2的一尾t测验;如果ALTERNATIVE=1,作被择假设μ1>μ2的一尾t测验。

例子:TWOSAMPLE 99 C1 C2 (进行C1、C2两组数据的99%的t测验)

2.TWOT

用法:TWOT [置信水平K] C,C

子命令:ALTERNATIVE,POOLED

功能:作两个平均数差数的t测验和置信区间的估计;

说明:TWOT和TWOSAMPLE的功能相同,只是输入数据格式有别;第一列含有两个样本的观察数据,第二列则包含第一列数据所属样本的下标值,如1和2,1代表第一列中对应的数据属第一个样本,2代表第一列中对应的数据属第二个样本。如果置信水平没有指明,假定置信水平为95%;如果没有ALTERNATIVE子命令,做两尾测验。

例子:TWOT C1 C2 (对C1中的两组数据进行95%的t测验)

(二)情况之一:

〖例4〗以20头猪作饲养试验,随机抽取其中的10头为一组,喂以甲种饲料,另10头为一组,喂以乙种饲料,饲养一个月后测得各头猪增加的体重(斤)列于表1。试测验两种饲料对猪增重有无显著差异。

表1 喂以不同饲料各头猪增加的体重(斤)

饲料种类

猪的体重(斤)

甲种饲料(X1)

30

35

40

32

42

31

41

38

36

34

乙种饲料(X2)

25

27

33

35

37

33

33

34

31

29

1 MINITAB程序

在进行成组数据的比较时,首先要对两个样本的方差进行同质性检验,如果方差同质,则使用联合方差进行平均数差数的假设测验,否则不能使用联合方差。

# Example 4-4
SET C1
30, 35, 40, 32, 42, 31, 41, 38, 36, 34
END
SET C2
25, 27, 33, 35, 37, 33, 33, 34, 31, 29
END
# 方差同质性检验
LET K1=STDEV(C1)**2/STDEV(C2)**2
CDF K1; # 计算F值的累积概率值
F 9 9.
# 用联合方差进行平均数的假设测验
TWOS C1 C2;
POOLED.
# end

2 MINITAB计算结果

1.3130 0.6542 (累积概率值为0.65说明两个样本方差没有显著差异)
TWOSAMPLE T FOR C1 VS C2
N MEAN STDEV SE MEAN
C1 10 35.90 4.25 1.3
C2 10 31.70 3.71 1.2
95 PCT CI FOR MU C1 - MU C2: (0.4, 8.0)
TTEST MU C1 = MU C2 (VS NE): T= 2.35 P=0.030 DF= 18
POOLED STDEV = 3.99

结果表明:由于两个样本方差同质,所以使用两个样本的联合方差进行t测验,两个样本平均数相等的概率为0.03,所以两个样本平均数具有显著差异,也就是说两种饲料对猪增重有显著差异。

(三)情况之二:

〖例5〗调查某地区小麦密点播田块7块,小麦撒播田块8块,每块田的亩产量(斤)列于表2。试测验两种播种方式的小麦产量是否有显著差异。

表2 小麦播种方式试验产量结果

播种方式

产量

密点播 510 480 470 490 500 490 480  
撒播 500 450 430 440 490 480 410 420

1 MINITAB程序

# Example 4-5
SET C1
510, 480, 470, 490, 500, 490, 480
END
SET C2
500, 450, 430, 440, 490, 480, 410, 420
END
# 进行方差同质性检验
LET K1=STDEV(C1)**2/STDEV(C2)**2
CDF K1; # 计算F值的累积概率
F 7 6.
# 不使用联合方差的t测验
TWOS C1 C2
# end

2 计算结果与分析

6.2760 0.9802 (累积概率达到了0.98,所以两个样本的方差在0.05水平上显著)

TWOSAMPLE T FOR C1 VS C2

N MEAN STDEV SE MEAN

C1 7 488.6 13.5 5.1

C2 8 452.5 33.7 12

95 PCT CI FOR MU C1 - MU C2: (6.8, 65)

TTEST MU C1 = MU C2 (VS NE): T= 2.78 P=0.021 DF= 9

结果表明:由于两个样本方差不同质,所以使用两个样本各自的方差进行t测验,两样本平均数相等的概率为0.021,所以两个样本平均数差异显著,也就是说密点播产量显著不同于撒播产量。

四、成对数据的比较

成对数据的假设测验比成组数据的要简单,只需要测验成对数据的差数与0是否有显著差异即可,所以可以用t测验命令完成成对数据的假设测验。下面是一个实例。

〖例6〗我们在10个试验点进行了早稻新品种和当地品种成对比较试验,其产量结果列于表3所示。试测验新品种与当地品种之间是否有显著差异。

表3 早稻品种比较试验产量结果表

品种

产量

新品种

880

950

840

940

780

880

920

810

940

780

当地品种

820

920

880

870

810

820

880

780

890

760

1 MINITAB程序:

# Example 4-6
READ C1 C2
880 820
950 920
840 880
940 870
780 810
880 820
920 880
810 780
940 890
780 760
END
LET C3=C1-C2 #计算每对数据的差数
TTEST C3 #对差数列C3进行t测验
TINT 95 C3 #计算差数的95%的置信区间
TINT 99 C3 #计算差数的99%的置信区间
# end

2 计算结果与分析

TEST OF MU = 0.000 VS MU N.E. 0.000
N MEAN STDEV SE MEAN T P VALUE
C3 10 29.000 37.253 11.780 2.46 0.036
N MEAN STDEV SE MEAN 95.0 PERCENT C.I.
C3 10 29.0 37.3 11.8 (2.3,55.7)
N MEAN STDEV SE MEAN 99.0 PERCENT C.I.
C3 10 29.0 37.3 11.8 (-9.3,67.3)

结果表明:当t=2.46时,其概率为0.036,说明两个平均数之间的差异已达到0.05的显著水平,也就是说新品种较当地品种显著增产,增产的幅度为2.3~55.7斤。

五、实习

实习1 测得1960~1972年间越冬代棉红铃虫在江苏东台的羽化高峰期依次为(以6月30日为0)8,6,10,5,6,6,10,-1,12,11,9,1,8。试求其平均值、标准差和变异系数。〖答案:=7.0,s=3.8,CV=54.3〗

实习2 某玉米品种在不施氮肥的情况下,一般产量为250kg/亩。现调查该品种在施同样氮肥量情况下,10个小区的产量数据(kg/亩)为:270,300,285,268,275,298,310,295,304,278。试测验施氮肥在产量上是否和未施氮肥差异显著,并以95%的可靠度估计施氮肥情况下该品种的亩产范围。〖答案:t=8.056,亩产范围是277.5~299.1〗

实习3 据历史资料,“岱字棉15”纤维长度为一N(29.8,2.25)的总体。现从中选出一个株系,取10个纤维样品,测得其纤维长度分别为31.2,30.9,31.5,30.9,30.5,31.2,31.8,30.9,30.6,30.7。试测验该株系的纤维长度是否显著优于原总体。〖答案:=31.0,s=0.408,Z=1.71,一尾P=0.043〗

实习4 测定前作喷洒过某种有机砷杀雄剂的麦田植株样本4次,得株体中的砷残留量为7.5,9.7,6.8,6.4(mg);测定对照(前作未用过有机砷杀雄剂)的植株样本3次,得株体中砷含量为4.2,7.0,4.6。试测验喷洒有机砷杀雄剂是否使后作株体的砷含量显著增高。〖t=2.05,一尾P=0.048,达显著水平〗

实习5 为测定A、B两种病毒对烟草的致病力,取8株烟草,每一株皆半叶接种A病毒,另半叶接种B病毒,以叶面出现枯斑数的多少作为致病力强弱的指标,得结果于表4。试测验两种病毒致病力的差异显著性。〖答案:t=2.632,P=0.034〗

表4 两种病毒在烟叶上产生的枯斑数

株号

1

2

3

4

5

6

7

8

病毒A

9

17

31

18

7

8

20

10

病毒B

10

11

18

14

6

7

17

5


© 1998-, 董占山, 版权所有。
转载文章请注明出处(www.sunfinedata.com/articles)。