编程技术、软件应用与系统模拟

(Programming, Applicaiton and Simulation)



本站目录

 

首页
ASP/Access/IIS
DELPHI/PASCAL
PASCAL高级编程
C语言编程实例
WORD
Excel
MATLAB
MINITAB讲座
Windows
DOS
SAS
生物系统模拟
土壤水分剖析器
其他



镜像站点

 

主站
北美镜象站
欧洲镜象站(1)
欧洲镜象站(2)

本站 Google

[搜索]  [站内导航]
座右铭:
只做有益人类的事
不做有害人类的事


第七讲 MINITAB在回归与相关分析中的应用

董占山

(中国农科院棉花所,河南安阳,455112)

本讲首先介绍3个与相关和回归分析有关的命令,然后介绍用MINITAB进行一元线性回归分析、非线性回归分析、多项式回归分析、多元回归分析、相关和通经分析的具体方法。

一、命令介绍

(一)通用回归分析命令

用法:REGRESS C K C,...,C

子命令:NOCONSTANT

功能:对所给数据配合回归方程。

说明:第一列为因变量,K为自变量个数,K之后的K个列变量为自变量,最后还可以加上存放残差和拟合值的列。如果要配合不含回归截距的方程,可以使用子命令NOCONSTANT。

(二)逐步回归分析命令

用法:STEPWISE C C,...,C

功能:对所给的回归自变量进行筛选,从中选出对因变量有显著影响的变量。

说明:这条命令最多可以使用100个列变量。具体到某一台计算机,究竟能够使用多少个自变量,要根据计算机的内存容量而定。

(三)相关分析命令

用法:CORRELATE C,...,C [ M ]

功能:计算列对之间的相关系数。

说明:CORRELATION最多可以有100个列变量作参数,计算结果可以存到矩阵M中。

二、一元线性回归分析

〖例1〗许多害虫的发生都与气象条件有一定的关系,山东临沂测定1964~1973年间7月下旬的温雨系数(雨量mm/平均温度℃)和大豆第二代造桥虫发生量(每百株大豆上的虫数)的关系如表7-1。试建立回归方程。

表7-1 温雨系数和造桥虫虫口密度

变量

样本值

温雨系数(X)

1.58 9.98 9.42 1.25 0.3 2.41 11.01 1.85 6.04 5.92

造桥虫虫口密度(Y)

180 28 25 117 165 175 40 160 120 80

1 MINITAB程序

# EXAMPLE 7-1
SET C1
1.58 9.98 9.42 1.25 0.3 2.41 11.01 1.85 6.04 5.92
END
SET C2
180 28 25 117 165 175 40 160 120 80
END
REGR C2 1 C1
# END

2 MINITAB计算结果

The regression equation is
C2 = 179 - 14.1 C1(回归方程)
(回归系数的显著性测验)
Predictor Coef Stdev t-ratio p
Constant 179.21 13.34 13.44 0.000
C1 -14.110 2.124 -6.64 0.000
s(标准误) = 25.74 R-sq(决定系数)= 84.7% R-sq(adj) = 82.7%
Analysis of Variance(回归方程的方差分析)
SOURCE DF SS MS F p
Regression 1 29239 29239 44.14 0.000
Error 8 5299 662
Total 9 34538

三、曲线回归分析

下面以Logistic曲线回归为例,介绍如何用MINITAB进行曲线回归分析。

(一)K已知

〖例2〗江苏台东测定1972年越冬代棉红铃虫的化蛹进度(Y,%),其结果列于表7-2。试作回归分析。

表7-2 越冬代棉红铃虫的化蛹进度

日期(月/日)

Y(%)

X(以5/31为0)

6/5

3.5

5

6/10

6.4

10

6/15

14.6

15

6/20

31.4

20

6/25

45.6

25

6/30

60.4

30

7/5

75.2

35

7/10

90.2

40

7/15

95.4

45

7/20

97.5

50

本例中由于Y是化蛹进度,所以K的期望值等于100。

1 MINITAB程序

# EXAMPLE 7-2
SET C1
5 10 15 20 25 30 35 40 45 50
END
SET C2
3.5 6.4 14.6 31.4 45.6 60.4 75.2 90.2 95.4 97.5
END
LET C3=LOGE((100-C2)/C2)
REGR C3 1 C1
LET K1=EXP(4.12861)
PRIN K1 # A=K1
# END

2 MINITAB计算结果

(二)K未知

〖例3〗测定某种肉鸡在良好的饲养条件下的生长过程,每两周测定一次,结果列于表7-3。试以Logistic方程描述之。

表7-3 肉用鸡的生长过程

变量

取值

X(周次)

2 4 6 8 10 12 14

Y(公斤)

0.3 0.86 1.73 2.2 2.47 2.67 2.8

对这一类资料必须首先求出极限生长量K,才能进行回归计算。设2对等距X的生长量分别是Y1、Y2和Y3,那么

1 MINITAB程序

# Example 7-3
SET C1
2 4 6 8 10 12 14
END
SET C2
0.3 0.86 1.73 2.2 2.47 2.67 2.8
END
# CALCULATE THE K VALUE
LET K1=0.3
LET K2=2.2
LET K3=2.8
LET K4=(K2**2*(K1+K3)-2*K1*K2*K3)/(K2**2-K1*K3)
PRINT K4 # K
LET C3=(K4-C2)/C2
LET C3=LOGE(C3)
REGR C3 1 C1
LET K5=EXP(2.9938)
PRINT K5 # A=K5
#END

2 MINITAB计算结果

四、多项式回归分析

〖例4〗取连年施用有机肥的水稻土(pH=5.5),加入HCl或Na2CO3改变其pH值(X),在30℃下放置28天,然后中和之,测定每100克烘干土中NH4+氮的毫克数(Y),结果列于表7-4。试确定Y依X的多项式回归方程。

表7-4 调整水稻土pH(X)后NH4+氮释放量(Y)的变化

变量

取值

X

2 3 4 5 6 7 8 9

Y

13 9.2 6.6 4.7 4 7.1 13.2 20

1 MINITAB程序

# Example 7-4
SET C1
2 3 4 5 6 7 8 9
END
SET C2
13 9.2 6.6 4.7 4 7.1 13.2 20
END
LET C3=C1*C1
LET C4=C1*C3
REGR C2 3 C1 C3 C4
#END

2 MINITAB计算结果

(R2=0.991,F=145.57**)

五、多元回归分析

〖例5〗研究杂种水稻南优3号在不同密度和肥料条件下的每亩穗数(X1,万穗/亩)、每穗总粒数(X2)和结实率(Y,%)的关系,得表7-5。试求结实率依每亩穗数、每穗粒数的二元线性回归方程。

表7-5 南优3号穗数(X1)、粒数(X2)和结实率(Y)的关系

变量

观察值

X1

16.6 15.9 18.8 19.9 23.5 14.4 16.4 17.3 18.4 19.3 19.9

X2

146.5 163.5 140 122.4 140 174.3 145.9 147.5 139.1 126.8 125.2

Y

81.3 77.2 78 82.6 66.2 77.9 80.4 77.7 79.7 80.6 83.3

1 MINITAB程序

# Example 7-5
SET C1
16.6 15.9 18.8 19.9 23.5 14.4 16.4 17.3 18.4 19.3 19.9
END
SET C2
146.5 163.5 140 122.4 140 174.3 145.9 147.5 139.1 126.8 125.2
END
SET C3
81.3 77.2 78 82.6 66.2 77.9 80.4 77.7 79.7 80.6 83.3
END
REGR C3 2 C1 C2
#END

2 MINITAB计算结果

(R2=0.931,F=54.02**)

六、逐步回归分析

〖例6〗测定丰产3号小麦的每株穗数(X1)、每穗结实小穗数(X2,主茎)、百粒重(X3,克)、株高(X4,厘米,主茎)和每株籽粒产量(Y,克)的关系,得结果于表7-6。试选择Y依Xi的最优线性回归方程。

表7-6 丰产3号小麦产量性状表

序号

每株穗数

X1

每穗结实小穗数

X2

百粒重

X3

株高

X4

单株籽粒产量

Y

1

10

23

3.6

113

15.7

2

9

20

3.6

106

14.5

3

10

22

3.7

111

17.5

4

13

21

3.7

109

22.5

5

10

22

3.6

110

15.5

6

10

23

3.5

103

16.9

7

8

23

3.3

100

8.6

8

10

24

3.4

114

17.0

9

10

20

3.4

104

13.7

10

10

21

3.4

110

13.4

11

10

23

3.9

104

20.3

12

8

21

3.5

109

10.2

13

6

23

3.2

114

7.4

14

8

21

3.7

113

11.6

15

9

22

3.6

105

12.3

1 MINITAB程序:

# Example 7-6
SET C1
10 9 10 13 10 10 8 10 10 10 10 8 6 8 9
END
SET C2
23 20 22 21 22 23 23 24 20 21 23 21 23 21 22
END
SET C3
3.6 3.6 3.7 3.7 3.6 3.5 3.3 3.4 3.4 3.4 3.9 3.5 3.2 3.7 3.6
END
SET C4
113 106 111 109 110 103 100 114 104 110 104 109 114 113 105
END
SET C5
15.7 14.5 17.5 22.5 15.5 16.9 8.6 17 13.7 13.4 20.3 10.2 7.4 11.6 12.3
END
STEPWISE C5 C1-C4
REGR C5 3 C1-C3
#END

2 MINITAB计算结果

STEPWISE REGRESSION OF C5 ON 4 PREDICTORS,WITH N = 15
STEP 1 2 3
CONSTANT -8.064 -30.013 -46.966
C1 2.40 1.97 2.01
T-RATIO 7.33 6.43 7.65
C3 7.3 7.8
T-RATIO 2.79 3.46
C2 0.67
T-RATIO 2.31
S 1.90 1.54 1.32
R-SQ 80.52 88.18 92.05

(R2=0.92,F=42.44**)

七、通径分析

通经系数表示了自变量对因变量的相对重要性,在多元统计分析中有重要意义,本节给出计算通经系数的一般方法,即通过变量间的相关矩阵推导出通经系数的方法。

〖例7〗对表7-6中的数据进行通径分析,按上例逐步回归的结果,将X4剔除。

1 MINITAB程序

# Example 7-7
SET C1
10 9 10 13 10 10 8 10 10 10 10 8 6 8 9
END
SET C2
23 20 22 21 22 23 23 24 20 21 23 21 23 21 22
END
SET C3
3.6 3.6 3.7 3.7 3.6 3.5 3.3 3.4 3.4 3.4 3.9 3.5 3.2 3.7 3.6
END
SET C4
15.7 14.5 17.5 22.5 15.5 16.9 8.6 17 13.7 13.4 20.3 10.2 7.4 11.6 12.3
END
CORR C1-C4 M1 # CORRELATION COEFICIENT
COPY M1 C11-C14
DELE 4 C11-C14
COPY C11-C13 M1
INVE M1 M2
MULT M2 C14 C15 # PATH COEFICIENT
LET C11=C11*C15(1)
LET C12=C12*C15(2)
LET C13=C13*C15(3)
PRIN C11-C14
# END

2 MINITAB计算结果

ROW C11 C12 C13 C14
1 0.753421 -0.027052 0.170945 0.897314
2 -0.102271 0.199291 -0.050829 0.046192
3 0.377261 -0.029672 0.341390 0.688980

在上述输出结果中,除了C14列为各自变量与因变量的相关系数外,处于对角线上的数字就是各个变量的直接通经系数,其余数字为间接通经系数。


© 1998-, 董占山, 版权所有。
转载文章请注明出处(www.sunfinedata.com/articles)。