§2.4 多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model

§2.4 多元线性回归模型的统计检验

Statistical Test of Multiple Linear Regression Model

一、拟合优度检验

二、变量显著性检验

三、方程显著性检验

计量经济学模型是应用数理统

计方法建立的一类经济数学模型，

模型必须满足数学理论与方法上的

要求，所以在模型参数估计后，需

要检验其是否满足数学理论与方法

上的要求。

• 我们所要进行的统计检验包括两个方面，一方面检验回归方程对样本数据的拟合程度，通过可决系数来分析；另一方面检验回归方程的显著性，通过假设检验对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断，包括对回归方程线性关系的检验和对回归系数显著性的检验。

一、拟合优度检验Testing the Simulation Level

拟合优度检验，顾名思义，是检验模型对样本观测值的拟合程度。

1 、总体平方和、残差平方和和回归平方和

TSS 为总体平方和（ Total Sum of Squares ），反映样本观测值总体离差的大小； ESS 为回归平方和（ Explained Sum of Squares ），反映由模型中解释变量所解释的那部分离差的大小； RSS 为残差平方和（ Residual Sum of Squares ），反映样本观测值与估计值偏离的大小，也是模型中解释变量未解释的那部分离差的大小。

TSS=RSS+ESS

2

2

2

)ˆ(

)ˆ(

)(

ii

i

i

YYRSS

YYESS

YYTSS

2 、拟合优度检验统计量：可决系数 R2

和校正可决系数

（ 1）可决系数

用可决系数2R 进行拟合优度检验，可决系

数的计算公式为：

2

2

2ˆ

YY

YYR

i

i

，该统计量越接近于 1，模型

的拟合优度越高。

2R

10 2 R

在应用过程中我们会发现，如果在模型中增加一个解释变量，模型的解释功能增强了，可决系数 2R 计

——算公式中的分子回归平方和 2ˆ YYi 就会增大，

因而 2R 就增大。这就给人一种错觉：似乎要使模型拟合得好，就必须增加解释变量。但是，在样本容量一定的情况下，增加解释变量必定使得自由度减少。所以，用以检验拟合优度的统计量必须能够防止这种倾向，我们可以用自由度来调整 2R ，用 2R 来表示调整后的可决系数，以剔除解释变量数目与样本容量的影响，使具有不同样本容量和解释变量数目的回归方程可以进行拟合优度的比较。

22 RR

2R 可以为负

)1()1(

11 22 R

kn

nR

（2）校正可决系数

对于前述一元回归例题， 221

2 ˆˆii xYY ，

9965.04405903.9

8751239.97083.0ˆ 2

2

2212

i

i

y

xR

结果表明，在 Y 的总变差中，有 9 9 . 6 5 % 可以由解

释变量 X （或回归方程）做出解释，回归方程对于

样本观测点拟合良好。也就是说，城镇居民的人均

消费性支出的变化，有 9 9 . 6 5 % 是由人均可支配收

入决定的。

二元回归例题的可决系数为：

999.0

37.7

366.7ˆ2

22

i

i

y

yR

这表明，在人均居民消费额的总变差中，有 9 9 . 8 7 % 可以由人均国

内生产总值和前期人均居民消费额做出解释，回归方程对于样本

观测点拟合很好。

校正判定系数为：

9987.0999.011210

1101)1(

)1(

11 22

R

kn

nR

统计意义：用方差而不用变差，考虑到自由度，剔除解释变量数

目与样本容量的影响，使具有不同样本容量和解释变量数目的回

归方程可以对拟合优度进行比较。 Back

二、变量显著性检验Testing the Individual Significance

关于假设检验

• 假设检验是统计推断的一个主要内容，它的基本任务是根据样本所提供的信息，对未知总体分布的某些方面的假设作出合理的判断。

• 假设检验的程序是，先根据实际问题的要求提出一个论断，称为统计假设；然后根据样本的有关信息，对假设的真伪进行判断，作出拒绝或接受假设的决策。

• 假设检验的基本思想是概率性质的反证法。• 概率性质的反证法的根据是小概率事件原理，该原

理认为“小概率事件在一次试验中几乎是不可能发生的”。

变量显著性检验即对回归系数的显著性进行检验，如果变量是显著的，那么回归系数应该显著地不为 0 。于是，在变量显著性检验中设计的原假设为： H0 ： i=0而备择假设为： H1: i0 其中的下角标 i ，在一元回归模型中取值1 ：在二元回归模型中取值 1 、 2 。

然后根据样本观测值和估计值，计算统计量：

iii

St

ˆ

ˆ

)1(~ kntt

该统计量服从自由度为()nk1的t分布，即

在t统计量的算式中，i为总体回归系数，i为相应的参数估计量，iS为参数估计量i的标准差。

对于一元回归模型，

2

2

ˆ

ˆ1

ixS

，其中

2 为随机

误差项方差的估计量，

2

ˆ

1

ˆˆ

221

22

2

n

xy

kn

YY iiii

对于二元回归模型，

2

2122

21

221

2

2

2122

21

222

1

ˆ)ˆ(

ˆ)ˆ(

xxxx

xSE

xxxx

xSE

22

22

21

21

2

222

22

ˆˆˆ

ˆ1

ˆ

iii

iii

xxy

yye

kn

e

计算出t统计量后，要选定一个显著性水平，结合自由度( )n k 1，由t分布表（见附表5），

查得临界值t n k

2

1( ) 。

如果计算出的t统计量的绝对值t＞t n k2

1( ) ，

则在(1－)的置信概率下拒绝原假设H0。表

明在(1－)的置信概率下，i不是由 0i 这样的

总体产生的，i显著地不为0，即变量 iX对被

解释变量的影响是显著的；

如果 t＜

)1(2

knt ，则在 ( 1 － α )的置

信概率下接受原假设 H 0，表明在 ( 1 － α )

的置信概率下，与 0 没有什麽差别，

即变量 X i 对被解释变量的影响是不显著

的。

0:

0:

11

10

H

H

2584.01-1-8

8751239.97083.0-4405903.9

1

ˆ

1

ˆˆ

2

221

22

2

kn

xy

kn

YY iiii

对前述一元例题的回归系数进行显著性

检验：

665.41017.0

07083.0ˆ

ˆ

i

St ii

6,025.0

6,025.0

665.41

447.2

tt

t

017.08751239.9

0.2584ˆ2

2

ˆ1

ix

S

∴拒绝原假设H0，接受备择假设 1H。表

明在95%置信概率下， 1不是由 01

这样的总体产生的， 1显著地不为0，即

变量 iX对被解释变量的影响是显著的；也

就是说，在95%的置信概率下，城镇居民

的人均可支配收入对于人均消费性支出的

影响是显著的。

0:

0:

11

10

H

H

2584.01-1-8

8751239.97083.0-4405903.9

1

ˆ

1

ˆˆ

2

221

22

2

kn

xy

kn

YY iiii

017.08751239.9

0.2584ˆ2

2

ˆ ix

Si

665.41017.0

07083.0ˆ

ˆ

i

St ii

6,025.0

6,025.0

665.41

447.2

tt

t

对于前述二元例题，我们已经得到对我国

1 9 9 1 ~ 2 0 0 0 年消费模型的估计结果：

2122110 302.0339.0011.0ˆˆˆˆ XXXXY

现选定显著性水平 05.0 ，对偏回归系数 ( 斜率 )

进行检验， ∑已知 y i2 = 7 . 3 7

366.724.7302.028.15339.0ˆˆˆ 22112 yxyxy i

027.0

89.1427.783.31

001.027.7ˆ)ˆ(

001.01210

004.0

1ˆ

004.0366.737.7ˆ

22

2122

21

222

1

22

222

xxxx

xSE

kn

e

yye iii

7,025.0

7,025.0

1

11

11

10

22

2122

21

221

2

365.2

556.12027.0

0339.0

)ˆ(

ˆ

0:

0:

057.089.1427.783.31

001.083.31ˆ)ˆ(

tt

t

SEt

H

H

xxxx

xSE

∴拒绝 0: 10 H ，接受 0: 11 H

检验结果表明，在 95%置信概率下， 1不是由 01 这样

的总体产生的， 1显著地不为 0，即变量 1X对被解释变量

的影响是显著的；也就是说，在 95%的置信概率下，人均

国内生产总值对人均居民消费额的影响是显著的。

7,025.0

7,025.0

2

22

21

20

365.2

298.5057.0

0302.0

)ˆ(

ˆ

0:

0:

tt

t

SEt

H

H

∴拒绝 0: 20 H ，接受 0: 21 H

检验结果表明，在 95%置信概率下， 2 不是由 02 这样

的总体产生的， 2 显著地不为 0，即变量 2X 对被解释变

量的影响是显著的；也就是说，在 95%的置信概率下，前

一期人均居民消费额对本期人均居民消费额的影响是显著

的。 Back

三、方程显著性检验Testing the Overall Significance

F 检验的思想来自于总离差平方和的分解式： TSS=ESS+RSS

由于回归平方和 ESS 是解释变量 X 联合体对被解释变量 Y 的线性作用的结果，所以，如果 ESS/RSS的比值较大，则 X 的联合体对 Y 的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。因此 ,可通过该比值的大小对总体线性关系进行推断。

1 、 F检验的思想

由于iY服从正态分布，根据数理统计学中的定义，iY的一

组样本的平方和服从2分布。所以有：

2)( YYESS i ～2()k

2)( ii YYRSS ～2 1( )n k

即回归平方和、残差平方和分别服从自由度为k和( )n k 1的

2分布。进一步根据数理统计学中的定义，如果构造一个统计量

FESS

kRSS

n k

( )1

则该统计量服从自由度为（ k ， n-k-1 ）的 F 分布。

2 、方程显著性 F 检验的步骤

对回归方程线性关系显著性的检验采用 F 检验，检验依据样本估计的回归方程所体现的被解释变量与解释变量之间的线性关系在总体上是否显著成立，即是检验总体模型

ikikiii XXXY 22110 i = 1 , 2 , … , n中的参数是否显著不为 0 。按照假设检验的原理与程序，首先提出假设，原假设为： 0,: 210 kH

即模型线性关系不成立。备择假设为：不全为零kH ,,,: 211

对于一元线性回归模型，假设为：

0:

0:

11

10

H

H

然后根据样本观测值和估计值，计算F统计量

的数值：

1/ˆ

/ˆ

)1(

2

2

knYY

kYY

knRSS

kESS

F

ii

i

F 统计量服从自由度为 ( , )k n k 1 的 F分布。选定

一个显著性水平，查 F 分布表（见本书附录），

可以得到一个临界值 F k n k ( , ) 1 。

1/1

/2

2

knR

kRF

其中，2R为判定系数，k为模型中解释变量的个

数，n为样本容量。

如果所计算的F＞F k n k( , ) 1，则在(1－)的置信概率下拒绝原假设H0，即模型的线性关系显著

成立，模型通过方程显著性检验。如果所计算的F<F kn k( , ) 1，则在(1－)的置信概率下接受原假设H0，即模型的线性关系显著不成立，模型未

通过方程显著性检验。

对前述得到的回归方程 21 302.0339.0011.0ˆ XXY

进行线性关系显著性的检验，首先给出假设

49957/999.01

2/999.0

1/1

/

,:

0:

2

2

211

210

knR

kRF

H

H

不全为零

3 、方程显著性 F检验的例题

选定显著性水平 05.0 ，本例中第一自由度21 k ，第二自由度 7121012 kn ，( 本

例中解释变量数目k=2，样本容量n=10)，查F分布

表，得到临界值

7,2,05.0

7,2,05.0 74.4

FF

F

∴拒绝 0H，接受 1H。在95%的置信概率下，模型的

线性关系显著成立，人均国内生产总值和前期人均

居民消费额在整体上对于人均居民消费额的解释作

用是显著的。

对于一元线性回归模型，F检验与t检验的假设均为：

0:

0:

11

10

H

H

此时，两种检验是一致的。

3 、在一元线性回归中， t检验与 F检验是一致的

另一方面，两个统计量之间有如下关系：2

22

122

21

2

221

2

2

)2(

ˆ

)2(

ˆ

)2(

ˆ

)2(

ˆ

iiiii

i

i

i

xnexnene

x

ne

yF

2

2

2

2

1

1

2ˆ t

xn

e

i

i

但在多元回归情况下，两种检验说明的问题不同、

作用不同，不能相互取代。

拟合优度检验和方程显著性检验是从不同

原理出发的两类检验，前者是从已经得到估计

的模型出发，检验它对样本观测值的拟合程度，

后者是从样本观测值出发检验模型总体线性关

系的显著性。

4 、关于拟合优度检验与方程显著性检验关系的讨论

可见，Ｆ与 R2 同向变化：当 R2 ＝０时，Ｆ＝０；当 R2= 时，Ｆ为无穷大； R2 越大，Ｆ值也越大。

Rn

n k kF2 1

1

1

FESS

kRSS

n k

( )1

)1/(

)1/(12

nTSS

knRSSR

因此，Ｆ检验是所估计回归总显著性的一个度量，也是对的一个显著性检验。即：2R

检验原假设，等价于检验 0: 20 H0: 210 H

0: 20 0: 2

1

所以，拒绝原假设 0: 20 接受备择假设 0: 2

1

统计意义：在 9 5 % 的置信概率下，回归方程可以解释的方差显著地大于未被解释的方差， 9493.02 R 显著地不等于0 ， 9493.02 R 不是由 02 这样的总体产生的。

经济意义：在 9 5 % 的置信概率下，消费者平均收入和该商品价格在整体上对商品需求量的解释作用是显著的。

7,2,05.02

2

74.449957/999.01

2/999.0

1/1

/F

knR

kRF

例如，前述求得二元回归例题的可决系数为 999.02R ，

对其显著性进行检验：

Back

§2.4 多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model

Documents

Transcript of §2.4 多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model