1. 回归预测
预测可分为点预测与区间预测 。
点预测是根据给定的解释变量
,利用回归模型来估计预测其中相应的被解释变量
。
即可作为总体单值
的预测估计值,也可作为总体均值E(Y0)的预测估计值。
简单线性回归预测的点预测公式为:

式中X0是给定的对X的预测值,
是X给定时Y的预测值,
是已估计出的样本回归系数。回归预测是一种条件预测,即在得到自变量X的预测值X0的条件下对因变量Y进行预测。
区间预测是在一定的置信概率保证下,通过考察预测误差的范围,进而确定真实值Y0或E(Y0)可能被哪个区间范围所包含。既然是区间就会有上限和下限。上限和下限都是以点预测值为中心设立的,上限(或下限)与预测估计值之差称为极限误差,用
表示,其计算方法为:

式中,S表示预测误差的标准差,在对均值E(Y0)进行区间预测时,

在对单值
进行区间预测时,

其中
为随机误差项标准误差的估计量,

n表示样本容量;
k表示解释变量的个数,
X0为预测期的解释变量取值;
为解释变量各观察值的平均值;
为解释变量的第i个观察值。
是当显著性水平为α,自由度为n-k-1时,t分布的右侧临界值。
均值E(Y0)的预测区间为:

其中,
它表明当X=X0时,真实均值E(Y0)将以(1-α)的置信概率被区间
所包含。
单值Y0的预测区间为:

其中

它表明当X=X0时,真实单值Y0将以(1-α)的置信概率区间:
所包含。
如果所拥有样本容量大于或等于30,则可将上述各式中的t统计量改为正态分布统计量
当观察资料的项数n较大,即样本容量较大,且X0接近于
时,“
”将接
近于1。如果实际情况能够满足这些条件,则可以用
代替S,求得近似的预测区间。
请大家注意,上述涉及到预测值时,均称之为“预测估计值”。经常听到这样的说法,“如果给定解释变量值,根据模型就可以得到被解释变量的预测值为…值”,这种说法是不科学的,也是回归模型无法达到的。如果一定要给出一个具体的“预测值”,那么它的置信概率为0;如果一定要回答以100%的置信概率被什么区间所包含,那么这个区间是∞。
在实际应用中,我们常希望置信区间越小越好,那么,如何才能缩小置信区间呢?
方法有三:
① 增大样本容量n;
② 更主要的是提高模型的拟合优度,以减小残差平方和
③ 提高样本观测值的分散度。在一般情况下,样本观测值越分散,
,
,其中
的值越大,致使区间缩小。
置信概率与置信区间是矛盾的。置信概率越高,在其它情况不变时,临界值
越大,置
信区间越大。如果要求缩小置信区间,在其它情况不变时,就必须降低对置信概率水平的要求。
以下第三部分得到的回归方程
进行预测。
应用回归模型进行预测,必须首先从其他途径用其他手段得到解释变量的预测值。现假设该市城镇居民2003年的人均可支配收入为8300元,即X0=8300元,对2003年该市人均消费性支出进行预测。
首先,将X0=8300代入上述回归方程,进行点预测:
(元)
即,2003年该市人均消费性支出的点预测估计值为6404.756元。
然后进行区间预测:
在第三部分已经求出:
则
本例欲对人均消费性支出进行区间预测,属于均值区间预测,因此采用公式
进行计算:
其中
取自本文第三部分中表3-3之后的相应计算结果:
取自表3-3的合计栏。
选定显著性水平α=0.05,本例中的自由度为

则人均消费性支出的预测区间为:

P[6404.756-2.447×46.606≤E(Y0) ≤6404.756+2.447×46.606]=1-0.05
P[6290.711≤E(Y0) ≤6518.801]=0.95
这一结果的统计意义为:在95%的置信概率下,当X0=8300时,区间[6290.711,6518.801]将包含总体均值E(Y0)
经济意义为:当人均可支配收入的预测值为8300元时,该市人均消费性支出的可能取值区间为6290.711元至6518.801元,这一结论的置信概率为95%。
应用二元回归模型进行预测的步骤与前述相同,只是S的计算公式有所改变,对于均值区间预测:

对于单值区间预测:

以下利用第三部分得到的回归
方程进行预测。
已知2002年我国人均国内生产总值X01为8.75千元,2001年我国人均居民消费额X02为3.95千元,预测我国2002年的人均居民消费额。
首先进行点预测:

即我国2002年的人均居民消费额的点预测估计值为4.007千元。
然后进行区间预测:
=
选
定显著性水平α=0.05,本例中的自由度为

则人均居民消费额的预测区间为:

P[4.17-2.365×0.026≤E(Y0)≤4.231]=0.95
该结果的统计意义为:在95%的置信概率下,当X01=8.75,X02=3.95时,区间[4.109,4.231]将包含总体均值E(Y0)。
经济意义为:当人均国内生产总值为8.75千元,前一年人均居民消费额为3.95千元时,人均居民消费额的可能取值区间为4.109千元至4.231千元,这一结论的置信概率为96%。
【07年单选题】
24.在进行统计预测时,人们一般( )。
A.较为重视远期资料,给予较大的权重;相对地轻视近期资料,给予较小的权重
B.较为重视远期资料,给予较小的权重;相对地轻视近期资料,给予较大的权重
C.较为重视近期资料,给予较大的权重;相对地轻视远期资料,给予较小的权重
D.较为重视近期资料,给予较小的权重;相对地轻视远期资料,给予较大的权重
【答案】C
【07年判断题】
68.在利用指数平滑预测法进行预测时,平滑系数
越大,对数列的修匀效果越好。
【答案】错误
【08年判断题】
69.如果要缩小置信区间,在其他条件不变的情况下,必须提高置信水平。
【答案】错误
【08年综合题】
(三)某地区2000—2007年地区生产总值与税收收入资料如下表所示:
单位:亿元
|
年份 |
地区生产总值(X) |
各项税收(Y) |
|
2000 2001 2002 2003 2004 2005 2006 2007 |
856 970 1130 1407 1599 1770 2024 2404 |
125 135 143 164 192 200 213 238 |
根据上表资料求得:



取0.05,查表得:

用Excel分析工具库中的“回归”模块得到下列结果:
回归统计
|
R2 |
0.984809 |
|
修正的R2 |
0.982277 |
|
标准误差 |
5.409858 |
|
观测值 |
8 |
|
df SS MS F Significance F |
|
回归 1 11383.90064 11383.90064 388.97 1.10177E-06 |
|
残差 6 175.599356 29.266559 |
|
总计 7 11 559.5 |
|
|
系数 |
标准误差 |
t统计量 |
P-value |
|
截距 |
61.92964 |
6.103886 |
10.15 |
5.33238E-05 |
|
变量(X) |
0.075211 |
0.003813 |
19.72 |
1.10177E-06 |
请根据上述资料从下列备选答案中选出正确答案。(提示:考生可以根据本题给出的中间结果进行计算和分析,也可以根据Excel的输出结果直接进行分析。)
86.要研究地区生产总值与税收收入的统计依存关系,正确的分析步骤是( )。
A.定性分析地区生产总值与税收收入是否存在相互联系,如果确实存在相互联系,则通过相关分析测定两者相关的密切程度
B.通过回归分析,研究地区生产总值与税收收入之间具体的数量关系形式
C.通过统计检验,判断上述分析中所得到的地区生产总值与税收收入之间的关系是否具有普遍性
D.分析中地区生产总值与税收收入之间的关系是否是因果关系
【答案】ABCD
87.根据题中所给资料,指出下列正确的说法( )
A.地区生产总值与税收收入的相关系数
B.
表示在Y的总变差中,有98.4809%可以由解释变量X做出解释
C.
,回归系数表示地区生产总值每增加1亿元,税收收入增加0.075211亿元
D.
,回归系数表示地区生产总值每增加1亿元,税收收入平均增加0.075211亿元
【答案】ABD
88.检验回归系数和回归方程的线性关系是否显著,正确的说法是( )
A.F检验用来检验回归系数的显著性,其假设为
︰
=0;
︰

B.F检验用来检验回归方程线性关系是否显著,其假设为:
︰回归方程线性关系不显著;
︰回归方程线性关系显著
C.t检验用来检验回归系数的显著性,其假设为
︰
=0;
︰

D.t检验用来检验回归方程线性关系是否显著,其假设为:
︰回归方程线性关系不显著;
︰回归方程线性关系显著
【答案】BC
89.检验回归系数和回归方程线性关系是否显著,正确的检验统计量和结论是( )
A.
;因为
,所以回归系数显著
B.
;因为
,所以回归方程线性关系不显著
C.
;
因为
,所以回归系数不显著
D.
;
因为
,所以回归方程线性关系显著
【答案】AD
90.假设某年该地区的生产总值达到2500亿元,则根据拟合的回归方程,采用区间估计的方法可以推算出同年税收收入95%的( )
A.置信下限为
B.预测下限为
C.置信上限为
D.预测上限为
【答案】BD
相关内容
编辑推荐
(责任编辑:)
近期直播
免费章节课
课程推荐
统计师
[协议护航-退费班]
12大模块 准题库资料 协议退费校方服务
统计师
[协议护航-畅学班]
12大模块 准题库资料 协议续学校方支持
统计师
[丰羽计划-畅学班]
4大模块 题库练习 精品课程