许可优化
许可优化
产品
产品
解决方案
解决方案
服务支持
服务支持
关于
关于
软件库
当前位置:服务支持 >  软件文章 >  回归方程预测区间近似计算方法详解

回归方程预测区间近似计算方法详解

阅读数 6
点赞 0
article_banner

   1 预测区间与置信区间的差别

   预测区间估计(prediction interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间。变量的估计叫预测区间,预测区间反映了单个数值的不确定性;

   置信区间估计(confidence interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间。参数的估计叫置信区间,置信区间反映了预测均值的不确定性。

   例如,有回归方程:

   工作量=2*规模+3,

   当规模=10, 预测的y值的平均值为23,但是工作量的实际值可以有无数个,如(23.01,23.2,22.1,22.34,…..),这些实际值会在一个区间内浮动,该区间即为预测区间。如果随机抽多个样本,比如样本1(23.01,23.2,22.1),样本2(23.2,22.1,22.34),每个样本的均值会在一个区间内浮动,该区间即为置信区间。

   2 预测区间与置信区间谁窄谁宽?

   平均值的预测仅存在抽样误差。单个值的预测除了抽样误差外,还有其他干扰因素,所以预测区间PI总是要比对应的置信区间CI大。

   针对均值的置信区间肯定要窄一些,而具体想预测某一个体值,那区间肯定要宽,因为误差会很大。

   比如,让你预测一个公司中项目的平均生产率,与让你预测一个项目的生产率,你觉得哪个误差更大呢?对于一个公司的均值,即使你什么信息都不知道,估计预测的也差不到哪儿去,而让你预测某个项目的生产率,那你可能就不知所措了。

   3 如何近似计算预测区间?

   3.1 预测区间的简单计算公式

   如果准确计算预测区间,公式是比较复杂的,而且需要建立方程的所有样本的数据,在实践中并不推荐这么做。所以通常我们都是近似计算预测区间。

   预测区间的上限=预测值+1.96 残差的标准差;

   预测区间的下限=预测值-1.96 残差的标准差;

   上述公式是基于回归方程的理论假设推理出来的:

   线性回归中,我们假定,对于每一特定的x值,其对应的y值应该是来自一个服从某一均值和标准差的分布,y是服从正态分布的。

   在建立方程之前我们对此做了假设检验。

   1.96倍标准差对应的区间,就是置信度为95%的区间。

   残差的标准差在我们进行回归分析时,minitab的计算结果已经给出来了:

   3.2 当对Y做了变换时,预测区间如何计算

   在实际建模时,如果对y做了对数变换,比如:

   lny=ax+b

   则此时得到的残差标准差是lny的,不是y的,所以计算lny的预测区间为:

   lny预测区间上限=ax+b+1.96S

   则y的预测区间上限应该是:

   y=exp(ax+b+1.96S)

   y的预测区间下限应该是:

   y=exp(ax+b-1.96S)

   如果对y做了其他变化,道理类似。

免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

相关文章
技术文档
QR Code
微信扫一扫,欢迎咨询~
customer

online

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 board-phone 155-2731-8020
close1
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

姓名不为空

姓名不为空
手机不正确

手机不正确

手机不正确
公司不为空

公司不为空

公司不为空