2024年4月12日发(作者:)

偏回归系数

偏回归系数是指能够从随机样本中得到的和回归系数之间的差,

反映了真实值和预测值之间的偏差,这种差别取决于两种相关性:先

验概率和预测误差。

通过对学生的测试,我发现偏回归系数经常出现在以下几种题型

中: 1.给定一个观测值x1,若x1的均值为1,方差为0,标准误为

0,那么称x1的均值为x。这道题里面, x1的均值为1,方差为0,

那么,它的值就是1,而不是一个具体的数字,也就是说,这个观测

值x1不等于x1。由此可见, x1与x1之间存在着关系,但又不是具

体的某个数。这个不是数字的x1到底代表什么?这时候我们需要一

个指标来描述它,这个指标就是偏回归系数,也叫均方差或均值标准

误。 2.已知y=x+1, x代表原来的数据x1, y代表新增加的数据y,

如果x1在变动过程中没有变化,即x1不随时间变化,那么, y就

是原来的数据x1。这道题里面,新增加的数据y等于x1,也就是说,

y是x1的加减号,也就是说, x1和y是线性相关的,即x1的任何

变动都会影响到y。

偏回归系数给了我们一个非常直观的信息:要不要使用回归系数。

要不要使用回归系数?这是一个老生常谈的问题,没有人否认它的重

要性,但是每个人看待这个问题的角度、出发点和所站的高度都不同。

要使用回归系数,前提是假设x1在变动过程中保持不变。而事实上,

这种假设是很难成立的,大多数时候, x1在变动过程中不是在变小

就是在变大,甚至在整个过程中处于波动状态。这时候,如果还是坚

- 1 -

持“假设x1在变动过程中保持不变”,实际上已经背离了回归系数最

初的含义,把它当作自变量不再管,完全忽视它对因变量y的影响。

然而,对这个问题还有一些争论,主要集中在三个方面: 1.什

么情况下可以忽略x1对y的影响; 2.哪些变量影响y; 3.可以忽

略x1对y的影响吗?是不是在做最小二乘法时就可以忽略x1对y的

影响? 在现实中,我们经常需要对因变量和自变量进行平滑处理,

这个时候如果x1的变动使得因变量y产生波动,那么,这个时候不

仅应该计算x1对y的影响,还应该计算x1的偏回归系数。 这样做

虽然会使得x1的变动对因变量y产生更大的影响,但是,这样做的

结果是使得x1的变动对因变量y产生的影响更加接近于x1的真实变

动,更加有利于对因变量y的控制。

- 2 -