2024年4月12日发(作者:)
偏回归系数
偏回归系数是指能够从随机样本中得到的和回归系数之间的差,
反映了真实值和预测值之间的偏差,这种差别取决于两种相关性:先
验概率和预测误差。
通过对学生的测试,我发现偏回归系数经常出现在以下几种题型
中: 1.给定一个观测值x1,若x1的均值为1,方差为0,标准误为
0,那么称x1的均值为x。这道题里面, x1的均值为1,方差为0,
那么,它的值就是1,而不是一个具体的数字,也就是说,这个观测
值x1不等于x1。由此可见, x1与x1之间存在着关系,但又不是具
体的某个数。这个不是数字的x1到底代表什么?这时候我们需要一
个指标来描述它,这个指标就是偏回归系数,也叫均方差或均值标准
误。 2.已知y=x+1, x代表原来的数据x1, y代表新增加的数据y,
如果x1在变动过程中没有变化,即x1不随时间变化,那么, y就
是原来的数据x1。这道题里面,新增加的数据y等于x1,也就是说,
y是x1的加减号,也就是说, x1和y是线性相关的,即x1的任何
变动都会影响到y。
偏回归系数给了我们一个非常直观的信息:要不要使用回归系数。
要不要使用回归系数?这是一个老生常谈的问题,没有人否认它的重
要性,但是每个人看待这个问题的角度、出发点和所站的高度都不同。
要使用回归系数,前提是假设x1在变动过程中保持不变。而事实上,
这种假设是很难成立的,大多数时候, x1在变动过程中不是在变小
就是在变大,甚至在整个过程中处于波动状态。这时候,如果还是坚
- 1 -
持“假设x1在变动过程中保持不变”,实际上已经背离了回归系数最
初的含义,把它当作自变量不再管,完全忽视它对因变量y的影响。
然而,对这个问题还有一些争论,主要集中在三个方面: 1.什
么情况下可以忽略x1对y的影响; 2.哪些变量影响y; 3.可以忽
略x1对y的影响吗?是不是在做最小二乘法时就可以忽略x1对y的
影响? 在现实中,我们经常需要对因变量和自变量进行平滑处理,
这个时候如果x1的变动使得因变量y产生波动,那么,这个时候不
仅应该计算x1对y的影响,还应该计算x1的偏回归系数。 这样做
虽然会使得x1的变动对因变量y产生更大的影响,但是,这样做的
结果是使得x1的变动对因变量y产生的影响更加接近于x1的真实变
动,更加有利于对因变量y的控制。
- 2 -


发布评论