统计中内生性问题的解决方案

2014-06-27 MedSci MedSci原创

所谓内生性,就是模型中的一个或多个解释变量与随机扰动项相关。内生解释变量会造成严重的后果:不一致性inconstent和有偏biased,因为不满足误差以解释变量为条件的期望值为0。产生解释变量内生一般有三个原因: 1. 遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。否则,就会造成解释变量与残差项相关,从而引起内生性问题。 2. 度量误差 (measurement e

所谓内生性,就是模型中的一个或多个解释变量与随机扰动项相关。内生解释变量会造成严重的后果:不一致性inconstent和有偏biased,因为不满足误差以解释变量为条件的期望值为0。产生解释变量内生一般有三个原因: 1. 遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。否则,就会造成解释变量与残差项相关,从而引起内生性问题。 2. 度量误差 (measurement error):由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差(regression error)的一部分,从而导致内生性问题。3. 解释变量与被解释变量相互影响(也称联立性)解决内生性问题的方法主要有: 1.工具变量法(IV) 这种方法相信大家都已经学过,就是找到一个变量和内生化变量相关,但是和残差项不相关。在OLS的框架下同时有多个IV,这些工具变量被称为two stage least squares (2SLS) estimator。具体的说,这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV,放到原来 的

作者:MedSci



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. 2014-07-27 zgarycn

    刚接触的理论,学习中

    0

相关资讯

统计方法选用手册

一、 两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(

统计学全新发展趋势

在过去的20、30年中,统计学在不少方面取得了很大进展,这主要得益于越来越快的电脑速度,使得很久以前只能停留在理论层次上的一些内容变成了现实。当前 的统计学教材内容几乎跟20年前没什么太大变化,但统计学的发展却是有巨大变化,这里根据个人的知识水平将其总结一下,为感兴趣的同仁提供一些发展方向的借鉴。尤其是贝叶斯分析方法(Bayesian Analysis),从相关到因果的研究,从线性向非线性方向发

生物统计学家:临床研究的幕后高手

【编者按】临床研究往往少不了统计学,其在肿瘤临床研究中的地位更是举足轻重。而在现实中,生物统计学家却是一个熟悉而又陌生的名字。熟悉是因为统计的“必要性”,陌生往往是因为统计的“高深莫测”。 本文作者Daniel Sargent教授和Qian Shi教授作为梅奥肿瘤研究中心的“掌门人”,将跟大家“揭露”生物统计学家在肿瘤临床试验中所扮演的角色。 日前,Chinese Clinical O

高级统计教程:从 Yule-Simpson悖论到因果推断

临床研究到底能不能做出因果关系?原则上,在研究中解释和研究因果推断(causal inference)的,均十分谨慎!因为一般认识中,统计并不能研究因果。那么真的不能或是能呢?这确实是一个问题:统计研究因果,能,还是不能?直接给出回答,比较冒险。 目前市面上能够买到的相关教科书仅有 2011 年图灵奖得主 Judea Pearl 的 Causality: Models, Reaso

高级统计:病因研究理论及偏倚

病因学说在推动医学科学的发展上曾起过重大的作用,而成为医学观点的生物医学模式的组成部分。一、病因的可能分类1.单病因说在单病因说的思想指导下,人们把病因归纳为:①生物因素,主要是各种病原微生物;②物理因素,如声、热、光、电、放射线等超过正常范围后均可致病,此外还有损伤;③化学因素,如农药、化学药品、各种营养要素等。由于发现单单上述病因因素常常不足以引致疾病,人们认识到病因与宿主因素(如性别、年

协方差矩阵的理解与统计学含义

一、统计学的基本概念 统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。 以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],两个集合的均值都是10,