学院动态

学术观点

经济学院2018年第八次学术讲座:Sequential Estimation of Censored Quantile Regression Models

文章来源: 发表时间:2018-03-21 11:45:51点击次数:

本网讯(通讯员 邹建文)2018年3月20日上午10点,2018年经济学院第八次学术讲座在经济学院405会议室举行,香港科技大学教授陈松年作了题为“Sequential Estimation of Censored Quantile Regression Models”的汇报。

陈松年首先指出,过去一二十年间,随着计量统计软件的普及、数据可获得性的增加,分位数回归的应用迅速增加。陈松年以加入工会对工人收入的影响为例说明分位数的优势,Chamberlain(1994)研究显示,最小二乘估计的美国制造业工人加入工会收入平均提高15.8%,但这只是平均效应,问题在于15.8%在不同工人之中是怎样分布的。陈松年指出,工会对能力弱的工人作用更大,比如不太会说话的工人,而对能力强的工人作用更小,表现在分位数回归中,就是在0.1分位,加入工会的效应达到28.1%,从0.1分位到0.9分位,效应逐渐减弱,在0.9分位,甚至略微小于零。

陈松年也举了另外的例子来说明数据截取与内生性问题。在公共财政里,个人应纳税收入存在上限,在美国大约有32%的人的收入在报税时存在着截取。在劳动经济学里,估计受教育回报是个经典问题,受教育程度就存在内生性,尤其是在美国大学申请制,上大学很大程度取决于学生的个人选择的情况下,受教育程度与家庭背景、天赋、能力等因素相关,因此存在内生性。在估计酒类消费的恩格尔曲线时,要用酒类消费对总支出做回归,因为可能存在着不同支出的同时决策及消费的测量误差,因此存在内生性问题,同时消费又不会是负值,所以16%的数据存在着数据截取。

先考虑只有数据截取的分位数回归问题,这个领域的研究最早由Powell (1984, 1986)做出,存在数据截取时,分位数回归的困难在于数据截取本身取决于回归系数,后续的研究用核估计的非参方法估计样本选择,而非参的方法要求自变量的维度不能太高,最多四维五维,维度高了一是计算上存在困难,二是分组后样本就很少了,无法进行非参估计。

陈松年指出,截取下的分位数回归本质上是样本选择不可行的问题。对于这个问题,陈松年的想法是可以进行序贯估计,定义一系列分位点,比如数据从零值以下截断,就从99分位、98分位到1分位,在99分位,可以认为估计的结果不受数据截断的影响,由此可以用正常的分位数回归的方法进行估计,假设从99分位到98分位影响是连续的,那么可以用98分位去挑选99分位的样本,挑选了样本后就可以做分位数回归估计98分位的系数,以此类推进行序贯估计。陈松年证明了序贯估计的极限性质。

在存在内生性下的分位数回归,Chernozhukov and Hansen (2006)给出了比较好的回答。而在同时存在内生性和数据截取下的分位数回归又更加的复杂,现有的研究面临着自变量维度的问题,并且难以计算、难以进行统计推断。陈松年基于序贯估计的思路,对这个问题进行了回答,相比以往的研究,序贯估计有着容易计算、容易推断并且是参数方法没有维度的问题。

讲座之中,陈松年与经济学院的师生进行了交流互动。陈松年与经济学院王少平教授、杨继生教授、魏杰老师、彭斌老师、蔡必卿老师及几位博士生交流了国内学术界的状况,并讨论了了理论计量与应用计量培养的问题。

微信公众号