学院动态

学术观点

经济学院2018年第四十次学术研讨会:Estimating the Number of Factors in High Dimensional Constrained Factor Models

文章来源: 发表时间:2018-11-22 14:16:06点击次数:

本网讯(通讯员:高达)11月20日晚上19点30分,经济学院2018年经济学院2018年第四十次学术研讨会在经济学院105教室顺利举行。本次研讨会特别邀请博士研究生向镜洁为我院师生作了题为“Estimating the Number of Factors in High Dimensional Constrained Factor Models”的主题讲座。我院沈淑林,赵钊等老师及一大批对因子模型感兴趣的硕博研究生参会。

向镜洁博士最开始介绍了这篇文章的背景,并对其做了一个大概的介绍。她指出Tsai和Tsay(2010)在一项开创性工作中提出的约束因子模型是将先验知识引入因子模型应用的有效途径,因此具有广泛的应用前景。正确地确定因子个数是应用因子模型的一个基本问题。所以,本文研究二维截面尺寸(N)和时间(T)增加的约束因子模型中因子个数的估计。使用与Bai和Ng(2002)提出的相似信息准则,我们证明了使用该准则可以一致地估计因素的数量。我们还提出了两步估计部分约束因子模型中的因子个数的方法。我们进行蒙特卡洛模拟研究所提出的方法的有限样本性质。

接下来,向镜洁博士为我们从以下几个方面做了具体的阐述。首先,何为受约束的因子模型。当解释变量的维度变得足够高时,被估计的因子就很难去解释。然而,我们可以通过降低因载荷矩阵的维度去解决这个问题。因此,Tsai和Tsay(2010)就提出了受约束的因子模型,Yit = hi′ Λft +εit , i = 1, 2, . . . , N ; t = 1, 2, . . . , T 其中,Yit是解释变量, hi 是已知的约束。在Tsai和Tsay(2010)的研究中,利用股票数据,通过把 hi 设定成行业的指标变量,例如某一类股票属于同一行业就都设为0,另外一类股票属于另外一个行业就设为1等方式。这与分组因子模型有着很大的区别,分组因子模型是将因子分为很多不同的种类,因此被解释变量是受到不同的因子的影响,而我们这里的受约束的因子模型是将 hi分为不同的组别,但都是受潜在同一的因子的影响,而我们另外常说的分层因子模型只是在提取出尽可能多的因子之后,还有部分共有因子存在于残差内,于是,残差部分可以再次提取因子。接下来是如何对共同因子以及因子的个数的估计,这也是全文的核心。向镜洁博士讲到,我们通过主成分分析方法来估计受约束的因子模型,而主成分分析方法是通过最小化残差平方和,在这里,采用最小二乘的思想,而不是用极大似然估计的方法的原因在于,最小二乘的方法在估计上不仅渐进无偏而且收敛速度更快。对于因子的数量的估计,目前可以有Bai and Ng (2002) 的信息准则方法,以及Ahn and Horenstein (2013)的特征值比检验等方法。而我们由于对hi是已知的,所以第一种方法更适合。我们在用信息准则选取因子的个数时,是在Bai(2002) 的基础上做了一些改进,选取因子个数的标准是 PCc(g) = Vc(g,Fˆg) + g·p(N,T) ,其中Vc(g,Fˆg)是残差平方和项,p(N,T)是惩罚项,为了使得这两项的制衡作用,要满足以下两个条件,即p(N,T)→0 as N,T→∞,(2)N·p(N,T)→∞asN,T→∞. 也就是两者在趋近和趋近无穷时是一个差不多的量级的概念。最后为了验证受约束的因子模型的有效性,向镜洁博士给我们展示了其蒙特卡洛模拟的结果。其中最关键的是数据生成过程,她设置了hi 为提前已知的0-1均匀分布。载荷矩阵是N(0.2,1) 独立同分布,随机扰动项包含同方差和异方差的情况,最终的结果表明,在同方差情况下和在个体异方差的情况下,随着N,T的增大,我们构建的受约束的因子模型于Bai and Ng (2002)相比,具有能更快的收敛的效果,不仅可以适用AIC准则而且可以用BIC准则,在个体异方差的情况下,在时间异方差的情况下,Bai and Ng (2002)的方法基本失效,而本文提出的方法却可以很好的收敛。最后如果是存在截面相关的话,本文提出的方法在收敛速度上更快。

研讨会最后,向镜洁博士指出虽然Bai and Ng (2002)的方法的估计量是一致的,即Bai and Ng (2002)最初设计的近似因子模型的PCp and ICP准则在N和T不是很大且存在特质错误是交叉相关的时候的估计量是一致的,但是还有很多缺陷。他们的方法很大程度上依赖于标准化的方向,这大大限制了它们的适用性。基于约束因子模型的结构,本文提出了一种新的约束因子模型设计方法。我们提出的方法的优点如下,我们的方法表现出良好的特质误差即是横截面相关。我们的方法的性能对Y的归一化具有稳健性。而且,在BIC2中,在Bai和NG(2002)中不是优选的,在我们的模拟中考虑的所有情况下具有最高精确估计。

微信公众号