学院动态

学术观点

经济学院2019年第五十一次学术讲座:Prediction using many samples with models containing partially shared parameters

文章来源: 发表时间:2019-10-15 10:51:59点击次数:

本网讯(通讯员:寇赢心)1014日下午16:00,经济学院第五十一次学术讲座在经济学院105教室举行。来自中科院系统所预测科学研究中心的张新雨研究员进行了题为《Prediction using many samples with models containing partially shared parameters》的精彩报告。经济学院魏杰老师主持此次讲座,参加此次讲座的还有文旷宇副教授、蔡必卿老师、沈淑琳老师、彭斌老师以及博士研究生和硕士研究生。

报告分为引言、预测过程、理论参数、模拟案例、真实案例和总结六个部分。

报告伊始,张老师指出在多模型回归中存在问题,即如果主要的模型和其他模型有相同的参数(允许有不同的冗余参数),如何整合其他模型中的信息来提高对主模型的估计预测的准确性,对此,他提出了一个模型平均方法(model averaging method)来整合这些信息,数据生成过程为fYji|Xji,Zji(y,X,Z)= fj(XTβ+ZTαj,y,γj),在不同的总体中,有不同的函数形式fj和不同的参数值αjγj,但总体模型有共同的参数β。他指出主要目标是在给定变量XZ的情况下预测因变量。不失一般性,将要预测的第一个模型记为主模型(main model),其他模型被称为辅助模型(helper model)。如果只用一个模型进行预测,只需用第一组数据估计参数并预测,如果运用多模型来估计,传统做法为对所有数据运用MLE来提高预测,但MLE的前提所有模型设定都是正确的很难满足,因此,他提出的平均模型(model averaging)方法就可以解决这一问题。

接下来张老师梳理了与model averaging相关的文献,包括贝叶斯模型平均(Bayesian model averaging)frequentist model averaging,但这两种方法的缺点是只能对同一个数据集用不同的模型,而张老师提出的modeling averaging可以对不同的数据集采用不同的模型。文献回顾过后,张老师介绍了预测的过程,第一步,在每一个数据集下用不同的方法得到参数估计值;第二步,运用估计值对第j个模型预测Yj;第三步,对每一个模型进行加权,来得到Y(w)的预测值;第四步,建立交叉验证准则(cross-validation criterion)来估计在不同权重集下的预测表现,CV的计算方法实质上是有约束的二次规划;第五步,选择使交叉验证平均预测误差最小的权重矩阵w;第六步,计算在w的预测值下的Y(w)的预测值,称之为模型平均预测值(MAP)

进一步,张老师介绍了在错误设定的主模型下的理论性质,首先定义风险函数R(w),目标为极小化风险函数。对此,张老师给出了五个假设,分别为无论模型设定对错估计值都可以收敛到真实值、方差有界性、可导性、一致可积性、在有限参数值已知和最优权重矩阵情况下的最小风险ξ>>n-1/2N2,如果主模型是正确的,那么可以证明ξ=0,假设5不成立。进一步可以证明,在上述假设下,会得到最优权重选择。之后张老师讨论了在正确设定的主模型下的理论性质,此时将假设5更改为假设6,即错误模型的加权极限要远大于n-1/2(N+M2),在此假设下,主模型被赋予的权重为1,而辅助模型的权重为0。同时可以证明,在大数据应用中,model averaging方法比简单平均的方法表现更好。由于现实中模型的复杂性不会随样本大小而增加,因此错误设定的模型的平均风险一般是常数,因此提出假设7,即错误模型加权极限风险不趋于零,这样在假设1-57满足的情况下,model averaging方法得到的风险会小于运用简单平均。需要注意的是,样本容量要求每组数据量比组数多,并且对错误模型的数量有限制。

随后,张老师进行了蒙特卡洛模拟,分别假设为线性回归模型、logistic模型以及两种模型的混合模型,比如主模型和四个辅助模型为线性,两个辅助模型为logistic模型,可以看出正确设定模型被赋予的总体权重。进一步,张老师讲述了一个该方法在现实中应用的案例,该案例研究台湾一家银行的信用卡违约情况,首先按照顾客的信用额度将顾客分为六组,y表示每个月是否有违约,x表示前五个月的还款比例,z表示性别、年龄、受教育水平等,运用这些变量来预测下个月是否会还款,分别对每组数据应用六个模型,分别测量每个组中每种模型的权重,结果表明model averaging方法相比于其他平均回归和MLE方法而言,所得结果更为稳健。

讲座最后,张老师进行了总结,并指出了该方法的缺陷,即由于随机权重和可能的模型误设,无法给预测区间。关于该模型的进一步应用,张老师指出所有面板模型都可以用这种方法来回归,即使不同组个体的解释变量不同。之后,张老师与在座师生就该方法是否可以用于结构突变模型、分组数据的相关性、overfitting的问题、在空间模型中能否运用该问题等内容展开了进一步讨论,大家受益匪浅,讲座圆满结束。


微信公众号