(暨南大学统计学博士后科研流动站)
【摘要】以数据生成过程为导向,探讨了异方差来源的基本类型;依据非参数统计的基本思想,设计了切实可行的Mood方差检验方法与平方秩检验方法,并针对异方差来源类型,分析了相应的检验思路。蒙特卡罗模拟表明,Mood方差检验方法在异方差检验方面具有很高的检验效力;平方秩检验方法在异常经济现象情形下检验效力较低,而在其他情形下检验效力很高。同时,进一步阐释了纠正异方差的基本逻辑。
关键词 非参数统计 异方差 数据生成 蒙特卡罗
中图分类号 F224.0 文献标识码 A JEL分类号 C14:C15
A Test for Heteroscedasticity from the Perspective of Nonparametric Statistics and its Application
——Based on the Data Generated Process Oriented
Abstract: Based on the Data Generated Process Oriented, the paper discusses the basic types of the source of heteroscedasticity. According to the basic idea of nonparametric statistics, it designs the feasible Mood and squared rank test methods, and it analyzes the testing sequence in view of the source of heteroscedasticity. Monte Carlo Stimulation shows that the test power of the Mood method is very high; the test power of squared rank test method is lower in the case of abnormal economic phenomenon, but it is higher in the other case. At the same time, it further explains the basic logic for the correction of heteroskedasticity.
Key words: Nonparametric Statistics; Heteroscedasticity; Data Generated; Monte Carlo
引言
作为实际经济现象数量分析的有力工具,计量经济学至今在经济学领域的经验研究中占据着重要地位。计量经济学主要处理的是变量之间的统计依赖关系,这种统计依赖关系是确定性依赖关系与随机性依赖关系的集合体。其中,随机性依赖关系更多地体现在随机扰动项的设定方面,这也是计量经济学中“计量”的本质与精髓。因此,考察随机扰动项的基本特征是研究计量经济学理论的重要内容。而随机扰动项的基本特征主要体现在基本假定方面,其中同方差性假定是其基本内容之一。若忽略该假定,则通常的t检验与F检验将不再有效。异方差检验因而成为众多学者努力研究计量经济学理论的重要方向。目前异方差检验的方法主要有帕克检验、格莱泽检验、斯皮尔曼等级相关检验、戈德菲尔德—匡特检验、怀特检验等,其基本思路是:检验随机扰动项的方差是否与模型中的解释变量存在着某种关联。实质上是对背后的数据生成过程的一种探索,这种探索蕴含着一个假定:在穷尽作为解释变量的恒常性因素[2]前提下,若随机扰动项存在异方差,则该异方差是由模型中的解释变量所致。这种检验思路具有一定的合理性与优越性,既可以确定异方差产生的来源,又可以进一步提出补救措施。然而,这是在考虑所有作为解释变量的恒常性因素前提下的假定,由于现实经济问题的复杂性,实际经验研究中该前提往往得不到满足,如遗漏重要解释变量等,此时随机扰动项的方差可能与模型构建中的解释变量不存在关联,若依然利用上述检验方法进行异方差诊断,很可能导致检验失效。进一步地,即使满足了前提条件,由于在不同时间与不同空间下无数单独影响可以忽略的非显著因素集之间差异性的存在,随机扰动项的方差也存在差异。因此,上述方法在此情况下通常不具有适用性。
为突破随机扰动项的方差与模型中的解释变量存在某种关联的限制,国内学者从不同视角进行了相关研究。夏帆和倪青山(2012)提出了分布拟合的检验方法,该方法通过样本数据的分布与同方差假定下应该具有的F分布之间是否存在显著差异来进行异方差检验。但该方法在实际应用中无法分析异方差产生的原因,也没有提出进一步纠正异方差的措施。兰嘉庆和余宛泠(2004)克服了参数服从假设分布的缺陷,提出了检验异方差的游程检验方法。该方法需要先对估计残差进行分类和排序,但没有明确按照何种规则进行排序,不同的排序方式导致检验结果差异很大,而且该方法也没有提出进一步的补救措施。张荷观(2006)根据回归分析的基本思想,提出一种基于分组的异方差检验方法,该方法不依赖于模型估计后的残差,但该方法设定样本数据具有重复性,即一个解释变量对应于n个被解释变量。由于客观经济世界具有不可逆性,因此,这一设定不具有现实性。
针对上述局限,本文从问题研究本质,即数据生成机制出发,探讨异方差产生的来源,在此基础上进行非参数统计设计,并据此阐释纠正异方差的哲学逻辑,以期抛砖引玉,以达到对异方差检验正本清源的目的。
[1] 本文获得国家自然科学基金项目“中国战略性新兴产业的空间布局与发展路径”(71273276)、教育部哲学社科青年基金项目(13YJC910004)的资助。
[2] 李子奈(2008)将影响被解释变量的因素集分为显著的恒常性因素集、显著的偶然性因素集和无数单独影响可以忽略的非显著因素集,其中解释变量为所有显著的恒常性因素集。