社科网首页|论坛|人文社区|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
返回首页
基于Lasso-Logistic模型的个人信用风险预警方法

作者:方匡南 章贵军 张惠颖

2014-02-11 10:33:31 来源:数量经济技术经济研究

(厦门大学经济学院统计系)

摘要: 随着个人消费信贷市场的不断发展,个人信用评估越来越引起人们的重视。变量选择是个人信用评估模型的重点和难点,传统的逐步回归等子集选择法存在估计结果不稳定、计算量庞大等缺陷。本文将lasso-logistic模型引入到个人信用评估中,通过模拟实验发现,逐步回归法倾向于保留一些不重要的变量,而且选出正确模型的概率较低,而Lasso不仅计算更加快捷、同时进行变量选择和参数估计,而且能更准确筛选出重要变量。此外,本文以信用卡消费信贷违约数据为例对我国个人信用评估进行了实证分析,发现相对于全变量Logistic模型和逐步回归Logistic模型,lasso-logistic模型更能抓住影响消费信用风险的关键因素,而且预测准确率也更高。

关键词: 信用风险;Lasso-Logistic模型;变量选择

中图分类号:0212     文献标识码:A    

Individual Credit Risk Prediction Method: Application of a Lasso-Logistic Model

Abstract: With the development of credit market, people pay more attention to the problem of consumption credit risk. Variable selection is the important but difficult problem in individual credit risk prediction, traditional subset variable selection method such as stepwise regression have defects as like the results isn’t robust and computation is expensive. This article apply lasso-logistic model to the individual credit risk prediction, the simulation suggests that stepwise method is apt to keep nonzero variable and the probability to select correct model is low, while lasso has the advantages over other methods in computation, variable selection and parameter estimation simultaneously and grasping key factors. In additional, this article give an empirical analysis of individual credit evaluation using credit cards data from a famous bank in China, finding that lasso-logistic model relative to full logistic model and stepwise logistic model can select key factors and the predict accuracy is much higher.

Key words: Credit RiskLasso-Logistic ModelVariable Selection

 

引言

随着金融创新和个人消费观念的改变,国内商业银行零售信贷业务,特别是个人信贷业务发展很快,其中,信用卡业务是发展最快的业务之一。据央行统计,2012年信用卡消费金额占社会零售消费总额的32%,信用卡发卡量持续增长,截止2012年底,信用卡累计达到3.31亿张。随着信用卡规模的扩大,信用卡风险的防范与管理将会成为商业银行关注的焦点之一。信用卡的信用风险是指持卡人不能或不愿按照信贷协议约定偿还本息,从而对银行经营造成伤害的可能性。个人信用风险是信用卡业务面临的主要风险。因此,构建个人信用评估系统,及时有效地应对可能发生的个人信用风险,不论从商业银行自身而言,还是从监管机构而言,都具有重大的现实意义。

个人信用风险评估的核心是建立针对不同客户类别的个人信用评分模型,根据信用评分模型对申请者的信用进行量化评分。发达国家的商业银行有着比较成熟的个人信用评估系统,但我国很多的商业银行的个人信用评估尚在摸索阶段,即使已经构建也存在不少问题。总的来说,我国的个人信用评估主要存在两大问题:首先,部分商业银行完全照搬发达国家的个人信用评估模型,但是由于国内外在消费观念和文化上等差异,因此,照搬国外的个人信用评估模型存在较多问题;其次,如何选取合适的评估指标体系,因为影响个人信用风险的指标很多,比如年龄、性别、婚姻、学历、家庭月收入等,而传统的AICBIC等子集选择法(Subset Selection)存在缺陷,主要有:第一,子集选择法是一个离散而不稳定的过程,变量选择会受到数据集的微小变化而变化;第二,变量选择和参数估计分两步进行,后续的参数估计等没有考虑变量选择产生的偏误,从而低估实际方差;第三,子集选择法计算非常复杂(孙燕,2012)。本文将lasso-logistic模型引入到个人信用风险预警模型,科学地选择评估指标体系,以期构建合适我国国情且行之有效的个人信用风险评估模型,并提高个人信用风险的预警效果。



[1] 本文受到国家自然科学基金青年项目(7120113971303200)、国家社科基金青年项目(13CTJ001)和教育部人文社科项目(12YJC790263)的资助。