关联函数在小微金融中的应用 普惠金融贷款可靠吗

  [提要] copula实际上是一个多元分布函数,主要用于独立同分布多元时间序列建模。本文首次将coupla方法用于综合评价。根据经验选择婚姻状况、已有额度、资产合计、从事行业等四个指标作为申请人贷款能力综合评价指标体系。对于每个指标单独拟合一元分布,把累积分布函数看成标准化函数,标准化数值服从[0,1]区间的均匀分布。采用基于经验Copula的拟合优度检验,从五种常见的Copula,正态Copula、t Copula、gumbel Copula、frank Copula和claytonCopula中选择最优的t copula,极大似然估计其参数。最后将copula分布函数值当成综合评价值,给出申请人贷款能力排名。排名结果符合实际授信额度。
  关键词:小微金融;综合评价;copula;拟合优度检验
  中图分类号:F83 文献标识码:A
  收录日期:2013年4月20日
  在“高信用风险、高人工成本”的小微企业贷款业务中,如何降低不良贷款率是小微金融能否持续发展的关键之一。降低不良贷款率的核心在于如何从众多小微企业中甄选出优质客户。本文根据实际操作经验,选取对于贷款发放影响最大的四个指标,首次将多元统计中的copula方法综合评价小微企业贷款能力,定量给出申请者排名,为银行相关决策者提供借鉴和帮助。
  一、copula简介
  随机向量的联合分布函数是刻画随机向量概率性质的最好工具之一,分布函数是对变量变化规律的精确描述。在实际应用中,都要假定变量服从某一分布,正态分布是最常用的分布,其原因是现有的许多定理及结论都是与正态分布有关。尤其是大数定律及中心极限定理更是奠定了正态分布在概率统计中的重要地位。然而研究表明,在对诸如股票、汇率等金融变量进行分析时,假设这些变量服从正态分布并不合适。copula函数着眼于具有非线性特征的变量间的相互关系,对变量的相关性建立模型。copula函数最大的优点是把随机变量的边缘分布和它们之间的结构关系分开研究,使得研究过程更加清晰,方法更加灵活。
  Copula理论是由Sklar在1959年提出,Sklar指出,可以将任意一个n维联合累积分布函数分解成n个边缘累积分布和一个copula函数。边缘分布描述变量自身特征,copula函数描述变量之间相关性。任意边缘分布和任意copula都可以组合成一个崭新的多维联合累积分布函数,大大扩展了多元分布类型。
  常见的copula有Gauss Copula、Gumbel Copula、Clayton Copula和Frank copula。其中,Gauss Copula为:
  C (u,v)= ·exp{ }dsdt
  其中,?渍为一元标准正态分布,p∈(-1,1)。C 事实上是边际分布为标准正态分布。诸多研究表明,在数据的中间部分,模拟C 与实际数据吻合较好,但在尾部差别相当明显,当要度量尾部风险相依性时,椭圆族的高斯Copula是无能为力的。
  Gumbel Copula的密度函数具有非对称性,上尾高下尾低,其密度分布呈“J”字型。Gumbel Copula函数上尾的相关性较强,可用于描述在上尾处具有较强相关关系的现象。收益率呈左偏分布时,多用Clayton Copula去描述相关关系。Gumbel Copula函数的分布函数为:
  C (u,v; )=exp{-[(-lnu) +(-lnv) ] }
  Clayton Copula函数的分布函数为:
  C (u,v; )=(u +v -1)
  Clayton Copula的密度函数同样具有非对称性,上尾低,下尾高,其密度分布呈“L”字型。Clayton Copula函数下尾的相关性较强,可用于描述在下尾处具有较强相关关系的现象。收益率呈右偏分布时,多用Clayton Copula去描述相关关系。Frank Copula函数的分布函数为:
  C (u,v; )=- log[1- ]
  二、以累积概率分布函数标准化贷款指标
  根据个人工作经验,选择婚姻状况、已有额度、资产合计、从事行业II四个指标作为申请人贷款能力综合评价指标体系。四个指标中已有额度和资产合计是数值型变量,而婚姻状况和从事行业II是分类变量。22个申请样本中已婚者最多有15人,离异6人,只有1人未婚。从事行业II总共13个因素水平,最多的行业有3个样本。22个申请人中有一部分是以前没有在民生银行贷过款的新客户。而资产合计有2个申请人的资产远超于其他人,达到6,000多万元和8,000多万元。
  评价的第一步需要将指标标准化,剔除不同指标量纲的影响,一般标准化到[0,1]区间或者[-1,1]区间。标准化方法很多,理论上只要值域是[0,1]区间的函数都可以作为标准化函数。但有时需要考虑标准化函数的实际含义,选择比较简单的函数。
  婚姻状况和从事行业II分类变量可以看成离散分布,标准化数值可取离散分布的经验分布函数。已婚和离异对于授信额度没有差别,但是未婚者授信额度较低。将未婚者标准化为0.3,已婚和离异者标准化为0.9。同样对于从事行业II,个人经验表明,建材>交通运输设备>服务>仪器仪表>家具>医药、医疗设备>日用品>金属,剩下的服装、器材、食品、饮料和专用设备看成和基准行业服务一样。授信能力越强的行业,赋予其值也大。
  假设已有额度和资产合计服从伽玛分布,其形状参数和尺度参数可以采用极大似然估计。两者的Kolmogorov-Smirnov 检验结果如表所示,两者相伴概率都大于0.05,接受原假设,认为已有额度和资产合计两个指标服从伽玛分布。取伽玛分布参数为极大似然估计值,指标标准化值为累积分布函数值。
  三、copula评价结果   Copula种类很多,如正态、t、阿基米德、混合等等,不同生成元函数的阿基米德Copula各不相同。到底哪一种Copula适合数据,这是一个普遍问题。由于Copula种类太多,我们不可能在所有类型中选取,而只能在很小一部分Copula中选取。要想比较优劣,必须制定统一准则,计算不同Copula准则得分,取最大或者最小得分者为最优Copula。这就是Copula拟合优度检验问题。目前已有Copula拟合优度检验方法包括基于概率积分变换的拟合优度检验、基于核密度估计的拟合优度检验、基于卡方拟合优度检验、基于生成元核密度的拟合优度检验等。R语言的Copula宏包提供了一种基于经验Copula的拟合优度检验。
  选择五种常见的Copula,正态Copula、t Copula、gumbel Copula、frank Copula和clayton Copula,其中正态和t Copula 属于椭球型Copula,gumbel、frank和clayton属于阿基米德Copula。椭球型Copula 方差矩阵(dispersion matrix)含有较多参数,对于Copula,方差矩阵也称作相关矩阵(correlation matrix),决定变量之间的相关结构。方差矩阵通常有以下几种形式:1阶自回归(autoregressive of order 1)、可交换(exchangeable)、Toeplitz和一般形式。
  采用R语言基于经验Copula的拟合优度检验。由于t Copula和gumbel计算时间过长,改用基于乘子中心极限定理方法,其他Copula采用参数自助法。假设边缘分布为连续分布,这是该检验方法的基本前提。连续分布出现两个相同的值概率为零,如果样本中存在两个相同的值,就会影响最后相伴概率的计算。如果相伴概率都小于0.05,拒绝原假设,认为不服从该copula。在5种Copula中,只有t Copula对应的相伴概率大于0.05,认为t Copula最适合本文贷款数据。
  计算22个样本标准化数据对应t copula的概率分布函数值,作为综合评价值,所得排名与他们授信额度基本吻合,授信额度大的申请人排名都比较靠前,只有21号样本申请人授信额度400万元,但是排名最靠后。查阅此人申请资料,发现此人属于跟其他2个申请人一起联合担保,每人400万元额度。其他2人实力很强,但是此人本身经济实力较为一般。贷款额度最小的7号84万元和22号申请人95万元排名都非常靠后,说明基于copula的综合评价确实能反映申请人的银行贷款能力。
  四、总结
  本文根据个人工作经验,最终选择婚姻状况、已有额度、资产合计、从事行业II四个指标作为申请人贷款能力综合评价指标体系。首次将多元分布copula方法引入综合评价,得到各贷款申请人能力排名,为银行发放贷款提供一定的支持和参考。
  主要参考文献:
  [1]Nelsen R.An Introduction to Copulas[M].Berlin:Springer,1998.
  [2]史道济,姚庆祝.改进Copula对数据拟合的方法[J].系统工程理论与实践,2004.24.4.
  [3]Wang W,Wells M T.Model selection and semiparametric inference for bivariate failure-time data[J].Journal of The American Statistical Association,2000.9.