关于ZestFinance与京东合作国内个人征信的思考

未央网

从今年6月至今,市场各方都对央行首批个人征信牌照的发放翘首以待,足见个人征信体系建设在整个经济体系建设中的重要地位。随着这片蓝海的出现,众多企业对第二批牌照的申请跃跃欲试。6月底,京东金融与美国创业征信公司ZestFinance携手,创建JD-ZestFinanceGaia,筹备运用京东大数据开展国内个人征信业务。

与国内首批获准开展个人征信业务准备工作的机构相比,京东为什么不像他们一样选取类FICO[1] 的评分体系,而是在众多的标准中锁定了ZestFinance呢?

首先,市场需求是其产生的根源。在FICO一统天下的时代,金融数据在评分体系中占了相当大的比重,这对那些金融信用数据缺失或质量较差的个体在获取信贷方面是不公平的。这使得那些处于中下层的信用主体陷入了一个困境:越是需要资金,越难以较低的成本获取。相应的,高利贷的恶性循环随之而来。相比之下,创建于2009年的ZestFinance正是对原有个人征信体系的一种颠覆。它运用先进算法和多维度的大数据对借贷主体进行信用状况分析,并提供贷款和担保业务,致力于帮助信用主体降低借款成本,从而对其利益进行保护。

其次,ZestFinance的模型算法也更加稳健。美国三大征信局使用的FICO和国内一些个人征信机构的产品在方法上通常采取逻辑回归和决策树。然而,这两类方法是存在很大缺陷的。例如,逻辑回归一般只能包含至多10-15个风险因子,且各变量必须服从正态分布;决策树要求对所有申请者的分类是完全互斥的。显然,这些要求是难以满足的,由此产生的结果是“偏误”还是“错误”也很难评价。作为改进,ZestFinance首先对子模型采取更真实的非逻辑回归,再用多模型集成学习替代了对子模型的单一机器学习。

第三,ZestFinance认为“所有数据都是信用数据”。个人信用评价是对信用主体综合行为模式的判断,远非一个模型和几个维度的金融数据那么简单。不仅应尽可能的充分包含金融领域的行为模式数据, 同样应包含对非金融领域行为模式的评判,这也是对FICO的一大挑战。当然,这个角度并不说明风险因子越多越好,有效性是高拟合度的重要保障之一。

具ZestFinance官方统计,其评分结果较目前业内的最好评分提高了40%,不仅降低了借款人的成本,也在低违约率的前提下拉升了债权人的收益。

以上先进的技术和想法都是我们从ZestFinance身上学到的,然而,当它与京东真正开启在中国市场的合作,是否也有一些问题值得思考呢?

最核心的问题是来自数据层面的。我们知道,美国的市场是高度信息化的,各个子市场的高度发达都为多维大数据的获取创造了可能。这也正是ZestFinance把其所擅长的算法等技术发挥到极致的前提。对于目前的京东而言,其数据主要集中在消费金融方面,在社交、旅行等许多非金融场景的数据还不能有效覆盖,这会导致对信用主体非金融行为模式判别的缺失。在这种情况下,ZestFinance针对新市场的模型的有效性仍是未知的,与其在本土市场的表现差距有多大都是值得期待的。当然,在长期,对国内个人征信大数据的可得性和质量是乐观的。就像当下,政府大力推动的“大众创业,万众创新”就是拉动不同市场需求的催化剂,而需求拉动又是弥补数据缺口的有效途径之一。

另一方面,信息安全问题也是值得及早重视的。ZestFinance和TransUnion这些个人征信企业只是在国内开展业务的先锋,随着这个市场的不断发展完善,可能会有越来越多符合监管要求的国外征信企业进入市场。首先,个人征信的大数据属性注定了其与资本市场信用评级的不同。对我国居民个人隐私和相关行业大数据的保护是十分必要的。监管机构和相关合资方、合作方应务必在其运用国内大数据进行测试、开展业务的同时,通过法律、协议等保密手段严格进行风险控制。

此外,征信标准的制定在某种程度上是具有战略意义的。我们不能仅因为国外征信机构以往在某些目标市场的良好业绩就盲目迷信其方法和思路。这其中不仅仅有市场情况变化的原因。应该有更多的专业人士参与其中,预防所开发的信用评价标准过度的刺激或限制某一细分市场的发展,这在战略角度对我国的经济发展是不利的。从这个角度讲,国内个人征信机构强化自身实力迫在眉睫。

[1] 首批八家评分方法尚不明确,此处“类FICO”不代表任何确定性。