大数据征信的探索之路

未央网

一、 大数据征信诞生的背景

二十多年间,伴随着经济体系的变革,我国企业信贷体系发生了重大的变化,由以大型企业为主要贷款群转变为中、小、微企业成为贷款主力军。面对新的贷款群体,银行资金机构无法充分地给予资金,造成了日益严重的“中小微企业融资困境”。林毅夫早在2001年《经济研究》发表的文章《中小金融机构发展与中小企业融资》,认为小型金融机构更适合服务于小企业,奠定了我国之后大力推动中小型金融机构发展的理论基础。城市商业银行农村信用社、小额贷款公司纷纷成立,带动全社会的小微企业贷款产品激增,资金供给量大大提高,数年间小微企业融资环境得到了很大的改变。

然而,小型资金机构的出现并没有从根本上解决小微融资的困境,相对于大企业,小微企业对资金的占用比例极低(约30%),与小微企业对GDP的贡献(约70%)极不相称。近年来,小微企业的生存压力不断增大,传统行业竞争激烈,利润空间被不断挤压,赊销使小微企业面临残酷的资金周转压力,因资金链断裂倒闭的小微企业比比皆是。这种情况更加剧了资金机构“惜贷”行为,对小微企业贷款的负面预期导致小微企业贷款收缩,小微企业、小型金融机构两方陷入恶性循环。小微企业和小型资金机构处于整个信贷体系的最底层。

小微企业信贷的困局看似很复杂,牵扯宏观、微观各方的行为,但实际我们看所有小微信贷的难点,全部集中于一点:资金方认为无法看清小微企业的风险,自然不能放款,这称之为“信息不对称风险”;既然无法识别风险,资金方制定了回避小微借款的贷款政策,形成了“逆向选择”,小微信贷就此止步,陷入无钱可贷的困境。无论是大型银行,还是小型资金机构,都面临同样的问题,所以都对小微信贷无计可施。这个问题可以笼统地称为社会诚信体系欠缺导致信用风险高。

信用体系欠缺导致资金方难以看清小企业实际情况,这有着现实的原因。我国的小微企业内部管理是很随意的,很多交易不会以规范的方式记录下来。正规的资金方需要经过严密的尽职调查第一还款来源(依靠经营偿还借款),辅之以第二还款来源(抵押品),才能做出决策。这个过程可以称之为“征信”或者“信用审核”。前面我们已经分析过,由于资金方缺乏有效的可利用于小微企业的信用调查、审核手段,对于小微贷款项目,这个过程不但冗长成本很高,而且通常难以找到准确、真实、有价值的信息,阻碍了小企业信贷的成功率性。同样,对于那些私募资金机构、民间资金机构,本来没有能力进行相关调查,放贷只能靠感觉和其他手段,风险更大。

由此,我们可以得出结论:小微企业贷款的瓶颈是“缺乏高效率、低成本、高精度基础征信服务”。可以想象,如果资金方有能力以一种低成本的方式准确识别小企业是否可信,再加以辅助风控措施(担保、抵押等),小微业务将变得有利可图,资金通道可以就此而打开,小微信贷就会变得顺畅而有序。大数据征信正是在这种社会背景下应运而生的。

二、 大数据征信技术的几条探索之路

随着大数据技术在各行业的深入应用,运用大数据为征信打开一条通路,逐渐成为了社会主流的意识。信用服务从业者、政府信用办公室、互联网金融公司对此进行了不懈的探索,期待找到一种可以针对于小微企业的量化深度评判方法。下面我们分析一下当前主要几种方法的特点。

(一) 量化信用评价(评级)模型(由内而外型)

多年以来,信贷机构、征信机构和评级机构一直期待着能够形成一个量化信用模型,将各方面的数据导入模型之后,能够自动生成评级结果,提示是否可以放贷。经过长期的探索、研究、试验之后,这个理想的模型一直没有出炉。我国部分有实力的资金方引进日本、美国知名咨询公司的信用分析模型,但这些模型对我国的实际情况的适用性很差,没有达到期待的效果——导入相关数据后即可对企业偿还能力和偿还意愿作出可靠的判断。

国外的先进模型以及国内机构的多年模型探索,都没有形成一个普遍性有效的评判小企业的量化模型,主要原因是我国小企业的数据质量低下。由于无论国内外使用的企业数据主要是财务报表数据,而财务数据是会计师事务所出具的。我国诚信体系存在巨大缺失,会计师事务所出具的审计报告几乎是制造出来的,其可信度很低。对于诚信企业,这份报告具有较大的参考性,而对于蓄意骗贷企业,也未必能够从审计报告中看出破绽。各种量化模型的探索之所以没有得到令人满意的结果,正是由于其所依据的数据质量是低下的,所以无论如何也不可能得出真正有价值的信息。这种方法基本上宣告了是无效的。

(二) 外部数据库接入(由外向内)模式

在企业内部数据质量不佳的条件下,各类机构开始向外寻找广度更大、更加可靠的数据来源,例如政府各部门的数据,税务系统数据、工商信息、行业主管单位业务数据、海关数据等,各行业协会的经营性数据等,也有在电商平台上积累的交易数据(如淘宝上的交易数据)。基于这些数据查找与某企业相关的数据并进行综合分析。我们称之为“由外向内型”的数据体系,也就是企业征信服务不再是从被评价的企业提取数据,而是运用外部数据体系实现。

这种模式的优势在于:数据库系统形成之后,单个企业的征信信息采集将非常容易,征信服务的边际成本极低,且速度极快,直接带来的好处是征信服务的收费将非常低廉,并且服务量很大。但这种模式也存在自身的劣势:对接多部门数据入口是一项巨大的系统工程,建设、磨合的成本很高,当前除了工商信息可以达到全国联网外,其他部门信息均在分布在市级部门,整合工作相当巨大。另外,也是最严重的问题还是数据质量。我国的小企业对外报送的经营信息具有很大的随意性,都是根据具体需要编出来的,例如为了避税、贷款或者其他目的。有些地区政府为了鼓励当地企业发展,给予很高的纳税优惠,比如核定一个固定纳税额度,这样的话就不会要求企业如实报送。因此,从各部门搜集到的数据恐怕与实际情况相差较远,如果用做征信服务,可信性也会遭到质疑。同时,一个企业产生的数据并非全部对外报送,事实上,对外报送的数据仅占一小部分,如基础财务报表、应纳税额等,而大部分的能够说明企业情况的数据沉淀在企业内部,如供销信息、产品品类、资金流转等,这些数据无法通过外部数据库找到。外部数据库的数据量虽大,但针对于某单一企业,却显得容量不足了。如果是电商内部生态圈数据也相对片面,因为一个企业不会仅仅通过一个电商渠道销售,单一电商交易数据显然是不够全面的。

如果用外部数据编织数据网的话,这张网将是巨大的,几乎可以覆盖全国的企业。但由于关于某一企业的数据量不足,这张网的数据线条比较稀疏,也就是数据网眼很大,多数关于企业的有价值信息都被漏掉了,有效信息过小,不足得出可信的结论。这就是由外向内建立征信数据体系的探索。数据网与有效征信的关系好比下图的关系:

国务院交办发改委建立全国信用体系以来,各级政府信用办公室主导将辖区内各个掌握数据的政府部门连接起来,形成一个统一的信用信息平台,由专业的第三方公司或者设立下属公司运营,出具满足社会需求的征信报告。除政府外,也有社会征信机构做类似的事情,接入一些政府端数据并运营。从目前的发展来看,这类征信服务当前能够提供的最主要的信息是工商注册类的信息,以及少量的各部门备案信息。这类征信服务提供的信息简单,收费低廉,但对于信贷业务而言,基本上没有发挥太大的作用。

(三) 单体企业数据征信服务(由内向外)

另外一种数据征信服务,是从企业内部挖掘有用信息,从这个角度来说,这种方法和传统的征信方法是一致的,不同的是采集的信息和分析模式。现在有些专业征信公司也在研发由内而外的数据征信方法。这种方法利用的数据量不像社会征信的数据量那么大(因此称“小数据”),但与贷款相关度很高,再保证真实度的基础上,可以得到很多有价值的信息(“大信息”),并且均为信贷业务中资金方最关注的信息。该项服务可以帮助资金方在最短的时间内评判该企业是否能达到可以贷款的条件,为资金方节约大量的调研时间和成本,适应小微企业融资的效率要求和风控要求。

数据征信虽然应用的基础数据量不像政府部门数据那样多,那样大,但采集到的都是相关度最高的信息,可以捕捉企业真实经营情况和偿还能力。如果从数据网的角度看,这种方法形成的数据网较小(只适用于某单个企业),但数据“网眼”恰好适合保留住关于该企业的大量有价值信息,而筛查掉无关信息、干扰信息,形成深度、高质量的征信报告,为信贷决策提供可靠依据。

这种数据征信服务的优势是,启动快,无需长期建设成本,很好地适应我国现有的信息基础和社会现实。其难点在于如何取得借款企业的充分信任因此愿意提供深度数据。

企业数据征信技术已非一个技术上的构想,而是已经开始了大量的实践。数据征信已经在担保业务、小贷业务中发挥了重要作用,帮助担保公司小贷公司排查风险、清晰评估项目、提高业务效率。相信随着市场环境的变化,将有越来越多的人意识到这种技术的价值。