征信大数据90%是垃圾,真正有用的数据从哪里来?

图灵汇官网

入夏以来,互联网金融市场动荡不断,尤其是在7月份,短短十天内就有超过一百家平台出现问题,引发了公众的高度关注。

从早期的野蛮扩张到后来的监管风暴,再到如今的两极分化,互联网金融市场的格局正在经历一个从高额利润到价格竞争再到健康发展的转变。与此相对应,放贷机构的竞争也经历了三个阶段:首先是资金成本的竞争;其次是运营成本的竞争;最后是风险成本的竞争。关键转折点在于征信体系的建立。

征信大数据:90%的数据质量堪忧

回顾中国互联网金融的发展历程,大致可以分为三个阶段: - 2006年至2011年,是信贷资产的探索期:平均贷款额度在3至5万元之间,目标客户主要是白领和企业主,主要通过线下渠道获客。 - 2011年至2013年,是信贷资产的爆发期:授信额度呈现两极化趋势,目标客户扩展到学生和蓝领阶层,线上获客变得越来越重要。 - 自2013年起,信贷资产逐渐场景化:大型电商平台如阿里、京东等纷纷加入。

随着信贷资产的发展,征信需求和解决方案也发生了变化。在探索期,风控主要关注负债率,征信工具主要是分散的QQ群,效率较低。进入爆发期后,风控开始关注借款人的稳定性和借款用途,征信工具转向了系统化的中央数据库,效率有所提升。

当前,国内大数据征信行业正处于快速发展阶段,组合式信用评估成为趋势。然而,尽管许多企业声称拥有大量数据,但其中大部分是低质量数据。据一位风险投资家表示,很多企业盲目收集大量数据,缺乏规划和结构,导致收集的数据大多无用。

百行征信占据主导地位

自1980年代末以来,征信行业经历了多个发展阶段,包括起步、平台搭建和央行主导等阶段。2015年,中国人民银行曾要求八家机构做好个人征信业务的准备工作,但最终成立的却是由互联网金融协会与芝麻信用、腾讯征信等机构联合组建的百行征信。

今年6月,百行征信与15家互联网金融机构和消费金融机构签署了信用信息共享合作协议,标志着百行征信正式运作。截至目前,百行征信已与超过120家机构达成了信用信息共享协议,另有50家机构表达了合作意愿。

尽管百行征信在行业内占据主导地位,但信息孤岛问题依然存在。各家征信公司都在利用中央数据库的方式存储和查询数据,但并非所有机构都愿意主动上传数据,操作起来也较为复杂。此外,信息共享的边界、数据质量和隐私保护等问题亟待解决。

小公司难有发展空间

在一位互联网金融领域的风险投资家看来,中国征信市场仍以官方机构为主导,市场化机构的空间有限。传统征信产业链由数据公司、征信公司和征信使用方三部分组成。数据公司的核心竞争力在于掌握独特数据源的能力,而征信公司的核心竞争力则在于数据源的完整性和数据分析能力。

互联网技术虽然增加了数据源,但并未能彻底改变征信公司的核心环节。对于初创公司而言,没有征信牌照意味着无法合法获取核心数据,也无法以牌照进行融资,从而难以在市场上立足。

因此,业内人士普遍认为,初创公司很难在征信领域取得重大突破,成为未来的行业巨头。相比之下,美国的FICO评分模式在中国难以复制,原因包括银行已有自建模型、传统模型无法满足多维度数据需求以及细分市场对专业模型的需求增加等。

本文来源: 图灵汇 文章作者: 蓝鲸TMT