全球电子商务、移动支付、社交网络以及云计算和大数据等互联网技术和商业模式的发展正改变着个人的生活方式与企业的运营方式。 以信息采集、整理、保存、加工,并向信息使用者提供服务的信用业也日益受到信息技术的冲击。大数据征信正在全球掀起征信业的变革。
征信业与信息技术联系密切。信息技术的进步驱动了信用风险管理水平的提高,促进了信用的可获得性。大数据技术出现之前,征信评价技术的发展可以说经历了三个阶段。
第一个阶段( 1950年以前) : 定性信用风险决策。
1950 年之前,审贷过程是根据放贷人的经验和对借贷人的了解,由人工来完成的。这种定性的决策方式,缺乏一个客观统一的标准,是否发放贷款完全依赖于信贷员个人的经验,而且决策效率很低。审贷不具备客观性和科学性。
第二个阶段( 1950-1980 年代) : 局部风险量化分析。
1956年信用评估数据挖掘公司费埃哲( FICO)成立,来自斯坦福的工程师William Fair 和数学家Earl Isaac 进行了数学分析模型和工程实现的整合,推出一个量化评分系统。利用FICO 评分模型,银行等信贷机构可以进行自动化的批量审贷,增加了信贷的可获得性,减少了违约率,引领了消费信贷的第一次革命。
由于仅仅使用内部的数据进行FICO 个人评分建模,因此FICO 模型在解决信贷交易双方信息不对称问题上的作用仍有局限。
第三个阶段( 1980年-2010年) : 全局量化风险分析。
1980年之后,征信机构Experian 收集了不同信贷机构个人消费者的信贷信息,形成了消费者的全局信息。不同的信贷结构之间共享全局信息,可以全面地了解个人消费者的信用状况,更好地解决了信息不对称问题,促成了信用风险管理的又一次革命。由于征信机构不能为缺少信贷信息的少量个人消费者提供全局信用记录,因此这类消费者无法享受信贷机构的正常服务。
目前,数据库技术、互联网技术、云计算与物联网技术的突飞猛进使人类社会进入了大数据时代,更高维度的数据和不同层次的数据都用于信用评分建模,挖掘数据潜在的价值。
各种机器学习的算法和模型广泛地用于企业信用风险评估中,以全样本为对象进行如因素分析、判别分析、分群分析、决策树、类神经网络以及规则归纳等。Ling-Jing Kao, Chih-Chou Chiu, Fon-Yu Chiu 将分类回归树模型应用于个人信用评估,准确率达到 92.9%,结果优于判别分析、Logistic 回归、SVM 等方法。Altman 使用神经网络(ANN)模型对企业信用进行评估,用于预测企业资金的窘迫度,并与 Logistics 回归模型进行了比较分析,结论是 ANN 模型以判别度 92.8%优于其他模型。
以大数据个人征信ZestFinance公司为例,在ZestFinance的大数据模型中,要用到3500个数据项,从中提取个变量,利用10个预测分析模型进行集成学习或者多角度学习,进而得到最终的消费者信用评分ZestFinance 的数据源是大数据,可以生成数以万计的风险变量,然后分别输入不同的预测模型中,例如欺诈模型、身份验证模型、预付能力模型、还款能力模型、还款意愿模型以及稳定性模型等。每一个子模型都从不同的角度预测个人消费者的信用状况,克服了传统信用评估中单个模型考虑因素的局限性,使预测更为精准。
基于大数据的新型信用评分模式较传统模式引入更多的变量,大大降低了贷款违约率。据ZestFinance公司网站介绍,目前该公司发放的发薪日贷款由于使用新的评分模型,相关贷款人的违约率降低将近50%。
大数据背景下,征信市场参与主体不断增加,市场竞争日趋激列。传统的征信机构对于大数据征信的态度比较谨慎,以研发为主,逐步推进;而新兴的互联网金额公司则比较激进,基本上直接利用大数据技术替代传统征信技术进行信用风险评估。在传统征信机构方面,全球最大的个人征信机构Experian(益博睿)已开发出跨渠道身份识别引擎,连接客户消费接触点。早在多年前,就投入研发社交关系数据,并探究互联网大数据对征信的影响。全球第二大征信机构Equifax(艾克飞)通过构建自己的数据创新团队和收购中小型IT高科技公司来为大数据产品和服务的研发布局。
文章来源:《大数据》 网址: http://www.dsjzz.cn/zonghexinwen/2020/0818/679.html
上一篇:IDC预测中国大数据市场规模2020年将达104.2亿
下一篇:报告:预计今年中国大数据市场规模达到104.2亿