2020-10-10 来源:
原文信息
Tobias Berg, Valentin Burg, Ana Gombović, Manju Puri, On the Rise of FinTechs: Credit Scoring Using Digital Footprints, The Review of Financial Studies, 2020.7
摘要
文章讨论了通过“数字足迹”,即用户访问浏览网页或注册而留下的记录数据,来预测消费者的信用违约情况。文章发现,即使是那些非常简单且容易获取的变量,其预测能力也可以与信用评分的预测能力相当。数字足迹是对征信机构的补充而不是替代,他可以影响对信用的评分并降低违约率。研究者讨论了“数字足迹”对金融中介机构的业务模式、非银行信贷渠道的影响,并进一步分析了其对消费者、企业和监管机构数字领域的行为影响。
以下为正文内容:
1引言
互联网留下了几乎每个人的信息痕迹,我们将其称之为“数字足迹”。即使没有在网络上专门编写有关自己的文本信息,上传财务或社交网络注册、浏览等简单行为,也会留非常有价值的个人信息。本文中,研究者试图获取“数字足迹”是否有助于增强对个人违约的评估,以及它是否可用于预测消费者付款行为和违约概率。
利用数字足迹对向消费者提供信贷有着非常重要的意义。金融中介机构的存在的一个关键原因是,银行拥有出色信息收集、处理和筛选能力,能都对借款人的信贷申请进行评估、监督,很好地解决信息不对称问题。但是,如果藉由数字足迹就能获取关于个人违约的重要信息,那么金融科技公司有望凭借其卓越技术优势,威胁金融中介机构的信息优势,从而挑战金融中介机构的业务模式。
文章使用了一个全面而独特的数据集,用以分析那些简单且极易获取的“数字足迹”对于预测评估违约概率的重要性。该数据集包括了德国一家电子商务公司约25万笔商品交易记录。需要说明的是,由于该网站采取的是货到付款的模式,所以公司评估客户的信用质量是非常重要的。文中的数据集包含了十个数字足迹变量(如设备类型、操作系统和电子邮件提供商),任何在数字领域运营的公司都可以轻松访问。除此之外,文中使用的数据还包含来自私人征信机构的信用评分。因此,研究者能够分别评估数字足迹相对于征信机构得分的识别能力。
研究结果表明,即使是那些简单易于访问“数字足迹”也可以表征个人的重要信息,如收入、性格和声誉,这些信息对于预测违约概率有着非常高的价值。Bertrand和Kamenica(2017)指出,iOS设备的使用者是收入处于25%的最佳预测指标之一。
2制度设置、描述性统计和数字足迹
文章数据来自一家德国电子商务公司,该公司主要在德国以线上的方式销售家具。购买商品前,客户需要使用其真实姓名进行注册,并提供个人地址和电子邮箱。对于公司而言,因为是货到付款模式,所以评价客户的信用非常重要。具体说来,客户下单后公司发货并开出账单,将商品和账单一起发送给客户。客户在14天内支付账单,若客户未按时付款,会收到来自公司的3次催款通知。通知后仍不付款的客户将被记为违约,该公司会将其转移到专门的收债公司。所以,文中使用的数据类似于一种短期的消费者贷款。
这家公司使用数字足迹以及来自两个征信机构的信息来确定客户是否具有足够的信誉。第一家征信机构可以提供基本信息,例如客户是否真是存在,以及客户当前是否破产,这主要用于筛选出恶意欺诈以及信用较差的客户。第二家信用机构的评分来自各个银行的信用历史数据(如信用卡等)。此外,人口的统计数据来自零售公司、电信公司和公用设施的记录。需要说明的是,这些信用分属不影响购买商品的价格。
本文使用的数据集涵盖了该公司2015年10月至2016年12月之间产生的的270,399笔交易记录。经过部分处理后,可用的观察值合计254819个,占全部样本的94%。表1提供了两个子样本的描述性统计信息。
表1:描述性统计
A组为具有信用局评分的样本,平均购买金额为为318欧元(约合350美元),客户平均年龄为45.06岁,拖欠付款的几率为0.9%。征信机构得分为0~100,99%的客户处于90~100这个区间,平均信用评分为98.11,中位数是98.86。此外,数据集覆盖了德国所有16个州,很大程度上代表了整个德国人口的地理分布。
除了征信机构评分外,该公司收集了每个客户“数字足迹”,这些数字足迹变量都是简单易用的变量,几乎每个公司都可以免费收集这些变量。下表A1列出了所有数字足迹变量。
表A1:数字足迹变量说明
3实证结果
(1)单变量结果
表2提供了具有信用局评分的客户样本的单变量回归结果。正如预期的那样,征信机构的评分非常有效:信用分数最低的客户违约率为2.12%,是平均违约率0.94%的两倍,是信用最高的那部分客户违约率的五倍。“数字足迹”变量的单变量回归结果非常有趣,代表收入和财富的数字足迹变量显示出支付行为的明显差异,如来自移动电话的订单违约率为2.14%,是来自台式电脑订单违约率(0.74)的3倍。其他数字足迹变量,如是否通过网页广告、设备的操作系统类别等,单变量回归结果也非常显著。这初步说明了数字足迹变量的区分能力。
表2:单变量回归结果
(2)多元结果:数字足迹和违约
表4提供了使用logistic回归所得到的多元回归结果,研究者针对每个种类分别报告了AUC结果。AUC是用于判断信用评分的区分力的指标,(Stein, 2007; Iyer et al, 2016), AUC的范围从50%(完全随机预测)到100%(完美预测)。在信息稀缺条件下,通常认为60%的AUC是比较理想的;而在信息丰富的条件下,AUC最好是70%或更高。
表4:多变量回归结果
表4中列1为征信机构评分作为自变量的报告结果,可以发现征信机构评分是违约的重要预测指标(AUC为68.3%,显著高于偶然对应的50%),较高的信用得分与较低的违约率相关。因此在后文中以68.3%的AUC作为数字足迹变量区分力的评价基准。列2报告了数字足迹的结果,列3同时使用了征信评分和数字足迹变量,列4则添加了年龄、性别、交易金额、购买商品月份和区域固定效果。列2中显示,数字足迹变量的AUC值为69.6%,高于征信评分的AUC值。这些结果表明,即使数字足迹中简单以获取的指标也能像征信评分一样有效地预测违约率。列3中使用征信评分时补充了数字足迹变量,结果显示与征信评分的系数和数字足迹变量的系数都几乎没有变化。这说明,数字足迹变量可以补充而非替代征信评分的信息内容。因此,同时使用数字足迹变量和征信评分的组合模型的区分力(AUC值达73.6%)显著高于单独使用征信评分(AUC值为68.3%)和数字足迹变量(AUC值为69.6%)的模型。
并且,文章中其他实证还发现:当前的数字足迹可以预测征信评分的的后续变化。征信评分可以预测传统贷款产品的违约率,文中的结果则指出了数字足迹对传统贷款产品也有很好的应用价值。
研究结果表明,即使是那些简单易于访问“数字足迹”也可以表征个人的重要信息,如收入、性格和声誉,这些信息对于预测违约概率有着非常高的价值。Bertrand和Kamenica(2017)指出,iOS设备的使用者是收入处于25%的最佳预测指标之一。
4经济意义
由于无法获取样本中客户的财务信息,也无法访问银行内部有关信息,研究者认为不能将数字足迹的信息性完全分解为财务特征的部分和软信息部分。但是,从相关文献中可以明确一些数字足迹变量与财务特征相关(例如,客户使用设备iOS与Android的差别),而其他特征(例如,购买或点击付费广告的时间)则较难与财务特征有关。
此外,数字足迹是独一无二的,几乎覆盖了世界上的每个人。此前的研究在运用非传统数据源时,较多的关注于支票账户信息、账单支付记录、保险支付记录、借记卡使用情况,数据的适用面比较窄,尤其是在新兴市场国家缺少有关服务。但是,随着世界各国使用智能手机的人数急剧增加,即使在官方记录很少且可靠的国家中,也可以非常轻松且容易地使用数字足迹。因此,研究者指出数字足迹具有独特的能力,可以极大地扩展无银行账户的信贷渠道。
文中还指在没有标准征信机构信息的情况下,数字足迹可能有助于克服借贷双方之间的信息不对称。尤其是,在发展中国家数字足迹的可用性急剧增加的推动下,出现了新的金融科技参与者,他们利用数字足迹挑战传统的银行业务并创新出了新的融资解决方案。金融科技的运用将有助于全球数十亿无银行账户的个享受到金融服务,促进金融普惠性并降低社会的不公平程度。
5结论
本文中,研究者分析了数字足迹预测消费者的违约行为的可行性,研究发现即使是数字足迹中的那些简单易获取的变量,也可以与征信机构的征信评分保持相当的区分力。数字足迹是对征信评分的补充而不是替代,这意味着使用两种来源(信贷评分+数字足迹)可以做出更好的贷款决策。研究显示,采用数字足迹方式评价客户信用质量后,违约率显着下降。数字足迹良好的客户可以获得信贷,而数字足迹状况不佳的客户则无法获得信贷。文章进一步指出,鉴于智能手机的广泛应用和数字足迹大量产生,使用数字足迹有可能为全球更多的个人提供更好的信贷服务,从而促进金融普惠性并减少不公平现象。同时,研究者也认为监管机构可能会更加密切关注数字足迹的使用,因为现有的金融机构会利用与政客和监管机构之间的良好关系来游说,对数字足迹的使用进行更严格的监管。
ABSTRACT
We analyze the information content of a digital footprint—that is, information that users leave online simply by accessing or registering on a Web site—for predicting consumer default. We show that even simple, easily accessible variables from a digital footprint match the information content of credit bureau scores. A digital footprint complements rather than substitutes for credit bureau information and affects access to credit and reduces default rates. We discuss the implications for financial intermediaries’ business models, access to credit for the unbanked, and the behavior of consumers, firms, and regulators in the digital sphere.