
搞互联网金融的,少点大数据忽悠吧_数据分析师
副标题:大数据迷思和对线下操作的批评反映的是一种片面技术倾向
对于互联网金融,互联网行业和传统金融行业的观点往往大不相同,前者认为互联网是重点,金融不过是下一个即将被颠覆的特定行业而已,只是由于金融行业的高门槛和严监管,颠覆进程会比较曲折;后者则认为金融有自己完全不同的逻辑,信用和风险是难以逾越的门槛,护城河高筑,互联网金融只能在互联网企业的一亩三分地里自娱自乐。
但是对于大数据,二者却难得的表现出空前一致。在10月30日召开的IFC1000全球金融峰会上,金融人士异口同声宣称大数据是互联网金融的最大亮点,因为大数据在解决金融核心问题——信评和风控——上拥有传统方法所不具备的显著优势和光明前景,是金融业“真正”互联网化的必由之路。而随后粉墨登场的互联网人士(多为P2P借贷从业者和网络征信从业者)亦纷纷发表演讲,介绍了自己在大数据审贷与信评方面的切身体验。一时间,星座与IP齐飞,表单共图谱一色。
听得笔者终于——睡着了。
出现这种惊人的一致毫不奇怪,因为本次会议的主题就是“大金融 大数据 大战略”,中心思想明确,“大数据”是出现在所有嘉宾发言中的关键词。但是,到底大数据在当前的互联网金融中应处于何种地位,笔者认为颇存在可供探讨之处。
任何对数据领域有一定了解的人都知道,大数据不是一个新鲜概念,它曾经被披上各种各样的外衣,有过各种各样的梦想。从最早沃尔玛啤酒与尿片的故事,到最近的精准营销和无人驾驶,数据分析确实存在成功应用的案例,并日益融入日常生活与商业决策。但是数据统计与分析不同于大数据,甚至数据挖掘都与大数据鼓吹者的理想相差甚远。而在当前的主流互联网金融应用(例如P2P借贷、众筹和供应链金融、渠道金融)中,大数据并非多重要的因素,应用时机也未必成熟。
数据源于对现象与行为的离散采样,是客观世界的数字化投射,这一投射是否准确取决于我们搜集、获取、整理数据的方式、频率与维度。能否从数据中发现未知的、有价值的信息与规律,并非取决于数据本身和算法,更多取决于“人”,取决于“人”对现象与行为的认识,以及把认识叠加于数据的采集与分析之上获得的数据洞察。绝大多数的算法和模型只是结果,是人的认识与洞察的形式化表现。
计算能力和智能技术的发展,为人们提供了更好的数据整理与分析工具。大数据的4个V(或者5个V)突出了数据处理难度的增加,即使它们天然蕴含有更有价值的信息,却不意味着信息获取成本的降低,更不意味着(在当前数据获取与处理能力的制约下)数据就是一切。而无论P2P借贷数据,还是网络征信数据,很难相信它们的体量能有多大,变化速度能有多快,从而能够沾上理论界所谓大数据的边,进而需要动用大数据的技术与手段。
毋庸置疑,金融行业天生拥有大数据,天然拥有优化大数据处理、进而降低信评与风控成本的动机。在利润最大化的追求下,大数据处理属于传统金融行业的内在创新动力,如果解决这一问题的时机成熟、成本宜人,他们自己就会猛扑上去,根本用不着互联网企业代劳(收购一家数据处理公司就够了)。传统金融行业对于大数据的期盼,更多在于社交网络、电商数据与金融数据的融合。这他们不是在忽悠,而是充分认识到问题难度和数据资源局限之后,所提出的一个联合攻关主张,这本身即说明大数据的有效处理不是一朝一夕的事情。对于传统金融行业,这一主张务实而合理,但是暂时而言,它并不是绝大多数互联网金融企业的菜。
大部分的互联网金融企业目前体量尚小(唯一的例外是阿里),用户规模和交易额都不大,缺乏大数据基础,亦无力承担大数据的基础设施和处理成本,更重要的是并没有大数据的迫切需求。以P2P借贷行业为例,无论是依赖网络审核还是线下审核,信贷员的经验和尽职程度都远比大数据重要,成本也更节省。目前P2P行业的O2O趋势更说明了,在中国特定的信用和数据环境下,线下工作的重要性远远超过单纯的数据分析。依据数据积累,加入一些星座、IP、社交图谱之类的新料确实可能会对风险控制有帮助,但其作用的发挥仍应基于及时互动,即根据这些数据对借款人进行初步筛选、考察和回访,而不是迷信数据,因为这些数据的完整性、真实性和一致性在当前的数据环境下并不容易保证。
有评论者认为,P2P行业日益线下化,破坏了依靠互联网和数据处理有效应对借贷风险的发展趋势,是开行业的倒车,说明互联网金融日益平庸且了无新意。这种观点与大数据忽悠陷入同一逻辑陷阱:过于迷信互联网金融的“核心”技术特质,而忽视了技术的多样化表现与互联网金融创新的外部动力。
首先,互联网金融依赖于互联网技术,但是彻底解决所谓核心问题(信评与风控)未必是首要目标。仍以P2P借贷为例,它的优点包括借贷渠道的扩大、参与人群的增加和借贷效率的提高。在传统金融无法、不愿覆盖的金融市场,P2P借贷承担着填补市场空白、普及金融服务的作用,它首先要解决的是特定群体金融服务的有无问题。如同余额宝之于屌丝理财,它并未也暂时没必要解决货币基金自身的问题。
其次,互联网金融提供了更为多样化的金融服务主体,阿里小贷对自身生态圈的用户放款,众筹为创业者提供了宽松的资金环境,智能理财使得低净值客户不用花费昂贵的理财顾问费用。资金融通成本的降低或许来自于风控成本的降低,或许来自渠道费用的节约,不一而足。根据帕累托改进,只要互联网金融在未导致金融行业整体状态变坏的情况下改善了一些人的金融状况,它就走在正确的道路上。
第三,新行业对于旧行业的颠覆,从来都不一定表现为直接解决核心问题。互联网教育能直接解决教育质量低下的问题吗?电子商务能直接解决销售问题吗?社会化媒体能直接解决媒体内容的高质量生产问题吗?答案均是不能!但是它们依然获得了空前成功。它们改变的,只是行业的逻辑;它们实现的是,只是让行业回归本质。在此基础之上,用户体验提升、行业资源重组,核心问题竟然开始悄然改善。
在线旅游企业携程的发展史可谓典型案例——10年前,携程大力发展线下渠道,在机场、火车站、酒店铺天盖地的派业务员撒名片,被指以互联网企业之名行线下机构之实,却获得充足发展。当时的互联网环境决定了类似企业不可能只靠互联网生存,线上线下相结合才是王道。10年后,携程却因线下组织过于庞大而成为进一步发展的累赘。这一案例充分说明:名实之辩毫无必要,关键是要在对的时间做对的事。
而目前的互联网金融,正如10年前的在线旅游业,想以直接解决核心问题的方式实现短期的爆发性颠覆并不现实,对于传统金融机构的评论(例如互联网金融只能是补充、互联网金融对银行的冲击有限之类)亦不必挂怀。仰望星空、玩转大数据,那是以后的事情,不必是首选项;脚踏实地,把自己的细分市场开拓足,把细分用户维持好,把必要的数据记录好,在控制整体风险与成本的情况下,利用互联网技术与思维在空白市场、新兴市场中服务于尽可能多的人群,才是当前最重要的事情。
经过未来几年的发展,当星星之火开始燎原,信评和风控真正成为传统金融行业核心竞争力的时候,互联网金融可能才会需要共同直面大数据问题——当然,那时再不面对就真的就晚了。
总之,大数据迷思和对线下操作的批评反映的是一种片面技术倾向,过重的技术视角只会抹杀互联网金融在交易主体、交易渠道、用户体验、普惠思维方面的巨大优势与革新价值。当前的互联网金融企业向别人忽悠下大数据未尝不可——只是,千万不要把自己也忽悠进去了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22