京公网安备 11010802034615号
经营许可证编号:京B2-20210330
搞互联网金融的,少点大数据忽悠吧_数据分析师
副标题:大数据迷思和对线下操作的批评反映的是一种片面技术倾向
对于互联网金融,互联网行业和传统金融行业的观点往往大不相同,前者认为互联网是重点,金融不过是下一个即将被颠覆的特定行业而已,只是由于金融行业的高门槛和严监管,颠覆进程会比较曲折;后者则认为金融有自己完全不同的逻辑,信用和风险是难以逾越的门槛,护城河高筑,互联网金融只能在互联网企业的一亩三分地里自娱自乐。
但是对于大数据,二者却难得的表现出空前一致。在10月30日召开的IFC1000全球金融峰会上,金融人士异口同声宣称大数据是互联网金融的最大亮点,因为大数据在解决金融核心问题——信评和风控——上拥有传统方法所不具备的显著优势和光明前景,是金融业“真正”互联网化的必由之路。而随后粉墨登场的互联网人士(多为P2P借贷从业者和网络征信从业者)亦纷纷发表演讲,介绍了自己在大数据审贷与信评方面的切身体验。一时间,星座与IP齐飞,表单共图谱一色。
听得笔者终于——睡着了。
出现这种惊人的一致毫不奇怪,因为本次会议的主题就是“大金融 大数据 大战略”,中心思想明确,“大数据”是出现在所有嘉宾发言中的关键词。但是,到底大数据在当前的互联网金融中应处于何种地位,笔者认为颇存在可供探讨之处。
任何对数据领域有一定了解的人都知道,大数据不是一个新鲜概念,它曾经被披上各种各样的外衣,有过各种各样的梦想。从最早沃尔玛啤酒与尿片的故事,到最近的精准营销和无人驾驶,数据分析确实存在成功应用的案例,并日益融入日常生活与商业决策。但是数据统计与分析不同于大数据,甚至数据挖掘都与大数据鼓吹者的理想相差甚远。而在当前的主流互联网金融应用(例如P2P借贷、众筹和供应链金融、渠道金融)中,大数据并非多重要的因素,应用时机也未必成熟。
数据源于对现象与行为的离散采样,是客观世界的数字化投射,这一投射是否准确取决于我们搜集、获取、整理数据的方式、频率与维度。能否从数据中发现未知的、有价值的信息与规律,并非取决于数据本身和算法,更多取决于“人”,取决于“人”对现象与行为的认识,以及把认识叠加于数据的采集与分析之上获得的数据洞察。绝大多数的算法和模型只是结果,是人的认识与洞察的形式化表现。
计算能力和智能技术的发展,为人们提供了更好的数据整理与分析工具。大数据的4个V(或者5个V)突出了数据处理难度的增加,即使它们天然蕴含有更有价值的信息,却不意味着信息获取成本的降低,更不意味着(在当前数据获取与处理能力的制约下)数据就是一切。而无论P2P借贷数据,还是网络征信数据,很难相信它们的体量能有多大,变化速度能有多快,从而能够沾上理论界所谓大数据的边,进而需要动用大数据的技术与手段。
毋庸置疑,金融行业天生拥有大数据,天然拥有优化大数据处理、进而降低信评与风控成本的动机。在利润最大化的追求下,大数据处理属于传统金融行业的内在创新动力,如果解决这一问题的时机成熟、成本宜人,他们自己就会猛扑上去,根本用不着互联网企业代劳(收购一家数据处理公司就够了)。传统金融行业对于大数据的期盼,更多在于社交网络、电商数据与金融数据的融合。这他们不是在忽悠,而是充分认识到问题难度和数据资源局限之后,所提出的一个联合攻关主张,这本身即说明大数据的有效处理不是一朝一夕的事情。对于传统金融行业,这一主张务实而合理,但是暂时而言,它并不是绝大多数互联网金融企业的菜。
大部分的互联网金融企业目前体量尚小(唯一的例外是阿里),用户规模和交易额都不大,缺乏大数据基础,亦无力承担大数据的基础设施和处理成本,更重要的是并没有大数据的迫切需求。以P2P借贷行业为例,无论是依赖网络审核还是线下审核,信贷员的经验和尽职程度都远比大数据重要,成本也更节省。目前P2P行业的O2O趋势更说明了,在中国特定的信用和数据环境下,线下工作的重要性远远超过单纯的数据分析。依据数据积累,加入一些星座、IP、社交图谱之类的新料确实可能会对风险控制有帮助,但其作用的发挥仍应基于及时互动,即根据这些数据对借款人进行初步筛选、考察和回访,而不是迷信数据,因为这些数据的完整性、真实性和一致性在当前的数据环境下并不容易保证。
有评论者认为,P2P行业日益线下化,破坏了依靠互联网和数据处理有效应对借贷风险的发展趋势,是开行业的倒车,说明互联网金融日益平庸且了无新意。这种观点与大数据忽悠陷入同一逻辑陷阱:过于迷信互联网金融的“核心”技术特质,而忽视了技术的多样化表现与互联网金融创新的外部动力。
首先,互联网金融依赖于互联网技术,但是彻底解决所谓核心问题(信评与风控)未必是首要目标。仍以P2P借贷为例,它的优点包括借贷渠道的扩大、参与人群的增加和借贷效率的提高。在传统金融无法、不愿覆盖的金融市场,P2P借贷承担着填补市场空白、普及金融服务的作用,它首先要解决的是特定群体金融服务的有无问题。如同余额宝之于屌丝理财,它并未也暂时没必要解决货币基金自身的问题。
其次,互联网金融提供了更为多样化的金融服务主体,阿里小贷对自身生态圈的用户放款,众筹为创业者提供了宽松的资金环境,智能理财使得低净值客户不用花费昂贵的理财顾问费用。资金融通成本的降低或许来自于风控成本的降低,或许来自渠道费用的节约,不一而足。根据帕累托改进,只要互联网金融在未导致金融行业整体状态变坏的情况下改善了一些人的金融状况,它就走在正确的道路上。
第三,新行业对于旧行业的颠覆,从来都不一定表现为直接解决核心问题。互联网教育能直接解决教育质量低下的问题吗?电子商务能直接解决销售问题吗?社会化媒体能直接解决媒体内容的高质量生产问题吗?答案均是不能!但是它们依然获得了空前成功。它们改变的,只是行业的逻辑;它们实现的是,只是让行业回归本质。在此基础之上,用户体验提升、行业资源重组,核心问题竟然开始悄然改善。
在线旅游企业携程的发展史可谓典型案例——10年前,携程大力发展线下渠道,在机场、火车站、酒店铺天盖地的派业务员撒名片,被指以互联网企业之名行线下机构之实,却获得充足发展。当时的互联网环境决定了类似企业不可能只靠互联网生存,线上线下相结合才是王道。10年后,携程却因线下组织过于庞大而成为进一步发展的累赘。这一案例充分说明:名实之辩毫无必要,关键是要在对的时间做对的事。
而目前的互联网金融,正如10年前的在线旅游业,想以直接解决核心问题的方式实现短期的爆发性颠覆并不现实,对于传统金融机构的评论(例如互联网金融只能是补充、互联网金融对银行的冲击有限之类)亦不必挂怀。仰望星空、玩转大数据,那是以后的事情,不必是首选项;脚踏实地,把自己的细分市场开拓足,把细分用户维持好,把必要的数据记录好,在控制整体风险与成本的情况下,利用互联网技术与思维在空白市场、新兴市场中服务于尽可能多的人群,才是当前最重要的事情。
经过未来几年的发展,当星星之火开始燎原,信评和风控真正成为传统金融行业核心竞争力的时候,互联网金融可能才会需要共同直面大数据问题——当然,那时再不面对就真的就晚了。
总之,大数据迷思和对线下操作的批评反映的是一种片面技术倾向,过重的技术视角只会抹杀互联网金融在交易主体、交易渠道、用户体验、普惠思维方面的巨大优势与革新价值。当前的互联网金融企业向别人忽悠下大数据未尝不可——只是,千万不要把自己也忽悠进去了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08