
金融行业对大数据的思考
“大数据”是一个约定俗成的说法,而“数据科学”则是更科学的定义,它包括了数据和计算相关领域的科学范畴。如果用一个更大的视角,互联网、平台化、社交媒体、搜索引擎、维基技术等科技元素将从根本上影响金融、经济,乃至整个社会。
但这并不妨碍我们用“大数据”这个词。因为,通过这个词,能够去包含这个时代许多与之相关的科学和技术,通过这个词,让人们能够更多、更直观地认识数据科学,以及数据的时代使命。
对于金融业而言,需要我们有充分的认识和准备,并加快做出相应的调整和变革。
一是对于大数据时代的到来,需要有一个专业、深刻和前瞻性的认识。从金融业的角度看,需要关注三个问题,首先是“去边界”思维,即在大数据和平台化时代,各种边界都会越来越模糊,所以,未来的创新和机遇,更多的是在边界发生的,不是中心,但我们对边界又关注了多少,认识了多少?
其次是“社会脑”的认识,大数据使得整个社会的信息实现了共享。从整个社会的层面,出现了一个趋势叫“数字社会主义”;从个人的层面,出现了一个“数位人生”的概念,即每一个人都将被数据化。社会和人的数字化是“社会脑”出现的前提,也是其进化的基础,它将从根本上改变我们对知识和智慧的传统认识,并营造出全新的“生存环境”。在这个大背景下,就面临着怎么利用好这个“社会脑”的问题。
第三是协同创新问题,消费者的“生产者化”是一个趋势,是“以客户为中心”的根本解,为此,金融业要有一个开放的心态,一个畅通的机制,一个协同的平台,适应这种潮流,核心是解决内外部信息流的统一视图,并通过商业模式的创新,实现行业效率的结构性提升。
二是在互联网和大数据的思维下,效率不再是静态和单一维度。在多维、跨界和融合的浪潮下,就有了“羊毛出在猪身上”的说法。对于传统思维而言,这无疑是颠覆性的,是不可思议的。但这并不妨碍互联网企业高举着免费的“旗帜”,摧枯拉朽,攻城略地,大有“横扫千军如卷席”的架势。尽管金融企业未必能够理解和接受,但必须清醒地认识到这些已经的的确确地在我们的周遭甚至是行业内发生了,“余额宝”就是一个鲜活案例。因此,我们需要重新思考金融行业的效率和盈利模式问题,并在商业模式上进行反思和行动。因为,不创新,则被创新。
三是互联网行业有一个非常流行的商业模式,叫免费模式。大多数人都乐此不疲地使用各种免费模式,就忘记了一句话:天下没有免费的午餐。人们在免费使用数据产品的同时,其实是被运营商免费使用了自己的信息。互联网和大数据时代走到了今天,需要提出一个概念:“数权”,即每个数据都有权利归属的,均存在“所有权”的问题。这种“数权”与我们的财产权一样,是不能够随意侵犯的,国家需要在制度层面来完善这个问题的治理,否则,很多人稀里糊涂下载了那么多APP软件,最后,几乎就没有隐私了。与此同时,金融业也面临着数据的“用”与“不用”的问题,这涉及到了大数据的一个核心问题:数据的隐私与保护。从社会的角度看,需要通过法律对“数权”加以保护,金融业面临着适应问题。从商业的角度看,数据隐私问题处理不好,客户就可能不接受金融企业的产品与服务。
四是在大数据时代,解构和重构数据将成为一种重要能力。解构和重构的逻辑起点是发现并实现客户需求和发展机会,是结构性的成本降低并提升效率。金融业需要回答如何将现有的数据进行解构,同时根据需求进行重构,创造出一个新的商业模式。这种解构和重构的背后是一种价值的发现与实现。同时,解构与重构能力的根本是洞察力和计算能力,洞察力的核心是发现新需求和价值洼地,计算能力提升的关键是对数据的“追随”,即要改变数据“迁就”计算的管理思维模式,而让计算“追随”并“服务”数据,提供灵活性、易构性和高效性的计算能力,并在服务业务创新中成就自我。
五是随着“云计算”的出现,带动了信息技术和管理理念的变革,“云计算”带给人们更大的价值在于催生了“云管理”的概念。现代商业面临的最大挑战是越来越复杂的管理与越来越动态的市场和客户需求之间的矛盾,越来越高的风险管理标准与越来越灵活的需求之间的矛盾。客户、销售和服务是越来越分散的,要求是更加灵活多变,而经营管理则要求尽可能地集中,以有效控制风险,降低成本。通过“云管理”概念的导入,就能够较好地破解这一难题。“云管理”的核心是“形散神聚”,它能够很好地解决和平衡集中管控与效率保证的关系,解决集中运营与灵活服务的矛盾,建立一种灵动敏捷的管理模式。
六是数据管理面临“内外有别”的问题。金融业要有两个认识:第一,长期以来,我们总认为行业数据是经营的重要基础,面向未来,要认识到行业数据,仅仅是经营和风险数据的一小部分,真正解读客户和风险,需要更多关注行业外的数据。第二,历史和存量数据固然重要,但大数据时代,实时数据的获取和利用成为可能,因此,要更多地关注对实时数据的利用,实现对客户需求和风险管控的动态掌握和有效管控。第三,在大数据时代,我们对于数据的管理也要有一个全新的认识。从传统的角度看,我们更多的是希望“拥有”数据,但在未来大数据时代,“拥有”既不经济,更不现实。因此,对于外部海量数据的使用和管理,不可能采用数据管理的传统理念和技术,更多的应当是“不求所有,但知所在”,以确保效率。
七是对“专业”的再认识和再管理。传统意义上的专业,一是靠信息不对称,二是靠个体智慧。互联网时代,特别是搜索引擎技术的出现,最大的贡献是实现了信息的平等。此外,以往的“专业”更多是以个体的专家为载体,但在维基技术和互联网进化论的环境下,专业更多的是体现为一种社会互动与共享,体现为一种“社会脑”。从金融业看,传统的风险管理专业能力也面临来自科技时代的挑战,特别是物联网和人工智能技术的出现,将从根本上改变许多领域对于专业的认识。面向未来,科技时代“专业”的存在形式将从个体、机构和静态形式走向环境、聚合和动态形式,为此,金融业需要以互联网思维,构建全新的专业能力,人工智能将成为重要构成。建立新专业能力的重要指导思想是从传统的风险等量管理向风险减量管理过渡,特别是利用互联网技术破解信息不对称难题,通过动态和自主的“点对点”匹配与对冲,实现社会总体风险暴露的降低,继而为社会创造福祉。
最后,大数据时代面临的最大挑战是数据人才。数据人才是一种两栖人才,未来金融业需要大量通晓金融业务和信息技术的复合型人才,包括数据科学家和数据工程师,而这些人才最重要的一个能力是解构和重构数据。因此,关注这种人才的培养,不仅是企业的经营管理问题,更是行业发展的基础和关键问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30