
大数据时代传统金融业正经受激荡_数据分析师培训
基于大数据(Big Data)构建的思维革命,正在悄然改变金融行业原有的竞争格局和生态系统。大数据与以往的数据有何不同?这些数量惊人的大数据将给金融业带来了怎样的颠覆性变革?
大数据不同于传统数据
“原来有一句很典型的话——在互联网上,谁也不知道你是一条狗,但现在经过多元化分析后,不仅知道你是一条狗,还知道你是一条什么样的狗!”谈及大数据带来的改变,中国保监会旗下中国保信公司常务副总裁罗胜打趣称。
大数据与传统的数据有何不同?罗胜认为,“数据多,并不是大数据”,大数据其多维度和多元化的变化,正是传统数据和大数据之间的最大的变化。例如,运用大数据分析飓风,它是由无数维度的量变决定循环发生的。
什么叫“大数据”?中科院金融科技中心首席科学家兼副主任刘世平认为,它不是一个突变的过程,而是一个渐进的过程,之所以今天大数据这个概念非常热,一是技术存储的能力加快了,二是新的算法和整个体系架构成立了。
“在某种意义上讲,正是因为互联网的发展,导致了这个数据的产生,反过来促使了互联网今天的发展,在大数据背景下,金融业的也得以重塑与颠覆。”作为论坛的主持人,刘世平直言大数据带给传统金融行业盈利模式的颠覆。
众所周知,大数据是指那些超过传统数据库系统处理能力的数据,它具有“4V”特征:大量化(Volume)、多样化(Variety)、快速化(Velocity)和价值化(Value),这正是大数据不同于传统数据的最大区别。
“我原来一直不太相信大数据,后来到了金融机构,才有了非常深的体会。”中信信托技术部总经理初壮认为,如果从数据的角度理解整个金融机构信息系统,那么你就会发现它有一些内在稳定性的东西。因为,频繁变化的应用的背后,不变的是永恒的数据。
大数据带给初壮的感受是,大数据才刚刚开始,因为人们在日常生活中,被数字化的环节越来越多,因此环节越多,我们得到的数据就越多,那么我们可能就在某些领域上会爆发一些新的应用。
作为专注金融行业的研究者,中国社科院金融所所长助理、研究员杨涛最近对金融与大数据关注颇多。他认为,随着大数据的兴起,传统的金融功能已在基础层面产生了逐渐的融合,这对金融前台和后台都产生了非常深的影响。
在杨涛看来,在上世纪九十年代行为经济学之前的一段时间,由于信息技术、信息应用学没有通过支持,所以信息应用学遇到了很大的难题,但随着信息技术的普及和大数据的技术发展,这一瓶颈已经得到逐渐的解决。
大数据背后的“金钥匙”
国宏汇金(北京)管理顾问有限公司董事长李斌表示,自去年私募备案以后,其公司就确定了一个方向——专注量化交易,其本质就是对大数据的应用与挖掘。他透露,最近两个月收益实现了80%,已经找到了大数据背后的“金钥匙”。
统计物理学出身的国寿安保沪深300基金经理李康,自从上学一直到工作,他基本上一直与数据打交道,他的理解是,整个的数据的外延,无论是从广度、时间这个轨道都在不断扩大。此外,对大数据的分析手段也在不断地创新。
作为工银瑞信基金经理,袁兵兵也非常看好大数据时代的相关公司,如果它拥有了大数据的重要环节,那它再做相关的业务开发时,就会有一个非常重要的优势,例如东方财富(300059,咨询)基于用户分析,其基金交易量呈现出井喷爆发式增长。
“大数据的价值在什么?就是它把我们对社会、对很多事物的分析重新来依靠逻辑出发,已经转变为一套数据自己的关联性、相关性的分析,来产生我们很多预想不到的好的数据结果。”谈及大数据对金融业的颠覆,北京天合万盛科技有限公司董事长、优股网创始人卢常福总结称。
如何寻找大数据里的“金钥匙”?李康举例称,互联网网站对投资者的行为有一些数字的统计,他们会开发一些真实的系统,然后对市场上的投资者做情绪统计研究,以此来预测未来的股市或个股趋势,目前已经有很多金融公司和互联网公司合作,发行了一些基于大数据的指数基金。
不过,随着各种金融数据量的越来越大,让李康感觉困惑的是,数据是不是越多就越好?数据越多的时候,我们怎么样从中间去寻找有效的数据?此时,如何对一些有干扰的噪音进行屏蔽和隔离,显得非常重要。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29