京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据颠覆金融业交易模式
大数据是最有潜力的“矿产资源”,那么如此有魅力的“矿产资源”如何助推金融业的发展?全球大数据应用研究论坛上,参会的众大咖认为,大数据不仅改变着金融业的交易模式,而且对控制风险、个性化定制、理性投资等方面让金融机构、消费者都能体验到新金融的颠覆魔力。
01去中间商,交易时间缩短
知名大数据网站德塔弗洛克(Datafloq)创始人马克·范·雷蒙南(Mark van Rijmenam)认为,首先,大数据技术在金融业方面的运用是有很多潜力可挖的。对消费者和金融业两方面的数据进行分析,及时了解消费者的需求,从这个层面上来讲,大数据技术的运用可以降低金融业的一些风险。而通过大数据技术,结合一些社交媒体或者其他渠道获得的数据,可以对客户进行更深的了解。再就是区块链的支撑是近些年大数据技术给金融业带来的最重要变化。以前银行之间的金融、现金交易会花几天的时间,现在这个时间被大大缩短,变成几分钟甚至几秒钟。
区块链是指什么?他说,就是通过单一、真实的源头,通过资源的分享,通过所有人都来分享一个统一的、单一的数据库、数据源,但是因为不同的参与方参与进来了,它们就可以形成这样一个链条式的连接。这就意味着当数据已经处于区块链当中就已经进行加密了,就不可能进行改变了。就像比特币的交易一样,这实际上就改变了做生意的方式,因为它将中间商已经取消了,如果想在全世界去给那些不认识的人,或者不相信的人去做交易提供资金,需要用第三方,比如说是银行,而通过区块链,就已经不需要这个银行的存在了,借款人可以在10分钟之内把钱借给另一个人,完全不需要中间商了。而就在一两周之前,第一个全球制造产品的交易,实际上这个是德克萨斯州的一船棉花运到了青岛,就是用区块链技术。
02大数据助推金融产品个性化定制
大数据发展速度最快的就是在金融领域,金融本身是通过信息不对称具备商业营运价值的,所以北美以及最近国内也有一个新的概念,就是科技金融,在这个过程里面,大数据落地在金融也是阶段性的,第一个阶段更多的是在信息基础架构的实施上,也就是信息处理能力,因为中国的金融发展速度是非常快的,随便举一个信用卡的公司,一个大型的股份制信用卡公司,覆盖的人群数量上亿张卡片规模,远远超过北美发达国家的数量,以传统的体系架构之下很难支撑中国的发展速度,所以大数据的第一个个性就是分布式计算的基础能力对金融核心体系的建设产生了根本性的变化,现在五大行和股份制银行都已经启动了金融基础设施替换进程,像国内光大银行也实现了第一个在线交易的全面柜员24小时在线的核心系统的替换,现在已经进入成熟商用了。
而第二个阶段为人工智能的变化,以人工智能为驱动的开始出现了很多创新型的新业态,在投资领域基金券商领域的基金投募系统,像银行领域也有个性化的服务,这些企业原来去银行只有几类用户,私人银行、金卡、白金卡用户,只有几类产品可以选择,面向一大批人群,现在会定制个性化产品,基于风险预期、流动性、存量推荐多少股、多少债等进行定制,这是针对差异化,计算量首先是非常大的,没有第一个阶段的基础设施是不可能完成的任务。第二,每一个人去算,不可能用大类的方法的经验,一定是算法,就像淘宝一样,买什么产品都有推荐引擎,每一个金融产品也有推荐引擎一样有匹配原则。
大数据还能快速分析借款者的还款能力。柯克·伯尔尼(Kirk Borne)是博思艾伦高级数据科学家、天体物理学家和空间科学家,是全球25位顶尖大数据科学家之一,他解析金融行业数据流,金融机构当中,有很重要的业务之一就是要去管理风险,他介绍,在交易以及各个领域、各个风险环境,都要很好地控制这样一个风险,把数据信息能够收集起来,能够驱动我们的业务不断地发展,能够使得金融各个表现能够更加的有益。
诊断型的分析就是可以帮助了解现在这个业务当中发生了什么事情,所以能够帮助采取相适应的行动,而不仅仅只是去被动的接收。不管是机器学习模型还是传统的模式,这都是一个学习的体系,能够了解它的行为模式是怎么样的,帮助更好地了解未来的发生情况。必须要很灵活的,非常灵敏地帮助很快的做出适应的调整。
有的时候,银行对未来进行预测的时候,得到的结果不是很积极。那么对于一些非常有风险性的客户,他们可能信誉不是很好,那么他们借款之后不一定能还款。那么有些信誉记录非常良好的人,他们一旦借款,还款能力会很强、会很可靠。所以能够基于他过去的一种信誉记录,进行对未来还款行为的预测。
那么机器学习是一些数字、数学相关的算法。如果把这样的一些数学的算法应用到机器上面,可能就跟人工智能相关了。同样的,如果把这样的一些机器学习的算术反映到数据上面,这叫做数据挖掘。这些都是强调必须从过去的经验数据上进行总结。这个地方,我们在提及数据科学,它就是说把科学的方法能够应用到各种不同的数据当中。包括一些自然的语言的过程,还有一些我们数据的语意信息,还包括视频等等,它能够去帮助我们去分析这样一个场景当中到底有哪些含义。
机器学习它对于金融领域有什么方面的应用呢?金融机构跟其他的产业一样,它可能会对用户分享和推荐一种产品。于是它们就开始实验一下,看看这个产品到底受不受欢迎,看看其他的人在买这些产品的时候,是不是也买这些产品,这就是一种科学过程,数据科学就是把这样一种科学过程从数据中进行发现。
03一张图谱摸清上市公司投资价值
知识图谱这个词在此次论坛上多次被提及,据介绍,知识图谱的作用就是把人类的知识变成计算机可以能够理解这样的一些东西,让计算机来按照知识图谱所组织的人类的知识来处理一些具体的问题。
“其实对于知识图谱来说,应该说随着整个人工智能的发展,从最初人工智能应该说是从1956年达特矛斯会议到现在提出知识图谱,已经有60年了,其实知识的表示一直在人工智能里面研究的一个很重要的领域,知识图谱这个概念应该说谷歌最先提出来的,实际上在往前追溯应该是1956年达特矛斯会议开始,是作为人工智能的分支,就是知识表示的分支一直存在着。”壹诺信用相关负责人表示,在大数据的领域,随着数据不断的丰富,种类是越来越多的,怎么把这样一些数据利用我们已有的知识组织起来,这可能就是知识图谱在大数据里面的一些应用。
同时,在很多时候,每一个人可能有自己的一些不同的专业的领域的背景,一方面需要建立一个通用的知识图谱,但是更重要的是,针对于不同的领域,需要有一些专业的图谱。
对于金融领域,举例来说,比如一个上市公司如何描述它?它的一些相关的组织架构、信用,可以从互联网、工商局的一些网站上得到一些信用,把这样的一些东西组织成为一个图谱,用来描述一个公司的实体。实际上,在很多的时候,分析一家公司是不是有很好的成长的价值的过程当中,就会用到这样一些相关的知识,这可能就是在金融业里面的一些应用。
其实对于图谱来说,我们把整个世界当做实体来看的,一个实体可能是一个人、一个公司、一个组织,对于整个这样一个过程来说,对个人来说也是同样的道理,只不过有一些数据可能是涉及到一些隐私等等一些方面的内容,这可能也会有一些安全方面的考量,比如说在支付宝上付了一些什么样的账,如果没有授权,别人是不会拿到这些数据的。
对于通用的整个图谱来说,现在一些大的公司都已经有一些相应的产品了,比如说谷歌、百度包括搜狗等,国内、国外的公司都有一些通用性的产品,比如微软最近发布了一些它对知识图谱管理的数据集。
“老百姓”这个词,对于普通的搜索来说可能就是在座的大家,但是可能知道金融行业人来说,知道这是一家上市公司,但是在百度、谷歌上面敲“老百姓”,这些都会出来的,对于一个分析人员来说,如果要是不能够识别出来这样的东西,处理起来相当的困难,大数据带来了数据量的增长,但是实际上也带来了对需求者感兴趣的命中率的降低,希望通过这样的技术,能够为专业的金融分析人员提供非结构化情报的支持。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06