京公网安备 11010802034615号
经营许可证编号:京B2-20210330
关于数据科学家在金融服务领域的工作,最好的事情之一是用例的丰富程度和数据科学家可以对现实世界产生的影响。当然,所有面向客户的业务都有常见的应用程序,如个性化体验、有针对性的交叉销售优惠或防止客户流失的积极策略。但银行、保险公司和他们的金融技术挑战者以许多其他有趣和有影响力的方式使用数据和分析。
例子包括:
对许多数据科学家来说,第二个吸引力是数据集的广度和深度,可以用来产生有意义的见解。银行和保险公司通常可以获得大量的数据,如人口统计、交易和关系,无论是在宏观层面还是在个人客户层面。尽管对它们的使用有一些限制,但像这样的高质量数据集的可用性通常可以追溯到几年前,这可能是数据科学家在构建预测模型时的梦想。
金融服务公司在数据和技术上的支出的规模以及其数据生态系统的相对成熟度也可以使它们对数据科学家具有吸引力。例如,大多数银行将其年收入的10%以上用于技术。数据和分析支出是其中越来越重要的组成部分,对许多大型企业来说,每年很容易达到或超过数亿美元--这一数字是科技行业中除最大企业外的所有企业都无法比拟的。由于多年在数据上的花费,很多也拥有了相对成熟的数据团队。因此,数据科学家可能会发现已经建立良好的支持系统,并且不希望自己管理从数据管道到数据治理的所有事情。
最后,在大多数地区,银行、保险公司和金融机构通常是数据科学家的最佳收入来源。虽然它本身很有吸引力,但它也是一个有用的指标,表明数据科学在这些公司中的价值,以及它对长期职业生涯的影响。在至少一家主要的全球银行,首席数据和分析官现在直接向集团首席执行官报告。
当然,有一个陷阱。在银行和保险公司(尤其是较大的银行和保险公司)从事数据科学家工作的所有有趣之处,有时也会使其变得笨拙和令人沮丧。一些数据科学家将这些纯粹视为挑战;其他人也可能认为它们是发展自己并产生更大影响的机会。
鉴于数据和分析在行业中的高风险使用,有一个很高的信任标准来证明数据和模型在实际生活中的使用足够好。例如,如果一个数据科学家正在建立一个预测模型,可以用来拒绝某人的贷款或保险,或者将某人标记为潜在的洗钱者,那么他们可能应该期待大量的审查。
类似地,考虑到客户通常信任银行和保险公司提供他们生活中最亲密的方面--例如,他们的收入或他们的病史,数据科学家可以围绕数据可用性和可用性找到详细的控制。每个行业都存在关于数据隐私、主权、道德和安全的问题,但很少有其他行业在管理这些问题上花费如此多的时间和精力。
在数据和相关技术上的大量支出,以及由数据工程师、分析师和风险专家组成的资源丰富的团队,可以为数据科学家提供茁壮成长的肥沃土壤。但是,同样的因素也会导致丧失敏捷性。在许多情况下,这些可能会转化为数据科学家的限制性技术选择,或者在他们的工作真正出现在生产中之前,通过精心控制和移交的多步骤过程。让新加入银行业的人感到惊讶的一个特殊领域是,需要让一个独立的团队对所有重要模型进行正式验证--这一步骤可以为正常的模型生命周期增加几周甚至几个月的时间。
支撑上述所有挑战的是,金融服务业是全球监管最严格的行业之一。作为回应,大多数银行和保险公司建立了一个DNA,尤其是在2008年金融危机之后。在许多地区,银行和保险公司的高级经理对其雇主的行为负有个人责任,因此任何可能违反客户信任或监管要求的事情都要特别谨慎对待。数据和算法的使用勾选了所有的框。毫不奇怪,金融监管机构是第一批就负责任地使用数据和人工智能提出指导方针的国家之一--例如,在新加坡、香港、欧盟、英国和美国。
显然,不是每个数据科学家都会喜欢银行、保险公司,甚至是受监管的金融技术公司。但是,如果:
BIOS:Shameek Kunduis是从技术和商业战略角度来看人工智能的领先专家,他的大部分职业生涯都在推动金融服务业负责任地采用数据分析/AI。他是Truera的首席战略官和金融服务主管。他是英格兰银行人工智能公私论坛和经合组织人工智能全球伙伴关系的成员,也是新加坡金融管理局人工智能公平、道德、问责制和透明度指导委员会的成员。最近,Shameek是渣打银行的集团首席数据官,在那里他帮助银行在多个领域探索和采用人工智能(例如,信贷、金融犯罪合规、客户分析、监控)。
Divya Gopinath是TruEra的研究工程师,TruEra是一家专注于让人工智能可信和透明的公司。在加入之前,Divyacomplement在麻省理工学院获得了本科和硕士学位,她的研究重点是为医疗保健领域构建机器学习算法。Divya是值得信赖的人工智能《走向数据科学》的主要贡献者,专注于公平和解决机器学习模型中的偏见的主题。
Arridhana Ciptadiis是Truera工程团队的成员。他以前是蓝六边形创始团队的一员,在那里他是公司所有机器学习工作的技术负责人。在此之前,他是亚马逊Lab126的机器学习科学家,在那里他为亚马逊的各种产品开发机器学习和计算机视觉技术。Ciptadi拥有博士学位佐治亚理工学院计算机科学专业。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25