
关于数据科学家在金融服务领域的工作,最好的事情之一是用例的丰富程度和数据科学家可以对现实世界产生的影响。当然,所有面向客户的业务都有常见的应用程序,如个性化体验、有针对性的交叉销售优惠或防止客户流失的积极策略。但银行、保险公司和他们的金融技术挑战者以许多其他有趣和有影响力的方式使用数据和分析。
例子包括:
对许多数据科学家来说,第二个吸引力是数据集的广度和深度,可以用来产生有意义的见解。银行和保险公司通常可以获得大量的数据,如人口统计、交易和关系,无论是在宏观层面还是在个人客户层面。尽管对它们的使用有一些限制,但像这样的高质量数据集的可用性通常可以追溯到几年前,这可能是数据科学家在构建预测模型时的梦想。
金融服务公司在数据和技术上的支出的规模以及其数据生态系统的相对成熟度也可以使它们对数据科学家具有吸引力。例如,大多数银行将其年收入的10%以上用于技术。数据和分析支出是其中越来越重要的组成部分,对许多大型企业来说,每年很容易达到或超过数亿美元--这一数字是科技行业中除最大企业外的所有企业都无法比拟的。由于多年在数据上的花费,很多也拥有了相对成熟的数据团队。因此,数据科学家可能会发现已经建立良好的支持系统,并且不希望自己管理从数据管道到数据治理的所有事情。
最后,在大多数地区,银行、保险公司和金融机构通常是数据科学家的最佳收入来源。虽然它本身很有吸引力,但它也是一个有用的指标,表明数据科学在这些公司中的价值,以及它对长期职业生涯的影响。在至少一家主要的全球银行,首席数据和分析官现在直接向集团首席执行官报告。
当然,有一个陷阱。在银行和保险公司(尤其是较大的银行和保险公司)从事数据科学家工作的所有有趣之处,有时也会使其变得笨拙和令人沮丧。一些数据科学家将这些纯粹视为挑战;其他人也可能认为它们是发展自己并产生更大影响的机会。
鉴于数据和分析在行业中的高风险使用,有一个很高的信任标准来证明数据和模型在实际生活中的使用足够好。例如,如果一个数据科学家正在建立一个预测模型,可以用来拒绝某人的贷款或保险,或者将某人标记为潜在的洗钱者,那么他们可能应该期待大量的审查。
类似地,考虑到客户通常信任银行和保险公司提供他们生活中最亲密的方面--例如,他们的收入或他们的病史,数据科学家可以围绕数据可用性和可用性找到详细的控制。每个行业都存在关于数据隐私、主权、道德和安全的问题,但很少有其他行业在管理这些问题上花费如此多的时间和精力。
在数据和相关技术上的大量支出,以及由数据工程师、分析师和风险专家组成的资源丰富的团队,可以为数据科学家提供茁壮成长的肥沃土壤。但是,同样的因素也会导致丧失敏捷性。在许多情况下,这些可能会转化为数据科学家的限制性技术选择,或者在他们的工作真正出现在生产中之前,通过精心控制和移交的多步骤过程。让新加入银行业的人感到惊讶的一个特殊领域是,需要让一个独立的团队对所有重要模型进行正式验证--这一步骤可以为正常的模型生命周期增加几周甚至几个月的时间。
支撑上述所有挑战的是,金融服务业是全球监管最严格的行业之一。作为回应,大多数银行和保险公司建立了一个DNA,尤其是在2008年金融危机之后。在许多地区,银行和保险公司的高级经理对其雇主的行为负有个人责任,因此任何可能违反客户信任或监管要求的事情都要特别谨慎对待。数据和算法的使用勾选了所有的框。毫不奇怪,金融监管机构是第一批就负责任地使用数据和人工智能提出指导方针的国家之一--例如,在新加坡、香港、欧盟、英国和美国。
显然,不是每个数据科学家都会喜欢银行、保险公司,甚至是受监管的金融技术公司。但是,如果:
BIOS:Shameek Kunduis是从技术和商业战略角度来看人工智能的领先专家,他的大部分职业生涯都在推动金融服务业负责任地采用数据分析/AI。他是Truera的首席战略官和金融服务主管。他是英格兰银行人工智能公私论坛和经合组织人工智能全球伙伴关系的成员,也是新加坡金融管理局人工智能公平、道德、问责制和透明度指导委员会的成员。最近,Shameek是渣打银行的集团首席数据官,在那里他帮助银行在多个领域探索和采用人工智能(例如,信贷、金融犯罪合规、客户分析、监控)。
Divya Gopinath是TruEra的研究工程师,TruEra是一家专注于让人工智能可信和透明的公司。在加入之前,Divyacomplement在麻省理工学院获得了本科和硕士学位,她的研究重点是为医疗保健领域构建机器学习算法。Divya是值得信赖的人工智能《走向数据科学》的主要贡献者,专注于公平和解决机器学习模型中的偏见的主题。
Arridhana Ciptadiis是Truera工程团队的成员。他以前是蓝六边形创始团队的一员,在那里他是公司所有机器学习工作的技术负责人。在此之前,他是亚马逊Lab126的机器学习科学家,在那里他为亚马逊的各种产品开发机器学习和计算机视觉技术。Ciptadi拥有博士学位佐治亚理工学院计算机科学专业。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08