京公网安备 11010802034615号
经营许可证编号:京B2-20210330
关于数据科学家在金融服务领域的工作,最好的事情之一是用例的丰富程度和数据科学家可以对现实世界产生的影响。当然,所有面向客户的业务都有常见的应用程序,如个性化体验、有针对性的交叉销售优惠或防止客户流失的积极策略。但银行、保险公司和他们的金融技术挑战者以许多其他有趣和有影响力的方式使用数据和分析。
例子包括:
对许多数据科学家来说,第二个吸引力是数据集的广度和深度,可以用来产生有意义的见解。银行和保险公司通常可以获得大量的数据,如人口统计、交易和关系,无论是在宏观层面还是在个人客户层面。尽管对它们的使用有一些限制,但像这样的高质量数据集的可用性通常可以追溯到几年前,这可能是数据科学家在构建预测模型时的梦想。
金融服务公司在数据和技术上的支出的规模以及其数据生态系统的相对成熟度也可以使它们对数据科学家具有吸引力。例如,大多数银行将其年收入的10%以上用于技术。数据和分析支出是其中越来越重要的组成部分,对许多大型企业来说,每年很容易达到或超过数亿美元--这一数字是科技行业中除最大企业外的所有企业都无法比拟的。由于多年在数据上的花费,很多也拥有了相对成熟的数据团队。因此,数据科学家可能会发现已经建立良好的支持系统,并且不希望自己管理从数据管道到数据治理的所有事情。
最后,在大多数地区,银行、保险公司和金融机构通常是数据科学家的最佳收入来源。虽然它本身很有吸引力,但它也是一个有用的指标,表明数据科学在这些公司中的价值,以及它对长期职业生涯的影响。在至少一家主要的全球银行,首席数据和分析官现在直接向集团首席执行官报告。
当然,有一个陷阱。在银行和保险公司(尤其是较大的银行和保险公司)从事数据科学家工作的所有有趣之处,有时也会使其变得笨拙和令人沮丧。一些数据科学家将这些纯粹视为挑战;其他人也可能认为它们是发展自己并产生更大影响的机会。
鉴于数据和分析在行业中的高风险使用,有一个很高的信任标准来证明数据和模型在实际生活中的使用足够好。例如,如果一个数据科学家正在建立一个预测模型,可以用来拒绝某人的贷款或保险,或者将某人标记为潜在的洗钱者,那么他们可能应该期待大量的审查。
类似地,考虑到客户通常信任银行和保险公司提供他们生活中最亲密的方面--例如,他们的收入或他们的病史,数据科学家可以围绕数据可用性和可用性找到详细的控制。每个行业都存在关于数据隐私、主权、道德和安全的问题,但很少有其他行业在管理这些问题上花费如此多的时间和精力。
在数据和相关技术上的大量支出,以及由数据工程师、分析师和风险专家组成的资源丰富的团队,可以为数据科学家提供茁壮成长的肥沃土壤。但是,同样的因素也会导致丧失敏捷性。在许多情况下,这些可能会转化为数据科学家的限制性技术选择,或者在他们的工作真正出现在生产中之前,通过精心控制和移交的多步骤过程。让新加入银行业的人感到惊讶的一个特殊领域是,需要让一个独立的团队对所有重要模型进行正式验证--这一步骤可以为正常的模型生命周期增加几周甚至几个月的时间。
支撑上述所有挑战的是,金融服务业是全球监管最严格的行业之一。作为回应,大多数银行和保险公司建立了一个DNA,尤其是在2008年金融危机之后。在许多地区,银行和保险公司的高级经理对其雇主的行为负有个人责任,因此任何可能违反客户信任或监管要求的事情都要特别谨慎对待。数据和算法的使用勾选了所有的框。毫不奇怪,金融监管机构是第一批就负责任地使用数据和人工智能提出指导方针的国家之一--例如,在新加坡、香港、欧盟、英国和美国。
显然,不是每个数据科学家都会喜欢银行、保险公司,甚至是受监管的金融技术公司。但是,如果:
BIOS:Shameek Kunduis是从技术和商业战略角度来看人工智能的领先专家,他的大部分职业生涯都在推动金融服务业负责任地采用数据分析/AI。他是Truera的首席战略官和金融服务主管。他是英格兰银行人工智能公私论坛和经合组织人工智能全球伙伴关系的成员,也是新加坡金融管理局人工智能公平、道德、问责制和透明度指导委员会的成员。最近,Shameek是渣打银行的集团首席数据官,在那里他帮助银行在多个领域探索和采用人工智能(例如,信贷、金融犯罪合规、客户分析、监控)。
Divya Gopinath是TruEra的研究工程师,TruEra是一家专注于让人工智能可信和透明的公司。在加入之前,Divyacomplement在麻省理工学院获得了本科和硕士学位,她的研究重点是为医疗保健领域构建机器学习算法。Divya是值得信赖的人工智能《走向数据科学》的主要贡献者,专注于公平和解决机器学习模型中的偏见的主题。
Arridhana Ciptadiis是Truera工程团队的成员。他以前是蓝六边形创始团队的一员,在那里他是公司所有机器学习工作的技术负责人。在此之前,他是亚马逊Lab126的机器学习科学家,在那里他为亚马逊的各种产品开发机器学习和计算机视觉技术。Ciptadi拥有博士学位佐治亚理工学院计算机科学专业。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09