京公网安备 11010802034615号
经营许可证编号:京B2-20210330

【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷款客户、机器学习、考核方案、授信额度、考核指标
【专访摘要】本次CDA持证专访邀请到扬州农商行的刘伟,他分享了自身从动物医学专业、非数据分析岗位成功转岗金融数据分析的经历,详解了数据预处理与特征工程的重要性、金融行业数据分析的具体应用,拆解了学习、工作与生活的平衡方法,同时为CDA课程体系提出了针对性建议,为零基础转岗数据分析的从业者提供了宝贵经验。
【主持人】欢迎大家观看CDA持证人采访,今天我们邀请到的是任职于扬州农商行的刘伟,欢迎刘伟可以和大家打个招呼。
【嘉宾】嗨,大家好,我是刘伟,目前在扬州农商银行任职,最感兴趣的研究领域是数据预处理与特征工程,还有Python办公自动化。
【主持人】刚才提到最感兴趣的研究领域是数据预处理与特征工程,还有办公自动化。为什么对这两个领域情有独钟呢?
【嘉宾】首先这两个领域是数据分析中偏前端的内容。尤其考验数据分析师的创新思维和编程基本功、数据的提取效率、字段的质量、品控和特征的显像处理等都会直接影响后续的机器学习建模的进程。其次,在整个建模过程中,数据预处理与特征工程的工作量占到了80%以上,而且每个项目原始数据的结构类型差异性巨大,暂时没有标准化的产品可以适配如此复杂多变的工程,专业人员的需求量较大,而真正的建模步骤包括数据记录的划分、预测模型的选择、模型参数的调优和预测效果的评价都较容易实现自动化和智能化。比如博森中英文语义开放平台等专业人员的替代率较高。最后,越是基础性的技术,应用的范围就越广,使用的频率就越高。因此,数据预处理与特征工程、Python办公自动化的思维方法和技术手段并不局限于数据分析,可以运用到实际工作中的方方面面,比如根原因分析和自动发送邮件等。
【主持人】本科读的是动物医学专业,之前在银行也并不是从事数据分析,是如何成功转岗的?有什么特别的经历吗?
【嘉宾】俗话说,女怕嫁错郎,男怕入错行。2012年2月,在一次不限专业的社会招聘中,我幸运的考上了当时还没有改制的宝应信用联合社。在2021年1月调离该单位之前,我陆续做过综合柜员、现金出纳、信贷经理和机关办事员。非常感恩这段经历,也曾经写过一首诗,叫埋头苦灌书,习文百转千回梦始真。八年往事感情,不忘初心砥砺行,真正印证了人生没有白走的路,每一步都算数。
【嘉宾】我是2019年3月开始担任监管报表的填报工作,直到当年11月才独立从事报表的填报工作。说句难为情的话,在3月之前,我连Excel中合并单元格等最简单的操作都不会,更别说统计函数和数据透视表了。但是拼着屁股决定脑袋的犟劲,我也只能赶鸭子上架了。
【嘉宾】有一句话说的特别好,上帝为你关闭了一扇门,但同时也为你打开了一扇窗。在3月到11月的9个月时间里,我遇到了人生第一本数据分析的书籍,《和秋月一起学Excel》,在网易云课堂上也开通了这本书的网课。在认真的学习后,我没有依靠科技信息部门及时自主的完成了国家进一步推动利率市场化改革时人行下发的LPR周报,这个事情满足了我莫大的成就感之后我就像一只井底之蛙,有点飘飘然,自以为在做报表方面也算是佼佼者了。也许冥冥中自有天意,我的一次偶然经历彻底改变了这种想法。
【嘉宾】某一天,我一时兴起,在智联招聘APP上搜索了银行和数据的关键词,查询结果中的岗位要求使我惊出了一身冷汗。诸如SQL、Power BI、SPSS、ASR和Python这些字眼我都闻所未闻,但就从那时起,我第一次知道了CDA。数据分析师也是考虑了许久才下定决心参加周末集训,正式开启了属于自己的数据分析师之旅,现在想起来真是一笔明智且超值的投资。
【主持人】接下来给大家分享一下数据分析在金融行业有哪些具体的应用。
【嘉宾】以我正在从事的工作为例,一是使用省联社的信贷台账,通过MySQL和Python等自动化方法前置各类监管报表及测算省联社的经营管理考核指标。这就是所谓的现状分析,对未达标的指标分析可能存在的原因,并给出合理的纠偏措施,这就是原因分析。最后预测采取纠偏措施后,月末该指标达标的可能性,这就是所谓的预测分析。
【嘉宾】第二是利用数据可视化的手段,如树状图、帕雷托图,针对某一系列产品,分别从贷款品种、贷款利率、客户年龄、客户性别、贷款不良率、授信额度和用信额度等方面展开分析,剖析原因,并给出相关建议,如风控规则是否偏紧、授信额度的计算公式是否调整等。第三,依据每季度修订的考核方案,通过Python办公自动化的手段,及时试算各分支机构和客户经理的得分和绩效情况,从而验证考核方案的合理性及可行性,为考核方案的施行与调整提供数据支撑。四是根据贷款客户历史用信的规律及部门研判的特定规则,比如说存在未到期的抵质押物的贷款客户,可能比信用保证类的贷款客户更容易营销成功,来从待营销的客户名单中进一步筛选以缩小范围,为开展走访的分支机构下发精准营销的客户名单。第五是随着互联网贷款的蓬勃发展,互联网贷款在各项贷款中的占比日益提高,但由于互联网贷款的便捷性,导致贷款客户的生产信息并不完整,比如说婚姻、学历和收入等。在人行的金融基础数据中,个人客户信息存在大量的缺失值,简单的可以用均数或众数来填充,高阶的可以使用随机森林或K-均值等算法来实现缺失值的填充。
【主持人】刚才提到了从最初可能连Excel合并单元格都不会,到现在的MySQL和Python自动化。那么如何平衡学习、生活和工作之间的关系呢?
【嘉宾】在我看来,这三者并不是水火不容的矛盾关系,而是同声相应、同气相求的共生关系。之所以认为是矛盾关系,是因为最大的冲突点在于时间的分配。鲁迅说过,时间就像海绵里的水,只要愿挤,总归还是有的。以我为例,我是这样处理以上三者之间的关系,总结起来就是一句话,挤时间学习,省时间工作,多时间生活。
【嘉宾】第一层含义,在内卷时代,学习是这三者之中的第一前提。说的再残酷一点,就是苦难的修行,因为只有忍受别人不能忍受的忍受,才能享受别人不能享受的享受,所以要坚持不懈的挤时间学习。第二层含义,将学习的理论在实践中磨练,不断的总结和优化,最终应用到实际工作中,既能极大的提高工作效率,又能确保最低的出错概率,将机械枯燥的加班时间匀给学习和生活,难道不是更好的吗?第三层含义,我以前不太懂老艺术家经常说艺术来源于生活又高于生活,但自从我开始写作,而且累积到一定程度的时候,我真的突然明白了,其实生活对于学习和工作都是一样的,可以给予无限的灵感。反而言之,学习和工作又都是为生活服务的,生活既是这三者的起点,又是这三者的终点,这三者是海子写的面朝大海,春暖花开,是三毛写的心若浮尘,浅笑安然,是刘飞写的长乐未央,长舞相望。
【主持人】聊了很多,也想听到更多的CDA持证人对CDA的建言献策。有什么想法可以和大家交流一下。
【嘉宾】第一,我在CDA学习已经将近两年的时间了,第一个现有的CDA课程体系基本上都是通用型,当运用到某一行业的时候,需要具体问题具体分析,能不能在数据分析应用范围最广的行业里选出几个代表性的开设专业性更强、内容更贴近应用场景的课程。第二,线上课程能否提供讲解导航的功能?当对某个知识点不清楚的时候,可以直接点击跳转至相应的进度点,而不是不停的快进在搜寻。第三就是进一步完善认证体系,虽然数据分析师的发展路径有很多,但目前只有三个等级的认证,可以根据市场对数据分析师多元化的需求向下细分和延伸认证体系,既能降低认证的难度,又能契合真实的需求。第四,也是我本人最关心的,就是Python助力办公自动化的课程能否再开发,可以深入挖掘日常工作中的痛点,采取教学相长的方法,可以事先征集学员的真实案例,组成类似于百科全书般的案例集,最后选取典型或特色案例进行针对性讲解。第五就是由于数学和英语是人工智能和深度学习的必备基础,CDA能否增设讲解机器学习中数学知识的相关课程,并且课件里的内容可以适当的用英文来展示?能否请CDA老师就最新发表的关于数据分析方面的国内外论文开展一些公开课交流和专业授课等。
【主持人】感谢刘伟接受我们的采访,介绍了自己的学习经历,从完全的零基础到Python的办公自动化。在采访之前我们也有过简短的交流,有一句话对我感触也很大,就是一定要调整好心态,能不能学好?想不想学好?最重要的就是自己有没有准备好,不要总是想我能不能学好,我能不能学会,只要下定决心就一定可以的。好了,这一期就到这里,我们下一期再见。

在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26