京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据技术在金融行业有哪些应用前景_数据分析师考试
最近大数据征信很火,那么在金融行业大数据究竟可以怎么用呢?
那我就说一下,大数据在我们内审上面的运用.
话说回答你的问题时候,我正在用我们行的系统跑大数据,今天看到你这个问题我觉得,我已经有资格回答一下了。
我在四大行干内审工作,对我们年轻人来说,现在经验比不上老同志,账务比不上财务部专业人员,我以前是干ERP的,最熟悉的其实是两个模块,即WMS和 MES,工业流程那一块,银行这块以前干过对私房贷这块,毕竟不想在工厂,就快毕业通过校招一批来到了这工作,也很幸运直接来到内审。
简单说,大数据对于内审只能说是一种手段,数据需要设计需要磨合,不是说一个程序下来,一个模型就会有答案,会计的手法千差万别,别的不说就拿我们行来说,当拿到总行的模型时候,我们就要考虑对当地情况是否有用,如果出疑点,疑点是否是真正的疑点这对内审人员来说都要凭借自己的判断。
大数据并不是内审人员的唯一手段,还有其他比如,对公信贷系统、影响系统、柜面操作系统(这里不说的太细,以免暴露自己在哪个行),还有一大堆外挂系统,说句实话这一套东西用下来没几年功夫还真玩不转。
大数据的作用很大,起码提高了我们的效率,以前都靠录入Excel,然后用透视功能或者自己编宏来做,但是Excel有个巨大问题,他是以单元格为单位,只能达到百万级数据,但是银行工作中,业务起码是亿级数据量,(我跑过Excel十万级数据真心卡的要死呀)所以我们通过现在国际通用的一种软件(这里省略是什么系统,大家可以猜一猜)这个单位是以行为主,可以达到亿级数据了,但是这仅仅是达到,我个人觉得跑百万以上的数据已经卡的要死了,所以特别怕关联明细账,每次出结果之前先拜众神,对于这个系统我还是初学者,但是因为这个系统用量不够,总行又推出了新的系统,并且嵌入之前的老系统,但是感觉这两个系统关联的。。。。(唉,呵呵,小职员不说话)
停了一会,我看刚跑出来的模型一如以往的缺限制条件,重新加条件继续跑吧。
幸运的是,每个模型都会出一些答案,在你的模型符合性、正确性兼备的情况下,得到疑点,别以为这些疑点出来就万事大吉了,你起码抽上几笔看一看吧,验证一下吧,至于符不符合总要拿法规制度量一量吧,就是真有问题,也要看是什么问题了,系统性问题,你找人家小柜员有毛用,一笔不良贷款出现你不能说那个网点风控失灵吧,总要有自己分析,而且你要对自己分析负责,这里涉及情况太多,然后从这纷乱繁杂的线索一一梳理,然后写个分析吧,痛苦的来了,因为通过文字准确的表达出来本身就需要锻炼。
再来说说现场审计吧,那叫一斗智斗勇,各种博弈,毕竟谁都不想承认自己错了,而且这个错了真是后果很严重,所以各种推诿,有些时候部门负责人都懒得搭理你,对于有些问题,对公客户经理有些集体跳槽,留下烂摊子(这不得不说银行员工缺少追责制度),然后我们就各种落井下石,其实最不忍的是,每次下去,人家好吃好喝的供着,我们回头给人家一刀,所以招人恨。其实我也想是人力资源部或者计财部的,那是带着升值指标和钱下去的。那是人家人爱,花见花开。
刚回头又看了一下模型,关键的来了。。。。要关联明细了,继续众神保佑吧。。。。。
当然我也不排除不怕死的,心理素质好的。。。
好了,每次这一通下来,该出报告了,好吧初稿,改稿改一,初稿改二,到初稿改N,最终稿一,最终稿二,到最终稿N,我见过最夸张一次,改了60多遍,最后审计报告,真是复印出来能当砖头,然后三堂会审各种头脑风暴。就出成果了。
感觉银行内审和外审有很大的不同,
像审计期间的不同,我们也有审计期间但是和外审审计期间不一样,毕竟我们有些责任不用那么严格。
像审计重点不同,外审重点是三大表真实性,我们更关注的肯定就不是三大表了(废话就一个公司的要作那么多三大表干毛,作假账的笑而不语。。。),我们关注的更多是内控合规和制度有效性还有顶层设计情况等等吧。
审计手段不同,这个是重点,以我的审计角度来判断,对于外审来说大数据的使用,外审用的不会像我们这样频繁,最主要的是一点,大数据需要数据来源,数据来源的可靠性,真的就有那么可信吗,既然数据来源不可信,要大数据有毛用,所以我估计在对审计对象初判,肯定是要对数据源进行判断,但是他们的手段我不是太了解,能不能有大神也给我科普一下呢。。。。
加班时间的不同,我们比起四大来说要好很多了,不过也是五十步笑百步,加班阴影也同样在我们头上盘旋,话说我已经好久没过星期六了耶。。。。
像工资的不同,外审比我们赚的多多了,四大起码平均20到30W吧,我们。。。就不说了反正丢人。
但是有一个相同点,就是怀疑的态度,在我们眼里,都是坏人满处不合规,有句话“大胆假设,小心求证”,其实说出这句话,我已经想要匿名发表,因为我透露了太多我党我行的信息,明眼人真心一看就知道我是哪个行的了,不过真的想遇到个前辈给指导一下。
我说实话也是心痒,想回答一下,看到他貌似应该是“五保”里面的一员吧,感慨现在内审手段都在与时俱进呀,前几天才听说证券公司也开始用大数据,看来金融界大数据已经开始扩展起来,但是我觉得内审这行用大数据真心还在草创阶段,像我们大数据主要在于资金追踪,其他方面虽有涉及但是很难有固定模式,我倒是觉得很难有固定模式。
对于大数据这个概念其实应用起来时间很短,其中提出来大数据概念我倒是觉得已经不算晚了,对于大数据瓶颈在于硬件,大家想想,我上学那会有个2G的内存都美的不行,觉得啥游戏都能玩了,再看看现在,光刺客信条5大革命安装下来我记得是30G,而计算机家用内存达到几T了,大数据不光内存因素。
还有更关键的运算效率吧,不要让我跑个百万级数据就崩溃比啥都强,毕竟我总是拜弯身是很消耗RP值的,我也有个七灾八难,不能把人品这么频繁的使用,我也不是RP值高,任性的人。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09