
大数据技术在金融行业有哪些应用前景_数据分析师考试
最近大数据征信很火,那么在金融行业大数据究竟可以怎么用呢?
那我就说一下,大数据在我们内审上面的运用.
话说回答你的问题时候,我正在用我们行的系统跑大数据,今天看到你这个问题我觉得,我已经有资格回答一下了。
我在四大行干内审工作,对我们年轻人来说,现在经验比不上老同志,账务比不上财务部专业人员,我以前是干ERP的,最熟悉的其实是两个模块,即WMS和 MES,工业流程那一块,银行这块以前干过对私房贷这块,毕竟不想在工厂,就快毕业通过校招一批来到了这工作,也很幸运直接来到内审。
简单说,大数据对于内审只能说是一种手段,数据需要设计需要磨合,不是说一个程序下来,一个模型就会有答案,会计的手法千差万别,别的不说就拿我们行来说,当拿到总行的模型时候,我们就要考虑对当地情况是否有用,如果出疑点,疑点是否是真正的疑点这对内审人员来说都要凭借自己的判断。
大数据并不是内审人员的唯一手段,还有其他比如,对公信贷系统、影响系统、柜面操作系统(这里不说的太细,以免暴露自己在哪个行),还有一大堆外挂系统,说句实话这一套东西用下来没几年功夫还真玩不转。
大数据的作用很大,起码提高了我们的效率,以前都靠录入Excel,然后用透视功能或者自己编宏来做,但是Excel有个巨大问题,他是以单元格为单位,只能达到百万级数据,但是银行工作中,业务起码是亿级数据量,(我跑过Excel十万级数据真心卡的要死呀)所以我们通过现在国际通用的一种软件(这里省略是什么系统,大家可以猜一猜)这个单位是以行为主,可以达到亿级数据了,但是这仅仅是达到,我个人觉得跑百万以上的数据已经卡的要死了,所以特别怕关联明细账,每次出结果之前先拜众神,对于这个系统我还是初学者,但是因为这个系统用量不够,总行又推出了新的系统,并且嵌入之前的老系统,但是感觉这两个系统关联的。。。。(唉,呵呵,小职员不说话)
停了一会,我看刚跑出来的模型一如以往的缺限制条件,重新加条件继续跑吧。
幸运的是,每个模型都会出一些答案,在你的模型符合性、正确性兼备的情况下,得到疑点,别以为这些疑点出来就万事大吉了,你起码抽上几笔看一看吧,验证一下吧,至于符不符合总要拿法规制度量一量吧,就是真有问题,也要看是什么问题了,系统性问题,你找人家小柜员有毛用,一笔不良贷款出现你不能说那个网点风控失灵吧,总要有自己分析,而且你要对自己分析负责,这里涉及情况太多,然后从这纷乱繁杂的线索一一梳理,然后写个分析吧,痛苦的来了,因为通过文字准确的表达出来本身就需要锻炼。
再来说说现场审计吧,那叫一斗智斗勇,各种博弈,毕竟谁都不想承认自己错了,而且这个错了真是后果很严重,所以各种推诿,有些时候部门负责人都懒得搭理你,对于有些问题,对公客户经理有些集体跳槽,留下烂摊子(这不得不说银行员工缺少追责制度),然后我们就各种落井下石,其实最不忍的是,每次下去,人家好吃好喝的供着,我们回头给人家一刀,所以招人恨。其实我也想是人力资源部或者计财部的,那是带着升值指标和钱下去的。那是人家人爱,花见花开。
刚回头又看了一下模型,关键的来了。。。。要关联明细了,继续众神保佑吧。。。。。
当然我也不排除不怕死的,心理素质好的。。。
好了,每次这一通下来,该出报告了,好吧初稿,改稿改一,初稿改二,到初稿改N,最终稿一,最终稿二,到最终稿N,我见过最夸张一次,改了60多遍,最后审计报告,真是复印出来能当砖头,然后三堂会审各种头脑风暴。就出成果了。
感觉银行内审和外审有很大的不同,
像审计期间的不同,我们也有审计期间但是和外审审计期间不一样,毕竟我们有些责任不用那么严格。
像审计重点不同,外审重点是三大表真实性,我们更关注的肯定就不是三大表了(废话就一个公司的要作那么多三大表干毛,作假账的笑而不语。。。),我们关注的更多是内控合规和制度有效性还有顶层设计情况等等吧。
审计手段不同,这个是重点,以我的审计角度来判断,对于外审来说大数据的使用,外审用的不会像我们这样频繁,最主要的是一点,大数据需要数据来源,数据来源的可靠性,真的就有那么可信吗,既然数据来源不可信,要大数据有毛用,所以我估计在对审计对象初判,肯定是要对数据源进行判断,但是他们的手段我不是太了解,能不能有大神也给我科普一下呢。。。。
加班时间的不同,我们比起四大来说要好很多了,不过也是五十步笑百步,加班阴影也同样在我们头上盘旋,话说我已经好久没过星期六了耶。。。。
像工资的不同,外审比我们赚的多多了,四大起码平均20到30W吧,我们。。。就不说了反正丢人。
但是有一个相同点,就是怀疑的态度,在我们眼里,都是坏人满处不合规,有句话“大胆假设,小心求证”,其实说出这句话,我已经想要匿名发表,因为我透露了太多我党我行的信息,明眼人真心一看就知道我是哪个行的了,不过真的想遇到个前辈给指导一下。
我说实话也是心痒,想回答一下,看到他貌似应该是“五保”里面的一员吧,感慨现在内审手段都在与时俱进呀,前几天才听说证券公司也开始用大数据,看来金融界大数据已经开始扩展起来,但是我觉得内审这行用大数据真心还在草创阶段,像我们大数据主要在于资金追踪,其他方面虽有涉及但是很难有固定模式,我倒是觉得很难有固定模式。
对于大数据这个概念其实应用起来时间很短,其中提出来大数据概念我倒是觉得已经不算晚了,对于大数据瓶颈在于硬件,大家想想,我上学那会有个2G的内存都美的不行,觉得啥游戏都能玩了,再看看现在,光刺客信条5大革命安装下来我记得是30G,而计算机家用内存达到几T了,大数据不光内存因素。
还有更关键的运算效率吧,不要让我跑个百万级数据就崩溃比啥都强,毕竟我总是拜弯身是很消耗RP值的,我也有个七灾八难,不能把人品这么频繁的使用,我也不是RP值高,任性的人。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09