京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA&中国工商银行股份有限公司数据挖掘内训圆满成功
2017年9月18-20日,CDA数据分析研究院在中国工商银行股份有限公司数据中心(上海)进行了一场以“Python语言数据挖掘应用”为主题的内训。培训班在嘉定园区开课,西三旗园区、外高桥园区和上海分行信息科技部远程视频参加,中心各部门员工报名积极,共有95名员工参加了集中培训。老师和数据分析部门的相关同事进行积极地交流学习,最后都收获了不少学习成果。
内训企业介绍
中国工商银行股份有限公司数据中心(上海)
中国工商银行股份有限公司数据中心(上海)[以下简称数据中心(上海)]为总行直属机构,于2000年11月10日正式挂牌成立。数据中心(上海)承担全行信息系统生产运行及灾备管理的职能,建立了全球领先的核心生产环境,形成了基于ITIL理念的生产运维体系,为工商银行境内外机构提供数据服务,并与500多家第三方机构相连接。
满足更高标准的业务连续性运作和系统可用性要求,工商银行在国内同业率先启动“两地三中心”工程建设。数据中心(上海)在上海外高桥、嘉定,以及北京西三旗三个园区建成两个并行运行、快速接管的同城数据中心和一个异地灾备中心,实现了最高等级的灾备部署,保证信息系统全年365天,全天24小时不间断运行。
十多年的奋勇开拓,不仅铸造了数据中心(上海)强大稳定的信息系统,更锤炼出一支锐意进取、追求卓越的人才团队。我们汇聚人才,更执于培养人才。我们引领改变,更擅于掌控改变。我们开拓视野,更乐于分享视野。我们追寻梦想,更敢于触动梦想。
内训内容简介
整场内训气氛和谐,参加内训的学员都表示收获颇多。
第一阶段:Python 基础学习
1. 语法初步
2. 列表、字符串和元组
3. 集合与字典
4. 条件和循环语句
5. 若干重要内置函数应用
6. 文件操作
7. 函数及其应用
8. 正则表达式
9. 数据库和 Python
10. 排序算法、 动态规划算法、递归算法等算法
1. 整理数据(切片、产生随机数、复制、广播、排序等)
2. 数据索引和选择的各种方法
3. 数据的分组、分割、合并、变形
5. 时间序列数据处理、建模和预测(ARIMA)
6. 含中文数据的处理
7. 数据去重、去离群值
8. R语言和Python(pandas)数据整理和建模的比较
9. 描述统计和推论统计分析
1.Logistic 回归模型对文本的分类
2.图片结构和分析(图片的K-means聚类分析)
3.图片的识别和分类:PCA建模
4.二维手写数字识别(KNN方法)
6.数据可视化的各种情形
7.新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐)
8.手写识别
9.朴素贝叶斯(Naïve Bayes)决策
10.酒的品质分类预测
11.机器学习的格点搜索和参数寻优
12.惩罚线性回归分类器
13.使用支持向量机识别和分类
14.金融时间序列预测(非ARIMA方法)
15.机器集成学习算法
16.随机模拟、用户流失预警、量化投资实战
学员评价
老师通过数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,即使是初学者也能快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架。
企业领导评价
本次培训内容丰富,基本涵盖机器学习常用算法和方法。通过集中培训和学习,学员们纷纷表示受益匪浅,对机器学习有了更深入了解,并且提升了动手实践能力。后续在数据分析实践中,结合我行业务和运维场景需要,使用所学的只是和方法更好的解决问题。同时希望后期与CDA数据分析师在专题类课程多交流,CDA认证、项目咨询等多方面达成更深入合作。
内训咨询
手机/微信:13121318867
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12