京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA&中国工商银行股份有限公司数据挖掘内训圆满成功
2017年9月18-20日,CDA数据分析研究院在中国工商银行股份有限公司数据中心(上海)进行了一场以“Python语言数据挖掘应用”为主题的内训。培训班在嘉定园区开课,西三旗园区、外高桥园区和上海分行信息科技部远程视频参加,中心各部门员工报名积极,共有95名员工参加了集中培训。老师和数据分析部门的相关同事进行积极地交流学习,最后都收获了不少学习成果。
内训企业介绍
中国工商银行股份有限公司数据中心(上海)
中国工商银行股份有限公司数据中心(上海)[以下简称数据中心(上海)]为总行直属机构,于2000年11月10日正式挂牌成立。数据中心(上海)承担全行信息系统生产运行及灾备管理的职能,建立了全球领先的核心生产环境,形成了基于ITIL理念的生产运维体系,为工商银行境内外机构提供数据服务,并与500多家第三方机构相连接。
满足更高标准的业务连续性运作和系统可用性要求,工商银行在国内同业率先启动“两地三中心”工程建设。数据中心(上海)在上海外高桥、嘉定,以及北京西三旗三个园区建成两个并行运行、快速接管的同城数据中心和一个异地灾备中心,实现了最高等级的灾备部署,保证信息系统全年365天,全天24小时不间断运行。
十多年的奋勇开拓,不仅铸造了数据中心(上海)强大稳定的信息系统,更锤炼出一支锐意进取、追求卓越的人才团队。我们汇聚人才,更执于培养人才。我们引领改变,更擅于掌控改变。我们开拓视野,更乐于分享视野。我们追寻梦想,更敢于触动梦想。
内训内容简介
整场内训气氛和谐,参加内训的学员都表示收获颇多。
第一阶段:Python 基础学习
1. 语法初步
2. 列表、字符串和元组
3. 集合与字典
4. 条件和循环语句
5. 若干重要内置函数应用
6. 文件操作
7. 函数及其应用
8. 正则表达式
9. 数据库和 Python
10. 排序算法、 动态规划算法、递归算法等算法
1. 整理数据(切片、产生随机数、复制、广播、排序等)
2. 数据索引和选择的各种方法
3. 数据的分组、分割、合并、变形
5. 时间序列数据处理、建模和预测(ARIMA)
6. 含中文数据的处理
7. 数据去重、去离群值
8. R语言和Python(pandas)数据整理和建模的比较
9. 描述统计和推论统计分析
1.Logistic 回归模型对文本的分类
2.图片结构和分析(图片的K-means聚类分析)
3.图片的识别和分类:PCA建模
4.二维手写数字识别(KNN方法)
6.数据可视化的各种情形
7.新闻的文本分类(TF-IDF准则、旅游新闻个性化推荐)
8.手写识别
9.朴素贝叶斯(Naïve Bayes)决策
10.酒的品质分类预测
11.机器学习的格点搜索和参数寻优
12.惩罚线性回归分类器
13.使用支持向量机识别和分类
14.金融时间序列预测(非ARIMA方法)
15.机器集成学习算法
16.随机模拟、用户流失预警、量化投资实战
学员评价
老师通过数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,即使是初学者也能快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架。
企业领导评价
本次培训内容丰富,基本涵盖机器学习常用算法和方法。通过集中培训和学习,学员们纷纷表示受益匪浅,对机器学习有了更深入了解,并且提升了动手实践能力。后续在数据分析实践中,结合我行业务和运维场景需要,使用所学的只是和方法更好的解决问题。同时希望后期与CDA数据分析师在专题类课程多交流,CDA认证、项目咨询等多方面达成更深入合作。
内训咨询
手机/微信:13121318867
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10