cda

全国校区

您的位置:首页 > 课程列表 > Python数据分析师集训班 - 3个月

Python数据分析师集训班 - 3个月

Python数据分析师集训班 - 3个月

难度系数:

课程系列:Level Ⅱ


周期: 12周

11800

立即报名 花呗分期 咨询老师

Python数据分析师集训班 - 3个月

 姓名:

 电话:

 邮箱:

   备注:

邀请码:

提交信息
  • WHAT 课程简介

    企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要透过什么样的方法,才能快速且实时的转变成决策时有用的信息,是现代企业所面临最迫切性的问题。
    Python数据分析集训课程针对针对周末时间充裕、零基础的专科、本科在校生,以及在职&欲转行从事数据分析的工作人员提供3个月全脱产周末集训,毕业可推荐相关工作。
    课程内容以CDA数据分析师标准大纲要求,包含Python基础 – Pandas数据清洗 - Python爬虫 - Python数据可视化(Matplotlib、Seaborn、Pyecharts) - Python机器学习算法等内容,并结合互联网金融、电信、银行、医疗、交通等行业实际案例来帮助学员建立整套的数据分析和机器学习思路,案例涉及营销优化、风险控制、用户研究、商业部署等领域,使学员所学更符合企业要求。
  • WHY 学习目标

    熟练掌握数据科学领域最受欢迎的编程语言-Python
    掌握使用Python和pandas库进行数据清洗和预处理
    使用Python爬虫获取网络数据
    学会使用matplotlib、seaborn进行初级可视化
    学会使用Pyecharts进行高级数据可视化
    学会构建机器学习算法进行分类、预测和聚类模型
    使用Python进行数据分析整体思路、针对业务做出模型最优化选择
    善用机器学习解决用户画像、精准营销、风险管理等商业问题
    使用机器学习实操电商、金融、电信、医药行业真实项目案例
  • WHO 学习对象和基础

    想从事数据领域工作,缺乏实践技能的在校学生
    希望转行数据领域人员
    个人发展遭遇瓶颈的数据分析师
    有数据化运营需求的产品运营、市场人员及管理者
    对Python数据分析和挖掘感兴趣的业界人士



课程案例,项目特训

点击图片任何区域可放大

知乎用户画像基本研究

案例介绍 知乎公司想要对本公司的用户群体进行分析,建立用户画像模型。在此过程中,数据清洗步骤是得到用户基本情况信息的重要步骤。基于数据分析的结论,可以给公司的精准营销、产品优化、业务布局等提供强有力的决策支持。
点击图片任何区域可放大

教育行业学习质量数据监控

案例介绍 某教育部门根据一场考试的学业水平,研究样本人群的部分特征(性别、父母的教育水平、居住是否城乡等)对各科目(比如数学,阅读,和写作)分数的影响,从而可以为教师针对不同环境下的群体提供个性化教学方式,因材施教,为学生的全面发展保驾护航。
点击图片任何区域可放大

人力资源之员工流失预警

案例介绍 企业培养人才需要大量的成本,为了防止人才再次流失,应当注重员工流失分析。员工流失分析是评估公司员工流动率的过程,目的是预测未来的员工离职状况,减少员工流失情况。
点击图片任何区域可放大

电商精准营销之用户画像

案例介绍 由于企业的竞争是客户的竞争,大多数企业已经意识到有效的客户细分是企业介入客户竞争的核心竞争力,企业的服务营销策略也离不开有效客户细分的支持。 本项目,旨在分析一个电子商务数据库中4000多个用户一年内购买商品的详细信息,从而对客户分类。最终模型可以应用到推荐系统、客户画像等多个领域,有较强的可实践性,及一定的商业价值。
点击图片任何区域可放大

时间序列预测零售销售额

案例介绍 电商公司一爆款产品由于制造商产能不稳定,经常由于进货不足而导致延迟发货,或者遭到投诉,甚至被取消订单。也时常因为进货太多而导致库存堆积,占用其他爆款产品的库存空间。该电商公司因此而导致大量订单流失和额外的运营成本。 本案例根据该产品的历史销售额记录,通过时间序列ARIMA模型对未来几个月的销售情况做出预测。提前预测产品的销售情况,以备电商公司能提前进货和库存管理,降低运营成本。

01Python编程基础知识

01-01成为Python高手之前必备基础知识
01-02数据分析的武器库与分析工具Python介绍
01-03Python的基本数据类型和数据结构
01-04Python的程序控制
01-05Python的函数与模块
01-06Python日期和时间处理
01-07Python字符串处理与正则表达式
01-08Python异常处理和文件操作
01-09作业练习:基于Python的函数创建与商业实操文件操作

02Python进行数据整理和数据清洗

01-01Numpy中的数据类型--ndarray数组的创建
01-02Numpy数组基础:索引、切片、变形、分裂
01-03Numpy数组运算:通用函数
01-04Numpy数组变形、拼接
01-05Numpy数组计算:广播、聚合、比较和掩码、数组排序
01-06Pandas对象简介:Series、Dataframe、Index
01-07Pandas数据加载与存储
01-08Pandas数值运算方法:通用函数、聚合函数、遍历
01-09Panda层次化索引
01-10Pandas数据处理:数据类型转换、缺失值处理、字符串转换
01-11Pandas数据表的合并与连接
01-12Pandas数据的累计与分组
01-13高性能Pandas:query()、eval()实现高性能运算
01-14Pandas数据规整化:清理、转换、合并、重塑
01-15Pandas时间序列&金融数据处理
01-16实战案例:基于pandas-SQL世界银行各国家发展指标及GDP变化趋势探索性分析
01-17作业练习:USDA食品数据清洗

03Python进行数据可视化技术-线上

01-01绘图思想的基本原理
01-02Python数据可视化包-Matplotlib介绍
01-03使用Matplotlib进行基本的图形绘制
01-04使用Python数据处理包Pandas做可视化
01-05Python数据可视化包-Seaborn介绍与图形绘制
01-06Python数据可视化包-Pyecharts介绍与图形绘制
01-07使用Python进行地图绘制-Pyecharts
01-08数据可视化技巧
01-09作业练习:制作数据可视化分析报告

04Python进行网络爬虫-线上

01-01网络爬虫基础知识
01-02网络请求及响应-Requests库
01-03HTML文档解析-BeautifulSoup库
01-04常见反爬虫机制及应对
01-05网络爬虫 VS 网络数据抓取
01-06案例实战1:新东方批量下载头像
01-07案例实战2:抓取豆瓣书籍简介
01-08案例实战3:模拟浏览器selenium抓取电商商品信息及评论
01-09作业练习:爬取豆瓣电影Top250数据抓取

05Python数据清洗高级操作及案例实战

01-01如何成为一名优秀的数据分析师
01-02使用Python读取数据:CSV文件、JSON数据、XML数据
01-03数据的获取与存储:数据的不平等性、真实性、可读性、清洁度等
01-04对获取到的数据进行探索:埃博拉病毒危机、列车安全数据、童工数据
01-05数据清洗探索:找出要清洗的数据、数据格式化、找出离群值和不良数据、找出重复数据、模糊匹配、正则匹配等
01-06数据清洗探索:标准化和脚本化(数据归一化和标准化、找到适合项目的数据清洗方法、数据清洗脚本化、用新数据测试)
01-07数据探索和分析:数据探索(表函数探索、连接多个数据集、找出离群值、创建分组)
01-08数据探索与分析:分离和聚焦数据、描述结论、书写报告文档
01-09Pandas时间序列&金融数据处理
01-10实战案例1:视频网站数据清洗整理和结论研究
01-11实战案例2:教育领域学员学习质量数据化监控-清洗与可视化
01-12实战案例3:基于数据清洗的知乎用户画像探索
01-13作业练习:国外电商用户购买信息的数据处理与探索

06机器学习和数据挖掘概述-线上

01-01数据挖掘概念
01-02数据挖掘算法分类
01-03数理统计vs机器学习一般流程
01-04有监督学习算法
01-05无监督学习算法
01-06机器学习学习路线图和推荐书籍
01-07作业练习:阐述机器学习与统计学习的一般流程

07Python进行机器学习实战-Part1

01-01准备工作:开发环境配置
01-02机器学习基本概念和名词说明
01-03scikit-learn入门:Scikit-Learn库简介
01-04模型建立的基本思路
01-05KNN算法原理基础及实现
01-06模型优化:学习曲线和交叉验证
01-07补充理论:距离类模型的相关讨论
01-08模型评价与总结
01-09决策树算法的基本原理
01-10决策树算法的scikit-learn实现
01-11分类模型的评估指标:混淆矩阵
01-12实战案例:泰坦尼克号幸存者的预测
01-13过拟合和欠拟合
01-14决策树算法的优点和缺点
01-15作业练习:IBM Waston Analytics员工离职核心因素挖掘与分析

08Python进行机器学习实战-Part2

01-01随机森林概述:集成算法概述Bagging vs Boosting
01-02随机森林分类器和回归器实现
01-03机器学习中调参的基本思想
01-04调参应用:随机森林在乳腺癌数据上的调参
01-05聚类算法概述
01-06KMeans算法的概述和理论基础
01-07Kmeans算法的scikit-learn实现
01-08Kmeans矢量化应用:降维
01-09关联规则算法概述:频繁项集的产生与关联发现
01-10Apriori算法原理:先验原理
01-11使用Apriori算法来发现频繁项集
01-12作业练习:使用聚类分析做客户画像分析

09Python进行机器学习实战-Part3

01-01线性回归概述
01-02多元线性回归模型的构建
01-03回归类模型评估指标:精准性、拟合性
01-04多重共线性与岭回归、Lasso回归
01-05非线性问题及其处理方法
01-06多项式回归模型
01-07逻辑回归的概述:模型参数、sigmoid参数、逻辑回归的返回值解析
01-08逻辑回归的特点:模型拟合效果、计算速度、返回值的可解释性
01-09逻辑回归的构建与优化
01-10作业练习:数字化人力资源管理之员工流失风险预警

10Python进行机器学习实战-Part4

01-01SVM概述:SVM工作原理
01-02SVM模型构建:线性SVM和非线性SVM
01-03ROC曲线及相关问题
01-04概率与阈值
01-05SVM概率预测评估:predict_proba、decision_function
01-06绘制SVM的ROC曲线
01-07ROC曲线与AUC曲线
01-08利用ROC曲线找出最佳阈值
01-09朴素贝叶斯概述
01-10朴素贝叶斯模型分类:高斯朴素贝叶斯、多项式朴素贝叶斯
01-11作业练习:运用朴素贝叶斯做文本分类

11文本分析技术与综合案例

01-01文本分析简介及文本分析流程
01-02中文分词方法
01-03中文词性标注方法
01-04关键词提取方法
01-05命名实体识别
01-06文本分析模型实作与比较: 以网络舆情分析模型及命名实体识别为例
01-07新闻文件分类方法
01-08中文文本摘要方法
01-09作业练习:使用python进行新闻文本数据分词和词性标注

12深度学习技术与综合案例

01-01人脸识别及应用
01-02OpenCV及Dlib简介
01-03人脸侦测及人脸68个特征撷取
01-04人脸识别(利用ResNet)
01-05物体检测与定位及应用
01-06目标检测技术概述
01-07YOLOv3简介及COCO 数据集
01-08物体定位
01-09物体检测
01-10文本分析及深度学习模型实作与比较: 以新闻文件分类与摘要及人脸识别及物体侦测模型为例
01-11作业练习:建立电商产品舆情文本分类模型

13电信客户流失预警/信用卡盗刷预测建模

01-01传统监督学习方法与非监督学习方法
01-02半监督学习方法概述
01-03半监督学习模型实作与比较: 以电信业客户流失模型为例
01-04智能反欺诈概述
01-05反欺诈手法
01-06机器学习方法
01-07深度学习方法
01-08深度学习模型实作与比较: 以信用卡盗刷预测模型为例
01-09作业练习:银行业客户流失模型建置

14产品营销/小额信贷及信用风险预测建模

01-01传统模型评估方法与利润最大化评估方法
01-02增益图与利润图
01-03利润最大化模型实作与比较: 以产品营销模型为例
01-04传统学习与集成学习
01-05集成学习的分类:模型融合与机器学习元算法
01-06模型融合模型建置(多数法、平均法、加权平均法、堆叠法、混合法)
01-07机器学习元算法模型建置(袋装法、袋装通用法、随机森林、提升法、Adaboosting算法、Gradient Boosting算法、XGBoosting算法)
01-08集成学习方法实作与比较: 以小额信贷及信用风险预测模型为例
01-09作业练习:巴塞尔资本协定下之逾期评分卡(Collection Scorecard)之建置及预测

15期末毕业答辩

01-01银行业之进件评分卡建置
01-02电信行业交叉销售案例分析
01-03零售行业忠诚客户价值预测
01-04航空业客户聚类与精准营销

硬核服务

  • 朝九晚九全程跟班答疑

    助教线上服务时间由原先的上课期间答疑调整为课程持续期间答疑,包括中途休息时间;同时,每日答疑时间由原先的“朝九晚六”调整为“朝九晚九”,全面覆盖同学晚自习时间。
  • 一对一督学

    每个班级、每位同学、每月都会进行至少一次一对一辅导,询问同学学习状态、解决学员学习问题;同时,针对每个模块测试结果后10%的学员进行额外辅导,以确保学员能够跟上学习进度。
  • 定期直播串讲

    对于重难点知识和同学普遍反应的问题,助教将进行每周1-2次的晚自习串讲,串讲时常为2小时左右,且相关内容需要重新制作、有别于课程内容,帮助同学攻克重难点知识。
  • 五分钟内有问必答

    助教线上服务要求5分钟内有问必答,并能真正做到解决所有课程中遇到的问题。在原先每个班一个助教+一个班主任的配置下,调整为每个班2名助教+项目服务团队的模式,以确保快速、高质量的解决线上提问。
  • 出勤率和进度监督

    在课程持续期间,助教还需实时统计学员出勤情况,监督课堂纪律,跟进学习进度。除正常答疑外,服务团队会与班级同学保持沟通、给予正确指引,从而营造积极学习氛围。
  • 作业与测试

    在远程授课期间,每个课程会安排相关课后作业,确保同学课下能够进行适当练习,提升同学实时参与感、保证当日学习效果。除了作业,服务团队还会组织学员进行阶段性测试,以考试性质为主,主要考察学员对本阶段知识掌握程度。

来自业界的数据领袖团队

  • 吴昊天

    CDA数据分析研究院技术负责人兼高级讲师/CDA LEVEL II大数据分析师等级考试命题组组长

    曾就职于电子科技大学大数据中心,从事医疗大数据分析相关工作,拥有丰富的海量数据分析经验、算法研发经验、省级数据平台搭建经验,拥有算法专利若干,主要研究方向为机器学习和深度学习。
  • 李御玺

    台湾铭传大学教授/中华数据挖掘协会理事

    台湾大学博士,在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。 其还兼任厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问。服务过的客户包括:中国工商局、中信银行、台新银行等。
  • 赵仁乾

    CDA数据分析研究院讲师/京邮电大学管理科学与工程硕士

    现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。
权威 经管之家CDA LEVEL Ⅲ数据科学家认证证书,行业顶尖人才认证,已获得IBM大数据大学,中国电信,苏宁,德勤,猎聘,CDMS等企业的认可。
专业 CDA认证是根据商业数据分析专业岗位设立的一套体系化、科学化、正规化的人才标准。全国统考、专家命题、评分公平、流程严格,更具含金量。
权益 持证人享有系列特殊权益。证书皆绑定考生真实身份,可在CDA官网查询,确保唯一性与防伪性。证书三年审核一次,保证持证人的实力与权益。

认证介绍:
CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,涉及金融、电商、医疗、互联网、电信等行业大数据及数据分析从业者所需要具备的技能,符合当今全球大数据及数据分析技术潮流,为各界企业、机构提供数据分析人才参照标准。经管之家为中国区CDA数据分析师认证考试唯一主办机构,于每年6月与12月底在全国范围举办线下数据分析师考试,通过考试者可获得CDA数据分析师认证证书。
CDA持证人福利
1.可吸纳为CDA Institute、中国数据分析师(CDA)俱乐部会员,活动中具有优先报名参与权。
2.可优先获得CDA内部就业及职业发展推荐。
3.免费参与CDA举办的中国数据分析师行业峰会、大数据峰会、研讨会等各项活动,Level Ⅱ与Level III持证人享受特权位置。
4.可申请加入CDA数据分析项目组,参与项目合作(提供项目给持证人演练)。
5.CDA Level Ⅰ持证人免费享受Peixun.net会员服务6个月(价值588 RMB),Level Ⅱ与Level III持证人免费享受peixun.net会员服务1年 (价值998 RMB);
6.其他特权皆以各类活动公告为主。
进入考试报名系统
  • Q:上课形式是怎么样的?

    A:课程为远程在线直播 + 线上视频录播+课后全套录播 + 线上答疑,不受地域限制,直播需同步时间学习,录播视频同学可以自主安排时间学习视频。
  • Q:如果学不会怎么办?

    A:相信每位同学,来学习都会认真努力,不存在学不会的问题。上课期间,全程助教跟班答疑;课后,助教老师依旧会在群里帮大家解答学习上的疑问。此外,课程均赠送全套录播视频,有效期2年,方便学员反复观看巩固,稳扎稳打学会全部课程。
  • Q:本课程需要Python语言基础吗?

    A:不是必须的。本课程针对零基础学员学习,将从Python语言语法入门系统讲授知识,基础薄弱学员可通过报名课程预习视频学习。
  • Q: 在这门课程中会学习到什么?

    A: 你将在课程中学习如何选择不同的数据分析方法来解决问题,同时学会使用当前数据科学最主流和收欢迎的数据分析工具-Python。深入学习数据清洗、探索性分析、可视化技术和机器学习技术。使用在大数据、金融、智能领域进行预测分析,成为数据分析技术精英,具备加入领先科技企业的能力!

OK