热线电话:4000-51-9191

就学培训网

登录
首页系统课机器学习竞赛实战专题-蚂蚁金服支付风险识别
机器学习竞赛实战专题-蚂蚁金服支付风险识别
机器学习竞赛实战专题-蚂蚁金服支付风险识别
  • 视频班 随报随学

课程简介

机器学习竞赛实战专题-蚂蚁金服支付风险识别:本次课程对蚂蚁金服竞赛业务背景做了简单介绍,讲述了数据分析在拿到数据之后应该如何开始数据探索,如何跑出模型baseline,如何通过可视化及模型输出进行特征选择,如何理解自定义的评价函数,如何用合理的方式记录上分情况而不发生混乱,如何充分利用传统模型和竞赛杀器,如何根据模型原理进行调参,如何寻找准而不同的模型并做出最优的机器学习模型融合,以及最终如何将每一步串联到一起拿到最优模型结果

学习目标

最大化提升实战能力
取得数据科学竞赛TOP名次
拿到比赛丰厚奖金
斩获名企offer

学习对象和基础

具备一定数据分析理论基础,和Python软件基础
有简单项目经验,或尝试参加过机器学习方向的竞赛,熟悉数据分析常用库
具有一定机器学习算法基础,想深入参与推荐系统项目

01新手上路

01-01说在前面
01-02初识数据科学竞赛
01-03支付宝欺诈风险识别项目导学
01-04机器学习环境:jupyter使用
01-05机器学习常用库(pandas,scikit-learn)
01-06从业务场景认识比赛数据
01-07数据初探索
01-08快速搭建baseline版本
01-09如何制作线下科学验证体系
01-10比赛常用回归任务评价指标
01-11比赛常用分类任务评价指标
01-12支付宝反欺诈自定义评价函数
01-13数据内存优化技巧
01-14数据交叉验证
01-15使用内置cross_validate接口交叉验证
01-16使用logsitic分类模型
01-17使用KNN分类模型
01-18使用Adaboost分类模型
01-19使用Bagging分类模型
01-20使用RandomRorest分类模型
01-21使用GBDT分类模型
01-21scikit-learn各分类模型对比分析

02玩转机器学习竞赛两大杀器

02-01LightGBM采用scikit-learn方式调用
02-02LightGBM经典方式调用
02-03LightGBM交叉验证
02-04LightGBM参数解析
02-05LightGBM输出特征重要性
02-06LightGBM高级用法
02-07XGBoost使用
02-08XGBoost参数解析
02-09LightGBM和Xgboost自定义目标函数
02-10XGBoost与LightGBM对比分析
02-11LightGBM原理深度解析

03数据处理与特征工程中的骚操作

03-01数据探索与处理
03-02数据缺失值分析
03-03缺失值高级处理
03-04特征分析
03-05通过Adversarial训练方式试探训练集和测试集分布
03-06特征的IV和WOE编码
03-07基于模型的特征选择
03-08基于scikit-learn中RFECV的特征选择
03-09使用热力图分析特征相关性
03-10使用核密度图分析特征相关性
03-11类别不平衡分析
03-11类别不平衡分析
03-12基于模型的类别不平衡处理
03-13基于数据采样的类别不平衡处理
03-14灰样本拒绝推断方案
03-15多种方式特征选择
03-16特征分布不均匀的处理策略
03-17困难样本分析

04模型花式融合调参

04-01网格搜索优化模型参数
04-02贝叶斯方法优化模型参数
04-03机器学习比赛中随机种子的作用
04-04模型的偏差与方差分析
04-05准而不同模型选择策略
04-07stacking的模型融合策略
04-08模型之间的相关性分析
04-09蚂蚁金服项目方案整合