cda

数字化人才认证

首页 > 行业图谱 >

竞赛中常见的特征工程技巧有哪些?
2023-08-15
特征工程是机器学习和数据挖掘领域中的关键步骤之一。它涉及对原始数据进行转换、选择和创建特征,以使其更适合用于机器学习算法的训练和预测。在竞赛中,精心设计的特征工程技巧可以显著提高模型的性能。以下是常见 ...
如何对数据进行特征工程
2023-06-15
特征工程是机器学习中至关重要的一步,它是将原始数据转换为机器学习算法可以使用的特征向量的过程。在本文中,我们将探讨如何对数据进行特征工程。 数据清洗 在进行特征工程之前,首先需要对原始数据进行清洗。这 ...
特征工程是什么?常用的方法有哪些?
2020-07-07
“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器 ...

一文带你读懂 特征工程

一文带你读懂特征工程
2020-04-20
无论它的规模和大小如何,数据已经成为现代企业、公司和组织的一流资产。任何一个智能系统都需要数据驱动,无论它多复杂。每个智能系统的核心,均有一个或多个基于某种数据学习方法的算法,例如机器学习、深 ...

从“标签”到“人”:CDA数据分析师视角下的用户画像

从“标签”到“人”:CDA数据分析师视角下的用户画像
2026-04-30
 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何指导业务”时,却常常答不上来。其实,标签是对一个用户“打点描述”,画像是对一群人 ...

从“raw”到“ready”:CDA数据分析师视角下的标签加工方式

从“raw”到“ready”:CDA数据分析师视角下的标签加工方式
2026-04-29
 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当导致标签失效,或因规则模糊造成标签口径混乱。其实,好的标签并非设计出来,而是加工 ...

从零散数据到精准洞察:CDA数据分析师视角下的标签体系设计原理

从零散数据到精准洞察:CDA数据分析师视角下的标签体系设计原理
2026-04-28
 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。其实,零散的指标告诉你“数字是什么”,系统的标签体系告诉你“业务为什么”。标签体 ...

【CDA干货】基于客户行为数据序列的意图识别模型构建指南

【CDA干货】基于客户行为数据序列的意图识别模型构建指南
2026-04-22
在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成了客户行为数据序列。意图识别模型的核心价值,就是从这些连续、动态的行为序列中,挖 ...

【CDA干货】SQL日期提取:从文本到可用数据,解锁时间维度的业务价值

【CDA干货】SQL日期提取:从文本到可用数据,解锁时间维度的业务价值
2026-04-20
在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、数据建模特征构建,都离不开对日期信息的精准提取与高效利用。而SQL作为数据查询与处 ...

【CDA干货】特征重要性分析:解锁机器学习模型价值的核心钥匙

【CDA干货】特征重要性分析:解锁机器学习模型价值的核心钥匙
2026-04-20
在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮我们筛选冗余特征、优化模型结构,更能破解模型“黑箱”困境,揭示数据与目标变量之间 ...

【CDA干货】数据分析与数据挖掘:必备工具与核心技能全解析

【CDA干货】数据分析与数据挖掘:必备工具与核心技能全解析
2026-04-17
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗、零售等各个领域。数据分析聚焦“解读数据、发现规律”,回答“是什么、为什么”;数 ...

【CDA干货】随机森林特征重要性分析:原理、方法与实操指南

【CDA干货】随机森林特征重要性分析:原理、方法与实操指南
2026-04-16
在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延长训练时间,还可能引发过拟合,降低模型泛化能力,甚至掩盖关键特征的真实影响。随机 ...

案例分享会 | 医疗行业数据分析实践(2026.04.09)

案例分享会 | 医疗行业数据分析实践(2026.04.09)
2026-04-13
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破百万。深耕医疗行业数据分析与机器学习落地,擅长将统计建模、特征工程与临床业务深度 ...

CDA数据分析师:用好相关系数,精准挖掘变量关联、筑牢分析与建模根基

CDA数据分析师:用好相关系数,精准挖掘变量关联、筑牢分析与建模根基
2026-03-25
在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭建,亦或是后期的业务归因、策略优化,都离不开对变量间关联关系的精准度量。而相关系 ...

【CDA干货】机器学习算法工程实用案例解析:从落地到优化全流程

【CDA干货】机器学习算法工程实用案例解析:从落地到优化全流程
2026-03-18
机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于纯算法研究,工程落地更注重“实用性、稳定性、可扩展性”——既要选择适配业务场景的 ...

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合:原理、方法与应用全解析

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合:原理、方法与应用全解析
2026-03-18
在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。传统滤波方法(如扩展卡尔曼滤波EKF)依赖线性化近似,易在强非线性系统中引入误差; ...

【CDA干货】决策树模型变量重要性排序:原理、方法与实操指南

【CDA干货】决策树模型变量重要性排序:原理、方法与实操指南
2026-03-17
在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重要性排序,作为决策树模型的核心输出之一,更是数据分析与特征工程的关键环节——它能 ...

CDA数据分析师:数据读取实操指南,打通数据价值转化第一步

CDA数据分析师:数据读取实操指南,打通数据价值转化第一步
2026-03-16
数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数据与后续分析的“第一道枢纽”。不同于简单的“打开数据文件”,CDA分析师的数据读取, ...

CDA数据分析师:量化策略分析框架,解锁数据驱动决策的核心路径

CDA数据分析师:量化策略分析框架,解锁数据驱动决策的核心路径
2026-03-13
在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certified Data Analyst)数据分析师,作为量化策略的核心构建者与落地执行者,其专业能力 ...

【CDA干货】随机森林算法重要性分析:原理、实操与业务价值

【CDA干货】随机森林算法重要性分析:原理、实操与业务价值
2026-03-12
在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随机森林作为一种集成学习算法,不仅具备高精度、抗过拟合、适配多场景的优势,更自带“ ...

OK
客服在线
立即咨询