cda

数字化人才认证

首页 > 行业图谱 >

123 1/3
XGBoost做分类问题时每一轮迭代拟合的是什么?
2023-04-18
XGBoost(eXtreme Gradient Boosting)是一种强大的集成学习算法,常用于解决分类和回归问题。它是一种基于决策树的机器学习算法,在解决分类问题时,每一轮迭代拟合的是残差。本文将对XGBoost分类问题中每一轮迭代 ...
如何对XGBoost模型进行参数调优?
2023-04-10
XGBoost是一个高效、灵活和可扩展的机器学习算法,因其在许多数据科学竞赛中的成功表现而备受瞩目。然而,为了使XGBoost模型达到最佳性能,需要进行参数调优。本文将介绍一些常见的XGBoost参数以及如何对它们进行调 ...
XGBoost算法的这3类参数,你知道吗?
2020-07-09
XGBoost是诞生于2014年2月的一种专攻梯度提升算法的机器学习函数库,它有很好的学习效果,速度也非常快,与梯度提升算法在另一个常用机器学习库scikit-learn中的实现相比,XGBoost的性能可以提升10倍以上。还有,X ...

具有贝叶斯优化的 XGBoost 和随机森林

具有贝叶斯优化的XGBoost和随机森林
2019-09-28
作者 | Edwin Lisowski 编译 | CDA数据分析师 XGBoost and Random Forest with Bayesian Optimisation 在这篇文章中,我们将介绍带有贝叶斯优化算法的两种流行的算法即XGBoost和随机 ...
数据不平衡问题在机器学习中如何处理?
2024-04-23
在机器学习中,数据不平衡是指分类问题中不同类别的样本数量差距较大。这种情况可能会影响模型的训练和性能,导致对少数类别样本的预测能力较弱。因此,为了解决数据不平衡问题,我们需要采取一系列有效的方法来平 ...
CDA LEVEL III
2023-10-11
一、总则 CDA(Certified Data Analyst),即“CDA数据分析师”,是在数字经济大背景和人工智能时代趋势下,面向全行业的资格认证,旨在提升用户数字技能,助力企业数字化转型,推动行业数字化发展。「CDA人才 ...
如何处理缺失值或异常值?
2023-06-15
缺失值与异常值是数据分析中常见的问题,它们可以影响模型的准确性和可靠性。因此,在进行数据分析之前需要对这些值进行处理。本文将介绍如何处理缺失值和异常值的方法。 一、缺失值的处理 缺失值是指数据集中某些记 ...
为什么XGBoost泰勒二阶展开后效果就比较好了呢?
2023-04-13
XGBoost是一种基于决策树的集成学习算法,用于解决分类和回归问题。它在许多数据科学竞赛中表现优异,并被广泛应用于各种领域,如金融、医疗、电子商务等。 在XGBoost中,每个树的构建都是基于残差的。因此,如果我 ...
XGBoost做分类,预测结果输出的为什么不是类别概率?
2023-04-10
XGBoost是一种基于决策树的集成学习算法,在分类问题中通常被用来预测二元或多元分类结果。与传统的决策树相比,XGBoost具有更优秀的准确性和效率。 然而,在使用XGBoost进行分类时,其输出通常不是类别概率,而是对 ...
XGBoost模型训练时需要对类型特征进行one-hot编码吗?
2023-04-03
XGBoost是一种强大的机器学习算法,广泛应用于数据挖掘和预测建模。在XGBoost模型中,包括许多特征工程技术,例如对类型特征进行编码。在本文中,我们将探讨是否需要对类型特征进行独热编码,并介绍如何使用XGBoost ...
catboost原理介绍,与lightgbm和XGBoost比较优劣?
2023-04-03
CatBoost是一种基于梯度提升树的机器学习算法,它在处理分类和回归问题时都具有优秀的性能。CatBoost最初由Yandex团队开发,在2017年推出,并迅速受到了广泛关注和应用。 CatBoost与LightGBM和XGBoost都属于GBDT(Gr ...
用了更多特征,为什么XGBoost效果反而变差了?
2023-04-03
XGBoost是一种流行的算法,常用于解决回归问题和分类问题。它通过集成多个决策树来提高模型的精度和泛化能力。尽管有时候添加更多的特征可能会改善模型的性能,但有时候它可能会导致模型的性能反而变差。在本文中, ...
XGBoost是用二阶泰勒展开的优势在哪?
2023-03-31
XGBoost(eXtreme Gradient Boosting)是一种高效而强大的机器学习算法,它在大规模数据集上的性能表现非常出色。其中,使用二阶泰勒展开是XGBoost的重要优势之一,下面将详细介绍。 首先,我们来了解一下什么是泰勒 ...
XGBoost中的min_child_weight是什么意思?
2023-03-28
在介绍XGBoost中的min_child_weight之前,先简要介绍一下XGBoost。 XGBoost是一种广泛使用的机器学习算法,被用于各种数据科学任务,例如分类、回归等。它是“Extreme Gradient Boosting”的缩写,是一种决策树集成 ...
机器学习算法中 GBDT 和 XGBoost 的区别有哪些?
2023-03-22
Gradient Boosting Decision Tree (GBDT) 和 Extreme Gradient Boosting (XGBoost) 都是目前机器学习领域中非常流行的算法。两种算法都采用了 boosting 方法来提高分类或回归效果,但在实现细节上还是有一些区别的 ...

数据分析之数据挖掘入门指南

数据分析之数据挖掘入门指南
2022-10-25
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

盘点 | 每个数据分析师都应该了解的6个预测模型

盘点 | 每个数据分析师都应该了解的6个预测模型
2022-08-09
CDA数据分析师 出品 作者:Ivo Bernardo 编译:Mika 数据分析模型有不同的特点和技术,值得注意的是,大多数高级的模型都基于几个基本原理。 当你想开启数 ...
谁适合领导数据科学?
2022-03-14
由Polly Mitchell-Guthrie,副总裁,行业拓展和思想领导,Kinaxis。 如果一位数据科学总监领导分析团队超过10年,她的团队因其工作获奖,在会议上积极发言,并且拥有顶级项目的工业工程博士学位,你会雇佣 ...
停止学习数据科学寻找目的,找到目的学习数据科学
2022-02-21
作者布兰登·科斯利,FastDataScience.ai 数据科学家需求不足,没有两种方法。工作岗位嗯,有很多空缺,这个行业似乎只是在这个后疫情时代的数字世界里才有所增长。因此,数据科学专业的学生也是世界劳动力 ...
123 1/3

OK