cda

数字化人才认证

首页 > 行业图谱 >

12 2/2
catboost原理介绍,与lightgbm和xgboost比较优劣?
2023-04-03
CatBoost是一种基于梯度提升树的机器学习算法,它在处理分类和回归问题时都具有优秀的性能。CatBoost最初由Yandex团队开发,在2017年推出,并迅速受到了广泛关注和应用。 CatBoost与LightGBM和XGBoost都属于GBDT(Gr ...
xgboost是用二阶泰勒展开的优势在哪?
2023-03-31
XGBoost(eXtreme Gradient Boosting)是一种高效而强大的机器学习算法,它在大规模数据集上的性能表现非常出色。其中,使用二阶泰勒展开是XGBoost的重要优势之一,下面将详细介绍。 首先,我们来了解一下什么是泰勒 ...
xgboost中的min_child_weight是什么意思?
2023-03-28
在介绍XGBoost中的min_child_weight之前,先简要介绍一下XGBoost。 XGBoost是一种广泛使用的机器学习算法,被用于各种数据科学任务,例如分类、回归等。它是“Extreme Gradient Boosting”的缩写,是一种决策树集成 ...
机器学习算法中 GBDT 和 XGBOOST 的区别有哪些?
2023-03-22
Gradient Boosting Decision Tree (GBDT) 和 Extreme Gradient Boosting (XGBoost) 都是目前机器学习领域中非常流行的算法。两种算法都采用了 boosting 方法来提高分类或回归效果,但在实现细节上还是有一些区别的 ...

数据分析之数据挖掘入门指南

数据分析之数据挖掘入门指南
2022-10-25
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的46-50题。(单选题) 不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第三期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第三期)
2021-07-28
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的11-15题。(单选题) 不过,在出题前,要公布上一期Level Ⅲ 中1-5题的答案,大家一起来看! ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

机器学习还能预测心血管疾病?没错,我用python写出来了

机器学习还能预测心血管疾病?没错,我用python写出来了
2020-09-07
CDA数据分析师 出品   作者:Mika 数据:真达   后期:Mika 【导读】手把手教你如何用python写出心血管疾病预测模型。 全球每年约有1700万人死于心血管疾病,当中主要表现 ...

数据挖掘分析在CRM系统中的应用

数据挖掘分析在CRM系统中的应用
2018-06-28
数据挖掘分析在CRM系统中的应用 每个企业都会有客户流失的情况发生,已经失去或是即将失去的,这中情况对企业来说是正常现象,在面对这些常见的正常现象时,关键是企业从中能学到什么,得到重要信息并加之分析 ...

教你如何用R进行数据挖掘

教你如何用R进行数据挖掘
2018-05-16
教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用 ...
python实现随机森林random forest的原理及方法
2018-01-22
python实现随机森林random forest的原理及方法 想通过随机森林来获取数据的主要特征 1、理论 随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模 ...

如何解决机器学习中数据不平衡问题

如何解决机器学习中数据不平衡问题
2017-07-09
如何解决机器学习中数据不平衡问题 这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽 ...

这一年来,数据科学家都用哪些算法

这一年来,数据科学家都用哪些算法
2017-01-31
这一年来,数据科学家都用哪些算法 在“数据为王”的今天,越来越多的人对数据科学产生了兴趣。数据科学家离不开算法的使用,那么,数据科学家最常用的算法,都是哪些呢? 最近,著名的资料探勘信息网站KDnu ...
12 2/2

OK