cda

数字化人才认证

首页 > 行业图谱 >

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...
未来5年,数据科学工作岗位会短缺吗?
2022-02-28
c 在过去的五年里,当python编程成为潮流时,我一直在数据科学领域工作。当时,在2016年,神经网络和深度学习只是一些时髦的词。当时有一场关于谷歌自动驾驶汽车和强化学习的炒作。但是,大多数数据科学爱好者 ...

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例
2022-02-23
随着大数据的时代的来临,各个行业都受到了数据分析不同程度的影响和作用。尤其是在电信行业,数据分析已经逐渐成为电信运营商的战略优势之一。 大家好,我是一名CDA持证人,今天想跟大家分享一下,我如何 ...
如何学习机器学习的数学知识
2022-02-16
分享  数据科学有志之士最常见的问题之一是  行业中的守门人对这种担忧没有帮助,他们给学生贴上了不合格的标签,除非他们拥有该学科的硕士或博士学位。  那么,为了在数据科学行业 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

企业认可 | CDA数字化人才认证标准走进浙江农信

企业认可 | CDA数字化人才认证标准走进浙江农信
2021-10-22
2021年10月22日, 浙江省农村信用社联合社正式开启为期16天的内部培训,本次内训课程内容以CDA认证标准为基础,结合CDA LEVEL Ⅲ的技能要点,从企业数字化发展中必备的高级数据分析方法与技术出发,目标就是为了提升 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)
2024-08-14
不过,在出题前,要公布上一期Level Ⅲ 中76-80题的答案,大家一起来看! 77、ABD 79、BCD A、方差选择 C、卡方检验 82、对数变换是我们在处理特征工程当中常用的处理方法,以下关于对数变换的描 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第九期)
2021-08-05
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 42、A 44、B A.会将数据缩放到0-1范围之内 C.作用是将不同量纲数据的量纲进行统一 47.常见的缺失值填充方法有填充默认值 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第八期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第八期)
2021-08-04
不过,在出题前,要公布上一期Level Ⅲ 中36-40题的答案,大家一起来看! 37、A 39、C A.PCA的最大化方差理论有时候不适用 C.核主成分分析更加复杂因此效果更好 42.使用带L1惩罚项的逻辑回归模型 ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

实例 | 教你用python写一个电信客户流失预测模型

实例 | 教你用python写一个电信客户流失预测模型
2020-09-15
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 今天教大家如何用python写一个电信用户流失预测模型。之前我们用Python写了员工流失预测模型 ...

机器学习还能预测心血管疾病?没错,我用python写出来了

机器学习还能预测心血管疾病?没错,我用python写出来了
2020-09-07
CDA数据分析师 出品   作者:Mika 数据:真达   后期:Mika 【导读】手把手教你如何用python写出心血管疾病预测模型。 全球每年约有1700万人死于心血管疾病,当中主要表现 ...
如何用Python进行大数据挖掘和分析?快速入门路径图
2018-08-30
如何用Python进行大数据挖掘和分析?快速入门路径图 大数据无处不在。在时下这个年代,不管你喜欢与否,在运营一个成功的商业的过程中都有可能会遇到它。 什么是 大数据 ? 大数据就像它看起来那样——有 ...

如何让你的数据直觉更敏锐

如何让你的数据直觉更敏锐
2018-07-30
如何让你的数据直觉更敏锐 每当人工智能和机器学习取得一些进展时,这些进展一定占据着各大媒体的头版头条。 媒体对其有如此高的关注度,这意味着,现在科技界主流的兴趣领域是数据科学。 对于有大局意识 ...
R语言之决策树和随机森林
2018-06-16
R语言之决策树和随机森林 总结决策树之前先总结一下特征的生成和选择,因为决策树就是一种内嵌型的特征选择过程,它的特征选择和算法是融合在一起的,不需要额外的特征选择。 一、特征生成: 特征生成是 ...

一种面向高维数据的集成聚类算法

一种面向高维数据的集成聚类算法
2018-06-10
一种面向高维数据的集成聚类算法 聚类集成已经成为机器学习的研究热点,它对原始数据集的多个聚类结果进行学习和集成,得到一个能较好地反映数据集内在结构的数据划分。很多学者的研究证明聚类集成能有效 ...
机器学习入门报告之 解决问题一般工作流程
2018-03-20
机器学习入门报告之 解决问题一般工作流程 对于给定的数据集和问题,用机器学习的方法解决问题的工作一般分为4个步骤: 一.     数据预处理 首先,必须确保数据的格式符合要求 ...
随机森林进行特征重要性度量的详细说明
2018-03-17
随机森林进行特征重要性度量的详细说明 特征选择方法中,有一种方法是利用随机森林,进行特征的重要性度量,选择重要性较高的特征。下面对如何计算重要性进行说明。 1 特征重要性度量 计算某个特征X的重 ...

OK
客服在线
立即咨询