cda

数字化人才认证

首页 > 行业图谱 >

在 Pandas DataFrame 中如何归一化某列?
2023-04-10
Pandas是一种用于数据分析和处理的常用Python库。在Pandas DataFrame中,归一化某列可以将该列的值从原始比例缩放到0到1之间的标准比例,使其更容易与其他列进行比较和分析。本文将介绍如何对Pandas DataFrame中的某 ...
如何通过sklearn实现多标签分类?
2023-03-31
多标签分类是指一个数据点可能属于多个类别。例如,在图像分类中,一张图片可以同时包含多种物体,如猫、鱼、玩具等。在这篇文章中,我们将介绍如何使用scikit-learn(简称sklearn)来实现多标签分类。 首先,我们需 ...

资深数据分析师来聊一聊数据挖掘

资深数据分析师来聊一聊数据挖掘
2022-10-19
一、数据挖掘的层次 一直想整理下对数据挖掘不同层次的理解,这也是这两年多的时间里面,和很多金融领域、互联网做数据相关工作的小伙伴,聊天交流的一些整理和归纳。大概可以分为四类。 (一)纯粹的数据 ...

从审核专员成功转型数据分析师

从审核专员成功转型数据分析师
2022-04-22
我从17年毕业后,一直在字节跳动西安做审核。做了两年多的审核工作,我对这个工作失去了热情。字节的视频审核和文字审核并非完全使用机器,采取的是双重审核,先机器审核筛选后再做人工审核的方法。工作的时候,我们需 ...

风控难题之无监督风险感知:脑力、想象力、第六感、黑洞

风控难题之无监督风险感知:脑力、想象力、第六感、黑洞
2022-04-06
作者:小伍哥 来源:小伍哥聊风控 大家好,我是小伍哥。 有效的风险感知或者无监督风险识别,其实非常的难,很多同学甚至无法下手,做了的可能也没有效果,如果找到合适的方法了,其实是非常有意思, ...

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例

作为文科生,我是如何转行数据挖掘工程师的 | 附电信用户实战案例
2022-02-23
随着大数据的时代的来临,各个行业都受到了数据分析不同程度的影响和作用。尤其是在电信行业,数据分析已经逐渐成为电信运营商的战略优势之一。 大家好,我是一名CDA持证人,今天想跟大家分享一下,我如何 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

十年芳华,逐梦前行 | 记录我的数据科学家成长之路

十年芳华,逐梦前行 | 记录我的数据科学家成长之路
2021-12-13
作者:Roll 本文为「心中有数」CDA征文作品 小学时, 老师经常问:“你长大以后想当什么?” 我说,我想当一名科学家。 工作后, 领导经常问:“你的职业规划是什么?” ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十一期)
2021-08-11
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的56-60题。(单选题) 不过,在出题前,要公布上一期Level Ⅲ 中51-55题的答案,大家一起来看! ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第四期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第四期)
2021-07-29
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的16-20题。(单选题) 不过,在出题前,要公布上一期Level Ⅲ 中11-15题的答案,大家一起来看! ...

一个企业级数据挖掘实战项目,教育数据挖掘

一个企业级数据挖掘实战项目,教育数据挖掘
2021-07-06
来源:数据STUDIO 作者:云朵君 导读:大家好,我是云朵君!自从分享了一篇能够写在简历里的企业级数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了 ...

CDA LEVEL II 数据分析认证考试模拟题库(四)

CDA LEVEL II 数据分析认证考试模拟题库(四)
2021-04-27
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL II的模拟试题时间了,今天给大家带来的是模拟试题(一)中的16-20题。 不过,在出题前,要公布上一期LEVEL II中6-10题的答案,大家一起来看! 11、C ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2021-03-15
一、什么是机器学习 机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 一个计算机程序在完成了任务T之后,获得经验E,其表现效果为P,如 果任务T的性能表现,也就是用 ...

38万条数据,用python分析保险产品交叉销售相关因素!

38万条数据,用python分析保险产品交叉销售相关因素!
2020-11-16
CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】今天的内容是一期python实战训练,我们来手把手教你用Python分析保险产品交叉销售和哪些因素有关。 01、实战背 ...

实例 | 教你用python写一个电信客户流失预测模型

实例 | 教你用python写一个电信客户流失预测模型
2020-09-15
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 今天教大家如何用python写一个电信用户流失预测模型。之前我们用Python写了员工流失预测模型 ...

异常检测原理与实验

异常检测原理与实验
2018-08-19
异常检测原理与实验 最近需要对欺诈报价进行识别处理,简单的模型就是给定很多不同数据集,需要找出每个spu下可能存在的欺诈数据,比如{20,22,30},其中的欺诈数据可能就是30。其实加以抽象,属于异常检测范围。 ...
数据挖掘的方法及实施
2018-06-25
数据挖掘的方法及实施 作为一门处理数据的新兴技术,数据挖掘有许多的新特征。首先,数据挖掘面对的是海量的数据,这也是数据挖掘产生的原因。其次,数据可能是不完全的、有噪声的、随机的,有复杂的数据结构, ...

对数据科学家来说最重要的算法和统计模型

对数据科学家来说最重要的算法和统计模型
2018-05-31
对数据科学家来说最重要的算法和统计模型 作为一个在这个行业已经好几年的数据科学家,在LinkedIn和QuoLa上,我经常接触一些学生或者想转行的人,帮助他们进行机器学习的职业建议或指导方面相关的课程选择。一 ...

数据挖掘十大经典算法之K最近邻算法

数据挖掘十大经典算法之K最近邻算法
2018-01-02
数据挖掘十大经典算法之K最近邻算法 k-最近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。     基于实例的学习     1.已知一系列的训练样例,很多学习 ...

将SPSS分析技术应用于大数据

将SPSS分析技术应用于大数据
2017-10-24
将SPSS分析技术应用于大数据 了解 SPSS? 中处理大数据的新功能。现在可以对 SPSS 分析资产轻松地进行修改,以便连接到不同的大数据来源,它们还可以在不同的部署模式(批处理或实时模式)下运行。SPSS 平台的 ...

OK