cda

数字化人才认证

大数据时代最该关心的事儿-CDA数据分析师官网

首页 > 大数据时代

异常值处理常用的几种方法
2020-07-01
异常值,又称离群点,是指那些在数据集中存在的不合理的值,需要注意的是,不合理的值是偏离正常范围的值,不是错误值。比如人的身高为-1m,人的体重为1吨等,都属于异常值的范围。虽然异常值不常出现,但是又会对 ...

关联规则的评估标准和实现算法

关联规则的评估标准和实现算法
2020-07-01
相信做数据分析的小伙伴一定都听说过啤酒与尿布的故事,超市把有关联的东西放在一起,以方便顾客购买,这个故事体现的就是关联规则。关联规则又被称为关联分析,它的目的是在一堆事物中找出具有关联的事物。经常被 ...
协同过滤:基于用户的协同过滤和基于物品的协同过滤
2020-07-01
协同过滤(CollaborativeFiltering)是推荐算法中最经典、应用最广泛的类型,主要的功能是预测和推荐。它的原理是通过了解用户与物品之间的关系进行推荐,物品本身的属性不考虑在内。主要由线的协同和离线的过滤两部 ...
第十二届CDA数据分析师认证考试会因为疫情推迟吗?
2020-06-30
由于疫情原因,很多考生关心第十二届CDA认证考试时间是否还会有所变动, 现在CDA官宣了: 正式通知! CDA考试中心在此通知广大考生,第十二届考试暂不受影响,于7月25-26日正常进行。如有变化,CDA将第一时间 ...
数据清洗中常用的异常值检测的几种方法
2020-06-30
异常值是指样本中的个别值,其数值明显偏离它(或它们们)所属样本的其余观测值。异常值分析目的是检验是否有录入错误的数据以及是否含有不合常理的数据时。如果对异常值的存在忽视不见,在数据的计算分析过程中把异 ...
R语言是什么,特点有哪些?
2020-06-30
R语言是一种用来进行数据探索、统计分析、绘图的解释型语言。它具有丰富的数据类型、以及数量众多的算法功能包、以及非常灵活多样的作图功能。是目前各行各业的数据分析师都在实使用的一种语言,受到众多企业以及 ...

数据倾斜是什么,产生原因有哪些?

数据倾斜是什么,产生原因有哪些?
2020-06-30
数据倾斜是数据挖掘过程中的常见问题,尤其是在需要处理的数据量过于庞大时,我们可能会需要花费几周甚至更长时间去处理。小编今天就来跟大家分享一下数据倾斜的表现以及产生原因,希望对各位小伙伴有所帮助。 ...

一文看懂Python的控制结构:for、while、if…都有了

一文看懂Python的控制结构:for、while、if…都有了
2020-06-30
作者:挪亚·吉夫特(Noah Gift) 来源:大数据DT(ID:hzdashuju) 内容摘编自《人工智能开发实践:云端机器学习导论》 导读:本文介绍Python中的常见控制结构。 传统Python语言的主要控制结构是for ...

对比python字符串函数,学习pandas的str矢量化字符串函数

对比python字符串函数,学习pandas的str矢量化字符串函数
2020-06-30
文章来源:数据分析与统计学之美 作者:黄伟呢 1.概述 python字符串应该是python里面最重要的数据类型了,因此学会怎么处理各种各样的字符串,显得尤为重要。 我们不仅要学会怎么处理单个字符串, ...

应该怎样规划python学习规划路线?

应该怎样规划python学习规划路线?
2020-06-30
python现在在各行各业都有十分广泛的应用,而且近几年的市场需求也不断扩大,未来的发展前景也十分广阔,许多小伙伴想要去学习python来提高自己的职场竞争力。python学习难吗?应该怎样规划学习路线?下面跟小编一起 ...
机器学习里的无监督学习是什么?
2020-06-30
无监督学习是机器学习里的一种学习方式,下面将给大家具体解释一下无监督学习到底是什么? 首先我们可以对照监督学习来对比理解一下无监督学习的概念。 机器学习中,监督学习是一种明确的训练方式,你能够很 ...

机器学习中,线性与非线性的区别

机器学习中,线性与非线性的区别
2020-06-30
在机器学习中经常会遇到两个概念:线性、非线性。今天就让我们一起来看以下线性与非线性的。 一、一般在线性代数中,线性有以下两个特征: 齐次性:f(a*x)=a*f(x); 可叠加行:f(x+y)=f(x)+f(y)。 只要 ...
商业分析:什么是二八原则?
2020-06-30
二八原则,又叫帕累托原则,二八定律,是世界上有一种公认的企业定律,20%的人掌握着80%的财富,源出处就是80/20帕累托法则。在进行商业分析过程中,最常用到的就是一种模型。 从商业分析方面来说,二八原则的 ...

常用的评估客户价值的模型有哪几种?

常用的评估客户价值的模型有哪几种?
2020-06-30
客户价值一词大家都不陌生,指的是客户对企业的创利能力,那么应该如何来评估客户价值呢?经常用到的客户价值评估模型有以下三种。 一、RFM模型 RFM模型可以说是最简单、最实用的一种评估客户价值的方法了, ...

12306验证码为什么那么变态?都是这项深度学习应用给逼的

12306验证码为什么那么变态?都是这项深度学习应用给逼的
2020-06-29
作者:莫凡 来源:大数据DT(ID:hzdashuju) 导读:12306为什么要设置那么复杂的验证码机制呢?就是因为OCR。 今天聊OCR。 OCR是人工智能、机器学习特别是深度学习,在图像识别方向最为重要的应用之一。 ...
PowerBI是什么,有哪些优点?
2020-06-29
PowerBI是微软推出的一种的交互式报表工具,能够把的静态数据报表转换为效果酷炫的可视化的报表,还能够根据filter条件,动态筛选数据,对数据进行不同层面和维度的分析。通俗点来说,Power BI本质是一款数据分析 ...

python绘制正态分布及三大抽样分布的概率密度图像

python绘制正态分布及三大抽样分布的概率密度图像
2020-06-29
文章来源:数据分析与统计学之美 作者:黄伟呢 目录 1.scipy库中各分布对应的方法 from scipy import stats # 正态分布 stats.norm # 卡方分布 stats.chi2 # t分布 stats.t # F分布 ...

第十二届CDA认证考试如期举行,报名即将截止!

第十二届CDA认证考试如期举行,报名即将截止!
2020-06-29
2020年5月8日,CDA数据分析师考试中心发布《正式通知丨CDA第12届考试将延期一个月进行!》,通知确认第十二届CDA认证考试时间为7月25-26日。由于疫情形势变化,部分考生关心考试时间是否还会有所变动, CD ...
CDA大数据分析师的报考条件是什么,任何人都可以报考吗?
2020-06-29
“CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ。其中CDA Level II大数据分析师,指政府、金融、电信、零售、互联网、电商、医学等行业专门从 ...
第12届CDA数据分析师认证考试报名之后不能去参加考试怎么办?
2020-06-29
第12届CDA数据分析师认证考试的报名截止时间为2020年7月5日,还没有报名的小伙伴要注意不要错过截止日期。另外,有些已经报名的下伙伴会因为一些原因不能或者不想参加这次考试了,那应该怎么办呢? 解决方法一: ...

OK