CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据分析师:避免低质量数据的5个方法

数据分析师:避免低质量数据的5个方法
2016-04-28
数据分析师:避免低质量数据的5个方法 数据科学家的最怕的是低质量的数据。因为哪怕你发明出世界上最聪明的算法,这些算法碰到低质量数据便毫无用处。正如我们常说的,“垃圾数据入,垃圾数据出”。 我最近 ...

数据分析师常见的十道面试题目及解答

数据分析师常见的十道面试题目及解答
2016-04-28
数据分析师常见的十道面试题目及解答 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注 意到IP是32位的,最多有个2^32 ...

Airbnb 数据基础设施与其背后的哲学

Airbnb 数据基础设施与其背后的哲学
2016-04-28
Airbnb 数据基础设施与其背后的哲学 在 Airbnb 我们提倡数据文化并使用数据作为关键输入去决策。跟踪指标,通过实验验证假设,建立机器学习模型和深入挖掘商业洞察是我们快速聪明前进的关键。经 ...

MySQL连接到 R Excel 或SPSS

MySQL连接到 R Excel 或SPSS
2016-04-27
MySQL连接到 R Excel 或SPSS 数据文件数量多,格式种类多,会给管理这些数据文件带来难度。 1.通过专门的文件夹来保存 建立一个专门保存数据的文件夹,然后再建立不同的子目录来分门别类的保存文件,这是 ...
7个数据分析的习惯助你高效的工作
2016-04-27
7个数据分析的习惯助你高效的工作 1.相比花哨算法,更重视分析的简单性 如果你都不能向一个5岁的小孩解释清楚,那么你将很难将你的产品卖给其他人。产品数据分析的重点不是分析,别误会,你还是需要分析,但 ...

算法 | K-Means聚类算法的原理及实现

算法 | K-Means聚类算法的原理及实现
2016-04-27
K-Means是聚类算法中的一种,其中K表示类别数,Means表示均值。顾名思义K-Means是一种通过均值对数据点进行聚类的算法。K-Means算法通过预先设定的K值及每个类别的初始质心对相似的数据点进行划分。并通过划分后的均 ...

最适合实时数据分析的9大应用领域

最适合实时数据分析的9大应用领域
2016-04-27
最适合实时数据分析的9大应用领域 如今整个商业世界都面临着新的难题,即如何处理来自各客户接触点、交易以及互动对象的大量数据。但与此同时,我们也看到了解决问题的曙光——实时数据流技术,其能够存储大量 ...

机器学习在电商文本挖掘中的应用浅析

机器学习在电商文本挖掘中的应用浅析
2016-04-27
机器学习在电商文本挖掘中的应用浅析 电商平台中有海量的非结构化文本数据,如商品描述、用户评论、用户搜索词、用户咨询等。这些文本数据不仅反映了产品特性,也蕴含了用户的需求以及使用反馈。通过深度 ...

数据分析师:为什么说大数据与客户分析之间有所差异

数据分析师:为什么说大数据与客户分析之间有所差异
2016-04-27
数据分析师:为什么说大数据与客户分析之间有所差异 大数据预测与传统的基于抽样的预测不同之处在于,其基于海量历史数据和实时动态数据,发现数据与结果之间的规律,并假设此规律会延续,捕捉到变量之后进行预 ...

数据分析师告诉你:大数据时代如何识别虚假数据

数据分析师告诉你:大数据时代如何识别虚假数据
2016-04-27
数据分析师告诉你:大数据时代如何识别虚假数据 好的决策应该是“数据驱动”的,但是如果数据有效性不好,就不可能据此做出好的决定。我的整个职业生涯几乎都在做市场调研和调查数据分析方面的工作,根据我的经 ...

如何使用队列数据分析来留住你的用户

如何使用队列数据分析来留住你的用户
2016-04-26
如何使用队列数据分析来留住你的用户 在数据分析的世界中,队列分析因为看似非常复杂而总是被人忽视。这一次让我们来看一看队列分析究竟能为我们提供什么?以及怎样进行这种分析。 在种种数据分析工具中 ...

你的分析为何让你失望

你的分析为何让你失望
2016-04-26
你的分析为何让你失望 许多企业投下数百万美元用于大数据、分析法,并雇用数据分析家,但却感到很受挫。无可否认,他们现在得到了更多、更好的数据。他们的分析师和分析法也是一流的。但经理人对业务的想法和争 ...
如何利用数据分析做好NBO
2016-04-26
如何利用数据分析做好NBO 正如其他企业战略一样,企业在最开始应该反映它们想用推荐来实现什么,以及如何最好地实现这些目标。推荐战略设计应该包括诸如这些这样的话题: ● 你想让推荐怎样影响你的客户关系 ...

为建立数据分析优势利用专有数据

为建立数据分析优势利用专有数据
2016-04-26
为建立数据分析优势利用专有数据 人们普遍认为专有信息能为企业提供竞争优势,但如果不在业务过程中进行数据分析和应用,那么专有信息也很难发挥作用。没有哪种组织的资产能像数据这样为人们提供深刻的见解,并 ...

数据分析系列篇:如何写好一个专题的分析报告

数据分析系列篇:如何写好一个专题的分析报告
2016-04-26
数据分析系列篇:如何写好一个专题的分析报告 如果说你只是盲目的写代码、做开发、做产品,而忽视它本身的商业价值的话,那很多事情都变得没有了意义。前段时间写了几个数据分析系列篇,其实都没有好好列下,究 ...

传统的ROI数据分析

传统的ROI数据分析
2016-04-26
传统的ROI数据分析 决定对一数据分析项目投资多少并在之后评估投资的成功可能性是个复杂的过程。通常的复杂性是由项目的复杂性、投资和实现收益之间的时间差以确定实际成本和价值的难度决定的。然而,无论如何 ...
一位数据挖掘成功人士给数据挖掘在读研究生的建议
2016-04-25
一位数据挖掘成功人士给数据挖掘在读研究生的建议 关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等 ...

电商在运用数据分析时需要哪些

电商在运用数据分析时需要哪些
2016-04-25
电商在运用数据分析时需要哪些 对于现在的电商来说,数据分析师成为现在电商必不可少的。信息流、物流和资金流三大平台是电子商务的三个最为重要的平台。而电子商务信息系统最核心的能力是大数据能力,包括大数 ...

数据挖掘主要解决的四类问题

数据挖掘主要解决的四类问题
2016-04-25
数据挖掘主要解决的四类问题 数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归纳,数据挖掘的应用就是把这几类问题演绎的一个过程。下面让我们来看看它所解决的四类问题是如何界定的: ...

如何建立SAS报表

如何建立SAS报表
2016-04-25
如何建立SAS报表 一.使用PRINT过程步 1.PRINT过程步的基本使用 前面我们已经提到过利用PRINT过程步检查我们建立的SAS数据集的内容,实际上就是用PRINT过程步显示SAS数据集的内容。PRINT过程步由 ...

OK