CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

Excel2016四个超强的数据分析功能

Excel2016四个超强的数据分析功能
2016-08-18
Excel2016四个超强的数据分析功能 三维地图、预测工作表、引用外部数据查询、数据透视表更强大的功能改进、将Excel 表格发布到Office 365 Power BI实现数据的商业智能分析……Excel 2016在数据智能分析与展示上 ...

数据挖掘领域经典算法

数据挖掘领域经典算法
2016-08-17
数据挖掘领域经典算法 偶见网页数据挖掘领域十大经典算法,心血来潮,在学习的同时也想验验有哪些知道哪些实现过。 2006年12月,国际权威的学术组织the IEEE International Conference on Data Mining (ICDM ...

谈谈数据挖掘和机器学习

谈谈数据挖掘和机器学习
2016-08-17
谈谈数据挖掘和机器学习 首先声明的是本人并非数据挖掘和机器学习的高手,只是作为业余兴趣刚刚开始研究,据我所知好多朋友也和我一样对这方面的东西感兴趣,个人认为机器人技术是未来发展的方向。虽然我的专 ...

使用sklearn优雅地进行数据挖掘

使用sklearn优雅地进行数据挖掘
2016-08-17
使用sklearn优雅地进行数据挖掘 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模 ...

浅谈数据挖掘中的关联规则挖掘

浅谈数据挖掘中的关联规则挖掘
2016-08-17
浅谈数据挖掘中的关联规则挖掘 数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后 ...

异常检测算法--Isolation Forest

异常检测算法--Isolation Forest
2016-08-17
异常检测算法--Isolation Forest 提到森林,自然少不了树,毕竟森林都是由树构成的,看Isolation Forest(简称iForest)前,我们先来看看Isolation Tree(简称iTree)是怎么构成的,iTree是一种随机二叉树,每 ...

K-means算法及文本聚类实践

K-means算法及文本聚类实践
2016-08-17
K-means算法及文本聚类实践 K-Means是常用的聚类算法,与其他聚类算法相比,其时间复杂度低,聚类的效果也还不错,这里简单介绍一下k-means算法,下图是一个手写体数据集聚类的结果。 基本思想 k-mea ...

关于“数据分析师”岗,你想要了解的一切

关于“数据分析师”岗,你想要了解的一切
2016-08-16
关于“数据分析师”岗,你想要了解的一切 数据分析行业现在大热,只要是在科技创新领域的公司,纷纷都挂出来了急招“数据分析师”的牌子。但是很多人对它的概念并不了解,还有更多的创业者更是不知道是否应该去 ...

数据挖掘实例:电信业如何应用数据挖掘

数据挖掘实例:电信业如何应用数据挖掘
2016-08-16
数据挖掘实例:电信业如何应用数据挖掘 电信业务领域的全面开放,激烈竞争使得目前的中国电信市场烽烟四起。“客户-产品-市场-利润”成为目前各电信运营商的基本发展思路。中国电信集团去年在全国推出营销分 ...

数据挖掘系列卷积神经网络算法的一个实现

数据挖掘系列卷积神经网络算法的一个实现
2016-08-16
数据挖掘系列卷积神经网络算法的一个实现 从理解卷积神经到实现它,前后花了一个月时间,现在也还有一些地方没有理解透彻,CNN还是有一定难度的,不是看哪个的博客和一两篇论文就明白了,主要还是靠自己去专研 ...

数据挖掘系列BP神经网络算法与实践

数据挖掘系列BP神经网络算法与实践
2016-08-16
数据挖掘系列BP神经网络算法与实践 神经网络曾经很火,有过一段低迷期,现在因为深度学习的原因继续火起来了。神经网络有很多种:前向传输网络、反向传输网络、递归神经网络、卷积神经网络等。本文介绍基本的反 ...

基于WEB的数据挖掘综述

基于WEB的数据挖掘综述
2016-08-16
基于WEB的数据挖掘综述 我们现在已经生活在一个相当数字化的时代中,通信、计算机和网络技术正极大地影响着整个人类社会。然而,海量信息既给人们带来方便也带来了许多问题使我们 惊叹信息爆炸的同时,又不得不 ...

数据挖掘系列朴素贝叶斯分类算法原理与实践

数据挖掘系列朴素贝叶斯分类算法原理与实践
2016-08-16
数据挖掘系列朴素贝叶斯分类算法原理与实践 隔了很久没有写数据挖掘系列的文章了,今天介绍一下朴素贝叶斯分类算法,讲一下基本原理,再以文本分类实践。 一个简单的例子 朴素贝叶斯算法是一个典型的统计 ...
数据挖掘系列分类算法评价
2016-08-15
数据挖掘系列分类算法评价 一、引言 分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择 ...
数据挖掘系列使用mahout做海量数据关联规则挖掘
2016-08-15
数据挖掘系列使用mahout做海量数据关联规则挖掘 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,ma ...

数据挖掘系列使用weka做关联规则挖掘

数据挖掘系列使用weka做关联规则挖掘
2016-08-15
数据挖掘系列使用weka做关联规则挖掘 前面几篇介绍了关联规则的一些基本概念和两个基本算法,但实际在商业应用中,写算法反而比较少,理解数据,把握数据,利用工具才是重要的,前面的基础篇是对算法的理解,这 ...

数据挖掘系列关联规则评价

数据挖掘系列关联规则评价
2016-08-15
数据挖掘系列关联规则评价 前面我们讨论的关联规则都是用支持度和自信度来评价的,如果一个规则的自信度高,我们就说它是一条强规则,但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。 ...

数据挖掘系列关联规则FpGrowth算法

数据挖掘系列关联规则FpGrowth算法
2016-08-15
数据挖掘系列关联规则FpGrowth算法 上一篇介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消 ...

数据挖掘系列关联规则挖掘基本概念与Aprior算法

数据挖掘系列关联规则挖掘基本概念与Aprior算法
2016-08-15
数据挖掘系列关联规则挖掘基本概念与Aprior算法 关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。 啤酒与尿布的故事已经成为了关联规则挖掘的经 ...

数据挖掘之KNN分类

数据挖掘之KNN分类
2016-08-15
数据挖掘之KNN分类 分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个最 ...

OK