cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘中,分类与聚类的区别

数据挖掘中,分类与聚类的区别
2017-12-11
数据挖掘中,分类与聚类的区别 本文对数据挖掘中,极为常见的两类算法:分类与聚类,做个梳理。 首先,来看看分类和聚类各自的一些定义描述。 分类(classification ): 分类算法需要学习,它通过学习找出描述 ...

数据聚类的简单应用

数据聚类的简单应用
2017-12-09
数据聚类的简单应用 数据聚类data clustering:用来寻找紧密相关的事物,并将其可视化的方法。 1. 聚类时常被用于数据量很大(data-intensive)的应用中。 2. 聚类是无监督学习(unsupervised learning) ...
R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

数据工作的本质:从业务中来,到业务中去

数据工作的本质:从业务中来,到业务中去
2017-10-17
数据工作的本质:从业务中来,到业务中去 数据工作就组成结构和流程来说还是比较简单的,因为这个工作本来就很年轻,分工还没有很细。总体来讲,我把数据工作看成相互连接的三部分:取数、理数、用数,这是一个 ...

【每周一本书第6波】R 语言数据分析项目精解:理论、方法、实战

【每周一本书第6波】R 语言数据分析项目精解:理论、方法、实战
2017-09-28
【每周一本书第6波】R 语言数据分析项目精解:理论、方法、实战 读书是一件很私人的事,读什么、怎么读、为什么读都是因人而异的。读书很像是和好友的一次畅谈,更像是一次和伟人间私密的对话。找到一本适合自 ...

10个令人相见恨晚的R语言包

10个令人相见恨晚的R语言包
2017-09-15
10个令人相见恨晚的R语言包 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 ...

深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家

深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家
2017-09-06
深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家 最近有很多人咨询,想学习大数据,但不知道怎么入手,从哪里开始学习,需要学习哪些东西?对于一个初学者,学习大数据挖 ...

机器学习及大数据相关面试的职责和面试问题

机器学习及大数据相关面试的职责和面试问题
2017-06-06
机器学习及大数据相关面试的职责和面试问题 各个企业对这类岗位的命名可能有所不同,比如推荐算法/数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入 ...

 2017年最流行的15个数据科学Python库

2017年最流行的15个数据科学Python库
2017-06-02
Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程师将在 2017 年最常使用的 Python 库。 核心 ...

18本数据科学家必读的R语言和Python相关书籍

18本数据科学家必读的R语言和Python相关书籍
2017-05-25
前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是 ...

利用Python,四步掌握机器学习

利用Python,四步掌握机器学习
2017-05-18
利用Python,四步掌握机器学习 为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得 ...

机器学习的道、法、术、势、器

机器学习的道、法、术、势、器
2017-05-13
机器学习的道、法、术、势、器 “道、法、术、器”出于老子的《道德经》,后人又加了一个“势”,并且也有了不同的排列。很多人习惯用“道、法、术、势、器”的顺序,原因很简单:道以明向、法以立本、术以立策 ...

模式识别和机器学习、数据挖掘的区别与联系

模式识别和机器学习、数据挖掘的区别与联系
2017-05-05
模式识别和机器学习、数据挖掘的区别与联系 (一)模式识别的诞生与人工智能 自动控制起始是从工业革命之后,人们就希望设计出减少人工干预,能自己进行调节(regulate)的机器,工程领域开始想出了根轨迹等等 ...

如何通过数据挖掘手段分析网民的评价内容

如何通过数据挖掘手段分析网民的评价内容
2017-05-05
如何通过数据挖掘手段分析网民的评价内容 近年来微博等用户自媒体的爆炸式增长,使得利用计算机挖掘网民意见不但变得可行,而且变得必须。这其中很重要的一项任务就是挖掘网民意见所讨论的对象,即评价对象。本 ...

利用Python练习数据挖掘

利用Python练习数据挖掘
2017-05-03
利用Python练习数据挖掘 覆盖使用Python进行数据挖掘查找和描述数据结构模式的实践工具。 第一节 介绍 数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式。它使用广泛,并且是众多应用的技术基础。 ...

「CDAS 在线」央企财会到数据分析师的华丽转变

「CDAS 在线」央企财会到数据分析师的华丽转变
2017-04-28
去年的CDAS 2016 第三届中国数据分析师行业峰会上,有一个比较特别的分论坛。这个论坛的嘉宾有些原本并不是业内人士,但经过一段时间的学习,他们成功转型,成为一名数据分析师。他们也有一个共同的身份—— CDA ...
谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

从模型选择到超参调整,六步教你如何为机器学习项目选择算法

从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...

简单易学的机器学习算法—K-Means算法

简单易学的机器学习算法—K-Means算法
2017-03-23
简单易学的机器学习算法—K-Means算法 一、聚类算法的简介     聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。聚类算法与分类算法最大的区别是:聚类算法是无 ...

K-means算法原理与R语言实例

K-means算法原理与R语言实例
2017-03-17
K-means算法原理与R语言实例 聚类是将相似对象归到同一个簇中的方法,这有点像全自动分类。簇内的对象越相似,聚类的效果越好。支持向量机、神经网络所讨论的分类问题都是有监督的学习方式,现在我们所介绍的聚 ...

OK
客服在线
立即咨询