cda

数字化人才认证

首页 > 行业图谱 >

一文读懂聚类算法

一文读懂聚类算法
2018-01-11
一文读懂聚类算法 1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中 ...

数据科学家需要掌握的10个基本统计技术

数据科学家需要掌握的10个基本统计技术
2018-01-08
数据科学家需要掌握的10个基本统计技术 无论您在数据的科学性问题上持哪种看法,都无法忽视数据的持续重要性,也不能轻视分析、组织和情境化数据的能力。 根据大量的就业数据和员工反馈信息统计,在“25个最 ...

数据分析师&数据科学家&数据工程师——哪个角色最适合你

数据分析师&数据科学家&数据工程师——哪个角色最适合你
2018-01-02
What\'s the difference between a data analyst, scientist and engineer? 数据越来越多的影响并塑造着那些我们每天都要交互的系统。不管是你使用Siri,google搜索,还是浏览facebook的好友动态,你 ...

站在巨人的肩膀上做数据挖掘与机器学习—R帮你实现

站在巨人的肩膀上做数据挖掘与机器学习—R帮你实现
2018-01-03
R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站 ...

深入浅出,一篇超棒的机器学习入门文章

深入浅出,一篇超棒的机器学习入门文章
2017-12-19
深入浅出,一篇超棒的机器学习入门文章 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇 ...

数据挖掘中,分类与聚类的区别

数据挖掘中,分类与聚类的区别
2017-12-11
数据挖掘中,分类与聚类的区别 本文对数据挖掘中,极为常见的两类算法:分类与聚类,做个梳理。 首先,来看看分类和聚类各自的一些定义描述。 分类(classification ): 分类算法需要学习,它通过学习找出描述 ...

数据聚类的简单应用

数据聚类的简单应用
2017-12-09
数据聚类的简单应用 数据聚类data clustering:用来寻找紧密相关的事物,并将其可视化的方法。 1. 聚类时常被用于数据量很大(data-intensive)的应用中。 2. 聚类是无监督学习(unsupervised learning) ...
R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

10个令人相见恨晚的R语言包

10个令人相见恨晚的R语言包
2017-09-15
10个令人相见恨晚的R语言包 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 ...

深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家

深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家
2017-09-06
深入浅出:怎么从0开始学习大数据挖掘分析,才能成为合格的数据挖掘分析师及数据科学家 最近有很多人咨询,想学习大数据,但不知道怎么入手,从哪里开始学习,需要学习哪些东西?对于一个初学者,学习大数据挖 ...

18本数据科学家必读的R语言和Python相关书籍

18本数据科学家必读的R语言和Python相关书籍
2017-05-25
前言 “这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是 ...

利用Python,四步掌握机器学习

利用Python,四步掌握机器学习
2017-05-18
利用Python,四步掌握机器学习 为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得 ...

机器学习的道、法、术、势、器

机器学习的道、法、术、势、器
2017-05-13
机器学习的道、法、术、势、器 “道、法、术、器”出于老子的《道德经》,后人又加了一个“势”,并且也有了不同的排列。很多人习惯用“道、法、术、势、器”的顺序,原因很简单:道以明向、法以立本、术以立策 ...

模式识别和机器学习、数据挖掘的区别与联系

模式识别和机器学习、数据挖掘的区别与联系
2017-05-05
模式识别和机器学习、数据挖掘的区别与联系 (一)模式识别的诞生与人工智能 自动控制起始是从工业革命之后,人们就希望设计出减少人工干预,能自己进行调节(regulate)的机器,工程领域开始想出了根轨迹等等 ...

「CDAS 在线」央企财会到数据分析师的华丽转变

「CDAS 在线」央企财会到数据分析师的华丽转变
2017-04-28
去年的CDAS 2016 第三届中国数据分析师行业峰会上,有一个比较特别的分论坛。这个论坛的嘉宾有些原本并不是业内人士,但经过一段时间的学习,他们成功转型,成为一名数据分析师。他们也有一个共同的身份—— CDA ...
谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

从模型选择到超参调整,六步教你如何为机器学习项目选择算法

从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...

简单易学的机器学习算法—K-Means算法

简单易学的机器学习算法—K-Means算法
2017-03-23
简单易学的机器学习算法—K-Means算法 一、聚类算法的简介     聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。聚类算法与分类算法最大的区别是:聚类算法是无 ...

干货 | 基础机器学习算法

干货 | 基础机器学习算法
2017-03-10
本篇内容主要是面向机器学习初学者,介绍常见的机器学习算法,当然,欢迎同行交流。 哲学要回答的基本问题是从哪里来、我是谁、到哪里去,寻找答案的过程或许可以借鉴机器学习的套路:组织数据->挖掘知识->预测未来。 ...

R语言不平衡数据分类指南

R语言不平衡数据分类指南
2017-02-27
R语言不平衡数据分类指南 目前我们发展出了不少机器学习算法来对数据建模,基于数据进行一些预测已经不再是难事。不论我们建立的是回归或是分类模型,只要我们选择了合适的算法,总能得到比较精确的结果。然而 ...

OK
客服在线
立即咨询