CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

R语言学习路线和常用数据挖掘包

R语言学习路线和常用数据挖掘包
2017-12-13
R语言学习路线和常用数据挖掘包 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是— ...

python实现合并两个数组的方法

python实现合并两个数组的方法
2017-12-12
python实现合并两个数组的方法 这篇文章主要介绍了python实现合并两个数组的方法,实例分析了两种常用的合并数组的技巧,非常简单实用,需要的朋友可以参考下 python合并两个数组,将两个数组连接成一个数组,例如 ...
大话机器学习之数据预处理与数据筛选
2017-12-12
大话机器学习之数据预处理与数据筛选 数据挖掘和机器学习这事,其实大部分时间不是在做算法,而是在弄数据,毕竟算法往往是现成的,改变的余地很小。 数据预处理的目的就是把数据组织成一个标准的形式。 ...

Python金融大数据分析-蒙特卡洛仿真

Python金融大数据分析-蒙特卡洛仿真
2017-12-12
Python金融大数据分析-蒙特卡洛仿真 1.简单的例子 了解一点金融工程的对这个公式都不会太陌生,是用现在股价预测T时间股价的公式,其背后是股价符合几何布朗运动,也就是大名鼎鼎的BSM期权定价模型的基础。 ...

数据分析基础篇(设计师都应该了解)

数据分析基础篇(设计师都应该了解)
2017-12-12
数据分析基础篇(设计师都应该了解) 当今设计师还不了解数据,自身价值也将会越来越低 第1则- 前言 数据分析是一块知识领域,是一门学科性很强的科目,想要短时间内吃透并不简单,在进入这个领域之前, ...

如何成为一名数据分析师:数据的初步认知

如何成为一名数据分析师:数据的初步认知
2017-12-12
如何成为一名数据分析师:数据的初步认知 对所有从事数据相关工作的人而言,都有一个老生常谈的问题: 数据认知 !毕竟在真正开始分析、BI 报表开发或者建模前,对数据进行一定的审查和认知是必须的。今天,就 ...

数据分析:Python分析学生数据

数据分析:Python分析学生数据
2017-12-11
数据分析:Python分析学生数据 本文为优达学城数据分析入门课程的mini项目,所用数据集为优达学城某段时间内的学生数据。 数据简介 全部数据包含三个文件,其内容分别为: enrollments.csv: daily-engageme ...

数据挖掘中,分类与聚类的区别

数据挖掘中,分类与聚类的区别
2017-12-11
数据挖掘中,分类与聚类的区别 本文对数据挖掘中,极为常见的两类算法:分类与聚类,做个梳理。 首先,来看看分类和聚类各自的一些定义描述。 分类(classification ): 分类算法需要学习,它通过学习找出描述 ...

数据挖掘中的分类和聚类

数据挖掘中的分类和聚类
2017-12-11
数据挖掘中的分类和聚类 分类(classification ):有指导的类别划分,在若干先验标准的指导下进行,效果好坏取决于标准选取的好坏。 它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标 ...

Python图像灰度变换及图像数组操作

Python图像灰度变换及图像数组操作
2017-12-11
Python图像灰度变换及图像数组操作 使用python以及numpy通过直接操作图像数组完成一系列基本的图像处理 numpy简介: NumPy是一个非常有名的 Python 科学计算工具包,其中包含了大量有用的工具,比如数组对 ...
python对DICOM图像的读取方法详解
2017-12-11
python对DICOM图像的读取方法详解 DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。下面这篇文章主要给大家介绍了关于python ...

朴素贝叶斯分类算法理解及文本分类器实现

朴素贝叶斯分类算法理解及文本分类器实现
2017-12-11
朴素贝叶斯分类算法理解及文本分类器实现 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分类问题进行一个正式的定义 ...
一种根据关键字进行分类的文本分类算法
2017-12-10
一种根据关键字进行分类的文本分类算法 这样我们可以得出这个算法的重点: 1.提取关键字 如何自动提取关键字呢?我们知道IDF值在一定程度上可以表达一个词的重要程度,像“我的”,“你的” ...
文本分类常用算法比较
2017-12-10
文本分类常用算法比较 本文对文本分类中的常用算法进行了小结,比较它们之间的优劣,为算法的选择提供依据。 一、决策树(Decision Trees) 优点: 1、决策树易于理解和解释.人们在通 ...
朴素贝叶斯模型:文本分类+垃圾邮件分类
2017-12-10
朴素贝叶斯模型:文本分类+垃圾邮件分类 学习了那么多机器学习模型,一切都是为了实践,动手自己写写这些模型的实现对自己很有帮助的,坚持,共勉。本文主要致力于总结贝叶斯实战中程序代码的实现(python)及朴 ...

利用spark做文本分类(朴素贝叶斯模型)

利用spark做文本分类(朴素贝叶斯模型)
2017-12-10
利用spark做文本分类(朴素贝叶斯模型) 朴素贝叶斯模型 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基 ...
文本分类和聚类有什么区别
2017-12-10
文本分类和聚类有什么区别 简单点说:分类是将一篇文章或文本自动识别出来,按照已经定义好的类别进行匹配,确定。聚类就是将一组的文章或文本信息进行相似性的比较,将比较相似的文章或文本信息归为同一组的技 ...
数据挖掘笔记-聚类-Canopy-原理与简单实现
2017-12-10
数据挖掘笔记-聚类-Canopy-原理与简单实现 Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来 ...
python判断图片宽度和高度后删除图片的方法
2017-12-09
python判断图片宽度和高度后删除图片的方法 本文实例讲述了python判断图片宽度和高度后删除图片的方法。分享给大家供大家参考。具体分析如下: Image对象有open方法却没有close方法,如果打开图片,判断图片高 ...

数据聚类的简单应用

数据聚类的简单应用
2017-12-09
数据聚类的简单应用 数据聚类data clustering:用来寻找紧密相关的事物,并将其可视化的方法。 1. 聚类时常被用于数据量很大(data-intensive)的应用中。 2. 聚类是无监督学习(unsupervised learning) ...

OK