CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

模型验证的常用武器

模型验证的常用武器
2016-04-03
模型验证的常用武器 分类模型是数据挖掘中应用非常广泛的算法之一,常用的分类算法有Logistic模型、决策树、随机森林、神经网络、Boosting等。针对同一个数据集,可以有这么多的算法进行分析,那如何评估什 ...
算法 | 澄清P问题、NP问题、NPC问题
2016-04-03
澄清P问题、NP问题、NPC问题的概念 这或许是众多OIer最大的误区之一。 你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所 ...

各种排序算法总结

各种排序算法总结
2016-04-03
各种排序算法总结 排序算法是最基本最常用的算法,不同的排序算法在不同的场景或应用中会有不同的表现,我们需要对各种排序算法熟练才能将它们应用到实际当中,才能更好地发挥它们的优势。今天,来总结下各种 ...

当R用户用ggplot2 package时,经常问的10个问题

当R用户用ggplot2 package时,经常问的10个问题
2016-04-03
有时候数字确实需要分享一个美丽的故事分享! 当今社会,数据可视化是至关重要的。没有强大的可视化,几乎不可能在堆积如山的数据中创造或者叙述它的故事。这些故事有助于我们构建策略,并做出明智的商业决 ...

数据定义的挑战

数据定义的挑战
2016-04-03
数据定义的挑战 从数据科学的角度看,这次航天仼务的失利是数据定义没有做好,正所谓“失之毫厘,谬以千里”。数据定义是数据收集和分析的基础,看似简单,想要在实践中做好却并不容易。尤其是在大数据系统中( ...
一位资深数据分析师的分享:掌握基础及更新知识
2016-04-03
一、掌握基础、更新知识。 基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识),多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。 数据库查询—SQL 数据分析师在计算 ...

大数据图数据库之离线挖掘计算模型

大数据图数据库之离线挖掘计算模型
2016-04-02
大数据图数据库之离线挖掘计算模型 对于离线挖掘类图计算而言,目前已经涌现出众多各方面表现优秀而各具特点的实际系统,典型的比如Pregel、Giraph、Hama、PowerGraph、GraphLab、GraphChi等。通过对这些系统的 ...

大数据职位所需的数据场技能

大数据职位所需的数据场技能
2016-04-02
大数据职位所需的数据场技能 除了报表统计外,还需要对数据的有很强的解读能力。电商中的个性推荐技术,商业与银行中的欺骗检测,智能手机中语音识别等等技术,让我们浑身便散发出大数据与机器学习的各种场信息 ...

Python迭代和迭代器详解

Python迭代和迭代器详解
2016-04-02
一个对象,物理或者虚拟存储的序列。list,tuple,strins,dicttionary,set以及生成器对象都是可迭代的,整型数是不可迭代的。如果你不确定哪个可迭代哪个不可以,你需要用python内建的iter()来帮忙。 我们将要来 ...

大数据分析的几个最佳用例

大数据分析的几个最佳用例
2016-04-02
大数据分析的几个最佳用例 从外行的角度看来大数据是个挺了不起的东西,它也确实了不起,不过有一个前提就是我们能够有效地处理数据。怎样从海量数据中找出有用的信息才是最重要的。 本文中我们会讲一些大 ...

数据分析师经常遇到的13个问题

数据分析师经常遇到的13个问题
2016-04-02
数据分析师经常遇到的13个问题 1、最早的数据分析可能就报表 目前很多数据分析后的结果,展示的形式很多,有各种图形以及报表,最早的应该是简单的几条数据,然后搞个web页面,展示一下数据。早期可能数 ...

你的大数据分析为何让你失望

你的大数据分析为何让你失望
2016-04-02
你的大数据分析为何让你失望 许多企业投下数百万美元用于大数据、分析法,并雇用数据分析师,但却感到很受挫。无可否认,他们现在得到了更多、更好的数据。他们的分析师和分析法也是一流的。但经理人对业务的 ...

大数据时代:数据和算法,谁更重要?

大数据时代:数据和算法,谁更重要?
2016-04-02
大数据时代:数据和算法,谁更重要? 我知道很多人自始至终都认为数据是越多越好,即大数据越大越好,Google甚至直言:更多的数据胜过更好的算法,而过去很多侦探剧中崇尚“信息越多,就越靠近真相”的刑侦金句 ...
如何处理数据中的缺失值
2016-04-01
如何处理数据中的缺失值 现实世界中的数据往往非常杂乱,未经处理的原始数据中某些属性数据缺失是经常出现的情况。另外,在做特征工程时经常会有些样本的某些特征无法求出。路漫漫其修远兮,数据还是要继续挖的 ...

数据挖掘问答精选收藏

数据挖掘问答精选收藏
2016-04-01
数据挖掘问答精选收藏 1.现在有大数据、精准挖掘、人工智能等这么多概念及技术,它们之间的关系以及企业大数据实施的路线图应该是怎样的? 来自用户 SmartMining 的回答: 大数据、数据挖掘、人工智 ...

市场细分如何帮助你构建更好的预测模型?

市场细分如何帮助你构建更好的预测模型?
2016-04-01
市场细分如何帮助你构建更好的预测模型? 但是,这真的有必要吗?我们可不可以创建一个单独的模型和使它含有区融变量作为模型的输入。 这可能可以。特别是根据市场细分创建细分模型可能是一件吃力不讨 ...

10个表明数据科学能力成熟的迹象

10个表明数据科学能力成熟的迹象
2016-04-01
10个表明数据科学能力成熟的迹象 通常情况下,我们的业务已经转向为练习组织运作方式的转型——“建设一种能力”意味着建设一种文化来支持和充分利用数据科学。在许多情况下,这种文化的改变能够为世界上的许多 ...

机器学习中的梯度下降法

机器学习中的梯度下降法
2016-04-01
机器学习中的梯度下降法 最优化问题是机器学习算法中非常重要的一部分,几乎每一个机器学习算法的核心都是在处理最优化问题。 本文中我讲介绍一些机器学习领域中常用的且非常掌握的最优化算法,看完本篇文章 ...

用大数据时别辜负了你的大数据分析法

用大数据时别辜负了你的大数据分析法
2016-04-01
用大数据时别辜负了你的大数据分析法 许多企业投下数百万美元用于大数据、分析法,并雇用数据分析家,但却感到很受挫。无可否认,他们现在得到了更多、更好的数据。他们的分析师和分析法也是一流的。但经理人 ...

数据分析与统计推断:线性回归

数据分析与统计推断:线性回归
2016-03-31
数据分析与统计推断:线性回归 相关性(correlation) 相关性描述了两个变量之间线性关联的强度,表示符号为R。 属性: 相关系数的幅度(绝对值)测量两个数字变量之间线性关联的强度 相关系数 ...

OK