CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据时代的反爬虫绝技
2016-04-06
数据时代的反爬虫绝技 网络爬虫已经成了很普及的网络技术,会代码的可以自己捣鼓一个高级的“人工智能”爬虫,不会的也可以从网上下载一个开源的,然后找个机器或一些代理服务器,就可以肆无忌惮的薅羊毛了。轻 ...

App数据分析之旅,如何收集数据?

App数据分析之旅,如何收集数据?
2016-04-06
App数据分析之旅,如何收集数据? 为什么要针对App收集数据,想必大家能够举出很多理由。大家可以想一下,尽量不要设计到数据后期的分析,不要涉及产品优化,不要设计用户体验,更不要设计运营优化,等等。因 ...

美国首席数据科学家:打造数据产品必知秘籍

美国首席数据科学家:打造数据产品必知秘籍
2016-04-05
“当你在深夜遇到系统挂了和数据损坏,有什么办法可以避免那些痛苦和头痛?” 这是DJ·Patil在最近的CTO峰会提到的。他是RelateIQ前任产品副总裁,和美国现任首席数据科学家,Patil总结所有产生变革的经验教训和失 ...

如何面对PB级别数据的架构变迁?

如何面对PB级别数据的架构变迁?
2016-04-05
如何面对PB级别数据的架构变迁? 面对PB级别数据存储,我们一路走来也踩过很多坑,这里就直接进入主题了,给大家分享一下监控宝系统架构变迁的两个比较重要的点。 一、Redis的扩展 我们面临的第一个的问题 ...

基于你的点赞轨迹,数据挖掘可以探知你的性格秘密

基于你的点赞轨迹,数据挖掘可以探知你的性格秘密
2016-04-05
基于你的点赞轨迹,数据挖掘可以探知你的性格秘密 整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质 ...

懂你的推荐算法,推荐逻辑是怎样的?

懂你的推荐算法,推荐逻辑是怎样的?
2016-04-05
懂你的推荐算法,推荐逻辑是怎样的? 作为一个喜欢思考人生的美男子,我时常感慨,现在这个年代,人们上网获取信息的成本真的好低。智能手机,人手一台,打开3G就能上网,百度一搜,什 么都有。当然百度上搜出 ...

非一般的数据挖掘机:关联规则法

非一般的数据挖掘机:关联规则法
2016-04-05
非一般的数据挖掘机:关联规则法 机器学习中的许多数据挖掘方法主要是针对数值型数据的,算法也很偏向数理方法(例如支持向量机)。而分类数据(非数值型数据),其本质不过是简单的计数,针对这类数据的一个简 ...

一篇文章透彻解读聚类分析及案例实操(二)

一篇文章透彻解读聚类分析及案例实操(二)
2016-04-05
一篇文章透彻解读聚类分析及案例实操(二) 4 SAS聚类分析案例 1 问题背景 考虑下面案例,一个棒球管理员希望根据队员们的兴趣相似性将他们进行分组。显然,在该例子中,没有响应变量。管理者希望 ...

一篇文章透彻解读聚类分析及案例实操(一)

一篇文章透彻解读聚类分析及案例实操(一)
2016-04-05
一篇文章透彻解读聚类分析及案例实操(一) 本文主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。这里重点拿常见的工具SAS+R语言+Python介绍! 1 ...

用SAS进行数据分析:绘制累积柱状图并添加折线

用SAS进行数据分析:绘制累积柱状图并添加折线
2016-04-04
用SAS进行数据分析:绘制累积柱状图并添加折线 对于很多数据分析着来说,sas很多初级的朋友对他的应用不是很多,下面就介绍下一如何用SAS绘制累积柱状图并添加折线 PS:直接上代码,对SAS CODE ...

数据分析师?科学家?架构师?大数据人才的工作内容及年薪比较

数据分析师?科学家?架构师?大数据人才的工作内容及年薪比较
2016-04-04
数据分析师?科学家?架构师?大数据人才的工作内容及年薪比较 随着大数据时代的到来,数据分析与探勘成为科技显学,各行各业对于大数据的浓厚兴趣也直接反映在大数据人才的丰厚薪资中。 根据美国大数据及商业 ...

妙用Excel语音校对功能实现数据核对

妙用Excel语音校对功能实现数据核对
2016-04-04
妙用Excel语音校对功能实现数据核对  单位经常用Excel来统计分点压力数据,每次统计完成后还要对上百个中低压数据进行校对。如果用眼睛校对,很容易出差错。而使用Excel的“文本到语音”功能,让软件自动报 ...

如何破解word文件密码与Excel表格密码

如何破解word文件密码与Excel表格密码
2016-04-04
如何破解word文件密码与Excel表格密码 为Word文档加密本来无可厚非,但如果忘记了word文件密码怎么办?虽然网络上很多各种各样破解word文件密码软件,但它们无一例外的采用暴力破解office文件加密的方式,耗费 ...

大数据面试可能遇到的问题

大数据面试可能遇到的问题
2016-04-04
大数据面试可能遇到的问题 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮 ...

数据分析应从数据积累做起

数据分析应从数据积累做起
2016-04-04
数据分析应从数据积累做起 “不会酿酒,也能成为好的品酒师。”在IBM数据分析沙龙中,AsiaAnalytics首席执行官莫利伟通过品酒师的事例,说明企业应该如何正确进行数据分析,为大数据的应用作准备。作为一个企 ...

模型验证的常用武器

模型验证的常用武器
2016-04-03
模型验证的常用武器 分类模型是数据挖掘中应用非常广泛的算法之一,常用的分类算法有Logistic模型、决策树、随机森林、神经网络、Boosting等。针对同一个数据集,可以有这么多的算法进行分析,那如何评估什 ...
算法 | 澄清P问题、NP问题、NPC问题
2016-04-03
澄清P问题、NP问题、NPC问题的概念 这或许是众多OIer最大的误区之一。 你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所 ...

各种排序算法总结

各种排序算法总结
2016-04-03
各种排序算法总结 排序算法是最基本最常用的算法,不同的排序算法在不同的场景或应用中会有不同的表现,我们需要对各种排序算法熟练才能将它们应用到实际当中,才能更好地发挥它们的优势。今天,来总结下各种 ...

当R用户用ggplot2 package时,经常问的10个问题

当R用户用ggplot2 package时,经常问的10个问题
2016-04-03
有时候数字确实需要分享一个美丽的故事分享! 当今社会,数据可视化是至关重要的。没有强大的可视化,几乎不可能在堆积如山的数据中创造或者叙述它的故事。这些故事有助于我们构建策略,并做出明智的商业决 ...

数据定义的挑战

数据定义的挑战
2016-04-03
数据定义的挑战 从数据科学的角度看,这次航天仼务的失利是数据定义没有做好,正所谓“失之毫厘,谬以千里”。数据定义是数据收集和分析的基础,看似简单,想要在实践中做好却并不容易。尤其是在大数据系统中( ...

OK