cda

数字化人才认证

首页 > 行业图谱 >

R语言中plyr包

R语言中plyr包
2017-04-20
R语言中plyr包 apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例 ...

SAS宏中两个常用的options选项

SAS宏中两个常用的options选项
2017-04-19
SAS宏中两个常用的options选项 一、关于SAS中options选项msglevel msglevel:默认值是N(默认是关闭的),仅打印notes,warnings和error信息,如果设为I,则除了打印N选项的信息,同时打印附属信息,包括索 ...

Python小技巧

Python小技巧
2017-04-15
Python小技巧 在这里列举一些我使用Python时积累的小技巧。这些技巧是我在使用Python过程中经常使用的。之前很零碎的记在笔记本中,现在整理出来,和大家分享,也作为Python快速教程的一个补充。 import ...

一种基于数据挖掘的通用CRM系统框架及关键技术研究

一种基于数据挖掘的通用CRM系统框架及关键技术研究
2017-04-14
一种基于数据挖掘的通用CRM系统框架及关键技术研究 随着客户信息量的增加,客户与公司的关系变得越来越复杂,单纯操作性的客户关系管理CRM(Customer Relationship Management)已难以满足用户的需要。在CRM中 ...

从底层到应用,那些数据人的必备技能

从底层到应用,那些数据人的必备技能
2017-04-13
从底层到应用,那些数据人的必备技能 谨以此文献给对数据有热情,想长期从事此行业的年轻人,希望对你们有所启发,并快速调整思路和方向,让自己的职业生涯有更好的发展。 根据数据应用的不同阶段,我将从数 ...
谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

通过IMPORT过程读取外部文件数据

通过IMPORT过程读取外部文件数据
2017-03-30
通过IMPORT过程读取外部文件数据 通过IMPORT过程读取外部文件数据 除了可以通过DATA步读取外部文本文件数据外,SAS还提供了IMPORT过程,通过它可以从外部数据源读取数据并写入到SAS数据集中。而且,如果使用 ...

SAS程序错误及处理

SAS程序错误及处理
2017-03-30
SAS程序错误及处理 通常我们所开发的SAS程序,很少在第一次提交时就能够运行完成并产生正确结果。程序越长越复杂,就越可能出现语法或逻辑错误。本文介绍了一些良好的SAS编程规范以减少程序错误,同时也描述了 ...

阿里 HBase 超详实践总结

阿里 HBase 超详实践总结
2017-03-29
概述 HBase 是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的 BigTable 建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化 ...

如何快速搭建一个类似于神策数据或诸葛IO的数据分析平台?

如何快速搭建一个类似于神策数据或诸葛IO的数据分析平台?
2017-03-16
Growth Hacking 这个词在过去一两年开始迅速从硅谷传播到国内,也诞生了一系列专注于企业数据分析业务的明星初创公司,如 GrowingIO,神策数据,诸葛IO 等。 Growth Hacking 简单的来说就是用数据驱动的方式 ...

Excel 数据透视表,10 个不得不说的秘密

Excel 数据透视表,10 个不得不说的秘密
2017-03-15
这次,罂粟姐姐悄悄告诉你们 Excel 数据透视表的 10 个秘密。当然,如果有 1 个及以上的秘密是你之前不知道的,就果断打赏转发吧。(如果你全知道,呃……大神求带~) 1、手动刷新和定时刷新 ...

机器学习实战之PCA

机器学习实战之PCA
2017-03-14
机器学习实战之PCA 1.  向量及其基变换 1.1 向量内积 (1)两个维数相同的向量的内积定义如下: 内积运算将两个向量映射为一个实数. (2) 内积的几何意义 假设A\\B是两个n维向量, n维向量可以 ...

对应分析方法与对应图解读方法-—七种分析角度

对应分析方法与对应图解读方法-—七种分析角度
2017-03-13
对应分析方法与对应图解读方法-—七种分析角度 对应分析是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示化技术,当然也是强有力的市场研究分析技术。   &nbs ...

企业用户如何玩转大数据,赢在未来

企业用户如何玩转大数据,赢在未来
2017-03-09
企业用户如何玩转大数据,赢在未来 传统的数据治理在大数据时代面临着大量数据的接入、大量数据的存储和快速灵活处理的三方面问题,这一期我们来聊聊如何正确的思考和解决这三个问题。 大量数据接入 大量 ...

大数据时代,数据管理的12条铁则

大数据时代,数据管理的12条铁则
2017-03-09
大数据时代,数据管理的12条铁则 在大数据的时代,大家都在重视数据存储和一系列大数据相关技术,但是很多人忽略了数据是需要管理的,没有经过管理的数据,只能叫数据,而不能成为信息,无法真正体现出其内在价 ...

数据分析八大禁忌

数据分析八大禁忌
2017-03-07
数据分析八大禁忌 大家都对这种东西嗤之以鼻对不对?作为接受过高等教育的我们怎么会信这些命理风水的东西呢,比如床不能对着电视机,开玩笑,老祖宗的年代有电视机吗?躺着看电视才享受呢。对于这种东西,陈老 ...

SPSS-数据处理-数据变量

SPSS-数据处理-数据变量
2017-03-04
SPSS-数据处理-数据变量 spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中,我们称之为变量。 接下来主要介绍两点有关变量的基础知识 ...

spss-数据抽取-拆分与合并

spss-数据抽取-拆分与合并
2017-03-03
spss-数据抽取-拆分与合并 数据抽取也成为数据拆分,是指保留、抽取原数据表中某些字段、记录的部分信息,形成一个新字段、新纪录。分为:字段拆分和随机抽样两种方法。 一:字段拆分 如何提取“身份证号 ...

SPSS分析技术:两个独立样本的非参数检验

SPSS分析技术:两个独立样本的非参数检验
2017-03-02
SPSS分析技术:两个独立样本的非参数检验 在医学类研究中,经常会遇到治疗效果无法量化,但需要比较不同治疗方法优劣的需求。例如,比较止痛药的效果,疼痛程度无法准确量化,只能用主观打分来描述;理疗复健方 ...

R语言中的缺失值处理

R语言中的缺失值处理
2017-02-27
R语言中的缺失值处理 在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处 ...

OK