数据分析师

首页 > 技术干货

数据分析方法之对比分析法类型

数据分析方法之对比分析法类型

源自:CDA数据分析师 | 发布时间:2017-05-24 12:50:33

数据分析方法之对比分析法类型 之前在数据分析方法一文中讲过了数据对比分析法,对比分析法的意义何在呢?企业在运营、管理、决策的过程中存在着很多不确定 ... ...

SPSS筛选聚类变量

SPSS筛选聚类变量

源自:CDA数据分析师 | 发布时间:2017-05-24 12:47:11

SPSS筛选聚类变量 聚类分析是常见的数据分析方法之一,主要用于市场细分、用户细分等领域。利用SPSS进行聚类分析时,用于参与聚类的变量决定了聚类的结果, ... ...

Hadoop之HDFS与小文件

Hadoop之HDFS与小文件

源自:CDA数据分析师 | 发布时间:2017-05-24 12:13:36

Hadoop之HDFS与小文件 Hadoop有一个名为“HDFS”的分布式文件系统,它的设计目的是提供一个高容错,且能部署在廉价硬件的分布式系统;它的设计参照了Google的GFS(Google分布式文件系统);它能支持高吞吐量, ...

Hadoop+Hive常用知识总结

Hadoop+Hive常用知识总结

源自:CDA数据分析师 | 发布时间:2017-05-24 07:04:14

Hadoop+Hive常用知识总结 1、什么是Hadoop?什么是hive? Hadoop:一个分布式系统基础架构,由Apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力告诉运算和存 ...

SPSS详细操作:正态转换的多种方法

SPSS详细操作:正态转换的多种方法

源自:CDA数据分析师 | 发布时间:2017-05-23 12:14:19

SPSS详细操作:正态转换的多种方法 一、正偏态分布资料 1、轻度正偏态分布 偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,可以考虑对变量x取根号开平方的 ...

在R中整理数据

在R中整理数据

源自:CDA数据分析师 | 发布时间:2017-05-23 07:24:48

在R中整理数据 原始数据一般分散杂乱,并含有缺失和错误值,因此在进行数据分析前首先要对数据进行整理。 一、首先,了解原始数据的结构。 可使用如下函数(归属baseR)来查看数据结构: class(dataobje ...

SAS之DATA步运行机制

SAS之DATA步运行机制

源自:CDA数据分析师 | 发布时间:2017-05-23 07:09:53

SAS之DATA步运行机制 相信了解SAS软件的朋友都知道,SAS主要由DATA步和PROC步组成,其中DATA步作为数据读入、清洗、整理的主要程序步,学好DATA就显得尤为重要。而了解DATA步,重中之重就得了解PDV(Logical Pr ...

SAS之大话PDV

SAS之大话PDV

源自:CDA数据分析师 | 发布时间:2017-05-23 07:05:47

SAS之大话PDV 之所以说是数据源,而非输入缓冲区的原因上一条推送已经说明,这里就不再啰嗦啦。 这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。 IF语句 & WHERE语句 这两个语 ...

SPSS统计分析案例:多层感知器神经网络

SPSS统计分析案例:多层感知器神经网络

源自:CDA数据分析师 | 发布时间:2017-05-22 07:39:37

SPSS统计分析案例:多层感知器神经网络 神经网络模型起源于对人类大脑思维模式的研究,它是一个非线性的数据建模工具, 由输入层和输出层、 一个或者多个隐藏层构成神经元,神经元之间的连接赋予相关的权重, 训 ...

如何对数据排序和拆分文件

如何对数据排序和拆分文件

源自:CDA数据分析师 | 发布时间:2017-05-22 07:28:58

如何对数据排序和拆分文件 排序数据 对个案进行排序(排序数据文件的行)通常很有用,且有时对于某些类型的分析是十分必要的。根据一个或多个排序变量的值重新排序数据文件中个案的顺序: 从菜单中选择: ...

SPSS统计基础---代码本

SPSS统计基础---代码本

源自:CDA数据分析师 | 发布时间:2017-05-22 07:07:44

SPSS统计基础---代码本 大家好,从今天开始,将逐步介绍SPSS各个统计方法菜单中每个选项的含义及使用。 码本报告活动数据集中所有或指定变量和多重响应集的字典信息(如变量名称、变量标签、值标签、缺失值 ...

你真的会玩SQL吗?之逻辑查询处理阶段

你真的会玩SQL吗?之逻辑查询处理阶段

源自:CDA数据分析师 | 发布时间:2017-05-21 12:30:32

你真的会玩SQL吗?之逻辑查询处理阶段 最近要对数据库进行优化,但由于工作项目中已经很少亲自写SQL而且用的都不是很复杂的语句,所以有些生疏了,于是翻翻N年前的笔记资料,想以此来记录回顾总结一些实用的SQL ...

0基础搭建Hadoop大数据处理-环境

0基础搭建Hadoop大数据处理-环境

源自:CDA数据分析师 | 发布时间:2017-05-21 12:20:40

0基础搭建Hadoop大数据处理-环境 由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装CentOS7,具体的安装此处不作过多介绍,只作需要用到的知 ...

提升数据建模的10种技术措施

提升数据建模的10种技术措施

源自:CDA数据分析师 | 发布时间:2017-05-21 07:17:21

提升数据建模的10种技术措施 随着企业有了能够轻松访问和分析数据以提高性能的新机会,数据建模也是变形的。数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助 ...

0基础搭建Hadoop大数据处理-初识

0基础搭建Hadoop大数据处理-初识

源自:CDA数据分析师 | 发布时间:2017-05-21 07:14:24

0基础搭建Hadoop大数据处理-初识 在互联网的世界中数据都是以TB、PB的数量级来增加的,特别是像BAT光每天的日志文件一个盘都不够,更何况是还要基于这些数据进行分析挖掘,更甚者还要实时进行数据分析,学习, ...

关于数据分析思路的4点心得

关于数据分析思路的4点心得

源自:CDA数据分析师 | 发布时间:2017-05-20 13:07:33

关于数据分析思路的4点心得 1.看数据的纬度 在对一款产品或者一款产品的其中的一个模块进行分析时,我们可以从两个大纬度去分析数据。 首先是从广阔的视角先去查看数据,这里需要对该产品所处的行业数据 ...

商业数据挖掘的几种应用场景和主题

商业数据挖掘的几种应用场景和主题

源自:CDA数据分析师 | 发布时间:2017-05-20 13:03:49

商业数据挖掘的几种应用场景和主题 数据挖掘涉及到公司运营的方方面面,这包括对企业部门经营情况的评估、内部员工的管理、生产流程的监管、产品结构优化与新产品开发、财务成本优化、市场结构的分析和客户关系 ...

Python金融大数据分析-PCA分析

Python金融大数据分析-PCA分析

源自:CDA数据分析师 | 发布时间:2017-05-20 07:33:49

Python金融大数据分析-PCA分析 1.pandas的一个技巧 apply() 和applymap()是DataFrame数据类型的函数,map()是Series数据类型的函数。apply()的操作对象DataFrame的一列或者一行数据, applymap()是element ...

关于如何解释机器学习的一些方法

关于如何解释机器学习的一些方法

源自:CDA数据分析师 | 发布时间:2017-05-20 07:01:08

关于如何解释机器学习的一些方法 到现在你可能听说过种种奇闻轶事,比如机器学习算法通过利用大数据能够预测某位慈善家是否会捐款给基金会啦,预测一个在新生儿重症病房的婴儿是否会罹患败血症啦,或者预测一位 ...

R语言:关联规则+时间因素=序贯关联规则

R语言:关联规则+时间因素=序贯关联规则

源自:CDA数据分析师 | 发布时间:2017-05-19 12:51:19

R语言:关联规则+时间因素=序贯关联规则 序贯模型=关联规则+时间因素。 今天下午基本上把通过arulesSequences来进行序列模式挖掘搞明白了,晚上又把arulesSequences中最重要的函数cspade查看了一下。Mark一下。 ...

python实现六大分群质量评估指标(兰德系数、互信息、轮廓系数)

python实现六大分群质量评估指标(兰德系数、互信息、轮廓系数) ...

源自:CDA数据分析师 | 发布时间:2017-05-19 12:45:57

python实现六大分群质量评估指标(兰德系数、互信息、轮廓系数) 1 R语言中的分群质量——轮廓系数 因为先前惯用R语言,那么来看看R语言中的分群质量评估,节选自笔记︱多种常见聚类模型以及分群质量评估(聚类 ...

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹 ...

源自:CDA数据分析师 | 发布时间:2017-05-19 07:28:32

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等) 情感分析中对文本处理的数据的小技巧要求比较高,笔者在学习时候会为一些小技巧感到头疼不已。 主要包括以下内容: 1 批量读取txt ...

CDA数据分析师周边