数据分析师技术_数据分析技术_数据分析培训

SPSSModeler中数据测量类型的含义

SPSSModeler中数据测量类型的含义数据测量类型查看IBM SPSS Modeler 帮助文档，解释如下： • 默认值。具有未知存储类型和值的数据（例如，由于其尚未被读取)将 ...

2017-05-25

详解反向传播算法

详解反向传播算法反向传播算法(Backpropagation)已经是神经网络模型进行学习的标配。但是有很多问题值得思考一下：反向传播算法的作用是什么？神经网络模型的学习算法一般是SGD。SGD需要用到损失函数C ...

2017-05-25

R语言绘图—图形标题、坐标轴设置

R语言绘图—图形标题、坐标轴设置 R语言绘图是通过函数命令及相应参数设置实现的。如plot（x，y），plot为绘图函数命令，x，y则是绘图参数，指定了绘图的数据向量。但这种最基本的绘图设置很难满足个性化绘图的 ...

2017-05-25

数据分析方法之对比分析法类型

数据分析方法之对比分析法类型之前在数据分析方法一文中讲过了数据对比分析法，对比分析法的意义何在呢？企业在运营、管理、决策的过程中存在着很多不确定性，因此再利用数据分析进行生产决策，项目风险评估登 ...

2017-05-24

SPSS筛选聚类变量

SPSS筛选聚类变量聚类分析是常见的数据分析方法之一，主要用于市场细分、用户细分等领域。利用SPSS进行聚类分析时，用于参与聚类的变量决定了聚类的结果，无关变量有时会引起严重的错分，因此，筛选有效的聚类 ...

2017-05-24

Hadoop之HDFS与小文件

Hadoop之HDFS与小文件 Hadoop有一个名为“HDFS”的分布式文件系统，它的设计目的是提供一个高容错，且能部署在廉价硬件的分布式系统；它的设计参照了Google的GFS（Google分布式文件系统）；它能支持高吞吐量， ...

2017-05-24

Hadoop+Hive常用知识总结

Hadoop+Hive常用知识总结 1、什么是Hadoop？什么是hive？ Hadoop：一个分布式系统基础架构，由Apache基金会开发，用户可以在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的威力告诉运算和存 ...

2017-05-24

Hadoop及其构成

Hadoop及其构成玩计算机需要先装一个windows系统（或linux系统）。同样道理，玩大数据也要有个大数据系统，用于将数据汇聚起来，加以分析和处理，将其中有价值的信息分析出来，让人们认清事物的全局、预测未来 ...

2017-05-24

Hadoop环境中管理大数据存储八大技巧

Hadoop环境中管理大数据存储八大技巧在现如今，随着IT互联网信息技术的飞速发展和进步。目前大数据行业也越来越火爆，从而导致国内大数据人才也极度缺乏，下面介绍一下关于Hadoop环境中管理大数据存储技巧。 ...

2017-05-24

SPSS详细操作:正态转换的多种方法

SPSS详细操作:正态转换的多种方法一、正偏态分布资料 1、轻度正偏态分布偏度值>0，偏度值为其标准误差的2-3倍，即Z-score=2~3，此时认为资料分布呈现轻度的正偏态分布，可以考虑对变量x取根号开平方的 ...

2017-05-23

在R中整理数据

在R中整理数据原始数据一般分散杂乱，并含有缺失和错误值，因此在进行数据分析前首先要对数据进行整理。一、首先，了解原始数据的结构。可使用如下函数(归属baseR)来查看数据结构： class(dataobje ...

2017-05-23

SAS之DATA步运行机制

SAS之DATA步运行机制相信了解SAS软件的朋友都知道，SAS主要由DATA步和PROC步组成，其中DATA步作为数据读入、清洗、整理的主要程序步，学好DATA就显得尤为重要。而了解DATA步，重中之重就得了解PDV（Logical Pr ...

2017-05-23

SAS之大话PDV

SAS之大话PDV 之所以说是数据源，而非输入缓冲区的原因上一条推送已经说明，这里就不再啰嗦啦。这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。 IF语句 & WHERE语句这两个语 ...

2017-05-23

R读取MySQL数据出现乱码，解决该问题的方法总结

R读取MySQL数据出现乱码，解决该问题的方法总结我用的都是utf-8编码，电脑系统win7， MySQL-Front进行数据库的可视化。 1、我用的是RStudio，先去设置R的默认编码： Tools→Global Options...→Code→Savin ...

2017-05-23

R的变量类型和常用函数

R的变量类型和常用函数一、R的变量类型也可以说是数据存储方式，有： Vector：一维阵列 Matrics：二维阵列，其中所有元素是同一数据类型。 factor：种类变量，可使用levels函数来规定种类变量 ...

2017-05-23

SPSS统计分析案例:多层感知器神经网络

SPSS统计分析案例:多层感知器神经网络神经网络模型起源于对人类大脑思维模式的研究，它是一个非线性的数据建模工具，由输入层和输出层、一个或者多个隐藏层构成神经元，神经元之间的连接赋予相关的权重，训 ...

2017-05-22

如何对数据排序和拆分文件

如何对数据排序和拆分文件排序数据对个案进行排序（排序数据文件的行）通常很有用，且有时对于某些类型的分析是十分必要的。根据一个或多个排序变量的值重新排序数据文件中个案的顺序：从菜单中选择： ...

2017-05-22

SPSS统计基础---代码本

SPSS统计基础---代码本大家好，从今天开始，将逐步介绍SPSS各个统计方法菜单中每个选项的含义及使用。码本报告活动数据集中所有或指定变量和多重响应集的字典信息（如变量名称、变量标签、值标签、缺失值 ...

2017-05-22

SPSS统计基础---描述功能的使用

SPSS统计基础---描述功能的使用 “描述”过程为单个表中的若干变量显示单变量摘要统计量，并计算标准化值（z 得分）。变量可以按其均值（升序或降序）大小、按字母顺序或按您选择变量的顺序（缺省值）进行排序 ...

2017-05-22

SPSS统计基础---频率的使用

SPSS统计基础---频率的使用频率过程提供有助于描述多种类型的变量的统计量和图形显示。频率过程是查看数据理想的开始位置。对于频率报告和条形图，可以用升序或降序排列不同的值，也可以按其频率对类别进行排 ...

2017-05-22

CDA考试动态

CDA报考指南

热门栏目

最新资讯

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

从“样本均值”到“总体真相”：CDA数据分析师视角 ...

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

为什么统计是数据分析师的“底层语言”？ ...

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

CDA持证人专访：赵君研谈金融行业数据分析与运营岗 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...