SPSSModeler中数据测量类型的含义 数据测量类型 查看IBM SPSS Modeler 帮助文档,解释如下: • 默认值。具有未知存储类型和值的数据(例如,由于其尚未被读取)将 ...
2017-05-25
详解反向传播算法 反向传播算法(Backpropagation)已经是神经网络模型进行学习的标配。但是有很多问题值得思考一下: 反向传播算法的作用是什么?神经网络模型的学习算法一般是SGD。SGD需要用到损失函数C ...
2017-05-25
R语言绘图—图形标题、坐标轴设置 R语言绘图是通过函数命令及相应参数设置实现的。如plot(x,y),plot为绘图函数命令,x,y则是绘图参数,指定了绘图的数据向量。但这种最基本的绘图设置很难满足个性化绘图的 ...
2017-05-25
数据分析方法之对比分析法类型 之前在数据分析方法一文中讲过了数据对比分析法,对比分析法的意义何在呢?企业在运营、管理、决策的过程中存在着很多不确定性,因此再利用数据分析进行生产决策,项目风险评估登 ...
2017-05-24
SPSS筛选聚类变量 聚类分析是常见的数据分析方法之一,主要用于市场细分、用户细分等领域。利用SPSS进行聚类分析时,用于参与聚类的变量决定了聚类的结果,无关变量有时会引起严重的错分,因此,筛选有效的聚类 ...
2017-05-24
Hadoop之HDFS与小文件 Hadoop有一个名为“HDFS”的分布式文件系统,它的设计目的是提供一个高容错,且能部署在廉价硬件的分布式系统;它的设计参照了Google的GFS(Google分布式文件系统);它能支持高吞吐量, ...
2017-05-24
Hadoop+Hive常用知识总结 1、什么是Hadoop?什么是hive? Hadoop:一个分布式系统基础架构,由Apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力告诉运算和存 ...
2017-05-24
Hadoop及其构成 玩计算机需要先装一个windows系统(或linux系统)。同样道理,玩大数据也要有个大数据系统,用于将数据汇聚起来,加以分析和处理,将其中有价值的信息分析出来,让人们认清事物的全局、预测未来 ...
2017-05-24Hadoop环境中管理大数据存储八大技巧 在现如今,随着IT互联网信息技术的飞速发展和进步。目前大数据行业也越来越火爆,从而导致国内大数据人才也极度缺乏,下面介绍一下关于Hadoop环境中管理大数据存储技巧。 ...
2017-05-24
SPSS详细操作:正态转换的多种方法 一、正偏态分布资料 1、轻度正偏态分布 偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,可以考虑对变量x取根号开平方的 ...
2017-05-23
在R中整理数据 原始数据一般分散杂乱,并含有缺失和错误值,因此在进行数据分析前首先要对数据进行整理。 一、首先,了解原始数据的结构。 可使用如下函数(归属baseR)来查看数据结构: class(dataobje ...
2017-05-23
SAS之DATA步运行机制 相信了解SAS软件的朋友都知道,SAS主要由DATA步和PROC步组成,其中DATA步作为数据读入、清洗、整理的主要程序步,学好DATA就显得尤为重要。而了解DATA步,重中之重就得了解PDV(Logical Pr ...
2017-05-23
SAS之大话PDV 之所以说是数据源,而非输入缓冲区的原因上一条推送已经说明,这里就不再啰嗦啦。 这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。 IF语句 & WHERE语句 这两个语 ...
2017-05-23
R读取MySQL数据出现乱码,解决该问题的方法总结 我用的都是utf-8编码,电脑系统win7, MySQL-Front进行数据库的可视化。 1、我用的是RStudio,先去设置R的默认编码: Tools→Global Options...→Code→Savin ...
2017-05-23
R的变量类型和常用函数 一、R的变量类型 也可以说是数据存储方式,有: Vector: 一维阵列 Matrics: 二维阵列,其中所有元素是同一数据类型。 factor: 种类变量,可使用levels函数来规定种类变量 ...
2017-05-23
SPSS统计分析案例:多层感知器神经网络 神经网络模型起源于对人类大脑思维模式的研究,它是一个非线性的数据建模工具, 由输入层和输出层、 一个或者多个隐藏层构成神经元,神经元之间的连接赋予相关的权重, 训 ...
2017-05-22
如何对数据排序和拆分文件 排序数据 对个案进行排序(排序数据文件的行)通常很有用,且有时对于某些类型的分析是十分必要的。根据一个或多个排序变量的值重新排序数据文件中个案的顺序: 从菜单中选择: ...
2017-05-22
SPSS统计基础---代码本 大家好,从今天开始,将逐步介绍SPSS各个统计方法菜单中每个选项的含义及使用。 码本报告活动数据集中所有或指定变量和多重响应集的字典信息(如变量名称、变量标签、值标签、缺失值 ...
2017-05-22
SPSS统计基础---描述功能的使用 “描述”过程为单个表中的若干变量显示单变量摘要统计量,并计算标准化值(z 得分)。变量可以按其均值(升序或降序)大小、按字母顺序或按您选择变量的顺序(缺省值)进行排序 ...
2017-05-22
SPSS统计基础---频率的使用 频率过程提供有助于描述多种类型的变量的统计量和图形显示。频率过程是查看数据理想的开始位置。对于频率报告和条形图,可以用升序或降序排列不同的值,也可以按其频率对类别进行排 ...
2017-05-22在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11在CDA(Certified Data Analyst)数据分析师的实操体系中,统计基本概念是不可或缺的核心根基,更是连接原始数据与业务洞察的关 ...
2026-02-11在数字经济飞速发展的今天,数据已成为核心生产要素,渗透到企业运营、民生服务、科技研发等各个领域。从个人手机里的浏览记录、 ...
2026-02-10在数据分析、实验研究中,我们经常会遇到小样本配对数据的差异检验场景——比如同一组受试者用药前后的指标对比、配对分组的两组 ...
2026-02-10在结构化数据分析领域,透视分析(Pivot Analysis)是CDA(Certified Data Analyst)数据分析师最常用、最高效的核心实操方法之 ...
2026-02-10在SQL数据库实操中,字段类型的合理设置是保证数据运算、统计准确性的基础。日常开发或数据分析时,我们常会遇到这样的问题:数 ...
2026-02-09在日常办公数据分析中,Excel数据透视表是最常用的高效工具之一——它能快速对海量数据进行分类汇总、分组统计,将杂乱无章的数 ...
2026-02-09表结构数据作为结构化数据的核心载体,其“获取-加工-使用”全流程,是CDA(Certified Data Analyst)数据分析师开展专业工作的 ...
2026-02-09在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06