SPSSModeler中数据测量类型的含义 数据测量类型 查看IBM SPSS Modeler 帮助文档,解释如下: • 默认值。具有未知存储类型和值的数据(例如,由于其尚未被读取)将 ...
2017-05-25
详解反向传播算法 反向传播算法(Backpropagation)已经是神经网络模型进行学习的标配。但是有很多问题值得思考一下: 反向传播算法的作用是什么?神经网络模型的学习算法一般是SGD。SGD需要用到损失函数C ...
2017-05-25
R语言绘图—图形标题、坐标轴设置 R语言绘图是通过函数命令及相应参数设置实现的。如plot(x,y),plot为绘图函数命令,x,y则是绘图参数,指定了绘图的数据向量。但这种最基本的绘图设置很难满足个性化绘图的 ...
2017-05-25
数据分析方法之对比分析法类型 之前在数据分析方法一文中讲过了数据对比分析法,对比分析法的意义何在呢?企业在运营、管理、决策的过程中存在着很多不确定性,因此再利用数据分析进行生产决策,项目风险评估登 ...
2017-05-24
SPSS筛选聚类变量 聚类分析是常见的数据分析方法之一,主要用于市场细分、用户细分等领域。利用SPSS进行聚类分析时,用于参与聚类的变量决定了聚类的结果,无关变量有时会引起严重的错分,因此,筛选有效的聚类 ...
2017-05-24
Hadoop之HDFS与小文件 Hadoop有一个名为“HDFS”的分布式文件系统,它的设计目的是提供一个高容错,且能部署在廉价硬件的分布式系统;它的设计参照了Google的GFS(Google分布式文件系统);它能支持高吞吐量, ...
2017-05-24
Hadoop+Hive常用知识总结 1、什么是Hadoop?什么是hive? Hadoop:一个分布式系统基础架构,由Apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力告诉运算和存 ...
2017-05-24
Hadoop及其构成 玩计算机需要先装一个windows系统(或linux系统)。同样道理,玩大数据也要有个大数据系统,用于将数据汇聚起来,加以分析和处理,将其中有价值的信息分析出来,让人们认清事物的全局、预测未来 ...
2017-05-24Hadoop环境中管理大数据存储八大技巧 在现如今,随着IT互联网信息技术的飞速发展和进步。目前大数据行业也越来越火爆,从而导致国内大数据人才也极度缺乏,下面介绍一下关于Hadoop环境中管理大数据存储技巧。 ...
2017-05-24
SPSS详细操作:正态转换的多种方法 一、正偏态分布资料 1、轻度正偏态分布 偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,可以考虑对变量x取根号开平方的 ...
2017-05-23
在R中整理数据 原始数据一般分散杂乱,并含有缺失和错误值,因此在进行数据分析前首先要对数据进行整理。 一、首先,了解原始数据的结构。 可使用如下函数(归属baseR)来查看数据结构: class(dataobje ...
2017-05-23
SAS之DATA步运行机制 相信了解SAS软件的朋友都知道,SAS主要由DATA步和PROC步组成,其中DATA步作为数据读入、清洗、整理的主要程序步,学好DATA就显得尤为重要。而了解DATA步,重中之重就得了解PDV(Logical Pr ...
2017-05-23
SAS之大话PDV 之所以说是数据源,而非输入缓冲区的原因上一条推送已经说明,这里就不再啰嗦啦。 这里我们且将DATA步流程简单地分为从数据源读入到pdv和从pdv写入数据集。 IF语句 & WHERE语句 这两个语 ...
2017-05-23
R读取MySQL数据出现乱码,解决该问题的方法总结 我用的都是utf-8编码,电脑系统win7, MySQL-Front进行数据库的可视化。 1、我用的是RStudio,先去设置R的默认编码: Tools→Global Options...→Code→Savin ...
2017-05-23
R的变量类型和常用函数 一、R的变量类型 也可以说是数据存储方式,有: Vector: 一维阵列 Matrics: 二维阵列,其中所有元素是同一数据类型。 factor: 种类变量,可使用levels函数来规定种类变量 ...
2017-05-23
SPSS统计分析案例:多层感知器神经网络 神经网络模型起源于对人类大脑思维模式的研究,它是一个非线性的数据建模工具, 由输入层和输出层、 一个或者多个隐藏层构成神经元,神经元之间的连接赋予相关的权重, 训 ...
2017-05-22
如何对数据排序和拆分文件 排序数据 对个案进行排序(排序数据文件的行)通常很有用,且有时对于某些类型的分析是十分必要的。根据一个或多个排序变量的值重新排序数据文件中个案的顺序: 从菜单中选择: ...
2017-05-22
SPSS统计基础---代码本 大家好,从今天开始,将逐步介绍SPSS各个统计方法菜单中每个选项的含义及使用。 码本报告活动数据集中所有或指定变量和多重响应集的字典信息(如变量名称、变量标签、值标签、缺失值 ...
2017-05-22
SPSS统计基础---描述功能的使用 “描述”过程为单个表中的若干变量显示单变量摘要统计量,并计算标准化值(z 得分)。变量可以按其均值(升序或降序)大小、按字母顺序或按您选择变量的顺序(缺省值)进行排序 ...
2017-05-22
SPSS统计基础---频率的使用 频率过程提供有助于描述多种类型的变量的统计量和图形显示。频率过程是查看数据理想的开始位置。对于频率报告和条形图,可以用升序或降序排列不同的值,也可以按其频率对类别进行排 ...
2017-05-22机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19