数据分析师技术_数据分析技术_数据分析培训

SPSS统计基础-单因素方差分析功能的使用

SPSS统计基础-单因素方差分析功能的使用 “单因素ANOVA”过程按照单因子变量（自变量）生成对定量因变量的单因素方差分析。方差分析用于检验数个均值相等的假设。这种方法是双样本t 检验的扩展。除了确定均值间 ...

2017-06-08

SQL语句基础

SQL语句基础 SQL是一种特殊目的的编程语言，是一种数据库查询和程序设计语言，用于存取数据以及查询、更新和管理关系数据库系统。这次为大家讲述一些基本的，常用的SQL语句基本句法，这四个方面之间没有前后顺 ...

2017-06-08

在云中部署SQL的五个技巧

在云中部署SQL的五个技巧对于许多组织来说，将应用程序迁移到云端可以容忍短暂的停机时间，因为会得到明确的好处。采用云计算看起来就像一个明智周全的投资，通常很容易找出成本理由。然而，人们关于如何在云 ...

2017-06-08

SQL注入攻防入门详解

SQL注入攻防入门详解这几天把sql注入的相关知识整理了下，希望大家多多提意见。（对于sql注入的攻防，我只用过简单拼接字符串的注入及参数化查询，可以说没什么好经验，为避免后知后觉的犯下大错，专门查看大 ...

2017-06-08

数据分析方法:非参数检验

数据分析方法:非参数检验对于分布形态未知的数据，常用处理方法如下：判断数据序列的分布形态以标准的正态分布形态为基准，检验数据序列与正态序列是否存在分布差异性，这里可以用单样本的K-S检验，如 ...

2017-06-07

通过数据挖掘组织营销潜力的三个重要途径

通过数据挖掘组织营销潜力的三个重要途径如今，所有的营销都是在数据的背后完成的。营销人员知道他们的决定和行动必须有原始数据支持的理由。每天在全球网络上产生大约2.5万亿字节的数据。它来自各种来源，如 ...

2017-06-07

R语言实现Xbar-R控制图

R语言实现Xbar-R控制图 Xbar-R控制图在质量管理中主要用于对计量数据进行检测，以达到控制对象质量的目的。虽然用Excel可以轻松实现控制图的操作，不过作为R软件初学者，我试着用仅有的一点R语言知识进行了 ...

2017-06-07

R语言绘图之页面布局

R语言绘图之页面布局 par()、layout()、split.screen()函数 1. par()函数的参数详解函数par()可以用来设置或者获取图形参数，par()本身（括号中不写任何参数）返回当前的图形参数设置（一个list）；若要 ...

2017-06-07

R语言中样本平衡的几种方法

R语言中样本平衡的几种方法在对不平衡的分类数据集进行建模时，机器学习算法可能并不稳定，其预测结果甚至可能是有偏的，而预测精度此时也变得带有误导性。在不平衡的数据中，任一算法都没法从样本量少的类中 ...

2017-06-07

数据科学家与数据工程师

数据科学家与数据工程师数据科学家和数据工程师的主要区别，可以用ETL和DAD的区别来解释。 ETL(提取/变换/载入)是数据工程师，还有数据架构师或数据库管理员(DBA)的职责。 DAD(发现/获取/提炼)是数据科 ...

2017-06-06

数据科学的七种常见错误丨转行，你适合数据科学吗

数据科学的七种常见错误丨转行，你适合数据科学吗商业领域的数据科学家其实和侦探有着异曲同工之处，就是要去探索未知。不过在这过程中可能一不小心就会坠入“陷阱”，所以这就需要去了解和避免这些“陷阱”。 ...

2017-06-06

机器学习及大数据相关面试的职责和面试问题

机器学习及大数据相关面试的职责和面试问题各个企业对这类岗位的命名可能有所不同，比如推荐算法/数据挖掘/自然语言处理/机器学习算法工程师，或简称算法工程师，还有的称为搜索/推荐算法工程师，甚至有的并入 ...

2017-06-06

Hadoop文件系统

Hadoop文件系统 Hadoop是用Java写的，本小节要深入探索Hadoop的FileSystem类，与Hadoop的某一文件系统进行交互的API。虽然主要关注的是HDFS的实例，即DistributedFileSystem，但总体来说，还是应该集成FileSyst ...

2017-06-06

从HadoopURL中读取数据

从HadoopURL中读取数据要从Hadoop文件系统中读取文件，最简单的方法是使用java.net.URL对象打开数据流，进而从中读取数据。具体格式如下。 InputStreamin=null; try{ in=new URL(“hdfs://host/path”).o ...

2017-06-06

如何使用Python处理Missing Data

如何使用Python处理Missing Data 现实世界的数据中常常包含缺失的数据。原因很多，比如观察结果没有记录，或数据损坏。处理缺失的数据很重要，因为许多机器学习算法不支持具有缺失值的数据库。本教 ...

2017-06-05

Python机器学习实战：信用卡欺诈检测

Python机器学习实战：信用卡欺诈检测故事背景：原始数据为个人交易记录，但是考虑数据本身的隐私性，已经对原始数据进行了类似PCA的处理，现在已经把特征数据提取好了，接下来的目的就是如何建立模型使得检测 ...

2017-06-05

SPSS统计分析案例：可视离散化

SPSS统计分析案例：可视离散化 SPSS可视离散化 1、菜单操作：转换—可视离散化—弹出对话框； 2、可以看到这组年龄数据的总体分布情况，这个方法最大的优点在于，可以根据实际情况进行自定义分组，每个分 ...

2017-06-05

Python文本处理2个小案例（文本嗅探与关键词占比统计）

Python文本处理2个小案例（文本嗅探与关键词占比统计）问题描述：有一些句子和一些关键词，现在想找出包含至少一个关键词的那些句子（文本嗅探），可以参考print(\'=\'*30)之前的代码。如果想进一步计算 ...

2017-06-05

SPSS分析技术：非线性回归；非线性回归与曲线直线化有哪些异同点及优劣势

SPSS分析技术：非线性回归；非线性回归与曲线直线化有哪些异同点及优劣势本文介绍的非线性回归就是针对以上更为复杂的问题而提出的一个通用的模型框架，它采用迭代方法对用户设置的各种复杂曲线模型进行拟合， ...

2017-06-05

10个基于JavaScript的机器学习实例

10个基于JavaScript的机器学习实例随着人工智能技术的发展，机器学习越来越受到开发者们的关注，从而也导致了机器学习库如雨后春笋般的涌现出来，而且没有任何放缓的趋势。虽然，传统意义上 Python 已 ...

2017-06-05

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】OSM指标体系：自上而下拆解逻辑、搭建流 ...

【CDA干货】选择统计方法前最重要的核心工作：避免9 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

【CDA干货】问卷效度高与后续因子分析：逻辑关系、 ...

CDA持证人专访：唐一楠谈应届生数据分析就业与学习 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...