CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

R语言在生态学研究中的应用分析

R语言在生态学研究中的应用分析
2017-06-09
R语言在生态学研究中的应用分析 随着观测手段的不断进步和长期观测数据的不断积累,加上数据共享机制不断完善,生态学研究已经跨入的大数据的时代。面对巨量的原始数据,一个生态学者需要运用相当可观的数学知 ...

R语言做数据探索

R语言做数据探索
2017-06-09
R语言做数据探索 1 数据导入 数据常用格式.csv/.txt/.xls/.json/.xml。 R语言提供相应的函数和库实现对这些数据格式的导入。 现已导入.csv格式和以tab分隔的.txt格式为例 # 读.csv格式 data1<-read.c ...

SPSS统计基础-交叉表功能的使用

SPSS统计基础-交叉表功能的使用
2017-06-08
SPSS统计基础-交叉表功能的使用 交叉表过程形成二阶和多阶表,并提供了各种二阶表关联检验和度量。表的结构以及类别是否排序决定了要使用的检验或度量。 仅对二阶表计算交叉表关联统计量和度量。如果指定一 ...

SPSS统计基础-均值功能的使用

SPSS统计基础-均值功能的使用
2017-06-08
SPSS统计基础-均值功能的使用 均值过程计算一个或多个自变量类别中因变量的子组均值和相关的单变量统计。您也可以获得单因素方差分析、eta 和线性相关检验。 统计量。合计、个案数、均值、中位数、组内中位 ...

SPSS统计基础-单因素方差分析功能的使用

SPSS统计基础-单因素方差分析功能的使用
2017-06-08
SPSS统计基础-单因素方差分析功能的使用 “单因素ANOVA”过程按照单因子变量(自变量)生成对定量因变量的单因素方差分析。方差分析用于检验数个均值相等的假设。这种方法是双样本t 检验的扩展。除了确定均值间 ...

SQL语句基础

SQL语句基础
2017-06-08
SQL语句基础 SQL是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。这次为大家讲述一些基本的,常用的SQL语句基本句法,这四个方面之间没有前后顺 ...
在云中部署SQL的五个技巧
2017-06-08
在云中部署SQL的五个技巧 对于许多组织来说,将应用程序迁移到云端可以容忍短暂的停机时间,因为会得到明确的好处。采用云计算看起来就像一个明智周全的投资,通常很容易找出成本理由。然而,人们关于如何在云 ...

SQL注入攻防入门详解

SQL注入攻防入门详解
2017-06-08
SQL注入攻防入门详解 这几天把sql注入的相关知识整理了下,希望大家多多提意见。(对于sql注入的攻防,我只用过简单拼接字符串的注入及参数化查询,可以说没什么好经验,为避免后知后觉的犯下大错,专门查看大 ...

数据分析方法:非参数检验

数据分析方法:非参数检验
2017-06-07
数据分析方法:非参数检验 对于分布形态未知的数据,常用处理方法如下: 判断数据序列的分布形态 以标准的正态分布形态为基准,检验数据序列与正态序列是否存在分布差异性,这里可以用单样本的K-S检验,如 ...

通过数据挖掘组织营销潜力的三个重要途径

通过数据挖掘组织营销潜力的三个重要途径
2017-06-07
通过数据挖掘组织营销潜力的三个重要途径 如今,所有的营销都是在数据的背后完成的。营销人员知道他们的决定和行动必须有原始数据支持的理由。每天在全球网络上产生大约2.5万亿字节的数据。它来自各种来源,如 ...

R语言实现Xbar-R控制图

R语言实现Xbar-R控制图
2017-06-07
R语言实现Xbar-R控制图 Xbar-R控制图在质量管理中主要用于对计量数据进行检测,以达到控制对象质量的目的。 虽然用Excel可以轻松实现控制图的操作,不过作为R软件初学者,我试着用仅有的一点R语言知识进行了 ...

R语言绘图之页面布局

R语言绘图之页面布局
2017-06-07
R语言绘图之页面布局 par()、layout()、split.screen()函数 1. par()函数的参数详解 函数par()可以用来设置或者获取图形参数,par()本身(括号中不写任何参数)返回当前的图形参数设置(一个list);若要 ...
R语言中样本平衡的几种方法
2017-06-07
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

数据科学家与数据工程师

数据科学家与数据工程师
2017-06-06
数据科学家与数据工程师 数据科学家和数据工程师的主要区别,可以用ETL和DAD的区别来解释。 ETL(提取/变换/载入)是数据工程师,还有数据架构师或数据库管理员(DBA)的职责。 DAD(发现/获取/提炼)是数据科 ...

SAS中最最最实用的5个字符串处理函数

SAS中最最最实用的5个字符串处理函数
2017-06-06
SAS中最最最实用的5个字符串处理函数 本文将介绍SAS中处理字符串时最常用的5个函数: 1. SUBSTR函数:用以提取或替换特定位置的字符 2. TRANWRD函数:用以替换特定字符 3. TRANSLATE函数:用以替换字符 ...

数据科学的七种常见错误丨转行,你适合数据科学吗

数据科学的七种常见错误丨转行,你适合数据科学吗
2017-06-06
数据科学的七种常见错误丨转行,你适合数据科学吗 商业领域的数据科学家其实和侦探有着异曲同工之处,就是要去探索未知。不过在这过程中可能一不小心就会坠入“陷阱”,所以这就需要去了解和避免这些“陷阱”。 ...

机器学习及大数据相关面试的职责和面试问题

机器学习及大数据相关面试的职责和面试问题
2017-06-06
机器学习及大数据相关面试的职责和面试问题 各个企业对这类岗位的命名可能有所不同,比如推荐算法/数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入 ...

Hadoop文件系统

Hadoop文件系统
2017-06-06
Hadoop文件系统 Hadoop是用Java写的,本小节要深入探索Hadoop的FileSystem类,与Hadoop的某一文件系统进行交互的API。虽然主要关注的是HDFS的实例,即DistributedFileSystem,但总体来说,还是应该集成FileSyst ...

从HadoopURL中读取数据

从HadoopURL中读取数据
2017-06-06
从HadoopURL中读取数据 要从Hadoop文件系统中读取文件,最简单的方法是使用java.net.URL对象打开数据流,进而从中读取数据。具体格式如下。 InputStreamin=null; try{ in=new URL(“hdfs://host/path”).o ...

如何使用Python处理Missing Data

如何使用Python处理Missing Data
2017-06-05
如何使用Python处理Missing Data 现实世界的数据中常常包含缺失的数据。原因很多,比如观察结果没有记录,或数据损坏。处理缺失的数据很重要,因为许多机器学习算法不支持具有缺失值的数据库。 本教 ...

OK