cda

数字化人才认证

首页 > 行业图谱 >

如何做好大数据产品设计架构和技术策略

如何做好大数据产品设计架构和技术策略
2017-07-18
如何做好大数据产品设计架构和技术策略  经过研发多个大数据产品,将自己形成关于大数据知识体系的干货分享出来,希望给大家能够快速建立起大数据产品的体系思路,让大家系统性学习和了解有关大数据的设计架构 ...

SAS随机抽样以及程序初始环境

SAS随机抽样以及程序初始环境
2017-07-17
SAS随机抽样以及程序初始环境 在统计研究中,针对容量无限或者容量很大以至于无法直接对其进行研究的总体,都是通过从中抽取一部分个体作为研究对象,以考察总体的特征。被抽取的部分个体称为该总体的一个样本 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-07-13
“虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法,凸优化… 感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据 ...

SPSS大战多元回归分析

SPSS大战多元回归分析
2017-07-12
SPSS大战多元回归分析 使用多元回归进行数据分析,分析软件供选择的比较多,主要有Eviews、Spss、Stata、Sas、Gretel等。多元回归分析应用于各个领域,主要有经济、医学、农学等。今天小编为大家分享一篇SPSS大 ...

使用 IBM SPSS Modeler 进行数据挖掘之数据理解

使用 IBM SPSS Modeler 进行数据挖掘之数据理解
2017-07-06
使用 IBM SPSS Modeler 进行数据挖掘之数据理解 在数据挖掘项目中,数据理解常常不被重视。但其实数据理解在整个数据挖掘项目中扮演着非常重要的角色,可以说是整个项目的基石。在计算机领域有一句话,“Garbag ...

SPSS学习笔记之—两配对样本的非参数检验(Wilcoxon符号秩检验)

SPSS学习笔记之—两配对样本的非参数检验(Wilcoxon符号秩检验)
2017-07-05
SPSS学习笔记之—两配对样本的非参数检验(Wilcoxon符号秩检验) 一、概述 非参数检验对于总体分布没有要求,因而使用范围更广泛。对于两配对样本的非参数检验,首选Wilcoxon符号秩检验。它与配对样本t检验 ...

python将csv(中文)导入mysql数据库的简单代码

python将csv(中文)导入mysql数据库的简单代码
2017-07-04
python将csv(中文)导入mysql数据库的简单代码 使用PHP写的,源码我就不贴上来了,写的比较简单,先是读取了csv的第一行,根据这个创建了表格,然后再利用sql自带的语句 “load data infile....”将剩下的数据 ...

R语言实现分层抽样(Stratified Sampling)以iris数据集为例

R语言实现分层抽样(Stratified Sampling)以iris数据集为例
2017-07-02
R语言实现分层抽样(Stratified Sampling)以iris数据集为例 1.观察数据集 head(iris)   选取数据集中前6个数据,我们可以看出iris数据集一共有5个字段。 dim(iris)   iris数据集一 ...

R语言生存分析

R语言生存分析
2017-07-01
R语言生存分析 生存分析涉及预测当特定事件将要发生的时间。它也被称为故障时间分析,或死亡时间的分析。例如,预测天的人患有癌症将生存的数量和预测时间时机械系统是要失败。 在R中包名为 survival 是用来 ...

数据仓库的几个原则,让你避免“陷阱”

数据仓库的几个原则,让你避免“陷阱”
2017-06-30
数据仓库的几个原则,让你避免“陷阱” 想要数据粒度的合理性、模型的灵活性得到保证,并且能够适应未来的信息资源,需要遵守维度建模的一些原则。否则,很容易会遇到数据仓库障碍,并且把用户弄糊涂。 1.原 ...

SPSS数据标准化分析处理方法分析

SPSS数据标准化分析处理方法分析
2017-06-29
SPSS数据标准化分析处理方法分析 进行多元统计分析时,我们往往要收集不同量纲的数据,比如销售总额(万元),利润率(百分数)。这表现为变量在数量级和计量单位上的差别,从而使得各个变量之间不具有综合性, ...

8种常被忽视的SQL错误用法

8种常被忽视的SQL错误用法
2017-06-23
8种常被忽视的SQL错误用法 1. LIMIT 语句 分页查询是最常用的场景之一,但也通常也是最容易出问题的地方。比如对于下面简单的语句,一般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这 ...

大数据技术体系中的语义分析

大数据技术体系中的语义分析
2017-06-18
大数据技术体系中的语义分析 本文介绍了语义的相关概念、特征,指出语义分析技术在大数据挖掘中的重要性,并给出了示例。 一、什么是语义 在现实世界中,事物所代表的概念的含义,以及它与其他概念之间的 ...

大数据在价格认定工作中的运用前景浅析

大数据在价格认定工作中的运用前景浅析
2017-06-17
大数据在价格认定工作中的运用前景浅析 大数据的爆炸式增长在大容量、多样性和高增速方面,全面考验着我们的数据处理和分析能力,同时,也带来了获取更丰富、更深入和更准确地洞察市场行为的大量机会。关于数据 ...

使用R语言预测泰坦尼克号乘客生存率

使用R语言预测泰坦尼克号乘客生存率
2017-06-09
使用R语言预测泰坦尼克号乘客生存率 1912年4月10日,号称 “世界工业史上的奇迹”的豪华客轮泰坦尼克号开始了自己的处女航,从英国的南安普顿出发驶往美国纽约,4月14日晚,泰坦尼克号在北大西洋撞上冰山而倾覆 ...

13个真实世界情景中的数据科学应用

13个真实世界情景中的数据科学应用
2017-06-06
13个真实世界情景中的数据科学应用 现在让我们看看13个在真实世界情景下的例子,了解现代数据科学家可以帮助我们做些什么。这些例子将有助于你学习如何专注于一个问题和如何形式化一个问题,以及如何仔细评估所 ...

如何写出高性能SQL语句

如何写出高性能SQL语句
2017-06-03
如何写出高性能SQL语句 1、 首先要搞明白什么叫执行计划? 执行计划是数据库根据SQL语句和相关表的统计信息作出的一个查询方案,这个方案是由查询优化器自动分析产生的,比如一条SQL语句如果用来从一个 10万 ...

SQL优化经验总结34条

SQL优化经验总结34条
2017-06-03
SQL优化经验总结34条 我们要做到不但会写SQL,还要做到写出性能优良的SQL,以下为笔者学习、摘录、并汇总部分资料与大家分享! (1) 选择最有效率的表名顺序(只在基于规则的优化器中有效): ORACLE 的解 ...

Hadoop常见错误和处理方式

Hadoop常见错误和处理方式
2017-05-28
Hadoop常见错误和处理方式   常见问题及处理 mysql版本,必须是MYSQL5.1。 查询办法mysqladmin version 在建立hive数据库的时候,最好是:create database hive; oozie的数据库,同样:create ...

利用SQL查询扶贫对象医保报销比率的审计方法

利用SQL查询扶贫对象医保报销比率的审计方法
2017-05-27
利用SQL查询扶贫对象医保报销比率的审计方法 扶贫资金惠及贫困百姓的切身利益,主管部门多,资金实行逐级下拨,并且扶贫项目小而分散,主要在乡镇和农村实施。根据湖北省审计厅关于2017年扶贫审计工作方案的精 ...

OK