CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

数据分析需要权衡哪些要素

数据分析需要权衡哪些要素
2017-12-09
数据分析需要权衡哪些要素 无论一个公司部署什么类型的大数据技术栈,有一些共通的因素必须加以考量,以保证为大数据分析工作提供一个有效的框架。在开始一个大数据项目之前,去审视项目所要承担的新数据需求的 ...

大数据分析之聚类算法

大数据分析之聚类算法
2017-12-09
大数据分析之聚类算法 1. 什么是聚类算法 所谓聚类,就是比如给定一些元素或者对象,分散存储在数据库中,然后根据我们感兴趣的对象属性,对其进行聚集,同类的对象之间相似度高,不同类之间差异较大。最大 ...

Python实现桶排序与快速排序算法结合应用示例

Python实现桶排序与快速排序算法结合应用示例
2017-12-09
Python实现桶排序与快速排序算法结合应用示例 本文实例讲述了Python实现桶排序与快速排序算法结合应用的方法。分享给大家供大家参考,具体如下: #-*- coding: UTF-8 -*- import numpy as np from QuickSort i ...
Python实现快速排序和插入排序算法及自定义排序的示例
2017-12-08
Python实现快速排序和插入排序算法及自定义排序的示例 这篇文章主要介绍了Python实现快速排序和插入排序算法及自定义排序的示例,自定义排序用到了Python的sort和sorted函数,需要的朋友可以参考下 一、快速排 ...

SPSS OR 值与 RR 值

SPSS OR 值与 RR 值
2017-12-08
SPSS OR 值与 RR 值 在临床研究中,常常有OR、RR值,表示某因素对病情的影响程度。 那么什么是 OR 值?什么是 RR 值呢?以及他们之间的区别到底是什么呢? 下面学习一下Odds、OR、RR的概念: Odds: 称为比 ...

Python基于回溯法子集树模板解决最佳作业调度问题示例

Python基于回溯法子集树模板解决最佳作业调度问题示例
2017-12-08
Python基于回溯法子集树模板解决最佳作业调度问题示例 本文实例讲述了Python基于回溯法子集树模板解决最佳作业调度问题。分享给大家供大家参考,具体如下: 问题 给定 n 个作业,每一个作业都有两项子任 ...

SPSS重复测量的多因素方差分析

SPSS重复测量的多因素方差分析
2017-12-08
SPSS重复测量的多因素方差分析 一、概述 重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后,分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察 ...
Python中的一些陷阱与技巧小结
2017-12-08
Python中的一些陷阱与技巧小结 Python是一种被广泛使用的强大语言,让我们深入这种语言,并且学习一些控制语句的技巧,标准库的窍门和一些常见的陷阱。 Python(和它的各种库)非常庞大。它被用于系统自动化、w ...
Python实现快速排序算法及去重的快速排序的简单示例
2017-12-07
Python实现快速排序算法及去重的快速排序的简单示例 quick sort快速排序是一种再基础不过的排序算法,使用Python代码写起来相当简洁,这里我们就来看一下Python实现快速排序算法及去重的快速排序的简单示例: ...
Python实现通过文件路径获取文件hash值的方法
2017-12-07
Python实现通过文件路径获取文件hash值的方法 本文实例讲述了Python实现通过文件路径获取文件hash值的方法。分享给大家供大家参考,具体如下: import hashlib import os,sys def CalcSha1(filepath): with o ...
R语言线性回归预测网页流量
2017-12-07
R语言线性回归预测网页流量 回归是用已知的数据集来预测另一个数据集,如保险精算师也许想在已知人们吸烟习惯的基础上预测其寿命。回归模型的输出是数字。 1、基准模型 如果我们要在不使用其他任何信息的情况下 ...

如何实现降维处理(R语言)

如何实现降维处理(R语言)
2017-12-07
如何实现降维处理(R语言) 现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加 ...
Python通过递归遍历出集合中所有元素的方法
2017-12-07
Python通过递归遍历出集合中所有元素的方法 本文实例讲述了Python通过递归遍历出集合中所有元素的方法。分享给大家供大家参考。具体实现方法如下: 代码如下: \'\'\'\'\'通过递归遍历出集合中的所有元素 ...

R语言之随机数与抽样模拟篇

R语言之随机数与抽样模拟篇
2017-12-06
R语言之随机数与抽样模拟篇 R语言生成均匀分布随机数的函数是runif() 句法是:runif(n,min=0,max=1) n表示生成的随机数数量,min表示均匀分布的下限,max表示均匀分布的上限;若省略参数min、max,则默认 ...
R语言中样本平衡的几种方法
2017-12-06
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

数据缺失值的4种处理方法

数据缺失值的4种处理方法
2017-12-06
数据缺失值的4种处理方法 一、缺失值产生的原因 缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器 ...
python使用递归解决全排列数字示例
2017-12-06
python使用递归解决全排列数字示例 有1,2,3,4这4个数字,能组成多少个互不相同且无重复数字的三位数,下面是二种解决示例,需要的朋友可以参考下 第一种方法:递归 代码如下: def perms(elements): if ...
python中尾递归用法实例详解
2017-12-06
python中尾递归用法实例详解 本文实例讲述了python中尾递归用法。分享给大家供大家参考。具体分析如下: 如果一个函数中所有递归形式的调用都出现在函数的末尾,我们称这个递归函数是尾递归的。当递归调用是 ...
Python递归遍历列表及输出的实现方法
2017-12-06
Python递归遍历列表及输出的实现方法 本文实例讲述了Python递归遍历列表及输出的实现方法。分享给大家供大家参考。具体实现方法如下: def dp(s): if isinstance(s,(int,str)): print(s) else: for item i ...
Python复制文件操作实例详解
2017-12-05
Python复制文件操作实例详解 本文实例讲述了Python复制文件操作用法。分享给大家供大家参考,具体如下: 这里用python实现了一个小型的自动发版本的工具。这个“自动发版本”有点虚, 只是简单地把debug 目录下 ...

OK