cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘基本任务

数据挖掘基本任务
2017-05-02
数据挖掘基本任务 数据挖掘主要做什么?换而言之,数据挖掘主要解决什么问题呢?这些问题,可以归结为数据挖掘的基本任务。 数据挖掘的基本任务包括分类与预测、聚类分析、关联规则、奇异值检测和智能推荐等 ...
【广州市策动商贸有限公司】招聘数据分析师
2017-05-01
【广州市策动商贸有限公司】招聘数据分析师 广州市策动商贸有限公司创办于2010年,是一家专注于女性塑身内衣产品的设计、研发、生产及销售的品牌运营企业,旗下全资拥有互联网塑身衣品牌“MOVEON慕风”。自公司创立 ...

R语言:异常值检验、离群点分析、异常值处理

R语言:异常值检验、离群点分析、异常值处理
2017-04-29
R语言:异常值检验、离群点分析、异常值处理 笔者寄语:异常值处理一般分为以下几个步骤:异常值检测、异常值筛选、异常值处理。其中异常值检测的方法主要有:箱型图、简单统计量(比如观察极值) 异常值处理 ...

「CDAS 在线」央企财会到数据分析师的华丽转变

「CDAS 在线」央企财会到数据分析师的华丽转变
2017-04-28
去年的CDAS 2016 第三届中国数据分析师行业峰会上,有一个比较特别的分论坛。这个论坛的嘉宾有些原本并不是业内人士,但经过一段时间的学习,他们成功转型,成为一名数据分析师。他们也有一个共同的身份—— CDA ...
【广州市申迪计算机系统有限公司】招聘数据分析师
2017-04-26
【广州市申迪计算机系统有限公司】招聘数据分析师 广州市申迪计算机系统有限公司于1998年10月在广州市创立,是一家专业从事计算机软件开发、系统集成和技术服务的民营企业,注册资金为3001万。已通过ISO9001:2008质 ...
【上海盛大小额贷款股份有限公司】招聘数据分析师
2017-04-17
【上海盛大小额贷款股份有限公司】招聘数据分析师 上海盛大小额贷款股份有限公司(简称:“盛大小贷”)系盛大集团控股子公司,成立于2015年8月,实缴注册资本2.5亿元,是经上海市政府、上海市金融办批准设立的首批 ...

一种基于数据挖掘的通用CRM系统框架及关键技术研究

一种基于数据挖掘的通用CRM系统框架及关键技术研究
2017-04-14
一种基于数据挖掘的通用CRM系统框架及关键技术研究 随着客户信息量的增加,客户与公司的关系变得越来越复杂,单纯操作性的客户关系管理CRM(Customer Relationship Management)已难以满足用户的需要。在CRM中 ...

大数据时代下的数据挖掘简析

大数据时代下的数据挖掘简析
2017-04-12
大数据时代下的数据挖掘简析 随着大数据的兴起,隐藏在大数据背后的相关技术也逐渐被揭开神秘的面纱,其中,数据挖掘即是大数据应用过程中非常重要的环节。以下是国内领先的移动大数据服务商极光大数据的副总裁 ...
谷歌微软等科技巨头数据科学岗位面试题(108道)
2017-04-05
来自 Glassdoor 的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。由于 Glassdoor 允许匿名提交内容,很 ...

SAS数组的使用

SAS数组的使用
2017-04-03
SAS数组的使用 今天呢本想写个基于信息增益的决策树算法,突然发现把数组的使用方法给忘记了,那今天借介绍下SAS中数组的使用吧。 SAS把一组同为数值型或同为字符型的变量合在一起,使用同一个名字称呼 ...

从模型选择到超参调整,六步教你如何为机器学习项目选择算法

从模型选择到超参调整,六步教你如何为机器学习项目选择算法
2017-04-01
从模型选择到超参调整,六步教你如何为机器学习项目选择算法 随着机器学习的进一步火热,越来越多的算法已经可以用在许多任务的执行上,并且表现出色。 但是动手之前到底哪个算法可以解决我们特定的实际问 ...

sas信用评分之变量筛选

sas信用评分之变量筛选
2017-03-30
sas信用评分之变量筛选 今天介绍变量初步选择。这部分的内容我就只介绍information –value,我这次做的模型用的逻辑回归,后面会更新以基尼系数或者信息熵基础的筛选变量,期待我把。 Iv值的介绍你们已经很 ...

简单易学的机器学习算法—AdaBoost

简单易学的机器学习算法—AdaBoost
2017-03-28
简单易学的机器学习算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting两种方法,随机森林算法是基于Bagging思想的机器学习算法,在Bagging方法中,主要通过对训练数据集 ...

简单易学的机器学习算法—集成方法(Ensemble Method)

简单易学的机器学习算法—集成方法(Ensemble Method)
2017-03-28
简单易学的机器学习算法—集成方法(Ensemble Method) 一、集成学习方法的思想 前面介绍了一系列的算法,每个算法有不同的适用范围,例如有处理线性可分问题的,有处理线性不可分问题。在现实世界的生活中, ...

sas字符变量基于iv值的最优分类

sas字符变量基于iv值的最优分类
2017-03-27
sas字符变量基于iv值的最优分类 1.IV的用途 IV的全称是Information Value,中文意思是信息价值,或者信息量。 我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如 ...

如何快速搭建一篇数据化运营的大纲?

如何快速搭建一篇数据化运营的大纲?
2017-03-23
于是我希望,在七周成为数据分析师的系列后,把数据化运营作为第二个系列来完成。每次写文章,对自己也是一种总结和提升。 下面是一份「简略」的大纲,更恰当地说是草稿。当不久的将来开始正式写 ...

简单易学的机器学习算法—分类回归树CART

简单易学的机器学习算法—分类回归树CART
2017-03-22
简单易学的机器学习算法—分类回归树CART 分类回归树(Classification and Regression Tree,CART)是一种典型的决策树算法,CART算法不仅可以应用于分类问题,而且可以用于回归问题。 一、树回归的概念   ...

从曲线拟合问题窥视机器学习中的相关概念

从曲线拟合问题窥视机器学习中的相关概念
2017-03-20
从曲线拟合问题窥视机器学习中的相关概念 一直徘徊在机器学习的边缘未敢轻易造次并畏惧其基本原理思想,从每一本厚厚的参考资料中都可以看出机器学习是一门跨越概率论、决策论、信息论以及最优化的学科的综合学 ...

数据挖掘十大算法之Apriori详解

数据挖掘十大算法之Apriori详解
2017-03-17
数据挖掘十大算法之Apriori详解 有时候,人们会对机器学习与数据挖掘这两个名词感到困惑。如果你翻开一本冠以机器学习之名的教科书,再同时翻开一本名叫数据挖掘的教材,你会发现二者之间有相当多重合的内容。 ...

数据挖掘十大算法之CART详解

数据挖掘十大算法之CART详解
2017-03-16
数据挖掘十大算法之CART详解 CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将 ...

OK