cda

数字化人才认证

首页 > 行业图谱 >

用R语言实现对不平衡数据的四种处理方法

用R语言实现对不平衡数据的四种处理方法
2016-09-07
用R语言实现对不平衡数据的四种处理方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。那么,这种结果是为何发生的呢?到底是什 ...

数据挖掘工程师笔试及答案整理

数据挖掘工程师笔试及答案整理
2021-02-03
数据挖掘工程师笔试及答案整理 2013百度校园招聘数据挖掘工程师 《数据分析专项练习题库》 《CDA数据分析认证考试模拟题库》 《企业数据分析面试题库》 一、简答题(30分) 1、简述数据 ...

大数据的道、术、释

大数据的道、术、释
2016-07-09
大数据的道、术、释 大数据的 本质是对效率的提升,是对精细化的追求。一上来就讲到了大数据本质,有别于其他知识类的书籍。这本书更多的是从哲学思考的角度来组织“道”与“术”这两部 分的。前言部分就提到了 ...

 Spark 文本情感分析

Spark 文本情感分析
2016-06-08
本文描述了一个基于 Spark 构建的认知系统:文本情感分析系统,分析和理解社交论坛的非结构化文本数据。 基于 Spark 的文本情感分析 文本情感分析是指对具有人为主观情感色彩文本材料进行处理、分 ...

大数据架构师必读的NoSQL建模技术

大数据架构师必读的NoSQL建模技术
2016-06-07
大数据架构师必读的NoSQL建模技术 从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术。 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企业平台完全不同 ...

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林
2016-04-20
WePay机器学习反欺诈实践:Python+scikit-learn+随机森林 什么是shell selling? 虽然欺诈几乎涉及各种领域,但相对于传统的买方或卖方仅仅担心对方是否是骗子,支付平台需要担心的是交易双方。如果其中任何 ...

以性别预测为例,谈谈数据挖掘中的分类问题

以性别预测为例,谈谈数据挖掘中的分类问题
2016-03-02
以性别预测为例,谈谈数据挖掘中的分类问题 互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘 ...

数据分析:数据分析师的30种死法

数据分析:数据分析师的30种死法
2016-02-23
数据分析:数据分析师的30种死法 以下内容仅供大家会心一笑,与现实无关,如有对号入座者,我也不认账…… 1.项目来了,发现找不到数据,卒。 2.找开发同学帮忙取数,一个月的项目排期要等三个 ...

R语言中的情感分析与机器学习

R语言中的情感分析与机器学习
2016-02-14
来源 | 雪晴数据网 利用机器学习可以很方便的做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由Timothy P.Jurka开发的情感分析以及更一般的文本挖掘包已经 ...

揭秘:京东双十一商品搜索系统架构设计

揭秘:京东双十一商品搜索系统架构设计
2016-02-12
揭秘:京东双十一商品搜索系统架构设计 每年的双十一,都是电商促销大战,我们只看到了各类商品的优惠价格,而没有看到默默付出的技术人员(数据分析师,前端,推广人员)等等。他们为了更好更加人性化体现出自 ...

CDA题库-数据分析练习题3

CDA题库-数据分析练习题3
2021-02-03
《数据分析专项练习题库》 《CDA数据分析认证考试模拟题库》 《企业数据分析面试题库》 76.下表是一个购物篮,假定支持度阈值为40%,其中__(A D)__是频繁闭项集。   TID 项 ...
常用的机器学习&数据挖掘知识(点)
2015-12-20
常用的机器学习&数据挖掘知识(点) Basis(基础): MSE(Mean Square Error 均方误差), LMS(LeastMean Square 最小均方), LSM(Least Square Methods 最小二乘法), MLE(MaximumLike ...

基于R语言和SPSS的决策树算法介绍及应用

基于R语言和SPSS的决策树算法介绍及应用
2015-10-13
基于R语言和SPSS的决策树算法介绍及应用 机器学习在各个领域都有广泛的应用,特别在数据分析领域有着深远的影响。决策树是机器学习中最基础且应用最广泛的算法模型。本文介绍了机器学习的相关概念、常见 ...
数据挖掘150道试题 测测你的专业能力过关吗
2015-07-26
数据挖掘150道试题 测测你的专业能力过关吗 大数据技术Hadoop面试题,看看你能答对多少?答案在后面 单选题 1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类 ...
数据挖掘在电信欺诈侦测中的应用_数据分析师考试
2015-07-20
数据挖掘在电信欺诈侦测中的应用_数据分析师考试 随着移动业务的迅猛发展,移动通信业的收入日益增长。但是,随之而来的移动网络的欺诈行为也不断涌现,全球移动通信业都广泛面临着无线欺诈的严重问题, ...
数据挖掘150道试题 测测你的专业能力过关吗(2)_数据分析师培训
2015-03-19
数据挖掘150道试题 测测你的专业能力过关吗(2)_数据分析师培训 56. 如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为(C); A, 无序规则 B,穷举规则 C, 互斥规则 D,有序规则 57. ...

商务智能最大的挑战不是来自大数据

商务智能最大的挑战不是来自大数据
2015-01-30
商务智能最大的挑战不是来自大数据 要想从商务智能中获取最大的价值,就需要强大的数据治理能力,这往往从数据定义开始。 IT咨询师Wayne Eckerson说到,诚然,我们处在大数据时代,但从我接触的客户来 ...
探寻微博背后的大数据原理:微博推荐算法简述
2015-01-03
探寻微博背后的大数据原理:微博推荐算法简述 “We are leaving the age of information and entering the age of recommendation” — Chris Anderson in The Long Tail。 我们正在远离信息,而 ...

微博背后的大数据算法探寻:微博推荐算法简述

微博背后的大数据算法探寻:微博推荐算法简述
2014-09-02
      当今,大数据时代,探寻微博背后的大数据算法,在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的 ...

OK