cda

数字化人才认证

首页 > 行业图谱 >

智能“三反”模型开发

智能“三反”模型开发
2021-09-06
道——三类行为者的成本——收益分析 这次我们聊聊“违规识别”模型,在有的行里也被称为“三反”模型。这类模型的一个共同特点是获得明确标签(Y)的成本很高、主要特征提取自交易(有动帐)和行为(无动帐) ...

CDA LEVEL II 数据分析认证考试模拟题库(三十七)

CDA LEVEL II 数据分析认证考试模拟题库(三十七)
2021-06-18
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL II的模拟试题时间了,今天给大家带来的是模拟试题(二)中的41-45题。 不过,在出题前,要公布上一期LEVEL II中31-35题的答案,大家一起来看! 41.C ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2021-03-15
一、什么是机器学习 机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 一个计算机程序在完成了任务T之后,获得经验E,其表现效果为P,如 果任务T的性能表现,也就是用 ...
中国大数据算法大赛京东赛区冠军出炉 看京东如何玩转大数据
2018-07-22
中国大数据算法大赛京东赛区冠军出炉 看京东如何玩转大数据 7月19日,中国大数据算法大赛京东赛区——京东JDATA算法大赛决赛在京东总部举行,经过激烈角逐,Trident团队夺得大赛冠军,独得50万大奖。本次大赛是 ...

机器学习模型评价指标及R实现

机器学习模型评价指标及R实现
2018-06-02
机器学习模型评价指标及R实现 1.ROC曲线 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类( ...
机器学习中的非均衡分类问题
2018-04-09
机器学习中的非均衡分类问题 非均衡分类问题是指在分类器训练时,正例数目和反例数目不相等(相差很大),或者错分正反例导致的代价不同(可从代价矩阵观测)时存在的问题。 而大多数情况下,不同类别的分类 ...

R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解)

R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解)
2017-04-20
R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解) 与前面的RsowballC分词不同的地方在于这是一个中文的分词包,简单易懂,分词是一个非常重要的步骤,可以通过一些字典,进行特定分词。大致分析步骤如 ...

机器学习中的Accuracy,Precision,Recall和F1-Score

机器学习中的Accuracy,Precision,Recall和F1-Score
2017-03-18
机器学习中的Accuracy,Precision,Recall和F1-Score 在模式识别和信息检索领域,二分类的问题(binary classification)是常会遇到的一类问题。例如,银行的信用卡中心每天都会收到很多的信用卡申请,银行必 ...
对大数据的八大观点分析
2016-10-16
对大数据的八大观点分析 越来越多程序员也涌入大数据行业,但是仔细问一些从业人员什么是大数据?鲜有人知道?就算知道的,最常引用Victor的4V理论,大量(Volume),快速(Velocity),种类多(Variety),价值(Value) ...

数据挖掘与数据分析梳理

数据挖掘与数据分析梳理
2016-10-11
数据挖掘与数据分析梳理 一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: ...

2017校招数据分析岗位笔试/面试知识点

2017校招数据分析岗位笔试/面试知识点
2016-09-30
2017校招数据分析岗位笔试/面试知识点 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是 ...
《大数据的“道”“术”“释”》----读书摘录+思考
2016-09-28
《大数据的“道”“术”“释”》----读书摘录+思考 这本书是看到我老师的朋友圈推荐才买的,看了一下目录,比较喜欢。就认真的读了下去,这不是一本讲什么是大数据的书,而是一本为什么要用到大数据分析的书。 ...

以数据挖掘技术预测用户流失情况的方法

以数据挖掘技术预测用户流失情况的方法
2016-09-23
以数据挖掘技术预测用户流失情况的方法 所有网络服务及在线游戏的硬伤是什么?也就是游戏开始头几分钟或几小时内出现的大量用户流失情况。已经有不少人通过多种方式探索这个问题的解决之道,其中多由界面的易用 ...
中国大数据的发展以及商业价值
2016-09-16
中国大数据的发展以及商业价值 首先小编给你分享一个小故事介绍大数据入门是怎么一回事:以前有个国王很高兴想奖赏他的宠臣,然后说让他来提任何奖励,这个大臣给国王看下面这个棋盘,是个8*8的方格,如果我 ...
数据挖掘系列分类算法评价
2016-08-15
数据挖掘系列分类算法评价 一、引言 分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择 ...

R语言与分类算法的绩效评估

R语言与分类算法的绩效评估
2016-05-18
R语言与分类算法的绩效评估 关于分类算法我们之前也讨论过了KNN、决策树、naivebayes、SVM、ANN、logistic回归。关于这么多的分类算法,我们自然需要考虑谁的表现更加的优秀。 既然要对分类算法进行评价,那 ...
20个问题揭穿冒牌数据科学家
2016-05-12
20个问题揭穿冒牌数据科学家 如今数据科学家正式成为21世纪最性感的工作,人人都想来分一杯羹。 这也意味着会有一些冒牌货。这些人自称数据科学家,却不具有相应的技能。 这不见得是有意欺骗。数据科学是 ...

数据科学管理之道 关于管理数据科研团队的经验和教训

数据科学管理之道 关于管理数据科研团队的经验和教训
2016-04-22
数据科学管理之道 关于管理数据科研团队的经验和教训 当我初次到一家研究数据挖掘和机器学习的创业公司担任工程部副总裁时,其他高管都对这个问题感到好奇。他们知道,这是一支天赋异禀的团队,看上去也工作得 ...
揭穿冒牌数据科学家20个问题
2016-02-20
揭穿冒牌数据科学家20个问题 如今数据科学家正式成为21世纪最性感的工作,人人都想来分一杯羹。 这也意味着会有一些冒牌货。这些人自称数据科学家,却不具有相应的技能。 这不见得是有意欺骗。数据 ...

硅谷大数据的过去与未来

硅谷大数据的过去与未来
2016-01-31
硅谷大数据的过去与未来 在硅谷大家非常热情地谈创业谈机会,我也通过自己的一些观察和积累,看到了不少最近几年涌现的热门创业公司。这个是华尔街网站的全世界创业公司融资规模评选。它本来的标题是billion s ...

OK