cda

数字化人才认证

首页 > 行业图谱 >

机器学习中容易犯的错误——不注重样本精细化处理

机器学习中容易犯的错误——不注重样本精细化处理
2019-04-02
接触过机器学习的朋友应该知道,样本是机器学习模型的核心,这是因为样本直接关系到模型效果的好坏,不过在大多数情况下,很多人对待样本的态度根本不够,这就导致的机器学习中的错误。很多人关注样本不 ...

机器学习中容易出现的误区

机器学习中容易出现的误区
2019-02-22
在机器学习中很多人都可能有一定的误解,那就是认为复杂的事物容易出错,而简单的事物往往会得到极高的准确率,那么事实真的是这样的吗?在这篇文章中我们详细的给大家介绍一下这个问题,并给大家介绍一 ...

机器学习中的基础知识(四)

机器学习中的基础知识(四)
2019-02-19
在前面的文章中我们给大家介绍了很多有关机器学习的知识,这些知识都是十分有用的,掌握了这些知识我们才能够做好机器学习知识的储备。下面我们就给大家介绍一下机器学习中的基础知识的其他部分,希望大 ...

机器学习中的基础知识(入门上篇)

机器学习中的基础知识(入门上篇)
2019-02-16
前面我们已经给大家讲述了很多有关机器学习的概念,这些概念都是十分重要的,我们如果要学习人工智能的话就需要重视这些知识。在这篇文章我们接着给大家介绍机器学习中的基础知识,希望这篇文章能够给大 ...

带你轻松看懂机器学习工作流——以“点一份披萨外卖”为例

带你轻松看懂机器学习工作流——以“点一份披萨外卖”为例
2019-01-03
  作者 | Daniel Godoy 翻译 | Mika 本文为 CDA 数据分析师原创作品,转载需授权 想象一下你点了一份披萨外卖,过了一会儿美味热腾腾的披萨就送到家门口了。 你有没有想过从下单点外卖到披萨送过 ...

学数据分析需要学的知识详解(四)

学数据分析需要学的知识详解(四)
2018-12-14
我们在上一篇文章中给大家讲了数据预处理、概率论和统计这两方面的知识,这两个模块在数据分析中也是十分重要的。当然了学会这些去分析数据的时候还是不够的,因为这些知识去分析数据还差点火候,还需要 ...

算法太多挑花眼?教你如何选择正确的机器学习算法

算法太多挑花眼?教你如何选择正确的机器学习算法
2018-07-05
算法太多挑花眼?教你如何选择正确的机器学习算法 机器学习算法虽多,却没有什么普适的解决方案。决策树、随机森林、朴素贝叶斯、深度网络等等等等,是不是有时候觉得挑花了眼呢?福利来啦~本文将教你慧眼识精 ...

R语言︱决策树族——随机森林算法

R语言︱决策树族——随机森林算法
2018-06-15
R语言︱决策树族——随机森林算法 一、随机森林理论介绍 1.1 优缺点 优点。 (1)不必担心过度拟合; (2)适用于数据集中存在大量未知特征; (3)能够估计哪个特征在分类中更重要; (4)具有很好的抗噪声能力; (5) ...

【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析

【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析
2018-06-14
【数据看球】2018 年世界杯夺冠预测,CDA带你用机器学习来分析 随着2018年FIFA世界杯开赛在即,世界各地的球迷都渴望知道:谁将夺取梦寐以求的冠军奖杯? 如果你不仅是一名资深球迷,而且还是技术宅,那么你 ...

Kaggle大神经验分享丨如何用15个月冲到排行榜的首位

Kaggle大神经验分享丨如何用15个月冲到排行榜的首位
2018-05-16
Kaggle大神经验分享丨如何用15个月冲到排行榜的首位 在最新的Kaggle用户排行榜上,排名第一位的ID是Bestfitting,他本人叫Shubin Dai。Shubin Dai在两年前加入Kaggle,目前生活在中国湖南省长沙。他是一名数据 ...

超详细的大数据分析师职业规划

超详细的大数据分析师职业规划
2018-03-20
超详细的大数据分析师职业规划 最近有不少同学咨询有关数据分析职业发展的问题,由此可见,随着大数据的飞速发展,数据分析职业也成为很多同学关注的目标。不要急,这就给大家介绍数据分 ...

Python做数据分析-简洁、易读、强大

Python做数据分析-简洁、易读、强大
2018-04-09
使用过Python的用户都会被其简洁、易读、强大的库所折服,其pythonic语言特性,对人极其友好,可以说, 生产效率更高 月29-5月1日北京基于Python的数据分析现场班 三天的课程力图结合不同案例讲授数 ...

数据挖掘中的特征选择问题

数据挖掘中的特征选择问题
2018-02-26
数据挖掘中的特征选择问题 特征工程包括特征选择和特征提取。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。通常而言,特征选择是指选择获得相应模型和算法最好性能的特征集,工程上常 ...

使用Python进行描述性统计

使用Python进行描述性统计
2018-02-26
使用Python进行描述性统计 1 描述性统计是什么? 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...

逻辑回归,决策树,支持向量机 选择方案

逻辑回归,决策树,支持向量机 选择方案
2018-01-16
逻辑回归,决策树,支持向量机 选择方案 分类是我们在工业界经常遇到的场景,本文探讨了3种常用的分类器,逻辑回归LR,决策树DT和支持向量机SVM。 这三个算法都被广泛应用于分类(当然LR,DT和SVR也可以用于 ...

数据科学面临的共同挑战有哪些

数据科学面临的共同挑战有哪些
2018-01-08
数据科学面临的共同挑战有哪些 随着我们进入2018年,是时候看看那些使用数据科学和机器学习的公司面临的共同挑战。假设你的公司已经在大规模收集数据,需要用到分析工具,而且你已经认识到数据科学可以发挥重大 ...

数据分析师成长之路:京沪深CDA人每月学习趴

数据分析师成长之路:京沪深CDA人每月学习趴
2022-01-19
一说到大数据,你肯定想到那些互联网公司。大数据究竟是不是互联网公司专属的强大武器呢?这可不一定。未来所有的公司都会成为数据公司,传统行业更应该利用自己的优势,搜集海量的用户数据,实现逆袭。 在数据 ...

CDA数据分析成长之路 深圳站 成功举办

CDA数据分析成长之路 深圳站 成功举办
2017-12-26
CDA数据分析成长之路 深圳站 成功举办 2017年12月24日,在圣诞节前夜的下午,CDA数据分析成长之路沙龙活动在深圳南山区科技寺成功举办。 第一位分享嘉宾是来自深圳市必安提网络科技有限公司创始人梁辰 ...

业界共同开掘大数据文化价值

业界共同开掘大数据文化价值
2017-12-21
业界共同开掘大数据文化价值 使用深度学习方法按照本文所介绍的步骤处理结构化数据有这样的好处: 快 无需领域知识 表现优良 在机器学习/深度学习或任何类型的预测建模任务中,都是先有数据然后再 ...

复杂与失控的现实:大数据平台的思考

复杂与失控的现实:大数据平台的思考
2017-12-03
复杂与失控的现实:大数据平台的思考 “目前我们正在规划我们新一代的智能数据平台;这几年以来,我们也一直在尝试做一个足够强大的数据平台来高效支持内外部的应用;我们也在不断调研全球最新的数据技术和产品。 ...

OK