cda

数字化人才认证

首页 > 行业图谱 >

如何为分类问题选择合适的机器学习算法

如何为分类问题选择合适的机器学习算法
2018-01-12
如何为分类问题选择合适的机器学习算法 若要达到一定的准确率,需要尝试各种各样的分类器,并通过交叉验证选择最好的一个。但是,如果你只是为你的问题寻找一个“足够好”的算法或者一个起点,以下准则有利于 ...

数据科学家需要掌握的10个基本统计技术

数据科学家需要掌握的10个基本统计技术
2018-01-08
数据科学家需要掌握的10个基本统计技术 无论您在数据的科学性问题上持哪种看法,都无法忽视数据的持续重要性,也不能轻视分析、组织和情境化数据的能力。 根据大量的就业数据和员工反馈信息统计,在“25个最 ...

大数据时代,Python是否是最好的语言?

大数据时代,Python是否是最好的语言?
2022-01-20
Python越来越火了,Python 这几年的火热,离不开人工智能和机器学习。如果说 2017 年有一门最火“外语”,那一定是 Python。现在,Python 的这把火已经烧到了程序员的圈子外。根据国务院《新一代人工智能发展规划 ...

深入浅出,一篇超棒的机器学习入门文章

深入浅出,一篇超棒的机器学习入门文章
2017-12-19
深入浅出,一篇超棒的机器学习入门文章 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇 ...
文本分类常用算法比较
2017-12-10
文本分类常用算法比较 本文对文本分类中的常用算法进行了小结,比较它们之间的优劣,为算法的选择提供依据。  一、决策树(Decision Trees) 优点:  1、决策树易于理解和解 ...

利用spark做文本分类(朴素贝叶斯模型)

利用spark做文本分类(朴素贝叶斯模型)
2017-12-10
利用spark做文本分类(朴素贝叶斯模型) 朴素贝叶斯模型 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基 ...
【上海逸动医学科技有限公司】招聘数据分析师
2017-12-09
【上海逸动医学科技有限公司】招聘数据分析师 上海逸动医学科技有限公司(Innomotion Inc.) 2012年9月注册成立,坐落于G60上海松江科创走廊的核心地带--临港松江科技城。是以数字化、智能化医疗解决方案为核心的高新 ...

Kaggle机器学习大调查:中国从业者平均25岁,博士工资最高,最常使用Python

Kaggle机器学习大调查:中国从业者平均25岁,博士工资最高,最常使用Python
2017-11-17
Kaggle机器学习大调查:中国从业者平均25岁,博士工资最高,最常使用Python 笔者按:Kaggle 是互联网上最著名的数据科学竞赛平台之一,用户数量超过了100 万人。最近,这一社区首次进行了机器学习/ ...

R 语言数据分析师养成计划——从零开始的 14 个任务

R 语言数据分析师养成计划——从零开始的 14 个任务
2017-10-19
R 语言数据分析师养成计划——从零开始的 14 个任务 1992年,肉丝(Ross Ihaka)和萝卜特(Robert Gentleman)两个人在S语言(贝尔实验室开发的一种统计用编程语言)的基础上开始构思一种新的用于统计学分析 ...
【上海国响信息技术有限公司】招聘数据分析师
2017-10-15
【上海国响信息技术有限公司】招聘数据分析师 上海国响信息技术有限公司是一家运营级软件系统开发商, 是中国通信行业协会会员单位、国家下一代广电网NGB会员单位、上海市多媒体行业协会会员单位,是上海市著名的软件 ...

R 语言数据分析师养成计划——从零开始的 14 个任务

R 语言数据分析师养成计划——从零开始的 14 个任务
2017-09-25
R 语言数据分析师养成计划——从零开始的 14 个任务 1992年,肉丝(Ross Ihaka)和萝卜特(Robert Gentleman)两个人在S语言(贝尔实验室开发的一种统计用编程语言)的基础上开始构思一种新的用于统计学分析 ...

让Python猜猜你是否能约会成功

让Python猜猜你是否能约会成功
2017-09-21
让Python猜猜你是否能约会成功 我是一个婚恋网站的数据分析师,新入职的第二天,接到老板的任务,让我预测来婚恋网站新注册的男生&女生是否会约会成功。 如何预测一个新来的男生是否会约会成功呢?这很简单 ...
【福建淘汽互联科技有限公司司】招聘数据分析师
2017-08-01
【福建淘汽互联科技有限公司司】招聘数据分析师 福建淘汽互联科技有限公司,以大数据为驱动,对传统汽车销售/租赁产业进行互联网化模式升级,整合汽车主机厂、金融、保险、后市场服务等领域资源,打造汽车服务生态圈 ...

机器学习之径向基神经网络

机器学习之径向基神经网络
2017-07-25
机器学习之径向基神经网络 本文基于台大机器学习技法系列课程进行的笔记总结。 主要内容如下图所示: 首先介绍一下径向基函数网络的Hypothesis和网络的结构,然后介绍径向基神经网络 ...

【机器学习】半监督学习几种方法

【机器学习】半监督学习几种方法
2017-07-24
【机器学习】半监督学习几种方法 1.Self-training algorithm(自训练算法) 这个是最早提出的一种研究半监督学习的算法,也是一种最简单的半监督学习算法. 2.Multi-view algorithm(多视角算法) 一般多 ...

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱
2017-07-24
机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱 本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-out validation) ...

R语言与机器学习中的回归方法学习笔记

R语言与机器学习中的回归方法学习笔记
2017-07-21
R语言与机器学习中的回归方法学习笔记  机器学习中的一些方法如决策树,随机森林,SVM,神经网络由于对数据没有分布的假定等普通线性回归模型的一些约束,预测效果也比较不错,交叉验证结果也能被接受。下 ...

好课推荐丨CDA建模分析师-R语言

好课推荐丨CDA建模分析师-R语言
2017-07-13
“虽然是本科毕业,但是在看数据挖掘方面的算法理论时经常感觉一些公式的推导过程如天书一般,例如看svm的数学证明,EM算法,凸优化… 感觉知识跳跃比较大, 是我微积分学的不好还是中间有什么好的教材补充一下,数据 ...

R之KNN算法

R之KNN算法
2017-07-09
R之KNN算法 KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 例如,上图中,绿色圆 ...
【深圳柠创科技有限公司】招聘数据分析师
2017-06-06
【深圳柠创科技有限公司】招聘数据分析师 深圳柠创科技有限公司是美国领先的硅谷高科技创业企业LimeBike的中国分公司。LimeBike旨在通过先进的无桩共享单车模式来解决美国最后1英里的出行问题,已于2017年3月获得硅 ...

OK