cda

数字化人才认证

首页 > 行业图谱 >

大数据如何成为安全生产“利器”

大数据如何成为安全生产“利器”
2018-01-22
大数据如何成为安全生产“利器” 信息化一方面加速了安全生产事故信息传播速度,导致安全生产的被关注度空前高涨,另一方面,也为解决安全生产问题带来了“利器”——大数据。当前,大数据正以惊人的速度渗透到 ...

利用R语言如何判别和分类

利用R语言如何判别和分类
2018-01-21
利用R语言如何判别和分类 判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。       ...

机器学习与R之决策树C50算法

机器学习与R之决策树C50算法
2018-01-21
机器学习与R之决策树C50算法 决策树 经验熵是针对所有样本的分类结果而言 经验条件熵是针对每个特征里每个特征样本分类结果之特征样本比例和 基尼不纯度 简单地说就是从一个数据集中随机选取子项,度量其被错误 ...

北京焦灼?上海颓废?大数据如何解读城市性格?

北京焦灼?上海颓废?大数据如何解读城市性格?
2018-01-19
北京焦灼?上海颓废?大数据如何解读城市性格? 城市如人,在形成的过程中也会显现出独特的性格。具有特殊文化品格和精神气质的城市,无疑是最具吸引力而叫人难忘的。但你是否想过,如何用大数据深度探寻一个城 ...

R语言使用随机森林方法对数据分类

R语言使用随机森林方法对数据分类
2018-01-19
R语言使用随机森林方法对数据分类 说明 随机森林是另一类可用的集成学习方法,该算法在训练过程中将产生多棵决策树,每棵决策树会根据输入数据集产生相应的预测输出,算法采用投票机制选择类别众数做为预测 ...

R语言利用ROCR评测模型的预测能力

R语言利用ROCR评测模型的预测能力
2018-01-19
R语言利用ROCR评测模型的预测能力 说明 受试者工作特征曲线(ROC),这是一种常用的二元分类系统性能展示图形,在曲线上分别标注了不同切点的真正率与假正率。我们通常会基于ROC曲线计算处于曲线下方的面积AU ...

R语言基于模型的聚类方法处理

R语言基于模型的聚类方法处理
2018-01-18
R语言基于模型的聚类方法处理 说明 与使用启发式方法而非依赖某个形式化模型的层次聚类和K均值聚类不同,基于模型的聚类算法假设存在多种数据模型,并使用EM算法来判断可能性最大的数据模型作为对数据处理进 ...

颠覆我们生活的大数据 其核心商业价值是什么

颠覆我们生活的大数据 其核心商业价值是什么
2018-01-18
颠覆我们生活的大数据 其核心商业价值是什么 数据本身不产生价值,如何分析和利用大数据对业务产生帮助才是关键。首先例举一些大数据的典型应用,然后解释大数据的定义,最后总结大数据的价值。  & ...

大数据给IT企业带来攫金市场新机遇

大数据给IT企业带来攫金市场新机遇
2018-01-18
大数据给IT企业带来攫金市场新机遇 大数据,一个时髦的名词,也是当下热门的业务领域。大数据诱人的利益诉求点之一,即通过大数据能更好地提高效率,更好地有的放矢。一方面,大数据让公司内部更有效地运作;另 ...

决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略

决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略
2018-01-17
决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略  决策树缺点和注意事项:     决策树的最大缺点是原理中的贪心算法。因此它所做的选择只能是某种意义上的局部最优选择。 &nb ...

python 实例简述 k-近邻算法的基本原理

python 实例简述 k-近邻算法的基本原理
2018-01-17
python 实例简述 k-近邻算法的基本原理 首先我们一个样本集合,也称为训练样本集,在训练样本集中每个数据都存在一个标签用来指明该数据的所属分类。在输入一个新的未知所属分类的数据后,将新数据的所有特征和 ...

python实现的 K-近邻算法代码详细解释

python实现的 K-近邻算法代码详细解释
2018-01-16
python实现的 K-近邻算法代码详细解释 一、k近邻算法概述 k近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高 ...

逻辑回归,决策树,支持向量机 选择方案

逻辑回归,决策树,支持向量机 选择方案
2018-01-16
逻辑回归,决策树,支持向量机 选择方案 分类是我们在工业界经常遇到的场景,本文探讨了3种常用的分类器,逻辑回归LR,决策树DT和支持向量机SVM。 这三个算法都被广泛应用于分类(当然LR,DT和SVR也可以用于 ...

R语言使用逻辑回归分类算法

R语言使用逻辑回归分类算法
2018-01-15
R语言使用逻辑回归分类算法 逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fami ...

R语言使用朴素贝叶斯分类算法

R语言使用朴素贝叶斯分类算法
2018-01-15
朴素贝叶斯分类器也是一类基于概率的分类器,它源于贝叶斯理论,假设样本属性之间相互独立。 操作 利用朴素贝叶斯分类器对churn数据集进行分类: 导入e1071库,使用naiveBayes函数构建分类器 library(e1071) class ...

大数据的本质是什么,在竞争之中存在哪几误区

大数据的本质是什么,在竞争之中存在哪几误区
2018-01-14
大数据的本质是什么,在竞争之中存在哪几误区 继物联网、云计算之后,“大数据”迅速成为大家争相传诵的热门科技概念。“大数据”作为信息社会发展的一个新生事物,目前尚处在逐渐被认识、被应用的初始阶段,无 ...

数据分析的8个流程与7个常用思路

数据分析的8个流程与7个常用思路
2018-01-13
数据分析的8个流程与7个常用思路 在产品运营过程中,数据分析具有极其重要的战略意义,是产品优化和产品决策的核心大脑。因此做好数据分析,是产品运营中最重要的环节之一。 那么如何做好支付的数据分析呢? ...

主成分分析和因子分析及其在R中的…

主成分分析和因子分析及其在R中的…
2018-01-13
主成分分析和因子分析及其在R中的… 主成分分析和探索性因子分析是两种用来探索和简化多变量复杂关系的常用方法,它们之间有联系也有区别。 主成分分析(PCA)是一种数据降维方法,它能将大量相关变量转化为 ...

大数据定义、思维方式及架构模式

大数据定义、思维方式及架构模式
2018-01-12
大数据定义、思维方式及架构模式 一、大数据何以为大 数据现在是个热点词汇,关于有了大数据,如何发挥大数据的价值,议论纷纷,而笔者以为,似乎这有点搞错了原因与结果,就象关联关系,有A的时候,B与之 ...

如何为分类问题选择合适的机器学习算法

如何为分类问题选择合适的机器学习算法
2018-01-12
如何为分类问题选择合适的机器学习算法 若要达到一定的准确率,需要尝试各种各样的分类器,并通过交叉验证选择最好的一个。但是,如果你只是为你的问题寻找一个“足够好”的算法或者一个起点,以下准则有利于 ...

OK
客服在线
立即咨询