cda

首页 > 精彩阅读

Python 工程师面试必备 25 条 Python 知识点

Python 工程师面试必备 25 条 Python 知识点
2018-01-17
Python 工程师面试必备 25 条 Python 知识点 1.到底什么是Python?你可以在回答中与其他技术进行对比 下面是一些关键点: Python是一种解释型语言。 ... ...

成为数据科学家的7本入门推荐书籍

成为数据科学家的7本入门推荐书籍
2018-01-17
成为数据科学家的7本入门推荐书籍 过去的几年中我一直在阅读各式各样的数据科学方面的书籍资料,上述7本是我个人最为欣赏的,它们都是我认为的将数据科学 ... ...

让大数据分析更有效的5种技术措施

让大数据分析更有效的5种技术措施
2018-01-17
如今,数据量越来越大。近年来,企业已经意识到数据分析可以带来的价值,并且已经开始采用。企业现在的设备几乎都在监测和测量,并创造了大量的数据,通常比企业处理的更快。其问题是,而正因为大数据定义为 ...

决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略

决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略
2018-01-17
决策树、逻辑回归、线性回归使用时注意事项以及模型过拟合策略 决策树缺点和注意事项: 决策树的最大缺点是原理中的贪心算法。因此它所做的选择只能是某种意义上的局部最优选择。 若目标变量是连续变量,那么 ...

R语言获取优化的k均值聚类

R语言获取优化的k均值聚类
2018-01-17
R语言获取优化的k均值聚类 k均值算法效率快也易于实现,但在算法开始要求提前规定好簇K的数目,因此我们可以使用距离的平方和确定那个K值能够得到最好的k均值聚类效果。 操作 执行以下操作为K均值算法找到最合 ...

python 实例简述 k-近邻算法的基本原理

python 实例简述 k-近邻算法的基本原理
2018-01-17
python 实例简述 k-近邻算法的基本原理 首先我们一个样本集合,也称为训练样本集,在训练样本集中每个数据都存在一个标签用来指明该数据的所属分类。在输入一个新的未知所属分类的数据后,将新数据的所有特征和 ...

面对大数据过分渲染宣传,你需要了解的9件事

面对大数据过分渲染宣传,你需要了解的9件事
2018-01-17
面对大数据过分渲染宣传,你需要了解的9件事 大数据和开放数据不是一回事,但他们有着密切的联系(正如我在主题发言稿“未来的大数据将会开放到什么程度?”上写到的)。我们正在关注的大数据一些趋势和话题与 ...

没有云的话,大数据就是个作坊

没有云的话,大数据就是个作坊
2018-01-17
没有云的话,大数据就是个作坊 王坚,阿里巴巴最富争议性的人物之一,爱者极爱,恨者极恨。 我把王坚的分享做了个详细版的梳理,里面涉及了阿里云的定位、对大数据的反思、对APP创新的不看好,信息量很大, ...

回顾与展望丨数据科学 机器学习:2017年的主要发展和2018年的关键趋势

回顾与展望丨数据科学 机器学习:2017年的主要发展和2018年的关键趋势
2018-01-16
回顾与展望丨数据科学 机器学习:2017年的主要发展和2018年的关键趋势 KDnuggets邀请了数据科学相关领域杰出的代表人物对2017年的主要发展和2018年的趋势进行了总结和预测。主要内容涉及到 AI 、深度学习、机 ...

『如何成为十字型数据精英』线下活动回顾

『如何成为十字型数据精英』线下活动回顾
2018-01-16
『如何成为十字型数据精英』线下活动回顾 2018年1月14日,CDA数据分析师在北京举办了「如何成为十字型数据精英」线下活动,有幸邀请到了李奇(微软Excel MVP)、崔丹(GrowingIO 市场总监)、 王安(布本智能 ...

python实现的 K-近邻算法代码详细解释

python实现的 K-近邻算法代码详细解释
2018-01-16
python实现的 K-近邻算法代码详细解释 一、k近邻算法概述 k近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高 ...

决策树之ID3算法及其Python实现

决策树之ID3算法及其Python实现
2018-01-16
决策树之ID3算法及其Python实现 1. 决策树背景知识   决策树是数据挖掘中最重要且最常用的方法之一,主要应用于数据挖掘中的分类和预测。决策树是知识的一种呈现方式,决策树中从顶点到每个结点的路径都是 ...

逻辑回归,决策树,支持向量机 选择方案

逻辑回归,决策树,支持向量机 选择方案
2018-01-16
逻辑回归,决策树,支持向量机 选择方案 分类是我们在工业界经常遇到的场景,本文探讨了3种常用的分类器,逻辑回归LR,决策树DT和支持向量机SVM。 这三个算法都被广泛应用于分类(当然LR,DT和SVR也可以用于 ...

逻辑回归与决策树在分类上的区别

逻辑回归与决策树在分类上的区别
2018-01-16
逻辑回归与决策树在分类上的区别 在讨论之前,让我们来看一下逻辑回归和决策树的主要差别: 有些分歧是表面的,例如决策树可以对付缺失值,而逻辑回归需要挖掘人员预先对缺失数据进行处理。但实际上决策 ...

大数据要充分利用 但更要保护用户隐私

大数据要充分利用 但更要保护用户隐私
2018-01-16
大数据要充分利用 但更要保护用户隐私 全球进入移动互联网时代后,一个巨大进步是一切活动都在往移动互联网这个舞台上转移。所有社会活动、金融交易等都在网络上留下了痕迹或者说有迹可循。由此带来的进步是革 ...

目前大数据都还只是在瞎扯

目前大数据都还只是在瞎扯
2018-01-16
目前大数据都还只是在瞎扯 大数据很火,很多公司对大数据到了迷信的地步,各种客户开始争相买数据,指望着通过这些数据来对未来做预测。事实上,我们是不是应该担心这些数据反而让我们远离了真正的客户群? ...

学习 Python 编程的 19 个资源

学习 Python 编程的 19 个资源
2018-01-15
学习 Python 编程的 19 个资源 用Python编写代码一点都不难,事实上它一直被赞誉为最容易学的编程语言。如果你准备学习web开发, Python是一个不错的开始,甚至想做游戏的话,用Python来开发游戏的资源也有很多 ...

搞创意和策略的人,想转数据分析肿么办

搞创意和策略的人,想转数据分析肿么办
2018-01-15
搞创意和策略的人,想转数据分析肿么办 搞创意和策略的人,想转数据分析肿么办? 你学新闻传播出身,做互联网数据是不是特别难? 你这是转行吧,原来的东西是不是浪费了? 你觉得我能做数据分析吗? ...

京东2018大整改——刘强东更关注AI领域

京东2018大整改——刘强东更关注AI领域
2018-01-15
刘强东2018京东大调整——升级为三大事业群 更关注AI 没有一家公司允许因为组织效率低下而影响业务增速。对于京东这家管理着十余万人的大公司来说,尤其如此。 近期,刘强东以内部邮件 ...

R语言使用逻辑回归分类算法

R语言使用逻辑回归分类算法
2018-01-15
R语言使用逻辑回归分类算法 逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fami ...

R语言使用朴素贝叶斯分类算法

R语言使用朴素贝叶斯分类算法
2018-01-15
朴素贝叶斯分类器也是一类基于概率的分类器,它源于贝叶斯理论,假设样本属性之间相互独立。 操作 利用朴素贝叶斯分类器对churn数据集进行分类: 导入e1071库,使用naiveBayes函数构建分类器 library(e1071) class ...

R语言线性回归诊断

R语言线性回归诊断
2018-01-15
R语言线性回归诊断 回归诊断主要内容 (1).误差项是否满足独立性,等方差性与正态 (2).选择线性模型是否合适 (3).是否存在异常样本 (4).回归分析是否对某个样本的依赖过重,也就是模型是否具有稳定性 (5).自变量 ...

OK