cda

数字化人才认证

大数据时代最该关心的事儿-CDA数据分析师官网

首页 > 大数据时代

原理 + 代码|手把手教你用python实现智能推荐算法

原理 + 代码|手把手教你用python实现智能推荐算法
2020-07-17
来源:早起Python 作者:萝卜 推荐系统将成为未来十年里最重要的变革 社会化网站将由推荐系统所驱动 --- John Riedl明尼苏达大学教授 01前言 智能推荐和泛的营销完全不同 ...

数据运营体系,该如何搭建

数据运营体系,该如何搭建
2020-07-17
文章来源:接地气学堂 作者:接地气的陈老师 很多同学搞不清楚数据运营和数据分析啥区别。一提起要“搭建数据运营体系”或者“建立数据运营机制”就懵圈: 1、这跟我做一套数据指标有什么区别? 2 ...

2020年底前全面取消事业编制,32种事业编工种受殃及……

2020年底前全面取消事业编制,32种事业编工种受殃及……
2020-07-17
据悉,从事生产经营活动的事业单位,将在2020年底前全部转企业,取消事业编制,在职职工转为签订劳动合同,不再是原有的事业单位聘用合同。 此次改革受到波及的事业单位主要有32类,如:工程建设、维修、养 ...

快速教会你EXCEL重复值处理常用的几个小技巧!

快速教会你EXCEL重复值处理常用的几个小技巧!
2020-07-17
EXCEL是我们在工作中经常用到的数据统计和分析工具,我们在使用EXCEL分析数据,制作图表时经常会遇到有重复值需要处理的状况,今天小编与大家分享的就是EXCEL重复值处理的一些方法和技巧,希望对大家有所帮助。 ...

python数据清洗中,是如何识别和处理异常值的?

python数据清洗中,是如何识别和处理异常值的?
2020-07-17
异常值处理是python数据清洗中重要的步骤,虽然异常值出现频率比较低,但是如果置之不理的话,还是会对实际项目的分析造成偏差,所以今天小编就跟大家分享python数据清洗中应该如何识别和处理异常值,希望对大家有 ...
pandas是如何检测和处理缺失数据的?
2020-07-17
我们都知道pandas 是一款功能强大的python库,基于Numpy,支持高性能的矩阵运算,通常在数据挖掘和数据分析领域应用较多,但是pandas 数据清洗功能也不能忽视,今天小编就为大家分享pandas是如何检测和处理缺失数 ...

分布式文件系统HDFS概念及工作机制的简单介绍

分布式文件系统HDFS概念及工作机制的简单介绍
2020-07-17
HDFS 全称为Hadoop Distributed File System,是hadoop分布式文件系统,具体来说,是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。最主要的作用是作为 Hadoop ...

你想知道的箱型图的基础知识,都在这里了

你想知道的箱型图的基础知识,都在这里了
2020-07-17
箱型图,又叫做箱线图(Boxplot),或者箱须图(Box-whisker Plot),另外,盒式图指的也是它。箱型图通常是被用作观察数据整体的分布情况,是通过数据中的五个统计量:最小值(上边界)、上四分位数(75/%分位数)、中位 ...

应该怎样理解docker?它的优势在哪里?

应该怎样理解docker?它的优势在哪里?
2020-07-17
近年来,docker成了最火热、最具颠覆性的科学技术之一,受到了国内、国外许多泛云计算公司、互联网公司、IT大厂的青睐。docker到底是什么?为什么这么火?下面就跟小编一起来看吧! 一、docker概念 让我们先来 ...

如何用python快速简单的制作柱状图?

如何用python快速简单的制作柱状图?
2020-07-16
柱状图大家都会制作,那么你会用python制作柱状图吗? 我们先来看一下柱状图的定义:柱形图,又被称为长条图、或者柱状统计图,也叫作条图、条状图、棒形图,本质上来说就是一种以长方形的长度为变量的统计图表 ...

图论到底是什么?它的算法又有哪些?

图论到底是什么?它的算法又有哪些?
2020-07-16
图论是什么?关于图的理论?下面跟小编具体来了解一下图论以及简单的图论算法吧。 一、图论起源 18世纪著名古典数学问题之一。在哥尼斯堡的一个公园里,有七座桥将普雷格尔河中两个岛及岛与河岸连接起来(如图) ...

被python的这个“特性”给坑死了

被python的这个“特性”给坑死了
2020-07-16
以下文章来源:Python之禅 作者:刘志军 哈哈哈,被自己蠢死了,也被 python 的语法给坑死了。没想到还会遇到这种问题。 事情是这样的。 项目中遇到一个字符串替换的问题。 我们知道字符串替换可以 ...

教你用EXCEL绘制出好看的气泡图

教你用EXCEL绘制出好看的气泡图
2020-07-16
相信大家都有被要求做报表的时候,而EXCEL就是我们这些数据分析小白常用的报表制作工具。但即使是EXCEL制作出的报表也有很大差别,小编今天就教大家如何绘制出好看的气泡图,来吸引大家的眼球,成为工作汇报的加分 ...

Kudu是什么?它的优缺点表现在哪些地方?

Kudu是什么?它的优缺点表现在哪些地方?
2020-07-16
Kudu是由Todd Lipcon@Cloudera带头开发出存储系统,整体应用模式与HBase很相似,也就是能够支持行级别的随机读写,对于批量顺序检索功能也能支持。 一、Kudu的必要性 大家不禁要问了?既然与HBase相似,那为 ...

一篇文章掌握 python 内置 zip() 的全部内容

一篇文章掌握 python 内置 zip() 的全部内容
2020-07-16
文章来源: Python猫 作者:豌豆花下猫 zip() 是 Python 中最好用的内置类型之一,它可以接收多个可迭代对象参数,再返回一个迭代器,可以把不同可迭代对象的元素组合起来。 我之前写迭代器系列的时 ...

Series是什么?基本使用方法有哪些?

Series是什么?基本使用方法有哪些?
2020-07-16
Series 是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之 相关的数据标签(即索引)组成。 一、对于Series定义的理解 1.Series像是一个Python的dict类型,因为它的索引与元素是映射 ...

NameNode无法启动是什么原因?应该怎样解决?

NameNode无法启动是什么原因?应该怎样解决?
2020-07-16
NameNode无法启动这个问题,困扰着很多小伙伴,今天小编就来给大家分析一下NameNode无法启动的原因以及解决办法,希望对大家有所帮助。 如果NameNode无法正常启动,建议大家首先去翻看日志,通过日志,查找到无 ...

关于Kafka,你还需要知道这些!

关于Kafka,你还需要知道这些!
2020-07-16
关于Kafka,相信大家都不陌生,一个消息流的处理平台,目前很多开发人员都把它当做一个生产&消费的中间件。今天小编就跟大家系统介绍一下Kafka,希望对大家有所帮助。 一、Kafka概念 Kafka是一个消息系统, ...

什么是flume?它在大数据处理中起到什么作用?

什么是flume?它在大数据处理中起到什么作用?
2020-07-16
Flume 是 Apache 旗下的一款,开源,可靠性高,扩展性高,管理简单,并且能够支持客户扩展的数据采集系统。 Flume 是使用 JRuby 来构建的,因此依赖于 Java 运行环境。Flume 起初是由 Cloudera 的工程师设计出来, ...

谷歌、脸书、魔兽世界都在用!InnoDB是什么?有哪些关键特性?

谷歌、脸书、魔兽世界都在用!InnoDB是什么?有哪些关键特性?
2020-07-16
导读:InnoDB是事务安全的MySQL存储引擎,设计上采用了类似于Oracle数据库的架构。通常来说,InnoDB存储引擎是OLTP应用中核心表的首选存储引擎。同时,也正是因为InnoDB的存在,才使MySQL数据库变得更有魅力。 ...

OK