来源:早起Python 作者:萝卜 推荐系统将成为未来十年里最重要的变革 社会化网站将由推荐系统所驱动 --- John Riedl明尼苏达大学教授 01前言 智能推荐和泛的营销完全不同 ...
2020-07-17文章来源:接地气学堂 作者:接地气的陈老师 很多同学搞不清楚数据运营和数据分析啥区别。一提起要“搭建数据运营体系”或者“建立数据运营机制”就懵圈: 1、这跟我做一套数据指标有什么区别? 2 ...
2020-07-17据悉,从事生产经营活动的事业单位,将在2020年底前全部转企业,取消事业编制,在职职工转为签订劳动合同,不再是原有的事业单位聘用合同。 此次改革受到波及的事业单位主要有32类,如:工程建设、维修、养 ...
2020-07-17EXCEL是我们在工作中经常用到的数据统计和分析工具,我们在使用EXCEL分析数据,制作图表时经常会遇到有重复值需要处理的状况,今天小编与大家分享的就是EXCEL重复值处理的一些方法和技巧,希望对大家有所帮助。 ...
2020-07-17异常值处理是python数据清洗中重要的步骤,虽然异常值出现频率比较低,但是如果置之不理的话,还是会对实际项目的分析造成偏差,所以今天小编就跟大家分享python数据清洗中应该如何识别和处理异常值,希望对大家有 ...
2020-07-17我们都知道pandas 是一款功能强大的python库,基于Numpy,支持高性能的矩阵运算,通常在数据挖掘和数据分析领域应用较多,但是pandas 数据清洗功能也不能忽视,今天小编就为大家分享pandas是如何检测和处理缺失数 ...
2020-07-17HDFS 全称为Hadoop Distributed File System,是hadoop分布式文件系统,具体来说,是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。最主要的作用是作为 Hadoop ...
2020-07-17箱型图,又叫做箱线图(Boxplot),或者箱须图(Box-whisker Plot),另外,盒式图指的也是它。箱型图通常是被用作观察数据整体的分布情况,是通过数据中的五个统计量:最小值(上边界)、上四分位数(75/%分位数)、中位 ...
2020-07-17近年来,docker成了最火热、最具颠覆性的科学技术之一,受到了国内、国外许多泛云计算公司、互联网公司、IT大厂的青睐。docker到底是什么?为什么这么火?下面就跟小编一起来看吧! 一、docker概念 让我们先来 ...
2020-07-17柱状图大家都会制作,那么你会用python制作柱状图吗? 我们先来看一下柱状图的定义:柱形图,又被称为长条图、或者柱状统计图,也叫作条图、条状图、棒形图,本质上来说就是一种以长方形的长度为变量的统计图表 ...
2020-07-16图论是什么?关于图的理论?下面跟小编具体来了解一下图论以及简单的图论算法吧。 一、图论起源 18世纪著名古典数学问题之一。在哥尼斯堡的一个公园里,有七座桥将普雷格尔河中两个岛及岛与河岸连接起来(如图) ...
2020-07-16以下文章来源:Python之禅 作者:刘志军 哈哈哈,被自己蠢死了,也被 python 的语法给坑死了。没想到还会遇到这种问题。 事情是这样的。 项目中遇到一个字符串替换的问题。 我们知道字符串替换可以 ...
2020-07-16相信大家都有被要求做报表的时候,而EXCEL就是我们这些数据分析小白常用的报表制作工具。但即使是EXCEL制作出的报表也有很大差别,小编今天就教大家如何绘制出好看的气泡图,来吸引大家的眼球,成为工作汇报的加分 ...
2020-07-16Kudu是由Todd Lipcon@Cloudera带头开发出存储系统,整体应用模式与HBase很相似,也就是能够支持行级别的随机读写,对于批量顺序检索功能也能支持。 一、Kudu的必要性 大家不禁要问了?既然与HBase相似,那为 ...
2020-07-16文章来源: Python猫 作者:豌豆花下猫 zip() 是 Python 中最好用的内置类型之一,它可以接收多个可迭代对象参数,再返回一个迭代器,可以把不同可迭代对象的元素组合起来。 我之前写迭代器系列的时 ...
2020-07-16Series 是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之 相关的数据标签(即索引)组成。 一、对于Series定义的理解 1.Series像是一个Python的dict类型,因为它的索引与元素是映射 ...
2020-07-16NameNode无法启动这个问题,困扰着很多小伙伴,今天小编就来给大家分析一下NameNode无法启动的原因以及解决办法,希望对大家有所帮助。 如果NameNode无法正常启动,建议大家首先去翻看日志,通过日志,查找到无 ...
2020-07-16关于Kafka,相信大家都不陌生,一个消息流的处理平台,目前很多开发人员都把它当做一个生产&消费的中间件。今天小编就跟大家系统介绍一下Kafka,希望对大家有所帮助。 一、Kafka概念 Kafka是一个消息系统, ...
2020-07-16Flume 是 Apache 旗下的一款,开源,可靠性高,扩展性高,管理简单,并且能够支持客户扩展的数据采集系统。 Flume 是使用 JRuby 来构建的,因此依赖于 Java 运行环境。Flume 起初是由 Cloudera 的工程师设计出来, ...
2020-07-16导读:InnoDB是事务安全的MySQL存储引擎,设计上采用了类似于Oracle数据库的架构。通常来说,InnoDB存储引擎是OLTP应用中核心表的首选存储引擎。同时,也正是因为InnoDB的存在,才使MySQL数据库变得更有魅力。 ...
2020-07-16CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-09