cda

数字化人才认证

首页 > 行业图谱 >

数据工程师需要掌握的18个python库

数据工程师需要掌握的18个python库
2020-07-24
python之所以这么火,是因为它的应用广泛,之所以应用广泛,是因为它包含有许多功能强大的库。对于不是专业数据分析人员的我们,平时在工作和生活中,主要是用python来获取信息,制作可视化报表,但是专业的数据工 ...

经典聚类算法Kmeans的基本原理及实现

经典聚类算法Kmeans的基本原理及实现
2020-07-24
Kmeans算法,又叫做K均值聚类算法,可以说是无监督聚类算法中最具代表性,最经典的聚类算法了,这一算法的主要作用是将相似的样本自动归到一个类别中。小编特意整理了这一经典聚类算法的基本原理供大家参考,希望 ...

怎么理解随机森里中feature importance-特征重要性?

怎么理解随机森里中feature importance-特征重要性?
2020-07-22
feature importance,根据含义就能理解,也就是特征重要性,在预测建模项目中起着非常重要作用,能够提供对数据、模型的见解,和如何进行降维和选择特征,并以此来提高预测模型的的效率和有效性。今天小编为大家带 ...

应该怎样理解和绘制漏斗模型?

应该怎样理解和绘制漏斗模型?
2020-07-22
相信接触过数据分析的人,尤其是商业分析方面,一定有听说过漏斗模型。漏斗模型,顾名思义,也就是像漏斗一样的模型,在互联网或者是电商行业经常会用到的一种营销模型。今天,小编就为大家整理了漏斗模型的一些基 ...

机器学习中常见的决策树分类算法有哪几种?

机器学习中常见的决策树分类算法有哪几种?
2020-07-20
在机器学习中,因为决策树的算法是十分给力,因此使用决策树能够帮助我们解决很多的问题。决策树的算法分为很多种,今天小编主要跟大家介绍一下决策树的分类算法。 一、决策树的概念 决策树,根据名字就能知 ...

K-s曲线是什么,如何进行绘制?

K-s曲线是什么,如何进行绘制?
2020-07-17
今天跟大家分享的是:K-s曲线,直接上干货。 一、K-s曲线是什么 K-s全称:Kolmogorov-Smirnov,中文名叫做洛伦兹曲线,Ks经常被用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。好 ...

如何用python快速简单的制作柱状图?

如何用python快速简单的制作柱状图?
2020-07-16
柱状图大家都会制作,那么你会用python制作柱状图吗? 我们先来看一下柱状图的定义:柱形图,又被称为长条图、或者柱状统计图,也叫作条图、条状图、棒形图,本质上来说就是一种以长方形的长度为变量的统计图表 ...

玫瑰图是什么?如何进行绘制?

玫瑰图是什么?如何进行绘制?
2020-07-15
玫瑰图,全称为南丁格尔玫瑰图(Nightingale rose diagram),或者又叫做鸡冠花图、极坐标区域图等。早在克里米亚战争期间,统计学家和医学改革家佛罗伦斯‧南丁格尔 (Florence Nightingale) 就层使用玫瑰图表传达 ...

如何使用seaborn绘制好看的直方图和密度图?

如何使用seaborn绘制好看的直方图和密度图?
2020-07-15
seaborn是一款常用的python可视化库,基于matplotlib,相比matplotlib,seaborn绘制的多数图表都具有统计学意义,如分布、关系、统计、回归等,今天小编跟大家分享的是如何使用seaborn绘制直方图和密度图。 Sea ...

关于层次聚类算法原理的简单理解及实现

关于层次聚类算法原理的简单理解及实现
2020-07-14
层次聚类,即Hierarchical Clustering,是一种聚类算法,通过对不同类别数据点间的相似度的计算,从而创建一棵有层次的嵌套聚类树。 一、层次聚类算法原理 在聚类树中,树的最底层是不同类别的原始数据点, ...

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你
2020-07-14
CDA数据分析师 出品 作者:Mika、真达 数据:真达 后期:泽龙 【导读】今天我们用数据来聊一聊口味虾。 Show me data,用数据说话 今天我们聊一聊 口味虾 说起湖南这个地方,大家想到的 ...

机器学习中感知机是什么?如何实现?

机器学习中感知机是什么?如何实现?
2020-07-10
感知机(Perceptron)或者叫做感知器,是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络,是机器学习领域最基础的模型,被誉为机器学习的敲门砖。 ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

零基础学习python,这几本书少不了

零基础学习python,这几本书少不了
2020-07-10
python是世界上最强大、最受欢迎的编程语言之一,即使不是程序员,我们平时在工作中也会经常用到,例如用python分析竞品数据,做财务报表等等。目前,社会上已经掀起了一波学习python的热潮,但是很多人由于并 ...

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?
2020-07-07
CDA数据分析师 出品 作者:泽龙、Mika 数据:真达 后期:泽龙 【导读】 CBA重启开赛,辽宁为什么从冠军队变成鱼腩队?是侄子坑叔,还是亚洲第一控卫变身综艺咖,本期我们用全面的数据证明到底 ...

 这几个常用的python库你需要知道

这几个常用的python库你需要知道
2020-07-02
python可以说是近几年最火热、最实用的、最容易上手的工具之一了。功能强大、应用广泛,可以帮你搜集工作数据,还能帮你下载音乐,电影,于是就掀起了一波学习python的大潮,小编也毫不犹豫的加入了。但是对于向小 ...

seaborn的简单理解和入门

seaborn的简单理解和入门
2020-07-02
seaborn是建立在Matplotlib基础之上的高级的API,是比Matplotlib更为高级的的一种python可视化库。专攻于统计可视化,有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图(jointplots)和小提琴图(violind ...

实用又好看的Python可视化库有哪些?

实用又好看的Python可视化库有哪些?
2020-07-02
Python是一款功能强大的数据分析工具,其中Python可视化功能更是受到许多数据分析师的青睐,下面小编就给大家分享一些Python可视化库,希望对各位数据分析师小伙伴有所帮助。 1.Matplotlib Matplotlib是一个 ...
数据可视化工具有哪些?
2020-06-28
数据可视化是数据分析中最好展示数据的方法,能够形象地绘制对应的图像,能够让人更直观地理解数据。下面小编整理了几种数据可视化工具,希望对各位小伙伴有所帮助。 1.Excel Excel是很多人使用的数据可视化 ...

手把手教你用直方图、饼图和条形图做数据分析(Python代码)

手把手教你用直方图、饼图和条形图做数据分析(Python代码)
2020-06-24
导读:对数据进行质量分析以后,接下来可通过绘制图表、计算某些特征量等手段进行数据的特征分析。 作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据 ...

OK