cda

数字化人才认证

首页 > 行业图谱 >

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

实战 | 如何制作数据报表并实现自动化?

实战 | 如何制作数据报表并实现自动化?
2021-11-03
本章给大家演示一下在实际工作中如何结合 Pandas 库和 openpyxl 库来自动化生成报表。假设我们现在有如图 1 所示的数据集。 (图1) 现在需要根据这份数据集来制作每天的日报情况, ...

一个 Python 报表自动化实战案例

一个 Python 报表自动化实战案例
2021-10-25
给大家分享新书《对比Excel,轻松学习Python报表自动化》中关于报表自动化实战的一篇内容。 本篇文章将带你了解报表自动化的流程,并教你用Python实现工作中的一个报表自动化实战,篇幅较长,建议先收藏,文章 ...

如何评估机器学习模型的商业价值

如何评估机器学习模型的商业价值
2021-09-22
作者:amitvkulkarni CDA数据分析师编译 概述 对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程 ...

手把手教你用Pandas库对淘宝原始数据进行数据处理和分词处理

手把手教你用Pandas库对淘宝原始数据进行数据处理和分词处理
2021-08-25
来源:Python爬虫与数据挖掘 作者: Python进阶者 大家好,我是Python进阶者。 一、前言 大家好,我是Python进阶者,上个礼拜的时候,我的Python交流群里有个名叫程序的大佬,头像是绿色菜狗的那 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

Pandas中的宝藏函数-map

Pandas中的宝藏函数-map
2021-07-28
来源:AI入门学习 作者:小伍哥 pandas中的map类似于Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结 ...

集成算法,随机森林回归模型

集成算法,随机森林回归模型
2021-07-20
来源:数据STUDIO 作者:云朵君 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回归树与分类树的不同,不纯度的指标, 参数Criterion不一致。 RandomForestRegressor(n_estimators='wa ...

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史
2021-07-19
CDA数据分析师 出品 作者:Mika 【导读】 今天带大家用数据可视化解读120 年奥运变迁史。 几经波折,东京奥运会终于即将迎来开幕的时刻,距离7月23日东京奥运会开幕只有不到一周的时间了。 这 ...

时间序列,从开始到结束日期自增扩充数据

时间序列,从开始到结束日期自增扩充数据
2021-07-15
来源:数据STUDIO 作者:云朵君 糖尿病是全球最常见的慢性非传染性疾病之一。流行病学调查显示,我国约11%的成年人患有糖尿病,而在住院患者中这一比例更高。 住院期间将长期服用药物,医院 ...

运用Python爬取并分析全国5w+新楼盘近况

运用Python爬取并分析全国5w+新楼盘近况
2021-07-14
作者:云朵君 通过爬取全国城市在售预售新盘,下面以获取单个城市为例,介绍爬取数据部门主要代码。完整代码见文末获取方式。 1、定义函数 2、获取数据的主函数 def get_data(c_city, c ...

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码

太厉害了!Seaborn也能做多种回归分析,统统只需一行代码
2021-07-07
作者:云朵君 本文主要介绍回归模型图lmplot、线性回归图regplot,这两个函数的核心功能很相似,都会绘制数据散点图,并且拟合关于变量x,y之间的回归曲线,同时显示回归的95%置信区间。 所有图形将使 ...

一个企业级数据挖掘实战项目,教育数据挖掘

一个企业级数据挖掘实战项目,教育数据挖掘
2021-07-06
来源:数据STUDIO 作者:云朵君 导读:大家好,我是云朵君!自从分享了一篇能够写在简历里的企业级数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了 ...

高考旅游火热升温|数据显示,他们都想去这里

高考旅游火热升温|数据显示,他们都想去这里
2021-07-01
来源:数据STUDIO 作者:云朵君 大家好,我是云朵君。 紧张、激烈的高考大战已经告一段落了,经历了十年寒窗苦读的高三学子们,一边焦急等待成绩出来的同时,一边也会不由自主期待随之而来的快乐假期吧? ...

大数据告诉你:粽子甜咸之争谁胜出?吃货最爱买谁家的粽子?

大数据告诉你:粽子甜咸之争谁胜出?吃货最爱买谁家的粽子?
2021-06-15
CDA数据分析师 出品 【导语】:今天我们来聊聊粽子,Python分析部分请看第三部分。 又到一年端午节,作为中华民族的传统节日,传说粽子是为祭奠投江的屈原而传承下来的,如今吃粽子也成了端午的主要习俗 ...

不会用Python提取PDF表格?三种类型数据,轻松转换

不会用Python提取PDF表格?三种类型数据,轻松转换
2021-03-22
来源:早起Python 作者:自动化工作组 大家好,从PDF中提取信息是办公场景中经常需要用到的操作,也是经常又读者在后台问的一个操作。 内容少的话我们可以手动复制粘贴,但如果需要批量提取就可以考虑使 ...

用Python制作处理小工具,多种操作,一键完成,非常实用

用Python制作处理小工具,多种操作,一键完成,非常实用
2021-02-07
作者:GUI工作组 本文将结合GUI工具PySimpleGUI,来讲解如何制作一款属于自己的数据预处理小工具,让这个过程也能够自动化!最终效果如下 本文将分为三部分讲解: 主要涉及将涉及以下模块: 一、G ...

东京奥运会能如期举办吗?带你用数据看120年奥运变迁史

东京奥运会能如期举办吗?带你用数据看120年奥运变迁史
2020-11-30
   CDA数据分析师 出品   作者:真达、Mika 数据:真达   【导读】 2020年年初,突然袭来的新冠疫情给我们的生活带来了巨大的改变,与此同时也让许多国际体育赛 ...

如何用pandas更快的进行数据可视化

如何用pandas更快的进行数据可视化
2020-11-27
作者:刘早起 来源:早起Python(公众号) 如果你经常使用Python进行数据分析,那么对于pandas一定不会陌生,但是Pandas除了在数据处理上大放异彩,随着版本的不断更新,Pandas的绘图功能在 ...

pandas数据可视化原来也这么厉害

pandas数据可视化原来也这么厉害
2020-11-26
作者:小伍哥  来源:AI入门学习(公众号) 在python中,常见的数据可视化库有3个: matplotlib:最常用的库,可以算作可视化的必备技能库,比较底层,api多,学起来不太容易。 seaborn:是建 ...

OK