玫瑰图,全称为南丁格尔玫瑰图(Nightingale rose diagram),或者又叫做鸡冠花图、极坐标区域图等。早在克里米亚战争期间,统计学家和医学改革家佛罗伦斯‧南丁格尔 (Florence Nightingale) 就层使用玫瑰图表传达 ...
2020-07-15
EXCEL是我们平常工作中使用最多、最方便、最简单的一款数据统计和分析工具,但是如果数据量过大,EXCEL就不那么好用了,甚至连打开也变得非常困难,那么这时候就轮到python出场了。今天小编将会给大家分享如何使用 ...
2020-07-15seaborn是一款常用的python可视化库,基于matplotlib,相比matplotlib,seaborn绘制的多数图表都具有统计学意义,如分布、关系、统计、回归等,今天小编跟大家分享的是如何使用seaborn绘制直方图和密度图。 Sea ...
2020-07-15
requests库是一个简单,而且快速处理HTTP请求的第三方库,是目前公认的爬取网页速度最快的库。requests库拥有许多强大的功能,包括:国际域名以及url获取、http长连接、连接缓存等等,更多的详细功能可以参考reque ...
2020-07-15
BeautifulSoup是一款灵活又便捷的HTML/XML的解析器,通常被用来解析和提取 HTML/XML 数据。BeautifulSoup处理速度快,效率高,而且支持多种解析器,不用编写正则表达式也能快速地实现网页信息的提取。 1、Beaut ...
2020-07-15
scrapy一个开源和协作的框架,最初的设计目的为:页面抓取(更准确来说是网络抓取),因此scrapy能够以简便、快捷·、可扩展的方式从网站中提取所需的信息。现阶段scrapy的应用十分广泛,能够用于挖掘、监测和自动 ...
2020-07-15
xpath全称为XML Path Language, 是一门从XML中提取数据的语言,通常是利用元素和属性来进行导航的。 一、对于xpath的理解 1、xpath特点: xpath 包含一个标准函数库 xpath 是 XSLT 中的主要元 ...
2020-07-15Python是一款使用方便,易上手的工具,我们平常在工作中经常会用到,而且同时也是一款功能强大的编程语言,被广泛应用于数据分析、web开发、人工智能等行业。但是无论那个行业,哪个领域,想要熟练使用Python,就 ...
2020-07-15Pandas是一款很强大的Python库,具有很多方便的功能,今天小编就给大家分享用Pandas修改样式。 以下内容转载于早起Python微信公众号。 作者:刘早起 文章来源:早起Python 前言 在之前的很多文章中 ...
2020-07-14HbaseE是一个具有高可靠性、高性能特点、面向列、可伸缩的分布式存储系统。利用Hbase技术能够在廉价PC Server上搭建起大规模结构化存储集群。Hbase的目标为:存储并处理大型的数据。更进一步说就是仅需通过普通的 ...
2020-07-14
Hive是一款基于Hadoop的数据仓库工具,通常被用于数据提取、转化、加载,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive最大的优点是学习成本低, ...
2020-07-14数据分析的最终目的是驱动企业业务增长,今天小编就带大家来看一下数据分析成果落地难的那些问题。 文章来源:微信公众号接地气学堂 作者:接地气的陈老师 落地、见效!是很多做数据分析的同学最怕的 ...
2020-07-14mysql内置函数有很多,小编今天给大家整理了mysql常用的日期和时间函数,希望对大家学习mysql有所帮助。 日期格式:YYYY-MM-DD 时间格式:HH:MM:SS ...
2020-07-14使用python对数据进行处理时,数据挖掘是极为重要的方式和阶段,目的是搜集大量数据,并从中通过算法搜索出隐藏在数据中的那些隐含的、先前未知的,并有具有潜在使用价值的信息。那么python数据挖掘的具体流程是怎 ...
2020-07-14
前面跟大家介绍了RNN与CNN,下面小编简单跟大家介绍一下DNN-深度神经网络。 深度神经网络DNN,全称Deep Neural Networks,是深度学习的基础。与循环神经网络RNN、卷积神经网络CNN的最大区别就是:DNN特指全连接 ...
2020-07-14python具有强大的可视化功能,能够绘制出许多效果酷炫的图表,小编今天跟大家分享的是:如何用python绘制折线图。 以下文章转载于大数据DT微信公众号。 作者:屈希峰,资深Python工程师,知乎多个专栏作者 ...
2020-07-14tensorFlow是机器学习中应用最广泛,最受欢迎的算法库之一。Tensorflow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护,Google几乎在所有应用程序中都使用tensorFlow来实现机器学习。 下面小编整理了tensorF ...
2020-07-14
PyTorch是什么?单从字面上,我们就能很容易看出来,与Python和Torch有关。PyTorch是使用Python作为编程语言,可以说是Torch的Python版,是由Torch7团队开发的,一种开源的神经网络框架,专门用于 GPU 加速的深度神 ...
2020-07-14
半监督学习(SSL),全称Semi-Supervised Learning,类属于机器学习(Machine Learning,ML)。在只有少量标记样本,大部分样本都是无标记的情况下,可以使用半监督学习方法,根据无标记样本与标记样本间的相似度、以及 ...
2020-07-14
层次聚类,即Hierarchical Clustering,是一种聚类算法,通过对不同类别数据点间的相似度的计算,从而创建一棵有层次的嵌套聚类树。 一、层次聚类算法原理 在聚类树中,树的最底层是不同类别的原始数据点, ...
2020-07-14在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21