作者:俊欣 来源:关于数据分析与可视化 今天我们继续来讲一下Pandas和SQL之间的联用,我们其实也可以在Pandas当中使用SQL语句来筛选数据,通过Pandasql模块来实现该想法,首先我们来安装一下该模块 pi ...
2022-03-22
CDA数据分析师 出品 近几年,“法拍房”是一个极火的存在,火的原因是因为法拍房的数量越来越庞大,成交量和价格都受到关注。 01、法拍房趋势分析 2017年全国法拍房数量仅有几千套,2018年法拍房数 ...
2022-03-21
作者:麦叔 来源:麦叔编程 AttributeError 这是某位麦友提的问题: ❝ 麦叔之前有讲过python的 __call__(),__get__, __getattr__, __getattribute__这几个方法吗,网上搜索的讲的都不透 ...
2022-03-21
作者:麦叔 来源:麦叔编程 装饰器的本质 先简单说一下什么是装饰器。 装饰器,顾名思义,就是起装饰作用的东西。手机壳是一种装饰品。手机膜也是一种装饰品。 在编程的世界里,装饰器的作用, ...
2022-03-18
作者:Python进阶者 来源:Python爬虫与数据挖掘 前言 偶然想对数据分列多一些操作,但是遇到了问题,如下图所示。 上图这个是原始数据,但是现在想要下图这样的效果,怎么破呢? 这个 ...
2022-03-18作者:麦叔 来源:麦叔编程 我对注释的态度 加注释无疑是很好的习惯,但是有时候会被滥用。我一直持有以下几个观点: 最好的注释是代码,把代码写清晰是首要的,是程序员最重要的修炼。 ...
2022-03-16
作者:麦叔 来源:麦叔编程 深度copy和浅度copy回顾 在【#067】我们聊到了深度copy和浅度copy,如果还没看请点击文末查看。 我们有一个对象Coder(编程者),它包含昵称,编程年数,以及所会的编 ...
2022-03-16
作者:小伍哥 来源:小伍哥聊风控 一、了解tf-idf 对于文本处理,tf-idf的使用已经非常普遍,在sklearn等知名的机器学习开源库中都提供了直接的调用,然而很多人并没有搞清楚TF-IDF是怎么算出来的, ...
2022-03-14
作者:俊欣 来源:关于数据分析与可视化 今天我们来聊一下Pandas当中的数据集中带有多重索引的数据分析实战 通常我们接触比较多的是单层索引(左图),而多级索引也就意味着数据集当中的行索引有多个 ...
2022-03-14
作者:闲欢 来源:Python 技术 前几天,有个小妹妹问我:哪里可以找到 BBC 英语的音频? 她只有视频文件,但是她想在路上听音频学英语。 我当时就去网盘资源里面搜索,废了好大功夫才找到她要的资 ...
2022-03-11
作者:麦叔 来源:麦叔编程 扩展内置类 我们知道继承是面向对象编程的最重要特征之一。 牧羊犬可以继承自Dog类,就算不写一行代码,就拥有了Dog的基本特征和行为。 中学生可以继承自Stud ...
2022-03-11
作者:Python进阶者 来源:Python爬虫与数据挖掘 前言 大家好,我是吴老板。今天给大家分享一个可将Mongodb数据库里边的文件转换为表格文件的库,这个库是我自己开发的,有问题可以随时咨询我。 M ...
2022-03-10
作者:闲欢 来源:Python 技术 对于程序员来说,除了日常争论世界上最好的语言是哪一门以外,哪款 IDE 是最好的也是争议颇多,今天我们就来介绍 10 款最好的 Python 编程 IDE,总有一款 ...
2022-03-10
来源:Python数据之道 作者:阳哥 01、写在前面 最近几个月,我在微信视频号「价值前瞻」和「Python数据之道」发布了一些视频,有不少同学问到这些视频是怎么做的,用什么工具制作的。 在文章 用 pyth ...
2022-03-09
CDA数据分析师 出品 作者:徐杨老师 编辑:Mika 大家好,我是徐杨老师,很高兴又和大家见面了。 金三银四跳槽季马上就要到来了,是不是有很多同学都已经开始蠢蠢欲动了? 但是不少准备换工作的 ...
2022-03-09
作者:麦叔 来源:麦叔编程 深度copy和浅度copy回顾 在【#067】我们聊到了深度copy和浅度copy,如果还没看请点击文末查看。 我们有一个对象Coder(编程者),它包含昵称,编程年数,以及所会的编 ...
2022-03-08
作者:俊欣 来源:关于数据分析与可视化 今天小编来为大家介绍一个叫做Folium的模块,我们可以用它来绘制高清的交互式地图,并且标注出重要的地理位置等等,读者在看过本篇文章之后,读者大致会掌握 1. ...
2022-03-08
作者:俊欣 来源:关于数据分析与可视化 今天我们来讲一下用Pandas模块对数据集进行分析的时候,一些经常会用到的配置,通过这些配置的帮助,我们可以更加有效地来分析和挖掘 ...
2022-03-07
作者:極光 来源:Python 技术 正则表达式相信大家应该都不陌生,本质上就是一种微小的、高度专业化的编程语言,使用它你可以为要匹配的可能字符串集指定规则。大多数编程语言正则语法基本相似,只是实 ...
2022-03-07
CDA数据分析师 出品 来源:datacamp 编译:Mika 根据《韦氏词典》,数据指的是用作推理、讨论或计算基础的事实信息。 基于这个定义,我们可以进一步得出:数据可以理解为是收集到的任何信息,可以 ...
2022-03-04B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22