在 pandas 中如何实现 sql 查询中 case when then end 的功能？-CDA数据分析师官网

热线电话：13121318867

首页大数据时代在 pandas 中如何实现 sql 查询中 case when then end 的功能？

在 pandas 中如何实现 sql 查询中 case when then end 的功能？

2023-04-21

在pandas中实现SQL查询中的CASE-WHEN-THEN-END功能是一项非常有用的技能，可以帮助我们快速和高效地处理数据。我将向你介绍如何在Pandas中实现此功能，并提供一些示例，以便您更好地理解。

首先，让我们先回顾一下SQL中的CASE-WHEN-THEN-END语句是什么。它通常用于根据某些条件对数据进行分类或转换。例如，假设我们有一个“订单”表，其中包含客户的姓名、订单金额和订单日期。我们可以使用CASE-WHEN-THEN-END语句将订单金额按照以下规则进行分类：

如果订单金额小于100，则为“小额订单”。
如果订单金额介于100和1000之间，则为“普通订单”。
如果订单金额大于1000，则为“大额订单”。

在SQL中，可以通过以下方式实现：

SELECT
    customer_name,
    order_amount,
    CASE
        WHEN order_amount < 100 class="hljs-string">'Small Order'
        WHEN order_amount BETWEEN 100 AND 1000 THEN 'Regular Order'
        WHEN order_amount > 1000 THEN 'Large Order'
    END AS order_type,
    order_date
FROM
    orders;

现在让我们看看如何在pandas中实现相同的结果。Pandas提供了类似的功能，称为“np.select”。它将一个布尔数组列表作为第一个参数，每个布尔数组都代表一个条件。第二个参数是一个列表，其中包含与每个条件对应的值。如果没有任何条件被满足，则返回第三个参数作为默认值。以下是如何在Pandas中实现上述示例的代码：

import pandas as pd
import numpy as np

orders = pd.read_csv('orders.csv')

conditions = [
    orders['order_amount'] < 100 class="hljs-string">'order_amount'] >= 100) & (orders['order_amount'] <= 1000),
    orders['order_amount'] > 1000
]

choices = ['Small Order', 'Regular Order', 'Large Order']

orders['order_type'] = np.select(conditions, choices, default='Unknown')

print(orders)

在这个例子中，我们首先将数据集加载到一个名为“orders”的DataFrame中。然后，我们定义了三个条件，因此我们有三个布尔数组分别代表小额订单、普通订单和大额订单。接下来，我们定义了三个值列表，其中包含与每个条件相对应的值，即“Small Order”、“Regular Order”和“Large Order”。最后，我们使用np.select函数将这些条件和值传递给订单数据集，并将结果存储在名为“order_type”的新列中。

需要注意的是，我们还提供了一个默认值参数，以便处理任何未被满足的条件。在这个例子中，我们将默认值设置为“Unknown”。

此外，在Pandas中，也可以使用“pd.cut”函数来执行类似的操作。它允许我们将连续变量分成离散的区间，并将它们标记为相应的类别。例如，在上面的订单数据集中，我们可以使用以下代码将订单金额划分为三个等距的区间：

orders['order_type'] = pd.cut(orders['order_amount'], 3, labels=['Small Order', 'Regular Order', 'Large Order'])

在这种情况下，我们将订单金额分成三个等距的区间，并将每个区间标记为“Small Order”、“Regular Order”或“Large Order”。

总结起来，Pandas提供了多种实现SQL查询中CASE-WHEN-THEN-END功能的方法，包括使用np.select和pd.cut函数。这些函数都非常有用，可以帮助我们快速、高效地处理数据，并使得数据转换和分类更容易。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

SQL pandas DataFrame numpy 数据转换

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇如果利用pandas处理多列数据条件筛选？

下一篇sql 查询如何将结果集输出为一段字符串？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

在 pandas 中如何实现 sql 查询中 case when then end 的功能？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

CDA持证人专访：赵君研谈金融行业数据分析与运营岗 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

在 pandas 中如何 实现 sql 查询中 case when then end 的功能？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

CDA持证人专访：赵君研谈金融行业数据分析与运营岗 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

在 pandas 中如何实现 sql 查询中 case when then end 的功能？