在 pandas 中如何实现 sql 查询中 case when then end 的功能？-CDA数据分析师官网

热线电话：13121318867

首页大数据时代在 pandas 中如何实现 sql 查询中 case when then end 的功能？

在 pandas 中如何实现 sql 查询中 case when then end 的功能？

2023-04-21

在pandas中实现SQL查询中的CASE-WHEN-THEN-END功能是一项非常有用的技能，可以帮助我们快速和高效地处理数据。我将向你介绍如何在Pandas中实现此功能，并提供一些示例，以便您更好地理解。

首先，让我们先回顾一下SQL中的CASE-WHEN-THEN-END语句是什么。它通常用于根据某些条件对数据进行分类或转换。例如，假设我们有一个“订单”表，其中包含客户的姓名、订单金额和订单日期。我们可以使用CASE-WHEN-THEN-END语句将订单金额按照以下规则进行分类：

如果订单金额小于100，则为“小额订单”。
如果订单金额介于100和1000之间，则为“普通订单”。
如果订单金额大于1000，则为“大额订单”。

在SQL中，可以通过以下方式实现：

SELECT
    customer_name,
    order_amount,
    CASE
        WHEN order_amount < 100 class="hljs-string">'Small Order'
        WHEN order_amount BETWEEN 100 AND 1000 THEN 'Regular Order'
        WHEN order_amount > 1000 THEN 'Large Order'
    END AS order_type,
    order_date
FROM
    orders;

现在让我们看看如何在pandas中实现相同的结果。Pandas提供了类似的功能，称为“np.select”。它将一个布尔数组列表作为第一个参数，每个布尔数组都代表一个条件。第二个参数是一个列表，其中包含与每个条件对应的值。如果没有任何条件被满足，则返回第三个参数作为默认值。以下是如何在Pandas中实现上述示例的代码：

import pandas as pd
import numpy as np

orders = pd.read_csv('orders.csv')

conditions = [
    orders['order_amount'] < 100 class="hljs-string">'order_amount'] >= 100) & (orders['order_amount'] <= 1000),
    orders['order_amount'] > 1000
]

choices = ['Small Order', 'Regular Order', 'Large Order']

orders['order_type'] = np.select(conditions, choices, default='Unknown')

print(orders)

在这个例子中，我们首先将数据集加载到一个名为“orders”的DataFrame中。然后，我们定义了三个条件，因此我们有三个布尔数组分别代表小额订单、普通订单和大额订单。接下来，我们定义了三个值列表，其中包含与每个条件相对应的值，即“Small Order”、“Regular Order”和“Large Order”。最后，我们使用np.select函数将这些条件和值传递给订单数据集，并将结果存储在名为“order_type”的新列中。

需要注意的是，我们还提供了一个默认值参数，以便处理任何未被满足的条件。在这个例子中，我们将默认值设置为“Unknown”。

此外，在Pandas中，也可以使用“pd.cut”函数来执行类似的操作。它允许我们将连续变量分成离散的区间，并将它们标记为相应的类别。例如，在上面的订单数据集中，我们可以使用以下代码将订单金额划分为三个等距的区间：

orders['order_type'] = pd.cut(orders['order_amount'], 3, labels=['Small Order', 'Regular Order', 'Large Order'])

在这种情况下，我们将订单金额分成三个等距的区间，并将每个区间标记为“Small Order”、“Regular Order”或“Large Order”。

总结起来，Pandas提供了多种实现SQL查询中CASE-WHEN-THEN-END功能的方法，包括使用np.select和pd.cut函数。这些函数都非常有用，可以帮助我们快速、高效地处理数据，并使得数据转换和分类更容易。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

SQL pandas DataFrame numpy 数据转换

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇如果利用pandas处理多列数据条件筛选？

下一篇sql 查询如何将结果集输出为一段字符串？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

在 pandas 中如何实现 sql 查询中 case when then end 的功能？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

在 pandas 中如何 实现 sql 查询中 case when then end 的功能？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

在 pandas 中如何实现 sql 查询中 case when then end 的功能？