快速解释如何使用pandas的inplace参数

2020-07-22

pandas 是源于NumPy 的一种python库，主要是为了解决数据分析任务而创建的。pandas为我们提供了大量简单便捷地处理数据的函数和方法。今天小编给大家分享的就是：快速解释如何使用pandas的inplace参数，希望对大家学习和使用pandas有所帮助。

以下文章来源： DeepHub IMBA

作者：P**nHub兄弟网站

介绍

在操作dataframe时，初学者有时甚至是更高级的数据科学家会对如何在pandas中使用inplace参数感到困惑。

更有趣的是，我看到的解释这个概念的文章或教程并不多。它似乎被假定为知识或自我解释的概念。不幸的是，这对每个人来说都不是那么简单，因此本文试图解释什么是inplace参数以及如何正确使用它。

让我们来看看一些使用inplace的函数的例子:

fillna()dropna()sort_values()reset_index()sort_index()rename()

我已经创建了这个列表，可能还有更多的函数使用inplace作为参数。我没有记住所有这些函数，但是作为参数的几乎所有pandas DataFrame函数都将以类似的方式运行。这意味着在处理它们时，您将能够应用本文将介绍的相同逻辑。

创建一个示例DataFrame

为了说明inplace的用法，我们将创建一个示例DataFrame。

 import pandas as pd
 import numpy as np
 client_dictionary = {'name': ['Michael', 'Ana', 'Sean', 'Carl', 'Bob'],
                      'second name': [None, 'Angel', 'Ben', 'Frank', 'Daniel'],
                      'birth place': ['New York', 'New York', 'Los Angeles', 'New York', 'New York'],
                      'age': [10, 35, 56, None, 28],
                      'number of children': [0, None, 2, 1, 1]}
 df = pd.DataFrame(client_dictionary)
 df.head()

我们创建了一个数据框架，该数据框架有5行，列如下: name, second name, birthplace,age,number of children。注意，age、second name和children列中有一些缺失值(nan)。

现在我们将演示dropna()函数如何使用inplace参数工作。因为我们想要检查两个不同的变体，所以我们将创建原始数据框架的两个副本。

 df_1 = df.copy()
 df_2 = df.copy()

下面的代码将删除所有缺少值的行。

 df_1.dropna(inplace=True)

如果您在Jupyter notebook中运行此操作，您将看到单元格没有输出。这是因为inplace=True函数不返回任何内容。它用所需的操作修改现有的dataframe，并在原始dataframe上“就地”（inplace）执行。

如果在dataframe上运行head()函数，应该会看到有两行被删除。

 df_1.head()

现在我们用inplace = False运行相同的代码。注意，这次我们将使用df_2版本的df

 df_2.dropna(inplace=False)

如果您在Jupyter notebook中运行此代码，您将看到有一个输出(上面的屏幕截图)。inplace = False函数将返回包含删除行的数据。

记住，当inplace被设置为True时，不会返回任何东西，但是原始数据被修改了。

那么这一次原始数据会发生什么呢?让我们调用head()函数进行检查。

 df_2.head()

原始数据不变!那么发生了什么?

当您使用inplace=True时，将创建并更改新对象，而不是原始数据。如果您希望更新原始数据以反映已删除的行，则必须将结果重新分配到原始数据中，如下面的代码所示。

 df_2 = df_2.dropna(inplace=False)

这正是我们在使用inplace=True时所做的。是的，最后一行代码等价于下面一行:

 df_2.dropna(inplace=True)

后者更优雅，并且不创建中间对象，然后将其重新分配给原始变量。它直接改变原始数据框架，因此，如果需要改变原始数据，那么inplace=True是首选。

那么，为什么会有在使用inplace=True产生错误呢?我不太确定，可能是因为有些人还不知道如何正确使用这个参数。让我们看看一些常见的错误。

常见错误

使用inplace = True处理一个片段

如果我们只是想去掉第二个name和age列中的NaN，而保留number of children列不变，我们该怎么办?

我见过有人这样做:

 df[['second name', 'age']].dropna(inplace=True)

这会抛出以下警告。

这个警告之所以出现是因为Pandas设计师很好，他们实际上是在警告你不要做你可能不想做的事情。该代码正在更改只有两列的dataframe，而不是原始数据框架。这样做的原因是，您选择了dataframe的一个片段，并将dropna()应用到这个片段，而不是原始dataframe。

为了纠正它，可以这样使用

 df.dropna(inplace=True, subset=['second name', 'age'])
 df.head()

这样就可以将dataframe中删除第二个name和age列中值为空的行。

将变量值赋给inplace= True的结果

 df = df.dropna(inplace=True)

这又是你永远不应该做的事情!你只需要将None重新赋值给df。记住，当你使用inplace=True时，什么也不会返回。因此，这段代码的结果是将把None分配给df。

总结

我希望本文为您揭开inplace参数的神秘面纱，您将能够在您的代码中正确地使用它。

pandas DataFrame python numpy 数据分析

数据分析咨询请扫描二维码

上一篇不会绘制环形图？别担心，使用tableau简单几步就能完成

下一篇如何给列表降维？sum()函数的妙用

快速解释如何使用pandas的inplace参数

介绍

创建一个示例DataFrame

常见错误

总结

考试指南

报考指南

热门栏目

最新资讯

政府、国央企、科研单位——中国航信-面向测试度量 ...

CDA内训丨深圳迈瑞生物医疗数据分析统计思维培训 ...

CDA数据分析师应合肥阳光新能源科技有限公司邀约开 ...

CDA走进海尔大学

苏州中行&CDA数据分析师开展数据分析师培训 ...

中国银行江苏分行-大数据应用培训

浙江农信数据建模及案例应用培训

华夏银行信用卡中心-机器学习培训

字节跳动-CDA案例实操及行业分析

长沙银行-Python集训营

数据分析在业务中的三大应用场景

AI提示词的使用方法详解及示例

CDA立足未来职场，拓展前沿视野

CDA 塑造未来职涯：构筑未来职业发展的数字基石 ...

随机森林（Random Forest）算法的优点和缺点都有哪 ...

方差分析的基本思想和原理是什么？

发现了一个好用到爆的数据分析利器

自从搞懂了回调函数，我对Python的理解上了一个台阶 ...

2020在学硕士达300万，失去学历光环的新生代何去何 ...

缓解就业焦虑的利器，证书真的越多越有保障吗？ ...