京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在pandas中,可以使用条件筛选来选择满足特定条件的数据
import pandas as pd
d = np.array([[81, 28, 24, 25, 96],
[ 8, 35, 56, 98, 39],
[13, 39, 55, 36, 3],
[70, 54, 69, 48, 12],
[63, 80, 97, 25, 70]])
df = pd.DataFrame(data = d,
columns=list('abcde'))
df
| a | b | c | d | e | |
|---|---|---|---|---|---|
| 0 | 81 | 28 | 24 | 25 | 96 |
| 1 | 8 | 35 | 56 | 98 | 39 |
| 2 | 13 | 39 | 55 | 36 | 3 |
| 3 | 70 | 54 | 69 | 48 | 12 |
| 4 | 63 | 80 | 97 | 25 | 70 |
# 单一条件
df[df['a']>60]
df.loc[df['a']>60]
| a | b | c | d | e | |
|---|---|---|---|---|---|
| 0 | 81 | 28 | 24 | 25 | 96 |
| 3 | 70 | 54 | 69 | 48 | 12 |
| 4 | 63 | 80 | 97 | 25 | 70 |
# 单一条件&多列
df.loc[(df['a']>60) ,['a','b','d']]
| a | b | d | |
|---|---|---|---|
| 0 | 81 | 28 | 25 |
| 3 | 70 | 54 | 48 |
| 4 | 63 | 80 | 25 |
# 多条件
df[(df['a']>60) & (df['b']>60)]
| a | b | c | d | e | |
|---|---|---|---|---|---|
| 4 | 63 | 80 | 97 | 25 | 70 |
# 多条件 筛选行 & 指定列筛选列
df.loc[(df['a']>60) & (df['b']>60) ,['a','b','d']]
| a | b | d | |
|---|---|---|---|
| 4 | 63 | 80 | 25 |
以上是使用条件筛选来选取数据 ,接下来我们来看如何对数据进行数学计算
这里分享一个你一定用得到的小程序——CDA数据分析师考试小程序。 它是专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。 扫码加入CDA小程序,与圈内考生一同学习、交流、进步!

数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi