热线电话:13121318867

登录
2018-11-13 阅读量: 793
pandas怎么进行描述性统计?

describe()主要用于分析一组数据对象的分布特征,使用describe()函数一个很大的优点是,我们会得到数值列的描述性统计,并排除了字符列。

让我们首先创建一个DataFrame,显示学生姓名及其在数学和英语中的分数:

import pandas as pd

data = {
'Name': ['John', 'Alice', 'Joseph', 'Alex'],
'English': [64, 78, 68, 58],
'Maths': [76, 54, 72, 64]
}

df = pd.DataFrame(data)
print(df)

输出:

 English  Maths    Name
0 64 76 John
1 78 54 Alice
2 68 72 Joseph
3 58 64 Alex

我们只需要describe()在DataFrame上调用函数并获得各种度量,如均值,标准差,中位数,最大元素,最小元素等:

df.describe()  

输出:

   English      Maths
count 4.000000 4.000000
mean 67.000000 66.500000
std 8.406347 9.712535
min 58.000000 54.000000
25% 62.500000 61.500000
50% 66.000000 68.000000
75% 70.500000 73.000000
max 78.000000 76.000000

如您所见,该describe()方法完全忽略了“名称”列,因为它不是数字,这正是我们想要的。这简化了调用者的工作,因为在计算所需的数值统计数据之前,您无需担心删除非数字列。

0.0000
5
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子