pandas怎么进行描述性统计？

詹惠儿

2018-11-13 阅读量: 1168

pandas怎么进行描述性统计？

describe()主要用于分析一组数据对象的分布特征，使用`describe()`函数一个很大的优点是，我们会得到数值列的描述性统计，并排除了字符列。

让我们首先创建一个DataFrame，显示学生姓名及其在数学和英语中的分数：

import pandas as pd

data = {  
    'Name': ['John', 'Alice', 'Joseph', 'Alex'],
    'English': [64, 78, 68, 58],
    'Maths': [76, 54, 72, 64]
}

df = pd.DataFrame(data)  
print(df)

输出：

 English  Maths    Name
0       64     76    John  
1       78     54   Alice  
2       68     72  Joseph  
3       58     64    Alex

我们只需要describe()在DataFrame上调用函数并获得各种度量，如均值，标准差，中位数，最大元素，最小元素等：

df.describe()

输出：

   English      Maths
count   4.000000   4.000000  
mean   67.000000  66.500000  
std     8.406347   9.712535  
min    58.000000  54.000000  
25%    62.500000  61.500000  
50%    66.000000  68.000000  
75%    70.500000  73.000000  
max    78.000000  76.000000