Numpy中有许多用于统计分析的函数
针对二维数组,需要注意轴的概念,0和1代表纵轴和横轴
print(data.sum(axis=1)) #对行进行求和
print(data.mean(axis=1)) #对行进行计算均值
print(data.cumsum()) #累计求和
np.percentile(data,[0,25,50,75,100])
注:axis0:表示沿着列进行操作axis1:表示沿着行进行操作
data.sum() #对所有的元素进行求和
data.sum(axis=0) #对每列进行求和
data.sum(axis=1) #对每行进行求和
data.mean(axis=0) #计算每列的平均值
data.mean(axis=1) #计算每行的平均值
data[:,1].mean(axis) #计算第二列的均值
###累计求和###
data.cumsum() #从左往右累计求和
data.cumsum(axis=0) #对每列沿着列的方向进行累计求和
data.cumsum(axis=1) #对每行沿着行的方向进行累计求和
data.cumprod() #从左往右累积求积 这个时候等于0等于1基本没啥区别
data.max() #计算这组数据的最大值
data.max(axis=0) #计算每一列的最大值
data.max(axis=1) #计算每一行的最大值
np.percentile(data,50) #计算分位数 50分位数就相当于中位数
np.median(data) #计算data的中位数
###求极差### 最大值-最小值:data.max()-data.min()
np.ptp(data)#极差
data.ptp(axis=0) #计算每一列的极差
data.ptp(axis=1) #计算每一行的极差
data>0.3 #比较data中的每个数,大于0.3的显示true 小于的显示false
np.sum(data>0.3) #统计data中的大于0.3的个数