2020-10-31
阅读量:
837
python 中pandas和numpy的区别
包都有类似的数据分析工具,但是就细节上有时候也有差别。所以在切换时候需要注意。
两个包的函数methods在np.nan的处理上有区别。
如果是np的methods,比如我们要计算标准差,如果array里面有nan缺失值,那么返回的是nan。
但是如果我们是对于dataFrame求标准差,如果有nan,返回的是去掉nan之后序列中其他数字的标准差。
std函数本身也有一个差异:np.std里面有一个参数可以增加:ddof=1。default情况下,ddof=0,标准差计算时候用的分母是等于样本数量的,如果ddof=1,则返回的是无偏的标准差,使用的分母等于样本数量减去1,也就是统计上用的标准差。
pd包里面的method std直接返回的是后面的标准差,是统计意义上的标准差。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论