热线电话:13121318867

登录
2020-07-24 阅读量: 838
python数据清洗

生成数组:

import numpy as np

np.array([1,2,3])

常用数组:

全0、全1、全N数组

np.zeros((3,3)) #生成全0数组

np.zeros_like(arr1) #生成的0数组会和里面的arr1行列数(形状)一样

np.full((5,5),5) #5 X 5的全为5 的数组

单位数组:

np.eye(3) #3 X 3的单位数组

np.eye(3,4,1) #3 X 4, 主对角上的1向右偏移1个单位

对角阵:

np.diag([1,2,3,4], -1) # 主对角是1234向左下偏移1个单位

blob.png

空数组:

np.empty((3,3)) #里面的元素没有含义,只是为了占位置

线性序列数组:

Np.arrange(start,stop,step)

小知识点:在函数的帮助文档中,加方括号的参数和默认参数的区别:

è加方括号的如果不写不计入函数,默认的参数如果不写就视为默认值参与计算.

np.arrange(2,10,2) #右边的不包括, 从2到8,步长为2

blob.png

np.linspace(1.25,9.78,20,retstep=True) #从1.25到9.78,要20个数,显示步长

blob.png

生成等比数列:

np.logspace(起始值,终止值,个数,显示个数)

blob.png

生成随机整数数组:

np.random.randint(1,10,(2,3)) #2 X 3的1-10之间的随机数组

标准正态分布:

np.random.randn(2,3) #2 X 3的随机正态分布

均匀分布:

Np.random.rand(d0,d1,…) #d0 d1为每个维度上的元素数

随机数种子:

np.random.seed() #随机数种子要和生成随机数连用

blob.png

看形状:

arr1.shape()

看维度:

Arr1.ndim

看数组中元素的数据类型:

arr1.dtype #int32和int64比较常见

看元素个数:

Arr1.size

blob.png

arr2.reshape((2,8)) #改成2 X 8的形状,只改变形状,不改变原数组

arr2.resize((2,8)) #在原数组基础上改变

转置:

arr2.T #二维可以这样写

arr2.swapaxes(0,1) #0维度和1维度的互换,

arr2.flatten(0,1) # 降为一维,生成副本

arr2.ravel(0,1) # 降为一维,生成视图

blob.png

对数组排序:

blob.png

Arr3.sort() #第一行的排一下,第二行的排一下

Arr3.argsort(axis) #带arg的,一般都是显示的位置信息

blob.png blob.png

视图和原数据之间不独立,副本和原数据之间是独立的

blob.png

浅拷贝: 生成副本arr.view()

深拷贝: 生成视图arr.copy()

Np.split(arr2,2)

数组的拆分和拼接:

blob.png

数组的广播功能:

np.arrange(3)+5

数组转换成其他数据类型:

arr.tolist() #转换成列表

arr.mat() #转换成矩阵

blob.png

Pandas

Series:多是从DataFrame中提取出来的,但也可以自己创建

DataFrame多是从外部读取进来的

Series的运算是基于索引对齐的:

blob.png


25.4789
3
关注作者
收藏
评论(0)

发表评论

暂无数据