wangjuju123

2018-10-25   阅读量: 723

数据分析师 Python编程 Python数据分析

随机样本量(随机种子)生成方法介绍:

扫码加入数据分析学习群

1.1 np.random. rand(d0, d1, ..., dn),d0-dn应为整数,例如,生成一个一行两列的数组array,如下:

通过调整参数d,改变数组结构,生成[0,1)之间的数据,包括0,不包括1,返回值为指定维度的数组。


1.2 np.random.randn(d0, d1, ..., dn),生成一个或者一组具有标准正态分布性质的样本量,参数与rand用法相同。(标准正态分布是指以0为均值,以1为标准差的正态分布),例如:


1.3 np.random. randint(low, high=None, size=None, dtype='l'),生成随机整数,范围为[low,high),包含low,不包含high,size为输出的数据维度大小,默认为None,dtype为数据类型,默认为int。

当high没有填写时,生成样本量的范围时[0,low)。


1.4 np.random.random_sample([size]),生成由[0,1)之间的浮点数组成的array结构数据,size可更改数组内容个数,和np.random.random功能相同。


1.5 np.random. choice(a, size=None, replace=True, p=None),从一个给定的数组中生成随机样本。参数:a,为一维数组类似数据或整数(当a为整数时,对应的一维数组是np.arange(a),size是指数组的维度,replaces默认为True是指样本可出现重复值,为False是指不能出现重复值,p为数组中数据出现的概率。

当参数都为默认值,在取值范围[0,4)中生成一个一维数组,如下:

在设置了参数p之后:


1.6 np.random.seed()生成的随机数据可预测,当设置seed的参数相同时,会使每次生成的随机数相同

第一次不设置seed生成数组,如下:

再次执行后,数据发生变化:

当设置seed后,不论执行多少次都是固定的数据:


1.7 pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
7.3728 1 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子