热线电话:13121318867

登录
2019-03-07 阅读量: 816
Numpy CSV fromfile()

我可能试图在这里重新发明轮子,但numpy有一个fromfile()可以读取的功能 - 我想 - CSV文件。

它似乎非常快 - 甚至与熊猫相比read_csv(),但我不清楚它是如何工作的。

这是一些测试代码:

import pandas as pd

import numpy as np

# Create the file here, two columns, one million rows of random numbers.

filename = 'my_file.csv'

df = pd.DataFrame({'a':np.random.randint(100,10000,1000000), 'b':np.random.randint(100,10000,1000000)})

df.to_csv(filename, index = False)

# Now read the file into memory.

arr = np.fromfile(filename)

print len(arr)

我len()在那里包括了最后,以确保它不是只读一行。但奇怪的是,我的长度(将根据您的随机数生成而变化)为1,352,244。咦?

文档显示可选sep参数。但是当使用时:

arr = np.fromfile(filename, sep = ',')

解决办法:numpy.fromfile不是为了读取.csv文件,而是为了读取用该numpy.ndarray.tofile方法写入的数据。

20.1382
5
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子