2019-03-07
阅读量:
816
Numpy CSV fromfile()
我可能试图在这里重新发明轮子,但numpy有一个fromfile()可以读取的功能 - 我想 - CSV文件。
它似乎非常快 - 甚至与熊猫相比read_csv(),但我不清楚它是如何工作的。
这是一些测试代码:
import pandas as pd
import numpy as np
# Create the file here, two columns, one million rows of random numbers.
filename = 'my_file.csv'
df = pd.DataFrame({'a':np.random.randint(100,10000,1000000), 'b':np.random.randint(100,10000,1000000)})
df.to_csv(filename, index = False)
# Now read the file into memory.
arr = np.fromfile(filename)
print len(arr)
我len()在那里包括了最后,以确保它不是只读一行。但奇怪的是,我的长度(将根据您的随机数生成而变化)为1,352,244。咦?
文档显示可选sep参数。但是当使用时:
arr = np.fromfile(filename, sep = ',')
解决办法:numpy.fromfile不是为了读取.csv文件,而是为了读取用该numpy.ndarray.tofile方法写入的数据。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论