热线电话:13121318867

登录
2019-03-21 阅读量: 574
读入单个pandas数据帧时发生错误

我试图从本地目录中读取多个文本文件到一个单独的pandas数据帧。由于原始的文本文件来与额外的文件扩展名我改名吧,毕竟,然后我试图通过阅读所有文本文件到单个数据帧read_csv和concat从pandas。问题是,我能够读取带有pandas的单个文本文件,但是当我尝试将本地目录中的文本文件列表读入单个数据帧时,出现以下错误:

folder = 'fakeNewsDatasets[Rada]/fakeNewsDataset/fake'
allfiles=os.listdir(folder)
print(allfiles)

['biz01.txt',
'biz02.txt',
'biz03.txt',
'biz04.txt',
'biz05.txt',
'biz06.txt']
然后我尝试将这些文本文件读入单个数据帧,如下所示:

dfs=pd.concat([pd.read_csv(file, header = None, sep = '\n', skip_blank_lines = True) for file in allfiles], axis=1)

*
FileNotFoundError:[Errno 2]文件b'biz02.txt'不存在:b'biz02.txt'*

我不明白为什么会出现这个问题,因为将单个文本文件读取到pandas dataframe对我来说效果很好。

df = pd.read_csv('biz01.txt', header = None, sep = '\n', skip_blank_lines = True)
df=df.T
df.columns = ['headline', 'text']
解决办法:使用glob()它会更容易:

import glob
allfiles=glob.glob('C:\\folder1\\*.csv')
否则,你可能有加盟路径file,在做for file in allfiles阅读文件时pd.read_csv()

2.3677
1
关注作者
收藏
评论(0)

发表评论

暂无数据