2019-06-20
阅读量:
429
如何在文件中执行停用词操作
在文件中执行停用词操作
在下面的代码中,text.txt是要删除停用词的原始输入文件。filteredtext.txt是输出文件。可以使用以下代码完成:
import io
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
#word_tokenize accepts a string as an input, not a file.
stop_words = set(stopwords.words('english'))
file1 = open("text.txt")
line = file1.read()# Use this to read file content as a stream:
words = line.split()
for r in words:
if not r in stop_words:
appendFile = open('filteredtext.txt','a')
appendFile.write(" "+r)
appendFile.close()






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论