2019-03-15
阅读量:
809
jieba分词应注意什么?
- 分词后的返回值类型
- 分词后的返回值
- 如何去除所要分离文本的中英文符号,还有空格符
import jieba
wordList = jieba.cut("机器学习,算法对新鲜样本!的适应能力:叫泛化能力",cut_all=False)
print(type(wordList)) #类型是一个生成器generator
print(wordList) #本身是一个生成器对象generator Object
for list in wordList:
if list in ",./;'[]~!@#$%^&*()_+,。、;‘ 【】~!@#¥%……&*()——+《 》?:“{}<>?:\n\r":
None
else:
print(list)






评论(0)


暂无数据
推荐帖子
2条评论
6条评论
7条评论