2019-03-15
阅读量:
973
jieba分词应注意什么?
- 分词后的返回值类型
- 分词后的返回值
- 如何去除所要分离文本的中英文符号,还有空格符
import jieba
wordList = jieba.cut("机器学习,算法对新鲜样本!的适应能力:叫泛化能力",cut_all=False)
print(type(wordList)) #类型是一个生成器generator
print(wordList) #本身是一个生成器对象generator Object
for list in wordList:
if list in ",./;'[]~!@#$%^&*()_+,。、;‘ 【】~!@#¥%……&*()——+《 》?:“{}<>?:\n\r":
None
else:
print(list)
3.2276
1
2
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
2条评论
6条评论
7条评论

