热线电话:13121318867

登录
2019-03-15 阅读量: 809
jieba分词应注意什么?
  • 分词后的返回值类型
  • 分词后的返回值
  • 如何去除所要分离文本的中英文符号,还有空格符
import jieba
wordList = jieba.cut("机器学习,算法对新鲜样本!的适应能力:叫泛化能力",cut_all=False)
print(type(wordList)) #类型是一个生成器generator
print(wordList) #本身是一个生成器对象generator Object
for list in wordList:
if list in ",./;'[]~!@#$%^&*()_+,。、;‘ 【】~!@#¥%……&*()——+《 》?:“{}<>?:\n\r":
None
else:
print(list)

3.2276
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子