热线电话:13121318867

登录
2020-10-21 阅读量: 801
如何用jieba分词添加自定义词典?

问题详述:如何用jieba分词添加自定义词典?


答:

使用一个函数:jieba.load_userdict()


只含有一个参数。参数为一个文件,文件的的编码必须为utf-8.


自定义的字典的结构要求如下:


Structure of dict file: word1 freq1 word_type1; word2 freq2 word_type2; ... ;Word type may be ignored。例如:

然后在使用之前的函数将新建的词典加入到jieba里面去。


jieba能把‘速览’一词运用到分词去。


100.1074
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子