PGC123

2019-03-08   阅读量: 917

大数据 数据分析师 Python编程 R语言

jieba是做什么的?

扫码加入数据分析学习群

“结巴”中文分词:做最好的 Python 中文分词组件,当然jieba也有R语言版的包。

支持三种分词模式:

  • 精确模式,试图将句子最精确地切开,适合文本分析;
  • 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
  • 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
16.2595 4 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子