热线电话:13121318867

登录
2019-04-15 阅读量: 569
什么是NLTK模块

NLTK模块是一个庞大的工具包,旨在帮助您使用整个自然语言处理(NLP)方法。
要安装NLTK,请在终端中运行以下命令。

  • sudo pip install nltk
  • 然后,只需输入python,即可在终端中输入python shell
  • 类型进口NLTK
  • nltk.download( '全部')

由于大量的tokenizer,chunkers,其他算法以及所有要下载的语料库,上述安装将花费相当长的时间。

一些经常使用的术语是:

  • 语料库 - 文本正文,单数。Corpora是这个的复数。
  • 词典 - 单词及其含义。
  • 令牌 - 每个“实体”是基于规则分割的任何东西的一部分。例如,当句子被“标记化”为单词时,每个单词都是一个标记。如果您将句子标记为段落,则每个句子也可以是一个标记。
37.3534
5
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子