2019-04-15
阅读量:
569
什么是NLTK模块
NLTK模块是一个庞大的工具包,旨在帮助您使用整个自然语言处理(NLP)方法。
要安装NLTK,请在终端中运行以下命令。
- sudo pip install nltk
- 然后,只需输入python,即可在终端中输入python shell
- 类型进口NLTK
- nltk.download( '全部')
由于大量的tokenizer,chunkers,其他算法以及所有要下载的语料库,上述安装将花费相当长的时间。
一些经常使用的术语是:
- 语料库 - 文本正文,单数。Corpora是这个的复数。
- 词典 - 单词及其含义。
- 令牌 - 每个“实体”是基于规则分割的任何东西的一部分。例如,当句子被“标记化”为单词时,每个单词都是一个标记。如果您将句子标记为段落,则每个句子也可以是一个标记。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论