2018-12-19
阅读量:
878
python的NLTK功能?
Natural Language Toolkit(NLTK)是一个用于构建文本分析程序的平台。NLTK模块更强大的一个方面是词性标注。
要运行下面的python程序,您必须安装NLTK。请按照安装步骤进行操作。
- 打开你的终端,运行pip install nltk。
- 在命令提示符下编写python,以便python Interactive Shell准备执行您的代码/脚本。
- 类型进口NLTK
- nltk.download()
将弹出一个GUI,然后选择为所有包下载“all”,然后单击“下载”。这将为您提供所有的标记器,块,其他算法和所有语料库,这就是为什么安装需要很长时间。
例子:
import nltk
nltk.download()
让我们敲出一些快速词汇:
语料库:文本正文,单数。Corpora是其中的复数。
词典:单词及其含义。
令牌: 每个“实体”是基于规则分割的任何东西的一部分。
在语料库语言学中,词性标注(POS标记或PoS标记或POST)也称为语法标记或单词类别消歧。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论