2019-01-16
阅读量:
757
python如何使用NLTK进行词还原(2)
以下是使用NLTK实现词形还原词:
# import these modules
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
print("rocks :", lemmatizer.lemmatize("rocks"))
print("corpora :", lemmatizer.lemmatize("corpora"))
# a denotes adjective in "pos"
print("better :", lemmatizer.lemmatize("better", pos ="a"))

文本预处理包括词干化和词形还原。很多时候人们发现这两个词令人困惑。有些人认为这两者是一样的。实际上,词典化比词干化更受欢迎,因为词形还原会对词语进行形态分析。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论