热线电话:13121318867

登录
2019-01-16 阅读量: 757
python如何使用NLTK进行词还原(2)

以下是使用NLTK实现词形还原词:

# import these modules

from nltk.stem import WordNetLemmatizer

lemmatizer = WordNetLemmatizer()

print("rocks :", lemmatizer.lemmatize("rocks"))

print("corpora :", lemmatizer.lemmatize("corpora"))

# a denotes adjective in "pos"

print("better :", lemmatizer.lemmatize("better", pos ="a"))

文本预处理包括词干化和词形还原。很多时候人们发现这两个词令人困惑。有些人认为这两者是一样的。实际上,词典化比词干化更受欢迎,因为词形还原会对词语进行形态分析。

0.0000
6
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子