2019-02-13
阅读量:
666
python如何减少词根
词干是产生根/基词的形态变体的过程。词干程序通常被称为词干算法或词干分析器。词干算法将单词“朱古力”,“巧克力”,“酒心巧克力”减少到词根“巧克力”,把“检索”,“索引”,“检查”减少到词干“检索”。
根源词“喜欢”的更多例子包括:
- >“喜欢”
- >“中意”
- >“心仪”
- >“倾向”
代码:
# import these modules
from nltk.stem import PorterStemmer
from nltk.tokenize import word_tokenize
ps = PorterStemmer()
# choose some words to be stemmed
words = ["program", "programs", "programer", "programing", "programers"]
for w in words:
print(w, " : ", ps.stem(w))
输出:
program : program
programs : program
programer : program
programing : program
programers : program






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论