热线电话:13121318867

登录
2019-02-13 阅读量: 666
python如何减少词根

词干是产生根/基词的形态变体的过程。词干程序通常被称为词干算法或词干分析器。词干算法将单词“朱古力”,“巧克力”,“酒心巧克力”减少到词根“巧克力”,把“检索”,“索引”,“检查”减少到词干“检索”。

根源词“喜欢”的更多例子包括:

- >“喜欢”
- >“中意”
- >“心仪”
- >“倾向”

代码:

# import these modules

from nltk.stem import PorterStemmer

from nltk.tokenize import word_tokenize

ps = PorterStemmer()

# choose some words to be stemmed

words = ["program", "programs", "programer", "programing", "programers"]

for w in words:

print(w, " : ", ps.stem(w))

输出:

program  :  program
programs : program
programer : program
programing : program
programers : program
0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子