热线电话:13121318867

登录
2019-02-22 阅读量: 654
python如何统计单词频率

我们将设计另一个名为word_stats()的函数,该函数将单词频率字典(count_words_fast()/ count_words()的输出)作为参数。函数将返回唯一单词的总数(总和) /频率字典中的总密钥)和dict_values将它们的总数统计在一起,作为元组。

def word_stats(word_counts): # word_counts = count_words_fast(text)

num_unique = len(word_counts)

counts = word_counts.values()

return (num_unique, counts)

调用函数:所以,最后我们将阅读一本书,例如 - 罗密欧与朱丽叶的英文版,并从函数中收集关于词频,独特词,独特词总数等的信息。

text = read_book("./Books / English / shakespeare / Romeo and Juliet.txt")

word_counts = count_words_fast(text)

(num_unique, counts) = word_stats(word_counts)

print(num_unique, sum(counts))

brightness_4
text = read_book("./Books / English / shakespeare / Romeo and Juliet.txt")

word_counts = count_words_fast(text)         
(num_unique, counts) = word_stats(word_counts)
print(num_unique, sum(counts)) 

Output: 5118 40776
0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子