热线电话:13121318867

登录
2019-02-27 阅读量: 645
python如何利用NLP对文本进行分析(3)

示例:在应用上面的代码之前和之后(reviews => before,corpus => after)

第3步:标记化 ,涉及从文本正文中分割句子和单词。

第4步:通过稀疏矩阵制作单词包

  • 在数据集中获取所有不同的评论单词,而不重复单词。
  • 每个单词一列,因此会有很多列。
  • 行是评论
  • 如果评论数据集的行中有单词,那么单词的列数将出现在单词列下的单词行中。

24.8917
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子