2019-02-27
阅读量:
645
python如何利用NLP对文本进行分析(3)
示例:在应用上面的代码之前和之后(reviews => before,corpus => after)
第3步:标记化 ,涉及从文本正文中分割句子和单词。
第4步:通过稀疏矩阵制作单词包
- 在数据集中获取所有不同的评论单词,而不重复单词。
- 每个单词一列,因此会有很多列。
- 行是评论
- 如果评论数据集的行中有单词,那么单词的列数将出现在单词列下的单词行中。







评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论