2018-11-29
阅读量:
808
newspaper3k 模块
如果你还没见过它,那你见到 Python 的 newspaper 模块可不要被它震撼到了。
这个模块可以让你从一系列领先的国际出版物中检索新闻文章和相关的元数据。你可以检索图像、文本和作者姓名。
它甚至内置了一些 NLP 功能。
如果你想为你的项目使用 BeautifulSoup 或其他一些自己打造的 webscraping 库,你可以用 $ pip install newspaper3k 为你节省时间和精力。
详见:
https://newspaper.readthedocs.io/en/latest/user_guide/quickstart.html#performing-nlp-on-an-article






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论