如何利用python的BeautfulSoup库进行网页数据采集

3/14/2022 爬虫

# 准备工作

  • python的基础语法可以参照阮一峰老师的网站 (opens new window)
  • BeautifulSoup库的简介 (opens new window)
    • Beautiful Sou是一个可以从HTML或XML文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。Beautiful Soup会帮你节省数小时甚至数天的工作时间。

# 1.导入BeautifulSoup 对象

```from bs4 import BeautifulSoup```

# 2.本地文档的情况

  • 2.1
    soup = BeautifulSoup("markup.html", "html.parser")
    
    1
Last Updated: 5/2/2022, 9:10:03 AM