如何利用python的BeautfulSoup库进行网页数据采集
Danica 3/14/2022 爬虫
# 准备工作
- python的基础语法可以参照阮一峰老师的网站 (opens new window)
- BeautifulSoup库的简介 (opens new window)
- Beautiful Sou是一个可以从HTML或XML文件中提取数据的Python库。它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式。Beautiful Soup会帮你节省数小时甚至数天的工作时间。
# 1.导入BeautifulSoup 对象
```from bs4 import BeautifulSoup```
# 2.本地文档的情况
- 2.1
soup = BeautifulSoup("markup.html", "html.parser")1