Python爬虫BeautifulSoup--导航树

时间：2026-04-24 17:17:14

1、打开图中网页：

1、和许多其他库一样，在 BeautifulSoup 库里，孩子（child）和后代（descendant）有显著不同：和人类的家谱一样，子标签就是一个父标签的下一级，而后代标签是指一个父标下面所有级别的标签。例如， tr 标签是 tabel 标签的子标签，而 tr、 th、 td、 img 和 spa标签都是 tabel 标签的后代标签。

Python爬虫BeautifulSoup--导航树

1、BeautifulSoup 的 next_siblings() 函数可以让收集表格数据成为简单的事情，尤其是处带标题行的表格：

Python爬虫BeautifulSoup--导航树

1、在抓取网页的时候，查找父标签的需求比查找子标签和兄弟标签要少很多。通常情下，如果以抓取网页内容为目的来观察 HTML 页面，我们都是从最上层标签开始的，后思考如何定位我们想要的数据块所在的位置。但是，偶尔在特殊情况下你也会用BeautifulSoup 的父标签查找函数， parent 和 parents。

Python爬虫BeautifulSoup--导航树

2、选择图片标签 src="../img/gifts/img1.jpg"；

选择图片标签的父标签（在示例中是 <td> 标签）；

选择 <td> 标签的前一个兄弟标签 previous_sibling（在示例中是包含美元价格的 <td>标签）

选择标签中的文字，“$15.00”。