网页示例

python xpath 获取标签_HTML

获取指定ul标签中的所有a标签

html = etree.HTML(htext)
 # 获取所有a标签
 li_list = html.xpath('//ul[@class="news_list news_list_lab"]/li/a')
 for a in li_list:
     # 获取a标签中的文本值
     title = a.text
     # 获取a标签中的href属性值
     href = a.get("href")
     print(title, href)

输出:

python xpath 获取标签_python_02