网页示例
获取指定ul标签中的所有a标签
html = etree.HTML(htext)
# 获取所有a标签
li_list = html.xpath('//ul[@class="news_list news_list_lab"]/li/a')
for a in li_list:
# 获取a标签中的文本值
title = a.text
# 获取a标签中的href属性值
href = a.get("href")
print(title, href)
输出: