本站资源收集于互联网,不提供软件存储服务,每天免费更新优质的软件以及学习资源!

如何使用ScrapyXpath获取div标签下的完整HTML内容?

网络教程 app 1℃

如何使用ScrapyXpath获取div标签下的完整HTML内容

如何用 scrapy xpath 获取指定标签下的完整 html 内容?

给定以下 html 片段:

<div class="contson"> 这是文本 <p>aaaa</p> 这是文本2 <br>这是文本3</div>

我们希望获取 div.contson 中的所有内容,包括 html 标签。

‘这是文本<p>aaaa</p>这是文本2<br>这是文本3’

通常方法,如 string(.),只能获取纯文本。然而,node() 函数可以获取指定元素下的所有节点、元素和内容。

使用以下 xpath 表达式:

xx.xpath(‘//div[@class="contson"]/node()’).extract()

然后将列表转换为字符串:

"".join(xx)

即可得到所需的完整 html 内容。

以上就是如何使用 Scrapy Xpath 获取 div 标签下的完整 HTML 内容?的详细内容,更多请关注范的资源库其它相关文章!

转载请注明:范的资源库 » 如何使用ScrapyXpath获取div标签下的完整HTML内容?

喜欢 (0)