前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >72 - 使用Beautiful Soup 的CSS选择器获取节点信息

72 - 使用Beautiful Soup 的CSS选择器获取节点信息

原创
作者头像
ruochen
修改2021-06-15 10:53:54
1.1K0
修改2021-06-15 10:53:54
举报

如何使用Beautiful Soup 的CSS选择器获取节点信息

代码语言:txt
复制
from bs4 import BeautifulSoup

html = '''
<html>
<head>
    <meta charset="UTF-8">
    <title>Beautiful Soup</title>
</head>
<body>
<div>
    <ul>
        <li class="item" value1="1234", value2="hello world"><a href="https://www.xxx.com">ruochen</a></li>
        <li class="item2"><a href="https://www.xxx.com">若尘</a></li>
    </ul>
    <button id="button1">确定</button>
    <ul>
        <li class="item"><a href="https://www.taobao.com">淘宝</a></li>
        <li id="myli" class="item4"><a href="https://www.microsoft">微软</a></li>
        <li class="item5"><a href="https://www.google.com">谷歌</a></li>
    </ul>
</div>
<body>
'''

soup = BeautifulSoup(html, 'lxml')
tags = soup.select('.item')
print(tags)
print(type(tags))
for tag in tags:
    print(tag)
代码语言:txt
复制
[<li class="item" value1="1234" value2="hello world"><a href="https://www.xxx.com">ruochen</a></li>, <li class="item"><a href="https://www.taobao.com">淘宝</a></li>]
代码语言:txt
复制
<class 'list'>
代码语言:txt
复制
<li class="item" value1="1234" value2="hello world"><a href="https://www.xxx.com">ruochen</a></li>
代码语言:txt
复制
<li class="item"><a href="https://www.taobao.com">淘宝</a></li>
代码语言:txt
复制
tags= soup.select('#myli')
print(tags)
代码语言:txt
复制
[<li class="item4" id="myli"><a href="https://www.microsoft">微软</a></li>]
代码语言:txt
复制
tags = soup.select('a')
for tag in tags:
    print(tag)
    print(tag['href'])
代码语言:txt
复制
<a href="https://www.xxx.com">ruochen</a>
代码语言:txt
复制
https://www.xxx.com
代码语言:txt
复制
<a href="https://www.xxx.com">若尘</a>
代码语言:txt
复制
https://www.xxx.com
代码语言:txt
复制
<a href="https://www.taobao.com">淘宝</a>
代码语言:txt
复制
https://www.taobao.com
代码语言:txt
复制
<a href="https://www.microsoft">微软</a>
代码语言:txt
复制
https://www.microsoft
代码语言:txt
复制
<a href="https://www.google.com">谷歌</a>
代码语言:txt
复制
https://www.google.com

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何使用Beautiful Soup 的CSS选择器获取节点信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com