一、前言
前几天在Python白银交流群【菜?】问了一个Python网络爬虫的问题。问题如下:
问题:这个网页源代码里面的数据在tbody标签里面,但是requests发送请求后返回的内容里tbody里面是空的,没办法去解析数据。链接:如图所示。
已经尝试过的:csdb 百度等查资料,没有找到有用的,解决方案互相抄,提到解析的时候把tbody这一层标签去掉。问题是返回的内容里面,tbody里面是空的,去不去掉都一样。
这里【瑜亮老师】给了一个指导。
这是异步加载的页面,数据不在原url中,而是在这里。
是json数据。粉丝回复说是的 但是里面没有预算数据 哈哈哈,只有营业收入数据 没有预算数据 ,得进到pdf文件里面找 有的有预算数据 有的还没有。
顺利地解决了粉丝的问题。
如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!
大家好,我是Python进阶者。这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【菜?】提出的问题,感谢【瑜亮老师】给出的思路,感谢【冯诚】等人参与学习交流。
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!