前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >7行代码爬取本博客所有文章

7行代码爬取本博客所有文章

作者头像
SingYi
发布2022-07-13 21:42:09
3650
发布2022-07-13 21:42:09
举报
文章被收录于专栏:Lan小站Lan小站

为了水篇博客,我也是尽力了。

如果报错,就新建一个文件夹abc

image.png
image.png
代码语言:javascript
复制
import requests, parsel
for i in range(1, 37):
    res = parsel.Selector(requests.get(f'https://pan.lanol.cn/page_{i}.html').text)
    titles = res.xpath("//h2[@class='entry-title']/a/text()").extract()
    for index, value in enumerate(res.xpath("//h2[@class='entry-title']/a/@href").extract()):
        with open("./abc/" + titles[index] + '.html', 'a+', encoding='utf8')as f:
            f.write(parsel.Selector(requests.get(value).text).xpath("//div[@class='single-content']").extract_first())
image.png
image.png
本文参与?腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客?前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com