首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

出行平台采集机票价格信息

在上述Python代码中,首先引入了所需的模块,然后设置了代理信息和模拟浏览器访问的网页请求头。随后,使用requests库发送代理请求,并将返回的网页内容解析为HTML。接着,从HTML中提取所需的信息,比如机票价格,并将提取的信息保存到DataFrame中。最后,打印出提取的信息。

这段代码展示了如何使用代理发送网络请求,并从返回的HTML中提取所需的数据。这对于需要爬取网页数据的情况非常有用。

# 导入需要的模块

import requests

import pandas as pd

# 设置网页请求头,模拟浏览器访问

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

# 使用requests库发送代理请求

response = requests.get("https://jshk.com.cn", headers=headers, proxies={'http': f'http://{proxy_host}:{proxy_port}'})

# 将返回的网页内容解析为HTML

soup = BeautifulSoup(response.text, 'html.parser')

# 提取需要的信息,例如机票价格

price = soup.find('span', class_='price')

# 将提取的信息保存到DataFrame中

df = pd.DataFrame({'Price': [price.text]})

# 打印提取的信息

print(df)

以上代码中,首先导入了需要的模块。然后设置代理信息。接着设置网页请求头,模拟浏览器访问。使用requests库发送代理请求,并将返回的网页内容解析为HTML。提取需要的信息,例如机票价格,将提取的信息保存到DataFrame中,并打印提取的信息。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OBf7leoVQ1Gfs9yLXQmVyO4g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com