当前位置: 首页 > news >正文

有没有什么做地堆的网站制作网页的软件

有没有什么做地堆的网站,制作网页的软件,铁岭网站开发,长春网站建设 4435前言 最近在学习Python爬虫的知识,既然眼睛会了难免忍不住要实践一把。 不废话直接上主题 代码不复杂,简单的例子奉上: import requests from lxml import etreecookie 浏览器F12网络请求标头里有 user_agent 浏览器F12网络请求标头里有…

前言

最近在学习Python爬虫的知识,既然眼睛会了难免忍不住要实践一把。

不废话直接上主题

代码不复杂,简单的例子奉上:

import requests
from lxml import etreecookie = '浏览器F12网络请求标头里有'
user_agent = '浏览器F12网络请求标头里有'
# 具体的方法网上有很多这里不是叙述的重点headers= {'User-Agent': user_agent,'Cookie': cookie,'Host': 'fanqienovel.com','Connection': 'keep-alive'
}url = "https://****"# 使用get方法请求网页
resp = requests.get(url, headers=headers)# 将网页内容按utf-8规范解码为文本形式
content = resp.content.decode('utf-8')# 将文本内容创建为可解析元素
html = etree.HTML(content)# 获取1
title1 = html.xpath('//*[@id="app"]/div/div[2]/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]# 获取2
title2 = html.xpath('//*[@id="app"]/div/div/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]

“获取1”是页面打开后直接复制的XPath路径,但根据这个路径获取不到数据,见截图。

但content是有内容的,参阅网上的方案都未决解,但提供了思路。

是网站做了反爬虫处理,复制的XPath不准确导致的,想了个办法将content的内容复制到txt文档,然后修改为html的后缀用浏览器打开,在新的网页下重新复制XPath就得到了“获取2”的路径,可以发现1和2路径是有差异的。

问题到这就解决了。

http://www.dinnco.com/news/34905.html

相关文章:

  • 成都城乡建设局官方网站aso优化费用
  • co域名网站招商外包公司
  • 岳阳县住房和城乡建设局网站今日头条新闻大事件
  • 新塘做网站建立自己的网站
  • 哪里有网站开发团队谷歌chrome浏览器下载
  • 济济南市建设委员会 网站百度推广的广告靠谱吗
  • 前端做网站难吗网站seo优化价格
  • 做公司网站图片算是商用吗搜索引擎营销的主要方法包括
  • 石家庄网站制作视频软件商店安装
  • 室内设计网站都有哪些平台企业营销网站建设系统
  • 网站建设方案选公司简述搜索引擎的工作原理
  • 国外mod大型网站沧州网络推广公司
  • 广州网站建设代理如何做好市场推广
  • 燃烧学课程网站建设seo整站怎么优化
  • 南宁市营商环境建设局网站关键词优化
  • 网站图片设计兼职百度云登陆首页
  • wordpress网站如何播放视频建站系统主要包括
  • 东莞网站建设推广咨询平台如何做品牌宣传与推广
  • 网站建设网站管理深圳网络推广网站推广
  • 大兴网站开发网站推广公司
  • 有人模仿qq音乐做的h5网站吗免费刷粉网站推广免费
  • 阜阳网站建设seo 的原理和作用
  • wordpress rss 添加宁波如何做抖音seo搜索优化
  • wordpress怎么添加备案搜索引擎优化是免费的吗
  • 几分钟做网站竹子建站官网
  • 福田欧曼服务站电话seo智能优化软件
  • 怎么用wordpress 建站百度seo关键词工具
  • 泰州做网站优化qq推广平台
  • 国际转运网站建设网络推广外包公司排名
  • 十大那种直播软件武汉seo排名公司