当前位置：首页 > news >正文

有没有什么做地堆的网站制作网页的软件

news 2025/7/10 3:36:18

有没有什么做地堆的网站,制作网页的软件,铁岭网站开发,长春网站建设 4435前言最近在学习Python爬虫的知识，既然眼睛会了难免忍不住要实践一把。不废话直接上主题代码不复杂，简单的例子奉上： import requests from lxml import etreecookie 浏览器F12网络请求标头里有 user_agent 浏览器F12网络请求标头里有…

前言

最近在学习Python爬虫的知识，既然眼睛会了难免忍不住要实践一把。

不废话直接上主题

代码不复杂，简单的例子奉上：

import requests
from lxml import etreecookie = '浏览器F12网络请求标头里有'
user_agent = '浏览器F12网络请求标头里有'
# 具体的方法网上有很多这里不是叙述的重点headers= {'User-Agent': user_agent,'Cookie': cookie,'Host': 'fanqienovel.com','Connection': 'keep-alive'
}url = "https://****"# 使用get方法请求网页
resp = requests.get(url, headers=headers)# 将网页内容按utf-8规范解码为文本形式
content = resp.content.decode('utf-8')# 将文本内容创建为可解析元素
html = etree.HTML(content)# 获取1
title1 = html.xpath('//*[@id="app"]/div/div[2]/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]# 获取2
title2 = html.xpath('//*[@id="app"]/div/div/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]

“获取1”是页面打开后直接复制的XPath路径，但根据这个路径获取不到数据，见截图。

但content是有内容的，参阅网上的方案都未决解，但提供了思路。

是网站做了反爬虫处理，复制的XPath不准确导致的，想了个办法将content的内容复制到txt文档，然后修改为html的后缀用浏览器打开，在新的网页下重新复制XPath就得到了“获取2”的路径，可以发现1和2路径是有差异的。

问题到这就解决了。

http://www.dinnco.com/news/34905.html

相关文章：

成都城乡建设局官方网站aso优化费用

co域名网站招商外包公司

岳阳县住房和城乡建设局网站今日头条新闻大事件

新塘做网站建立自己的网站

哪里有网站开发团队谷歌chrome浏览器下载

济济南市建设委员会网站百度推广的广告靠谱吗

前端做网站难吗网站seo优化价格

做公司网站图片算是商用吗搜索引擎营销的主要方法包括

石家庄网站制作视频软件商店安装

室内设计网站都有哪些平台企业营销网站建设系统

网站建设方案选公司简述搜索引擎的工作原理

国外mod大型网站沧州网络推广公司

广州网站建设代理如何做好市场推广

燃烧学课程网站建设seo整站怎么优化

南宁市营商环境建设局网站关键词优化

网站图片设计兼职百度云登陆首页

wordpress网站如何播放视频建站系统主要包括

东莞网站建设推广咨询平台如何做品牌宣传与推广

网站建设网站管理深圳网络推广网站推广

大兴网站开发网站推广公司

有人模仿qq音乐做的h5网站吗免费刷粉网站推广免费

阜阳网站建设seo 的原理和作用

wordpress rss 添加宁波如何做抖音seo搜索优化

wordpress怎么添加备案搜索引擎优化是免费的吗

几分钟做网站竹子建站官网

福田欧曼服务站电话seo智能优化软件

怎么用wordpress 建站百度seo关键词工具

泰州做网站优化qq推广平台

国际转运网站建设网络推广外包公司排名

十大那种直播软件武汉seo排名公司