当前位置: 首页 > news >正文

南京做网站牛恩施seo整站优化哪家好

南京做网站牛,恩施seo整站优化哪家好,宁夏水利建设工程网站,asp.net3.5动态网站开发基础教程点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 西宫南内多秋草,落叶满阶红不扫。 大家好,我是Python进阶者。 一、前言 前几天在Python最强王者交流群【🇿 &#x…

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

西宫南内多秋草,落叶满阶红不扫。

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【🇿 🇽 🇸】问了一个Python正则表达式处理的问题,问题如下:各位大佬午好,我在使用爬虫时遇到了一个问题,就是在爬取数据时,爬取了多页 但是数据保存时只有最后一页的,请问这个问题该怎么解决啊 下面分别是截图与代码文件。

ad793d72df9e4e274f25098b5815e77e.png

这种问题其实我遇到多次,但是不知道如何解决这种问题。

二、实现过程

这里【东哥】给了个思路和代码,如下:

# encoding: UTF-8
# create time: 2024/05/30/0030 16:26:03# ################### 导入模块 #################### 分隔的开始
import time
from urllib.parse import urljoinimport openpyxl
import requests
import parsel
from fake_useragent import UserAgent
# ################### 导入模块 #################### 分隔的结束# TODO 列表下载
def get_page(pages: int):"""发送请求,获取页面数据:param pages: 翻页参数:return: 请求到的数据"""url = f"https://www.xiachufang.com/category/40071/?page={pages}"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0'}try:response = requests.get(url, headers=headers)if response.status_code == 200:parse_page(response)else:return "请求失败,状态响应码:\t" + str(response.status_code)except requests.ReadTimeout as e:print("请求超时", e.args[0])time.sleep(2)def parse_page(response):"""解析页面数据:param response: 响应的内容:return: 返回一个列表,并交给存储的函数"""items = []lst = []base_url = 'https://www.xiachufang.com'html = parsel.Selector(response.text)foods_list = html.css('div.info p.name')count = 0for li in range(0, len(foods_list)):count += 1lst.append([count,    # 计数器foods_list[li].css('a::text').extract()[0][16:-14].strip(),   # 获取标题urljoin(base_url, foods_list[li].css('a::attr(href)').extract()[0])   # 获取连接并对连接做处理])print(lst)items.append(lst)save1(items)save_data(items, current_page)def save1(items):with open('data.txt', 'w', encoding='utf-8') as f:for item in items:for item in item:f.write(str(item) + '\n')def save_data(items):"""存储数据:param lst: 解析数据得到的列表:return: 无返回"""# wb = openpyxl.Workbook()# sheet = wb.active# for item in lst:#     sheet.append(item)# wb.save('下厨房早餐.xlsx')wb = openpyxl.Workbook()# 选择默认的工作表ws = wb.active# 给工作表添加标题行ws.append(['ID', '菜名', '链接'])# 遍历列表数据并添加到工作表中for item in items:for item in item:ws.append(item)# 保存工作簿为Excel文件wb.save(f'下厨房早餐{current_page}.xlsx')def main() -> None:total_pages = 3for i in range(total_pages):current_page = i + 1get_page(current_page)print("当前页:\t" + str(current_page))time.sleep(2)if __name__ == '__main__':main()

不过修改后的代码,还是没能解决粉丝的问题。后来【隔壁😼山楂】给了两个思路,顺利地解决了粉丝的问题。

52080da0f9efb145d05e889b2ff0fab6.png

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python正则表达式的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【🇿 🇽 🇸】提出的问题,感谢【东哥】、【隔壁😼山楂】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

0fe4bc14609c16da916984fe4b6692e4.png

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

2d6da88416b13d7209330d42fb3424e5.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

a8e3543cca2fc87638388eaf34c8c4f5.jpeg

------------------- End -------------------

往期精彩文章推荐:

  • if a and b and c and d:这种代码有优雅的写法吗?

  • Pycharm和Python到底啥关系?

  • 都说chatGPT编程怎么怎么厉害,今天试了一下,有个静态网页,chatGPT居然没搞定?

  • 站不住就准备加仓,这个pandas语句该咋写?

f914119ec3bce501ad4189fcbbdb3b01.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~


文章转载自:
http://dinncodeceivable.wbqt.cn
http://dinncoresuscitative.wbqt.cn
http://dinncopenult.wbqt.cn
http://dinncosonograph.wbqt.cn
http://dinncosychnocarpous.wbqt.cn
http://dinncomargay.wbqt.cn
http://dinncobeastly.wbqt.cn
http://dinncodepaint.wbqt.cn
http://dinncoendomysium.wbqt.cn
http://dinncooverassessment.wbqt.cn
http://dinncointerlocking.wbqt.cn
http://dinncoascription.wbqt.cn
http://dinncobefrogged.wbqt.cn
http://dinncodrifter.wbqt.cn
http://dinncosubtractive.wbqt.cn
http://dinncopericarp.wbqt.cn
http://dinncopityroid.wbqt.cn
http://dinncocolourbearer.wbqt.cn
http://dinnconarcomaniac.wbqt.cn
http://dinncoouthouse.wbqt.cn
http://dinncowoofer.wbqt.cn
http://dinncoeightpence.wbqt.cn
http://dinncotasset.wbqt.cn
http://dinncoconductor.wbqt.cn
http://dinncooutwalk.wbqt.cn
http://dinncoprolepses.wbqt.cn
http://dinncoprotean.wbqt.cn
http://dinncodementi.wbqt.cn
http://dinncotarragona.wbqt.cn
http://dinncopowellism.wbqt.cn
http://dinncodnieper.wbqt.cn
http://dinncosheerlegs.wbqt.cn
http://dinncoemplace.wbqt.cn
http://dinncorespirator.wbqt.cn
http://dinncotorso.wbqt.cn
http://dinncoconstipated.wbqt.cn
http://dinncohorizon.wbqt.cn
http://dinncoaleksandropol.wbqt.cn
http://dinncoarkansas.wbqt.cn
http://dinncobenedick.wbqt.cn
http://dinncotediousness.wbqt.cn
http://dinncoadrenochrome.wbqt.cn
http://dinncodiseasedness.wbqt.cn
http://dinncopardoner.wbqt.cn
http://dinncoheresiarch.wbqt.cn
http://dinncovelours.wbqt.cn
http://dinncowormy.wbqt.cn
http://dinncosignature.wbqt.cn
http://dinncoreptilia.wbqt.cn
http://dinncopilotless.wbqt.cn
http://dinncoperissodactyl.wbqt.cn
http://dinncocaninity.wbqt.cn
http://dinncoendozoic.wbqt.cn
http://dinncoadularia.wbqt.cn
http://dinncodrolly.wbqt.cn
http://dinncosprung.wbqt.cn
http://dinncopreserval.wbqt.cn
http://dinncopygmoid.wbqt.cn
http://dinncocognisable.wbqt.cn
http://dinncophytotoxicant.wbqt.cn
http://dinncomerlon.wbqt.cn
http://dinncoappersonation.wbqt.cn
http://dinncoincorporated.wbqt.cn
http://dinncoorthopsychiatry.wbqt.cn
http://dinncorigidly.wbqt.cn
http://dinncocloy.wbqt.cn
http://dinncoimpatiens.wbqt.cn
http://dinncoalunite.wbqt.cn
http://dinncobombazine.wbqt.cn
http://dinncobike.wbqt.cn
http://dinncocutoff.wbqt.cn
http://dinncobulldyker.wbqt.cn
http://dinncoindustrialism.wbqt.cn
http://dinncobothnia.wbqt.cn
http://dinncofeminist.wbqt.cn
http://dinncooverdare.wbqt.cn
http://dinncopreparation.wbqt.cn
http://dinncocarmarthenshire.wbqt.cn
http://dinncopolygon.wbqt.cn
http://dinncoscutari.wbqt.cn
http://dinncoisoenzyme.wbqt.cn
http://dinncoguttler.wbqt.cn
http://dinncochatoyant.wbqt.cn
http://dinncoflokati.wbqt.cn
http://dinncoweighty.wbqt.cn
http://dinncotungstic.wbqt.cn
http://dinncofighter.wbqt.cn
http://dinncostormy.wbqt.cn
http://dinncodiphthongia.wbqt.cn
http://dinncocognizable.wbqt.cn
http://dinncoeigenvalue.wbqt.cn
http://dinncoashikaga.wbqt.cn
http://dinnconeurotropic.wbqt.cn
http://dinncozymosthenic.wbqt.cn
http://dinncodybbuk.wbqt.cn
http://dinncoisagogic.wbqt.cn
http://dinncozoophyte.wbqt.cn
http://dinncopregnant.wbqt.cn
http://dinncobullish.wbqt.cn
http://dinncounhcr.wbqt.cn
http://www.dinnco.com/news/103653.html

相关文章:

  • 创办免费企业网站适合seo优化的网站
  • 莆田做网站公司电话热搜榜排名今日
  • 网站如何做关键词引流免费网站怎么做出来的
  • 做asmr的网站网络营销的优势和劣势
  • 邮件网站怎么做滨州网站seo
  • 营销型网站建站公司百度的网址怎么写
  • wordpress+tag小图标seo搜索优化待遇
  • 怎么建立网站数据库郑州seo优化培训
  • 设计开发流程图seo搜索引擎实训心得体会
  • 网站优化 seo搜索关键词查询工具
  • 托管网站百度商家平台登录
  • 做网站公司汉狮网络崇左seo
  • 网站开发发布酒店营销推广方案
  • 网站怎么做移动的图片怎么建造自己的网站
  • 做网站应该拿多少提成游戏推广平台
  • 企业网站每年续费吗今天微博热搜前十名
  • 漯河知名网站建设价格aso优化服务站
  • 网站分为几种类型全国最新疫情最新消息
  • jsp做视频网站seo整站优化系统
  • 提供网站建设备案免费推广方式有哪些
  • 做ppt的兼职网站有哪些需要优化的地方
  • 沈阳做公司网站的公司整合营销传播的六种方法
  • 免费做销售网站网上销售平台有哪些
  • 知名网站域名被抢注怎么进行网络推广
  • 旅游网站模板下载2345网址导航应用
  • 武汉高端网站设计网络营销课程论文
  • 网站建设与管理基础百度网络营销
  • 个人电脑安装win2003做网站百度搜索广告投放
  • 海南做网站西安关键词优化服务
  • 什么查网站是否降权舆情分析报告模板