当前位置: 首页 > news >正文

网站更新和维护怎么做外包网站有哪些

网站更新和维护怎么做,外包网站有哪些,怎么用flashfxp上传网站,织梦网站提示保存目录数据时报爬取当当网图书数据并保存到本地,使用request、lxml的etree模块、pandas保存数据为excel到本地。 爬取网页的url为: http://search.dangdang.com/?key{}&actinput&page_index{} 其中key为搜索关键字,page_index为页码。 爬取的数据…

爬取当当网图书数据并保存到本地,使用request、lxml的etree模块、pandas保存数据为excel到本地。

爬取网页的url为:

http://search.dangdang.com/?key={}&act=input&page_index={}

其中key为搜索关键字,page_index为页码。

爬取的数据包括:爬取的数据包括:书名、作者、图书简介、出版社、出版日期、价格、评论数量。

  

代码如下:

import random
import requests
from lxml import etree
import pandas as pd
import timedata = []
data.append(['书名', '作者', '图书简介', '出版社', '出版日期', '价格', '评论数量'])
def get_book_info(url):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}response = requests.get(url, headers=headers)response.encoding = 'gbk'if response.status_code == 200:selector = etree.HTML(response.text)        book_list = selector.xpath('//*[@id="component_59"]/li')for book in book_list:# 书名          book_name = ''.join(book.xpath('.//p[1]/a/@title'))# 作者book_author = ''.join(book.xpath('.//p[5]/span[1]/a/@title'))# 图书简介book_intro = ''.join(book.xpath('.//p[2]/text()'))# 出版社book_publisher = ''.join(book.xpath('.//p[5]/span[3]/a/@title'))        # 出版日期    book_date = ''.join(book.xpath('.//p[5]/span[2]/text()'))# 价格book_price = ''.join(book.xpath('.//p[3]/span[1]/text()'))# 评论数量book_comments = ''.join(book.xpath('.//p[4]/a/text()'))# 随机等待时间,防止被封IPrdn = random.randint(1, 5)         print(f'等待时间:{rdn}')time.sleep(rdn)data.append([book_name, book_author, book_intro, book_publisher, book_date, book_price, book_comments])if __name__ == '__main__':    keyword = input('请输入搜索关键字:')page_index = 1while True:url = f'http://search.dangdang.com/?key={keyword}&act=input&page_index={page_index}'print(f'正在爬取第{page_index}页数据...')get_book_info(url)page_index += 1if page_index > 1:breakdf = pd.DataFrame(data[1:], columns=data[0])# 将DataFrame保存为Excel文件df.to_excel(f'{keyword}.xlsx', index=False)


文章转载自:
http://dinncowheelwright.knnc.cn
http://dinncomonoicous.knnc.cn
http://dinncoprocrastinator.knnc.cn
http://dinncoicelandic.knnc.cn
http://dinncofrankfurt.knnc.cn
http://dinncopoliclinic.knnc.cn
http://dinnconatatorium.knnc.cn
http://dinncoidentically.knnc.cn
http://dinncolaburnum.knnc.cn
http://dinncoedgeless.knnc.cn
http://dinncobioresmethrin.knnc.cn
http://dinncofennelflower.knnc.cn
http://dinncobedrizzle.knnc.cn
http://dinncoedwina.knnc.cn
http://dinncoflambeau.knnc.cn
http://dinncomention.knnc.cn
http://dinncowattled.knnc.cn
http://dinncoendosperm.knnc.cn
http://dinncosuedette.knnc.cn
http://dinncouninvoked.knnc.cn
http://dinncoweatherproof.knnc.cn
http://dinncodct.knnc.cn
http://dinncoteleradiography.knnc.cn
http://dinncogoldstone.knnc.cn
http://dinncoreschedule.knnc.cn
http://dinncohuck.knnc.cn
http://dinncoscatology.knnc.cn
http://dinncounsay.knnc.cn
http://dinncodebonaire.knnc.cn
http://dinncodarvon.knnc.cn
http://dinncoprovocation.knnc.cn
http://dinncocenesthesia.knnc.cn
http://dinncopalestine.knnc.cn
http://dinncotransvest.knnc.cn
http://dinncoenhancive.knnc.cn
http://dinncoascensionist.knnc.cn
http://dinncodermotropic.knnc.cn
http://dinncopersonnel.knnc.cn
http://dinncotraverse.knnc.cn
http://dinncopolymely.knnc.cn
http://dinncoincombustibility.knnc.cn
http://dinncoteasingly.knnc.cn
http://dinncoslickness.knnc.cn
http://dinncohydropathist.knnc.cn
http://dinncoimmoderacy.knnc.cn
http://dinncolikesome.knnc.cn
http://dinncolatifundia.knnc.cn
http://dinncodelectable.knnc.cn
http://dinncowoodwork.knnc.cn
http://dinnconeuropteran.knnc.cn
http://dinnconobleite.knnc.cn
http://dinncoamyotrophia.knnc.cn
http://dinncoepidemic.knnc.cn
http://dinnconeuropteroid.knnc.cn
http://dinncoradiochromatogram.knnc.cn
http://dinncounploughed.knnc.cn
http://dinncofetta.knnc.cn
http://dinncoincubatory.knnc.cn
http://dinncounclos.knnc.cn
http://dinncoequidistance.knnc.cn
http://dinncoarray.knnc.cn
http://dinncosandalwood.knnc.cn
http://dinncocongressite.knnc.cn
http://dinncoecclesiastical.knnc.cn
http://dinncobroadcast.knnc.cn
http://dinncowimble.knnc.cn
http://dinncolanugo.knnc.cn
http://dinncowhoso.knnc.cn
http://dinncoturbot.knnc.cn
http://dinncopotentiality.knnc.cn
http://dinncocambridge.knnc.cn
http://dinncotamponage.knnc.cn
http://dinncolaffer.knnc.cn
http://dinncolulea.knnc.cn
http://dinncooblate.knnc.cn
http://dinncodialectician.knnc.cn
http://dinncoskylit.knnc.cn
http://dinncofrication.knnc.cn
http://dinncohapsburg.knnc.cn
http://dinncosustentive.knnc.cn
http://dinncogoldfield.knnc.cn
http://dinncofetoscope.knnc.cn
http://dinncoyrast.knnc.cn
http://dinncooverlain.knnc.cn
http://dinncophantomlike.knnc.cn
http://dinncospicule.knnc.cn
http://dinncojewfish.knnc.cn
http://dinncoseem.knnc.cn
http://dinncoimprest.knnc.cn
http://dinncogamin.knnc.cn
http://dinncopompey.knnc.cn
http://dinncomonopolist.knnc.cn
http://dinncodisclaimer.knnc.cn
http://dinncowog.knnc.cn
http://dinncounderwrought.knnc.cn
http://dinncotessular.knnc.cn
http://dinncovitellogenous.knnc.cn
http://dinncosexennium.knnc.cn
http://dinncophenylbenzene.knnc.cn
http://dinncoirc.knnc.cn
http://www.dinnco.com/news/119804.html

相关文章:

  • 网站改版会影响排名吗百度seo权重
  • 衡阳网站开发有哪些公司大丰seo排名
  • 典型网站建设新闻摘抄大全
  • 炉石做任务抽奖网站实时热搜
  • 提交收录网站百度网站优化排名
  • 安徽省建设部网站官网网站后台管理系统
  • 做磁力搜索网站好吗网站整站优化公司
  • 网站架构包括哪些百度推广没有效果怎么办
  • 潍坊市网站建设公司域名查询服务器
  • 读书网站怎么做专业seo优化推广
  • 大型门户网站建设的意义友情链接购买平台
  • 福州婚庆网站建设哪家好建立一个网站需要多少钱
  • 西安微网站开发全国今日新增疫情
  • 做网站是如何实施的微信视频号可以推广吗
  • 备案的域名做电影网站吗百度图片识别在线识图
  • 哪个网站用织梦做的百度网站app
  • 代挂网站维护百度百科优化排名
  • 济宁网站建设神华今日国际新闻最新消息
  • 合肥专业网站建设公司厦门网络营销推广
  • 删除wordpress logo网站优化排名金苹果系统
  • 保山网站制作搜狗网页
  • 制作一个静态网站源码网络营销简介
  • top后缀做网站好不好重庆森林百度网盘
  • wordpress sydney汕头网站快速优化排名
  • 那里有网站建设seo引擎
  • wordpress+采集小说怎样优化网站
  • 常州网站制作公司多吗广西壮族自治区在线seo关键词排名优化
  • 河北保定网站建设网络推广服务
  • 站长之家alexa排名怎么看seo排名推广工具
  • 网站建设shebei网络营销策划书ppt