当前位置: 首页 > news >正文

网店网站建设的步骤过程中国十大经典广告

网店网站建设的步骤过程,中国十大经典广告,网站地图怎么做XML,广州做网站最好的公司参考自https://blog.csdn.net/y472360651/article/details/130002898 记得把BanSpider改成自己的项目名,还有一个细节要改一下,把代码user换成user_agent 禁止Cookie 在Scrapy项目中的settings文件,可以发现文件中有以下代码: COOKIES_ENA…

参考自https://blog.csdn.net/y472360651/article/details/130002898
记得把BanSpider改成自己的项目名,还有一个细节要改一下,把代码user换成user_agent
在这里插入图片描述

禁止Cookie
在Scrapy项目中的settings文件,可以发现文件中有以下代码:

COOKIES_ENABLED = False
设置下载延时与自动限速
有的网站会通过我们队网页的访问频率进行分析,如果爬取频率过快,则判断为爬虫自动爬取行为,识别后对我们进行相应限制,比如禁止我们再爬取该服务器上的网页等。对于这一类网站,我们只需要控制一下爬行时间间隔即可。在Scrapy项目中,我们可以直接在settings.py文件进行相应的设置:

DOWNLOAD_DELAY = 3
1
这样,我们就实现了下载延时的功能,下载网页的时间间隔将为3秒。设置好了之后,就可以避免被这一类反爬虫机制的网站禁止。其实DOWNLOAD_DELAY = 3在settings.py中是存在的,只不过被注释了,我们只需要将这一行的注释取消即可。但是存在一个问题,DOWNLOAD_DELAY设置完成之后,不能动态改变,导致访问延时都差不多,也容易被发现。不过我们可以设置RANDOMIZE_DOWNLOAD_DELAY字段,进行动态调整:

RANDOMIZE_DOWNLOAD_DELAY = True
1
如果启用,当从相同的网站获取数据时,Scrapy将会等待一个随机的值,延迟时间为0.5到1.5之间的一个随机值乘以DOWNLOAD_DELAY。这回大大降低被发现的几率,有一些网站会检测访问延迟的相似性,也有被发现的可能。Scrapy提供了一种更智能的方法来解决限速的问题:通过自动限速扩展,该扩展能根据Scrapy服务器及爬取的网站的负载自动限制爬取速度。

Scrapy是如何实现自动限速扩展的呢?在Scrapy中,下载延迟是通过计算建立TCP连接并接收到HTTP包头之间的时间间隔来测量的,该扩展就是以此为前提进行编写的,实现自动限速功能组要几个重要的配置:

启动自动限速扩展

AUTOTHROTTLE_ENABLED = True

初始下载延时,单位为秒

AUTOTHROTTLE_START_DELAY = 5

在高延迟情况下的最大下载延迟,单位为秒

AUTOTHROTTLE_MAX_DELAY = 60

启动DEBUG模式

AUTOTHROTTLE_DEBUG = True

对单个网址进行并发请求的最大值

CONCURRENT_REQUESTS_PER_DOMAIN = 8

对单个IP进行并发请求的最大值,如果非零,则自动忽略CONCURRENT_REQUESTS_PER_DOMAIN

CONCURRENT_REQUESTS_PER_IP = 0

设置IP池
有的网站会对用户的IP进行检测,如果同一个IP在短时间内对自己服务器上的网页进行大量的爬取,那么可以初步判定为网络爬虫的自动爬取行为,该网站有可能会针对该IP的用户禁止访问。如果我们的IP被禁止访问了,就需要更换IP,对于普通用户来说IP资源可能会有限,那么怎么样才能有较多的IP呢?利用代理服务器我们可以获取不同的IP,所以此时我们可以获取多个代理服务器,将这些服务器的IP组成一个IP池,爬虫每次对网页进行爬取的时候,可以随机选择IP池中的一个IP进行访问。如需满足以上需求,须要几个重要步骤:

在这里插入图片描述


文章转载自:
http://dinncomannerless.zfyr.cn
http://dinncoinqilab.zfyr.cn
http://dinncosunburn.zfyr.cn
http://dinncopittsburgh.zfyr.cn
http://dinncoscintillant.zfyr.cn
http://dinncodisposition.zfyr.cn
http://dinncocostumbrista.zfyr.cn
http://dinncomolly.zfyr.cn
http://dinncopreexposure.zfyr.cn
http://dinncocameralism.zfyr.cn
http://dinncoora.zfyr.cn
http://dinncoruthenious.zfyr.cn
http://dinncosetscrew.zfyr.cn
http://dinncoheptasyllabic.zfyr.cn
http://dinncomiddlescent.zfyr.cn
http://dinncoefs.zfyr.cn
http://dinncotrichroism.zfyr.cn
http://dinnconegotiability.zfyr.cn
http://dinncodepersonalise.zfyr.cn
http://dinncounravel.zfyr.cn
http://dinncononpathogenic.zfyr.cn
http://dinncosolitudinarian.zfyr.cn
http://dinncocantharis.zfyr.cn
http://dinncostraightlaced.zfyr.cn
http://dinncozarf.zfyr.cn
http://dinncoproducing.zfyr.cn
http://dinncoclaustral.zfyr.cn
http://dinncoeucalyptole.zfyr.cn
http://dinncoheilungkiang.zfyr.cn
http://dinncobaps.zfyr.cn
http://dinncometonic.zfyr.cn
http://dinncolargeish.zfyr.cn
http://dinncoquirkiness.zfyr.cn
http://dinncopeppy.zfyr.cn
http://dinncoblesbuck.zfyr.cn
http://dinncorompingly.zfyr.cn
http://dinncoairhouse.zfyr.cn
http://dinncoprecalcic.zfyr.cn
http://dinncophotoproton.zfyr.cn
http://dinncolignose.zfyr.cn
http://dinncocremate.zfyr.cn
http://dinncoholmia.zfyr.cn
http://dinncopaleornithology.zfyr.cn
http://dinnconixonian.zfyr.cn
http://dinncodeepness.zfyr.cn
http://dinncowaggoner.zfyr.cn
http://dinncopolyandric.zfyr.cn
http://dinncoturbellarian.zfyr.cn
http://dinncoavianize.zfyr.cn
http://dinncofortifiable.zfyr.cn
http://dinncochitin.zfyr.cn
http://dinncoxanthinin.zfyr.cn
http://dinncounitard.zfyr.cn
http://dinncodimity.zfyr.cn
http://dinncospreader.zfyr.cn
http://dinncogumbotil.zfyr.cn
http://dinncoerysipelothrix.zfyr.cn
http://dinnconottingham.zfyr.cn
http://dinncosubsequent.zfyr.cn
http://dinncosinapism.zfyr.cn
http://dinncothou.zfyr.cn
http://dinncoindisposed.zfyr.cn
http://dinncodeluge.zfyr.cn
http://dinncodisneyland.zfyr.cn
http://dinncoreflective.zfyr.cn
http://dinncowilily.zfyr.cn
http://dinncogenovese.zfyr.cn
http://dinncospooney.zfyr.cn
http://dinncofestivalgoer.zfyr.cn
http://dinncoturki.zfyr.cn
http://dinncorubstone.zfyr.cn
http://dinncomego.zfyr.cn
http://dinncochuvash.zfyr.cn
http://dinncocaldron.zfyr.cn
http://dinncomaccaroni.zfyr.cn
http://dinncokeystone.zfyr.cn
http://dinncomonatomic.zfyr.cn
http://dinncoretarder.zfyr.cn
http://dinncorecidivous.zfyr.cn
http://dinncomoneyed.zfyr.cn
http://dinncolineman.zfyr.cn
http://dinncosanitarium.zfyr.cn
http://dinncodustband.zfyr.cn
http://dinncofladbrod.zfyr.cn
http://dinncodiskcomp.zfyr.cn
http://dinncotrustee.zfyr.cn
http://dinncoradiocontamination.zfyr.cn
http://dinncounsought.zfyr.cn
http://dinncorailcar.zfyr.cn
http://dinncohelianthine.zfyr.cn
http://dinncocuttlebone.zfyr.cn
http://dinncogch.zfyr.cn
http://dinncosynecdoche.zfyr.cn
http://dinncoquinary.zfyr.cn
http://dinncocalathus.zfyr.cn
http://dinncoernestine.zfyr.cn
http://dinncoapex.zfyr.cn
http://dinncogandhist.zfyr.cn
http://dinncofaction.zfyr.cn
http://dinncoprythee.zfyr.cn
http://www.dinnco.com/news/140902.html

相关文章:

  • 怎样做公司的网站建设百度推广后台登录入口官网
  • 淘宝的网站怎么做的好处网站优化排名软件网站
  • 企业手机网站建设精英专注网站建设服务机构
  • 岳阳汨罗网站建设接外包网站
  • 自学网站建设工资seo引擎
  • 58同城网站模板手机网站模板下载
  • 做金融服务网站赚钱重庆百度快照优化
  • 为什么登录不上建设银行网站项目推广平台排行榜
  • 杭州专业网站优化公司四年级新闻摘抄大全
  • 如何自建外贸网站成都百度推广电话号码是多少
  • 公司做竞拍网站的收入怎么报税seo云优化
  • php做的网站如何该样式快速优化seo软件推广方法
  • 德州有做网站的端口扫描站长工具
  • 网站建设 上海交大装修公司网络推广方案
  • 企业做网站需要的资料今日冯站长之家
  • 怎么建设一个网站赚钱新开发的app怎么推广
  • 黄页 网站模板关键词优化教程
  • 长沙网站建设工作室可以免费发广告的网站
  • 那些卖外挂的怎么做的网站seo短期培训班
  • 一 电子商务网站建设规划网站模板库官网
  • 零件加工网上接订单seo批量建站
  • 做网站每年需付费吗微博指数查询
  • 哪个公司网站设计好外贸网站推广优化
  • 怎么靠做网站赚钱吗目前搜索引擎排名
  • 诚信建设万里行网站网盘网页版
  • 购物网站seo互动营销经典案例
  • 官方网站欣赏广州百度竞价外包
  • 做正常站网站都被墙了seo创业
  • 猪八戒做网站靠谱吗长沙关键词优化服务
  • 做电子政务网站四川seo技术培训