当前位置: 首页 > news >正文

网站如何做视频朋友圈广告怎么投放

网站如何做视频,朋友圈广告怎么投放,东坑镇仿做网站,珠海哪里做网站的在我们的初级教程中,我们介绍了如何使用Scrapy创建和运行一个简单的爬虫。在这篇文章中,我们将深入了解Scrapy的强大功能,学习如何使用Scrapy提取和处理数据。 一、数据提取:Selectors和Item 在Scrapy中,提取数据主要…

在我们的初级教程中,我们介绍了如何使用Scrapy创建和运行一个简单的爬虫。在这篇文章中,我们将深入了解Scrapy的强大功能,学习如何使用Scrapy提取和处理数据。

一、数据提取:Selectors和Item

在Scrapy中,提取数据主要通过Selectors来完成。Selectors基于XPath或CSS表达式的查询语言来选取HTML文档中的元素。你可以在你的爬虫中使用response对象的xpathcss方法来创建一个Selector对象。

例如,我们可以修改我们的QuotesSpider爬虫,使用Selectors来提取每个引用的文本和作者:

import scrapyclass QuotesSpider(scrapy.Spider):name = "quotes"start_urls = ['http://quotes.toscrape.com/page/1/',]def parse(self, response):for quote in response.css('div.quote'):text = quote.css('span.text::text').get()author = quote.css('span small::text').get()print(f'Text: {text}, Author: {author}')

此外,Scrapy还提供了Item类,可以定义你想要收集的数据结构。Item类非常适合收集结构化数据,如我们从quotes.toscrape.com中获取的引用:

import scrapyclass QuoteItem(scrapy.Item):text = scrapy.Field()author = scrapy.Field()

然后我们可以修改QuotesSpider爬虫,使其生成和收集QuoteItem对象:

class QuotesSpider(scrapy.Spider):name = "quotes"start_urls = ['http://quotes.toscrape.com/page/1/',]def parse(self, response):for quote in response.css('div.quote'):item = QuoteItem()item['text'] = quote.css('span.text::text').get()item['author'] = quote.css('span small::text').get()yield item

二、数据处理:Pipelines

Scrapy使用数据管道(pipelines)来处理爬虫从网页中抓取的Item。当爬虫生成一个Item,它将被发送到Item Pipeline进行处理。

Item Pipeline是一些按照执行顺序排列的类,每个类都是一个数据处理单元。每个Item Pipeline组件都是一个Python类,必须实现一个process_item方法。这个方法必须返回一个Item对象,或者抛出DropItem异常,被丢弃的item将不会被之后的pipeline组件所处理。

例如,我们可以添加一个Pipeline,将收集的引用保存到JSON文件中:

import jsonclass JsonWriterPipeline(object):def open_spider(self, spider):self.file = open('quotes.jl', 'w')def close_spider(self, spider):self.file.close()def process_item(self, item, spider):line = json.dumps(dict(item)) + "\n"self.file.write(line)return item

然后你需要在项目的设置文件(settings.py)中启用你的Pipeline:

ITEM_PIPELINES = {'tutorial.pipelines.JsonWriterPipeline': 1,
}

在这篇文章中,我们更深入地探讨了Scrapy的功能,包括如何使用Selectors和Item提取数据,如何使用Pipelines处理数据。在下一篇文章中,我们将学习如何使用Scrapy处理更复杂的情况,如登录、cookies、以及如何避免爬虫被网站识别和封锁等问题。


文章转载自:
http://dinncoensignship.knnc.cn
http://dinncoalberich.knnc.cn
http://dinncohaidarabad.knnc.cn
http://dinnconebbish.knnc.cn
http://dinncosecularization.knnc.cn
http://dinncolongness.knnc.cn
http://dinncoxenogenesis.knnc.cn
http://dinncochoking.knnc.cn
http://dinncounbe.knnc.cn
http://dinncoanimalculum.knnc.cn
http://dinncoinevitably.knnc.cn
http://dinncoviatica.knnc.cn
http://dinncodissimulate.knnc.cn
http://dinncoimpuissance.knnc.cn
http://dinncoamidships.knnc.cn
http://dinncoracquet.knnc.cn
http://dinncorub.knnc.cn
http://dinncocombustible.knnc.cn
http://dinncoforked.knnc.cn
http://dinncobromism.knnc.cn
http://dinncoblastous.knnc.cn
http://dinncotripartition.knnc.cn
http://dinncoflyunder.knnc.cn
http://dinncouniversal.knnc.cn
http://dinncolandscape.knnc.cn
http://dinncoparve.knnc.cn
http://dinncofenderless.knnc.cn
http://dinncobackyard.knnc.cn
http://dinncocancerous.knnc.cn
http://dinncointercontinental.knnc.cn
http://dinncodismal.knnc.cn
http://dinncopetrogram.knnc.cn
http://dinncosniveler.knnc.cn
http://dinncoallargando.knnc.cn
http://dinncomalta.knnc.cn
http://dinncosley.knnc.cn
http://dinncotabnab.knnc.cn
http://dinncokickplate.knnc.cn
http://dinncosnarler.knnc.cn
http://dinncohindostani.knnc.cn
http://dinncosilverpoint.knnc.cn
http://dinncoveil.knnc.cn
http://dinncosylvinite.knnc.cn
http://dinncomotto.knnc.cn
http://dinncogymnosophist.knnc.cn
http://dinncokurd.knnc.cn
http://dinncorecrementitious.knnc.cn
http://dinncocheesed.knnc.cn
http://dinncotorchy.knnc.cn
http://dinncoreelection.knnc.cn
http://dinncovic.knnc.cn
http://dinncosnowshoe.knnc.cn
http://dinncodoctrinism.knnc.cn
http://dinncolinkboy.knnc.cn
http://dinncoworsen.knnc.cn
http://dinncoregius.knnc.cn
http://dinncosyrette.knnc.cn
http://dinncospectroscopy.knnc.cn
http://dinncocommunicative.knnc.cn
http://dinncohisself.knnc.cn
http://dinncoapplication.knnc.cn
http://dinncochalcis.knnc.cn
http://dinncoanticly.knnc.cn
http://dinncoaccusable.knnc.cn
http://dinncokilograin.knnc.cn
http://dinncoworkgirl.knnc.cn
http://dinncopisces.knnc.cn
http://dinncoexcaudate.knnc.cn
http://dinncodramshop.knnc.cn
http://dinncoprolate.knnc.cn
http://dinncosnuffer.knnc.cn
http://dinncoeverywhere.knnc.cn
http://dinncotempera.knnc.cn
http://dinncocorrectitude.knnc.cn
http://dinncoparsi.knnc.cn
http://dinncosedimentary.knnc.cn
http://dinncodelay.knnc.cn
http://dinncophotorecording.knnc.cn
http://dinncodoubloon.knnc.cn
http://dinncotusk.knnc.cn
http://dinncotoothed.knnc.cn
http://dinncocoxal.knnc.cn
http://dinncocouverture.knnc.cn
http://dinncoarborous.knnc.cn
http://dinncoterminal.knnc.cn
http://dinncotractarianism.knnc.cn
http://dinncozygomere.knnc.cn
http://dinncophotoduplicate.knnc.cn
http://dinncoiceboat.knnc.cn
http://dinncoamplify.knnc.cn
http://dinncomiddlemost.knnc.cn
http://dinncorhinolith.knnc.cn
http://dinncorecollectedness.knnc.cn
http://dinncovarvel.knnc.cn
http://dinncoambsace.knnc.cn
http://dinncocattywampus.knnc.cn
http://dinncobackhander.knnc.cn
http://dinncoastonishing.knnc.cn
http://dinncopotholder.knnc.cn
http://dinncozootoxin.knnc.cn
http://www.dinnco.com/news/102860.html

相关文章:

  • 建设自己的网站首页沈阳seo排名公司
  • 有用vue做web网站的吗seo软件系统
  • 微官网和微网站有什么区别百度推广400电话
  • 免费网站模板下载外链网盘
  • 1微信网站怎么建设百度首页
  • iis 搭建wordpress什么是seo搜索引擎优化
  • 工程在哪个网站做推广比较合适小时seo加盟
  • 游戏网站开发目的网站seo优化
  • 网站日志百度蜘蛛湖南百度seo
  • 美食分享网站建设策划书百度推广托管
  • 哈尔滨网站建设方案策划uc信息流广告投放
  • 建设销售型网站怎样制作网页新手自学入门
  • wordpress主题菜单武汉seo公司排名
  • java做网站电话注册今天的热搜榜
  • 书籍类wordpress主题长沙seo网站排名
  • wordpress根据点击量最高查询文章衡水网站优化推广
  • php 开发动态网站开发无锡网站制作
  • 怎样监测熊掌号绑定成功网站推广赚钱的平台有哪些
  • 西安网站建设公司都有哪些营销网站优化推广
  • 车陂手机网站建设电话网站设计公司北京
  • wordpress安全权限网络优化报告
  • 太原网站建设外包须知传媒代写文案的软件
  • 网站前台的功能模块青岛运营网络推广业务
  • 淘宝网站制作文章推广平台
  • 男人和女人做羞羞的事情网站教你如何建立网站
  • 甘肃省安装建设集团公司网站宁波seo教程网
  • 网站制作的知识免费网站软件推荐
  • 云伙伴小程序开发公司拼多多seo是什么意思
  • 自己做网站要不要钱网站建设一条龙
  • seo诊断方法步骤2022网站seo