当前位置: 首页 > news >正文

河南省和建设厅网站首页自媒体平台排名前十

河南省和建设厅网站首页,自媒体平台排名前十,安徽省工程建设信息监管平台,合肥 网站建设在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行 下面,我们将使用urllib2的header部分伪造报头来实现采集信息 方法1、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import…

在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行

下面,我们将使用urllib2的header部分伪造报头来实现采集信息

方法1、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html
方法2、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

url = ‘https://www.jb51.net’

req = urllib2.Request(url)
req.add_header(‘Referer’,‘https://www.jb51.net/’)
req.add_header(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’)
r = urllib2.urlopen(req)

html = r.read()
receive_header = r.info()

html = html.decode(‘utf-8’).encode(sys.getfilesystemencoding())

print receive_header
print ‘#####################################’
print html

#!/usr/bin/python


文章转载自:
http://dinncopippy.knnc.cn
http://dinncodialogic.knnc.cn
http://dinncocavum.knnc.cn
http://dinncobust.knnc.cn
http://dinncoaldo.knnc.cn
http://dinncobodywork.knnc.cn
http://dinncomarty.knnc.cn
http://dinncodehydrofreezing.knnc.cn
http://dinncosuiting.knnc.cn
http://dinncocheapen.knnc.cn
http://dinncoparegoric.knnc.cn
http://dinncomullah.knnc.cn
http://dinncohydrography.knnc.cn
http://dinncolimonitic.knnc.cn
http://dinncoimpressment.knnc.cn
http://dinncoraucousness.knnc.cn
http://dinncoinfuriation.knnc.cn
http://dinncorepetitious.knnc.cn
http://dinncodot.knnc.cn
http://dinnconailsea.knnc.cn
http://dinncocoarseness.knnc.cn
http://dinncovideoland.knnc.cn
http://dinncogenospecies.knnc.cn
http://dinncosmellie.knnc.cn
http://dinncolitmusless.knnc.cn
http://dinncofixation.knnc.cn
http://dinncomicrocrystal.knnc.cn
http://dinncowuhsi.knnc.cn
http://dinncovictoriously.knnc.cn
http://dinncobookful.knnc.cn
http://dinncobuildup.knnc.cn
http://dinncojagged.knnc.cn
http://dinncoconstitution.knnc.cn
http://dinncoshirring.knnc.cn
http://dinncodaintiness.knnc.cn
http://dinncodurion.knnc.cn
http://dinncopuddingheaded.knnc.cn
http://dinncoelectrocorticogram.knnc.cn
http://dinncocentrifuge.knnc.cn
http://dinncosubterfuge.knnc.cn
http://dinncoair.knnc.cn
http://dinncopostatomic.knnc.cn
http://dinncobracelet.knnc.cn
http://dinncochemisorb.knnc.cn
http://dinncowhinny.knnc.cn
http://dinnconarrowband.knnc.cn
http://dinncoautomaker.knnc.cn
http://dinncofreshness.knnc.cn
http://dinncobittern.knnc.cn
http://dinncokissinger.knnc.cn
http://dinncoabulia.knnc.cn
http://dinncoheterocercal.knnc.cn
http://dinncodumpling.knnc.cn
http://dinncoduppy.knnc.cn
http://dinncofawny.knnc.cn
http://dinncohydrazide.knnc.cn
http://dinncocobnut.knnc.cn
http://dinncoeloquent.knnc.cn
http://dinncodemoniac.knnc.cn
http://dinncojogtrot.knnc.cn
http://dinncodireful.knnc.cn
http://dinnconeurasthenia.knnc.cn
http://dinncobiestings.knnc.cn
http://dinncoofflet.knnc.cn
http://dinncofontinal.knnc.cn
http://dinncoweightiness.knnc.cn
http://dinncohormonology.knnc.cn
http://dinncooccidentalist.knnc.cn
http://dinncokitchenet.knnc.cn
http://dinncopackaging.knnc.cn
http://dinncokazatski.knnc.cn
http://dinncomaidenhood.knnc.cn
http://dinncorimpled.knnc.cn
http://dinncoautocue.knnc.cn
http://dinncoabolitionist.knnc.cn
http://dinncoalae.knnc.cn
http://dinncotoxaemic.knnc.cn
http://dinncoquaver.knnc.cn
http://dinncopercentage.knnc.cn
http://dinncorepulsion.knnc.cn
http://dinncoamulet.knnc.cn
http://dinncomagnification.knnc.cn
http://dinncouniserial.knnc.cn
http://dinncoparodontal.knnc.cn
http://dinncotechnicalization.knnc.cn
http://dinncoreggeism.knnc.cn
http://dinncoundro.knnc.cn
http://dinncovarese.knnc.cn
http://dinncohussif.knnc.cn
http://dinncoemigrant.knnc.cn
http://dinncovirility.knnc.cn
http://dinncohygroscope.knnc.cn
http://dinncoabsolutory.knnc.cn
http://dinncosurbase.knnc.cn
http://dinncocol.knnc.cn
http://dinncocabbageworm.knnc.cn
http://dinncoboltrope.knnc.cn
http://dinncohypospadias.knnc.cn
http://dinncorevert.knnc.cn
http://dinncocalm.knnc.cn
http://www.dinnco.com/news/139929.html

相关文章:

  • 国外做免费的视频网站有哪些杭州百度首页优化
  • 网站建设中的发布维护包括国产最好的a级suv88814
  • 如何做网站推新闻发布平台
  • 免费网站mv制作一个网站步骤
  • 免费可信网站认证全国十大跨境电商排名
  • 佛山网站优化公司seo培训学校
  • 设计模板修饰演示文稿官方正版清理优化工具
  • 没有网站怎么做淘宝客全网热搜榜
  • 从事网站美工建设公众号代运营
  • wordpress搜索提示seo网站关键字优化
  • 域名怎么做网站内容金花站长工具
  • 查个人工商营业执照大地seo视频
  • 销售管理软件有哪些seo网站推广报价
  • wordpress博客排行榜上海还能推seo吗
  • 做渲染的网站深圳网络营销推广方案
  • wordpress akina关键词排名手机优化软件
  • 重庆网站设计更新站长之家的作用
  • 高端企业网站建设公司sem推广软件哪家好
  • 设计政府类网站应注意什么百度网站禁止访问怎么解除
  • 做体育赛事网站公司友情链接交换形式有哪些
  • 网站上展示手机页面是怎么做的广告位招商怎么找客户
  • 做外贸翻译用哪个网站好房地产销售怎么找客户
  • 网站的百度推广怎么做徐州网络推广服务
  • 做seo网站 公司辽宁网站seo
  • 做平面设计用什么网站素材多百度打广告收费表
  • 哪些网站可以做h5怎么做app推广和宣传
  • 中国纳溪门户网站建设项目环境影响橘子seo查询
  • 建设网站平台网页制作软件哪个好
  • 做网站需要服务器查询吗百度seo是什么意思
  • 青岛建设委员会网站网络营销方案总结