当前位置: 首页 > news >正文

怎么样做外链推广网站360优化大师安卓下载

怎么样做外链推广网站,360优化大师安卓下载,外包建设网站,个人网站注册平台要多少钱爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP # -*- coding: utf-8 -*- """…

爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)print(proxy_list)if __name__=='__main__':get_proxy(1)

这段代码是爬取第一页,仅仅做个示范,大家可以在下面写个for循环,多爬几页也是可以的,来看看输出结果:

接下来来看看刚才做的IP池能不能用,或者说效率怎么样。测试网站http://httpbin.org/ip,话不多说上代码:

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
import time
import random
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)return proxy_listdef proxy_read(proxy_list,i):proxy = proxy_list[i]print('当前IP为:{}'.format(proxy))sleep_time = random.randint(1,3)print('等待{}秒'.format(sleep_time))time.sleep(sleep_time)print('开始测试')proxy_jj = urllib.request.ProxyHandler({'http':proxy})opener = urllib.reequest.build_opener(proxy_jj,urllib.request.HTTPHandler)urllib.request.install_opener(opener)try:html = urllib.request.urlopen('http://httpbin.org/ip')rhtml = html.read()print(rhtml)except Exception as e:print(e)print('-------IP不能用------')if __name__=='__main__':proxy_list = get_proxy(1)print('开始测试')for i in range(100):proxy_read(proxy_list,i)

结果如上图,总得来说,代码很简单,好啦,end啦,下一篇文章‘用xpath打造免费IP池‘。敬请期待

http://www.dinnco.com/news/46168.html

相关文章:

  • 传媒公司vi西安seo搜推宝
  • 网站图片用什么做网站排名优化服务
  • 建站哪个平台好seo综合查询系统
  • 独立站搭建平台最吸引人的营销广告词
  • 招聘网站可以同时做两份简历吗中国网站排名
  • 平台设计网站公司电话seo 公司
  • 内蒙古建设工程造价信息网官方网站佛山网络营销推广
  • wordpress 改变js路径重庆做优化的网络公司
  • 有口碑的宜昌网站建设上海网站营销推广
  • 北京公司网站设计河南品牌网络推广外包
  • 成都网站建设科技山东seo推广公司
  • 大连城乡建设局网站谷歌建站
  • 用了采集站域名做网站怎么提高关键词搜索排名
  • b2b网站如何做seo综合检测
  • 外国语学校网站建设方案seo深圳培训班
  • 设计制作费用计入什么会计科目推广优化seo
  • 网站建设网站制作公司学市场营销后悔死了
  • 网站开发是做啥的此网站三天换一次域名
  • ui培训班 qfedu站长之家seo工具包
  • asp.net实用网站开发360广告投放平台
  • 交易网站开发文档广告外链购买平台
  • 网页设计与制作教程杨选辉seo网站优化多少钱
  • 个人网站备案可以做博客吗搜索引擎营销的主要方法
  • 网站备案 和 icp怎么优化网络
  • 吉林省党风廉政建设官方网站nba最新排行
  • 沧州网站建设制作西安百度百科
  • 郑州航海路附近网站建设公司网站域名ip地址查询
  • 广西住房和城乡建设网站视频专栏免费的自媒体一键发布平台
  • asp建站系统源码全国人大常委会委员长
  • 广州网站排名优化服务福州seo管理