当前位置: 首页 > news >正文

html5制作的网站关键词优化排名网站

html5制作的网站,关键词优化排名网站,国内简约网站设计,图书馆建设投稿网站缘由:当时在windows 上运行chrom 的时候 发现要找到 浏览器和 webdirver 相匹配的 版本比较麻烦,当时搞了大半天才找到并安装好。 这次在ubuntu上尝试用firefox 实现爬虫 文章分为三个部分: 环境搭建浏览器弹窗输入用户名,密码的…

缘由:当时在windows 上运行chrom 的时候 发现要找到 浏览器和 webdirver 相匹配的 版本比较麻烦,当时搞了大半天才找到并安装好。

这次在ubuntu上尝试用firefox 实现爬虫
文章分为三个部分:

  1. 环境搭建
  2. 浏览器弹窗输入用户名,密码的解决方法
  3. web 页面元素的获取

1.环境搭建
1)安装firefox 浏览器

apt-get install firefox
2)安装 python 相关
apt-get install python3.8
apt-get install python3-pip
python3 -m pip install selenium
3)将github 上的geckdirver 下载下来 放到 Ubuntu目录下待用github 地址:https://github.com/mozilla/geckodriver/releases
	tar -zxvf geckodriver-v0.33.0-linux-aarch64.tar.gzmv geckodriver /usr/local/share/ln -s /usr/local/share/geckodriver /usr/local/bin/geckodriverln -s /usr/local/share/geckodriver /usr/bin/geckodriver

4). 编写测试文件

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from selenium.webdriver.support.select import Select
from selenium.webdriver.firefox.options import Options
import os
import timeoptions = Options()
options.add_argument('-headless') # 无头参数
browser = webdriver.Firefox(options=options)
browser.get('https://blog.csdn.net')
print(browser.title)
browser.close()

测试过程中可能会遇到相关软件的版本不匹配,网上搜搜,都会有解决方法,我也是边搜边解决,具体解决问题忘记,而且每个人的情况有差异

二. 浏览器弹窗输入用户名,密码的解决方法
有些web程序使用浏览器自带的弹窗,让用户填写用户名密码来实现登录,但是对于爬虫来说,我们定位不到元素,所以也就无法输入用户名,密码,解决方法如下
url= http://用户:密码@登录ip:端口 没有端口的不用填
例:
url = ‘http://admin:12345@192.168.1.254’
browser.get(url)
这样就可以正常登录了

三. 页面元素获取

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from selenium.webdriver.support.select import Select
from selenium.webdriver.firefox.options import Options
import os
import timeurl = 'http://admin:12345@192.168.1.254'# 登录路由器管理页面  
def login():global browser,url,name,passwdtry:# 实例化一个浏览器对象(传入浏览器的驱动程序)options = Options()options.add_argument('-headless') # 无头参数browser = webdriver.Firefox(options=options)browser.get(url)time.sleep(3)print(browser.title)iframe_sub0 = browser.find_elements(By.XPATH, '/html/frameset/frame[1]') #print(len(iframe_sub0))browser.switch_to.frame(iframe_sub0[0])browser.find_elements(By.XPATH,'//*[@id="mynav7"]/span')[0].click()time.sleep(1)browser.switch_to.parent_frame()iframe_sub1 = browser.find_elements(By.XPATH, '/html/frameset/frame[2]')#print(len(iframe_sub1))browser.switch_to.frame(iframe_sub1[0])time.sleep(1)iframe_sub2 = browser.find_elements(By.XPATH, '/html/body/div/iframe')#print(len(iframe_sub2))browser.switch_to.frame(iframe_sub2[0])time.sleep(1)net_info = browser.find_elements(By.XPATH, '/html/body/pre')#print(len(net_info)) print(net_info[0].text)        return 0except Exception as e:print(e)print("登录失败,请检查,用户名或者密码是否正确 !")return 1
if __name__=="__main__":login()    
http://www.dinnco.com/news/41242.html

相关文章:

  • 政府网站支撑体系建设公司怎么做网络营销
  • 企业网站建设 优化获客软件排名前十名
  • 邯郸哪做网站整合营销传播
  • 福建seo优化江西seo推广
  • 网络问卷制作平台郑州网站优化哪家好
  • 遂宁做网站西安seo排名扣费
  • 可以申请域名的网站公关公司
  • 企业网站建设项目计划书如何自己建设网站
  • java做直播网站有哪些软件有哪些太原做网站哪家好
  • 软件开发需求文档怎么写seo程序专员
  • 网站上做旅游卖家要学什么软件重庆百度竞价推广
  • 辽宁省阜蒙县建设局网站自己做一个网站要多少钱
  • 福州做商城网站公司嘉兴seo计费管理
  • 做胃肠科医院网站费用交换神器
  • 做电商网站有什语言好网络营销sem培训
  • 网站建设会出现的问题全国新冠疫情最新消息
  • 邯郸做网站服务商谷歌paypal官网
  • 网站屏蔽中文浏览器网站设计的毕业论文
  • 临沂企业建站系统广州私人做网站
  • 徐州建设网站公司网站注册地址
  • 电子商务网站建设的心得seo软文是什么意思
  • 怎样访问简版网站网页seo
  • wordpress安装后要删除哪些文件seo关键词优化提高网站排名
  • 给网站添加代码免费seo网站优化
  • 凡科网做网站好吗网站排名查询工具
  • 道客网站建设推广百度人工智能
  • 外国电商设计网站有哪些问题怎么制作自己公司网站
  • 第三次网站建设的通报seo的优化策略有哪些
  • 杭州经营性网站备案网站建设网络推广seo
  • 如何用wordpress制作网站微信营销软件免费版