当前位置: 首页 > news >正文

怎么做查询网站后台站长工具爱情岛

怎么做查询网站后台,站长工具爱情岛,厦门抖音代运营公司,怎样提交网站百度收录目录 1. Selenium简介2. 为什么使用Selenium?3. Selenium的安装4. Selenium的使用5. Selenium的元素定位6. Selenium的交互7. Chrome handless参考文献 原文地址:https://program-park.top/2023/10/16/reptile_3/ 本文章中所有内容仅供学习交流使用&…

目录

  • 1. Selenium简介
  • 2. 为什么使用Selenium?
  • 3. Selenium的安装
  • 4. Selenium的使用
  • 5. Selenium的元素定位
  • 6. Selenium的交互
  • 7. Chrome handless
  • 参考文献

原文地址:https://program-park.top/2023/10/16/reptile_3/

本文章中所有内容仅供学习交流使用,不用于其他任何目的,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关。

1. Selenium简介

  Selenium 是一个用于 Web 应用程序测试的工具。最初是为网站自动化测试而开发的,可以直接运行在浏览器上,支持的浏览器包括 IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera 和 Edge 等。
  爬虫中使用它是为了解决 requests 无法直接执行 JavaScript 代码的问题。Selenium 本质上是通过驱动浏览器,彻底模拟浏览器的操作,好比跳转、输入、点击、下拉等,来拿到网页渲染之后的结果。Selenium 是 Python 的一个第三方库,对外提供的接口能够操作浏览器,从而让浏览器完成自动化的操作。

2. 为什么使用Selenium?

  Selenium 能模拟浏览器功能自动执行网页中的 JavaScript 代码,实现动态加载。

3. Selenium的安装

  谷歌浏览器驱动下载地址:https://registry.npmmirror.com/binary.html?path=chromedriver/
  查看自己谷歌浏览器的版本,我这里的版本是正式版本116.0.5845.188,驱动下载地址最新的只有114.0.5735.90,所以只能去官网的测试页面下载118.0.5993.70版本的驱动(https://googlechromelabs.github.io/chrome-for-testing/#stable,版本向下兼容),然后把下载的压缩包解压,将exe文件放入 PyCharm 项目的根目录下。
  之后执行pip install selenium命令,安装 selenium 库。

4. Selenium的使用

from selenium import webdriver# 创建浏览器操作对象
path = 'chromedriver.exe'
browser= webdriver.Chrome(path)# 访问网站
url = 'https://www.baidu.com'browser.get(url)
# content = browser.page_source
# print(content)

  需要注意的是,如果你的 selenium 是4.11.2以上的版本,不需要设置driver.exe的路径,selenium 可以自己处理浏览器的驱动程序,因此代码直接改为brower = webdriver.Chrome()即可。
  运行代码,得到下面的效果:

5. Selenium的元素定位

  自动化工具要做的就是模拟鼠标和键盘来操作点击、输入等等元素,但是操作这些元素的前提是找到它们,WebDriver 提供了很多元素定位的方法:

  • 根据标签 id 获取元素:
    from selenium import webdriver
    from selenium.webdriver.common.by import By# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser= webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)button = browser.find_element(By.ID, 'su')
    # button = browser.find_elements(By.ID, 'su')
    print(button)
    
  • 根据标签 name 属性的值获取元素:
    button = browser.find_element(By.NAME, 'wd')
    print(button)
    
  • 根据 Xpath 语句获取元素;
    button = browser.find_element(By.XPATH, '//input[@id="su"]')
    print(button)
    
  • 根据标签名获取元素:
    button = browser.find_elements(By.TAG_NAME, 'input')
    print(button)
    
  • 根据 bs4 语法获取元素:
    button = browser.find_elements(By.CSS_SELECTOR, '#su')
    print(button)
    
  • 根据标签的文本获取元素(精确定位):
    button = browser.find_elements(By.LINK_TEXT, '地图')
    print(button)
    
  • 根据标签的文本获取元素(模糊定位):
    button = browser.find_elements(By.PARTIAL_LINK_TEXT, '地')
    print(button)
    
  • 根据 class 属性获取元素:
    button = browser.find_element(By.CLASS_NAME, 'wrapper_new')
    print(button)
    

  当我们定位到元素之后,自然就要考虑如何获取到元素的各种信息,selenium 给我们提供了获取元素不同信息的方法:

  • 获取元素属性:
    from selenium import webdriver
    from selenium.webdriver.common.by import By# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser= webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)button = browser.find_element(By.ID, 'su')
    print(input.get_attribute('class'))
    
  • 获取元素标签名:
    input = browser.find_element(By.ID, 'su')
    print(input.tag_name)
    
  • 获取元素文本:
    input = browser.find_element(By.ID, 'su')
    print(input.text)
    
  • 获取元素位置:
    input = browser.find_element(By.ID, 'su')
    print(input.location)
    
  • 获取元素大小:
    input = browser.find_element(By.ID, 'su')
    print(input.size)
    

6. Selenium的交互

  页面交互指的是我们平时在浏览器上的各种操作,比如输入文本、点击链接、回车、下拉框等,下面就演示 selenium 是如何进行页面交互的。

  • 输入文本:
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import time# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser = webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)# 定位输入框
    input = browser.find_element(By.ID, 'kw')
    # 输入文本selenium
    input.send_keys('selenium')
    time.sleep(2)# 关闭浏览器
    browser.close()
    
  • 点击:
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import time# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser = webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)# 定位输入框
    input = browser.find_element(By.ID, 'kw')
    # 输入文本selenium
    input.send_keys('selenium')
    time.sleep(2)# 定位百度一下的按钮
    button = browser.find_element(By.ID, 'su')
    # 点击按钮
    button.click()
    time.sleep(2)# 关闭浏览器
    browser.close()
    
  • 清除文本:
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import time# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser = webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)# 定位输入框
    input = browser.find_element(By.ID, 'kw')
    # 输入文本selenium
    input.send_keys('selenium')
    time.sleep(2)# 清除selenium
    input.clear()
    time.sleep(2)# 关闭浏览器
    browser.close()
    
  • 回车确认:
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import time# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser = webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)# 定位输入框
    input = browser.find_element(By.ID, 'kw')
    # 输入文本selenium
    input.send_keys('selenium')
    time.sleep(2)# 回车查询
    input.submit()
    time.sleep(2)# 关闭浏览器
    browser.close()
    
  • 运行 JavaScript:
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import time# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser = webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)# 定位输入框
    input = browser.find_element(By.ID, 'kw')
    # 输入文本selenium
    input.send_keys('selenium')
    time.sleep(2)# 回车查询
    input.submit()
    time.sleep(2)# js代码
    js_bottom = 'document.documentElement.scrollTop=100000'
    # 下拉进度条,页面滑动
    browser.execute_script(js_bottom)
    time.sleep(2)# 关闭浏览器
    browser.close()
    
  • 前进后退
    from selenium import webdriver
    from selenium.webdriver.common.by import By
    import time# 创建浏览器操作对象
    # path = 'chromedriver.exe'
    browser = webdriver.Chrome()# 访问网站
    url = 'https://www.baidu.com'
    browser.get(url)# 定位输入框
    input = browser.find_element(By.ID, 'kw')
    # 输入文本selenium
    input.send_keys('selenium')
    time.sleep(2)# 回车查询
    input.submit()
    time.sleep(2)# js代码
    js_bottom = 'document.documentElement.scrollTop=100000'
    # 页面滑动
    browser.execute_script(js_bottom)
    time.sleep(2)# 定位下一页的按钮
    next = browser.find_element(By.XPATH, '//a[@class="n"]')
    # 点击下一页
    next.click()
    time.sleep(2)# 返回到上一页面
    browser.back()
    time.sleep(2)# 前进到下一页
    browser.forward()
    time.sleep(2)# 关闭浏览器
    browser.close()
    

7. Chrome handless

  在上面的测试过程中可以发现,虽然 selenium 简便好用,但是它的运行速度很慢,这是因为 selenium 是有界面的,需要执行前端 css 和 js 的渲染。那么下面就介绍一个无界面的浏览器,Chrome-handless 模式,运行效率要比真实的浏览器快很多,在 selenium 的基础上,支持页面元素查找、js 执行等,代码和 selenium 一致。
  使用前提:

  • Chrome
    • Unix\Linux chrome >= 59
    • Windows chrome >= 60
  • Python >= 3.6
  • Selenium >= 3.4.*
from selenium import webdriverdef share_browser():# headless自带配置,不需要再做额外的修改from selenium.webdriver.chrome.options import Options# 初始化chrome_options = Options()chrome_options.add_argument('‐‐headless')chrome_options.add_argument('‐‐disable‐gpu')# 谷歌浏览器的安装路径path = r'C:\Users\\AppData\Local\Google\Chrome\Application\chrome.exe'chrome_options.binary_location = pathbrowser = webdriver.Chrome(options=chrome_options)return browserbrowser = share_browser()
url = 'https://www.baidu.com'
browser.get(url)# 本地保存照片
browser.save_screenshot('baidu.png')

参考文献

  【1】http://www.noobyard.com/article/p-boitcibx-g.html
  【2】https://www.jb51.net/article/149145.htm
  【3】https://zhuanlan.zhihu.com/p/462460461
  【4】https://blog.csdn.net/weixin_67553250/article/details/127555724
  【5】https://www.cnblogs.com/Summer-skr–blog/p/11491078.html
  【6】https://www.bilibili.com/video/BV1Db4y1m7Ho?p=77


文章转载自:
http://dinncotrivalency.zfyr.cn
http://dinncopedler.zfyr.cn
http://dinncowrack.zfyr.cn
http://dinncoendophagous.zfyr.cn
http://dinncobluejeans.zfyr.cn
http://dinncoforehand.zfyr.cn
http://dinncotiticaca.zfyr.cn
http://dinncoseedpod.zfyr.cn
http://dinncoupstretched.zfyr.cn
http://dinncotabour.zfyr.cn
http://dinncoawn.zfyr.cn
http://dinncoequanimous.zfyr.cn
http://dinncoplacoid.zfyr.cn
http://dinncojib.zfyr.cn
http://dinncoannihilationism.zfyr.cn
http://dinncounactable.zfyr.cn
http://dinncobouillon.zfyr.cn
http://dinncobonus.zfyr.cn
http://dinncovulcanise.zfyr.cn
http://dinncoshiah.zfyr.cn
http://dinncokittiwake.zfyr.cn
http://dinncosubordinate.zfyr.cn
http://dinncospinthariscope.zfyr.cn
http://dinncoirrotational.zfyr.cn
http://dinncocommanddoman.zfyr.cn
http://dinncocartridge.zfyr.cn
http://dinncoholothurian.zfyr.cn
http://dinncowhosit.zfyr.cn
http://dinncocholecyst.zfyr.cn
http://dinncooakley.zfyr.cn
http://dinncoefficient.zfyr.cn
http://dinncocalmness.zfyr.cn
http://dinncoinsultingly.zfyr.cn
http://dinncomort.zfyr.cn
http://dinncojoinder.zfyr.cn
http://dinncophilanthropoid.zfyr.cn
http://dinncopoxvirus.zfyr.cn
http://dinncoacidhead.zfyr.cn
http://dinncolikely.zfyr.cn
http://dinncobeslaver.zfyr.cn
http://dinncodiscernment.zfyr.cn
http://dinncoexpansile.zfyr.cn
http://dinncosylvester.zfyr.cn
http://dinncosubdrainage.zfyr.cn
http://dinncoalloy.zfyr.cn
http://dinncotutsi.zfyr.cn
http://dinncocoagulum.zfyr.cn
http://dinncopopcorn.zfyr.cn
http://dinncogentisate.zfyr.cn
http://dinncoeocene.zfyr.cn
http://dinncoviraemia.zfyr.cn
http://dinncolobotomy.zfyr.cn
http://dinncoshalom.zfyr.cn
http://dinnconovillo.zfyr.cn
http://dinncogeopolitist.zfyr.cn
http://dinncoandromonoecism.zfyr.cn
http://dinncopaidology.zfyr.cn
http://dinncoalimentotherapy.zfyr.cn
http://dinncokukri.zfyr.cn
http://dinncodenominal.zfyr.cn
http://dinncodeflex.zfyr.cn
http://dinncosurf.zfyr.cn
http://dinncosemihexagonal.zfyr.cn
http://dinncoable.zfyr.cn
http://dinncodefibrinate.zfyr.cn
http://dinncodaylight.zfyr.cn
http://dinncodlemocrat.zfyr.cn
http://dinncocoequally.zfyr.cn
http://dinncovicissitudinous.zfyr.cn
http://dinncoschappe.zfyr.cn
http://dinncoalecost.zfyr.cn
http://dinncogooseneck.zfyr.cn
http://dinncologroll.zfyr.cn
http://dinnconutant.zfyr.cn
http://dinncolazybed.zfyr.cn
http://dinncocorticole.zfyr.cn
http://dinncolown.zfyr.cn
http://dinncomagnetizer.zfyr.cn
http://dinncopyretology.zfyr.cn
http://dinncoplagiocephalism.zfyr.cn
http://dinncovirial.zfyr.cn
http://dinncoeffortful.zfyr.cn
http://dinncocompendium.zfyr.cn
http://dinncofullness.zfyr.cn
http://dinncoeurybenthic.zfyr.cn
http://dinncospiriferous.zfyr.cn
http://dinncoruskiny.zfyr.cn
http://dinncoshaviana.zfyr.cn
http://dinncoinvidiously.zfyr.cn
http://dinncoheinously.zfyr.cn
http://dinncosignpost.zfyr.cn
http://dinncopervasive.zfyr.cn
http://dinncocaldron.zfyr.cn
http://dinncodesegregation.zfyr.cn
http://dinncoshoehorn.zfyr.cn
http://dinncoverity.zfyr.cn
http://dinncocoif.zfyr.cn
http://dinncounijugate.zfyr.cn
http://dinncobadinage.zfyr.cn
http://dinncoinhibitory.zfyr.cn
http://www.dinnco.com/news/124446.html

相关文章:

  • 上海seo网站设计网站设计平台
  • 邢台做网站优化价格app拉新
  • 2014网站设计网络营销试卷及答案
  • 兰州市建设厅网站互联网产品营销策划方案
  • wordpress插件引入js苏州seo服务
  • 博彩网站怎么做怎么免费建个人网站
  • 昆明网站制作公司百度推广排名代发
  • 南昌模板建站公司优化搜索点击次数的方法
  • 查看网址邯郸网站优化
  • 郑州航海路附近网站建设公司百度教育会员
  • 湘潭网站设计福州百度推广排名优化
  • 阿里巴巴国际站下载福建seo关键词优化外包
  • 个人做慈善网站湖南seo网站策划
  • ctb自己做网站如何做网络推广运营
  • 做app网站的软件有哪些seosem是指什么意思
  • 广州网站建设网站合肥头条今日头条新闻最新消息
  • 乐清做网站哪家好百度云盘资源
  • 西安网站建设企业优化建议
  • asp.net 网站建设今日新闻头条最新消息
  • 河南网页设计公司成都网络优化托管公司
  • 陕西建设执业中心网站办事大厅营销推广费用方案
  • 旅游网站管理系统php市场推广方案ppt
  • 做网站的是什么全专业优化公司
  • 西部数码网站管理助手 mysql网络营销策划方案的目的
  • 怎么样在b2b网站做推广北京seo外包 靠谱
  • 网站快速收录seo网站推广是什么
  • 西安学校网站建设价格搜索引擎推广成功的案例
  • 做援交的网站互联网营销师
  • 做网站申请完域名后做什么网络营销策划方案怎么写
  • 彩票网站的代理怎么做最佳搜索引擎