当前位置: 首页 > news >正文

网站建设模式有哪些内容付费内容网站

网站建设模式有哪些内容,付费内容网站,钢结构加工,做网站哪里需要用钱Python爬取网页信息 需求: 持续爬取某嵌入式设备配置网页上的状态信息 shell脚本 简单快速, 不用装插件只能爬取静态内容 用curl命令返回整个网页的内容用grep命令抓取其中某些字段结合正则表达式可多样查找但对于动态内容, 比如对某嵌入式设备配置网页上的一条不断更新的信…

Python爬取网页信息

  • 需求: 持续爬取某嵌入式设备配置网页上的状态信息

shell脚本

  • 简单快速, 不用装插件
  • 只能爬取静态内容
  1. curl命令返回整个网页的内容
  2. grep命令抓取其中某些字段
  3. 结合正则表达式可多样查找
  4. 但对于动态内容, 比如对某嵌入式设备配置网页上的一条不断更新的信息, 可能只能爬出来占位符XXXX, 不满足我的需要
#!/bin/bash
while true
do# 获取时间戳timestamp=$(date +"%Y-%m-%d %T")# 先获取网页内容, 再获取内容中带Temperature的一行temperature_line=$(curl -s "http://lidar-internal-config.com" | grep "Temperature")# 打印出来echo "$timestamp $temperature_line" >> log.txt  sleep 1
done
# wget和curl差不多效果
# wget -q -O - 192.168.4.5 | grep -o "gps lock\|gps unlock" | awk '{print strftime("%Y-%m-%d %H:%M:%S"), $0}'

python脚本

  • 要安装一些东西, 有点麻烦

  • 可以爬取动态内容, 模仿网页

  • Ubuntu安装selenium

    • pip安装的可能是py2环境下的, 这时要用pip3安装
  • 再安上边链接的步骤安装geckodriver

    • Ubuntu自带火狐, 所以用geckodriver, 会先打开一个网页, 然后在这个网页上刷新.
    • 如果用get打开网页就读取内容, 可能动态内容还没刷出来, 有时还会抓到占位符, 加个延时就行
    • phantomjs不会打开网页, 但对于变化内容还是只能爬出占位符XXXX, 官方好像也放弃这库, 推荐用firefox或chrome
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
import datetime
browser = webdriver.Firefox()
# browser = webdriver.PhantomJS() # 不好用
# 传入地址, 返回要抓取的内容
def Get_Status(address):browser.get(address)time.sleep(0.2) # 延时等待正常刷新# 定位到带GNSS静态字符的位置, 方便抓旁边的动态字符elements = browser.find_elements_by_xpath("//*[text()='GNSS']")sibling_element = elements[0].find_element_by_xpath(".").# 抓取动态内容find_element_by_xpath("./following-sibling::*").text# print(sibling_element)return sibling_elementcurrent_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
file_name = "./log/gps_monitor"+current_time+".txt" # 先定好文件名while True:current_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") # 每条记录打上时间戳Status = Get_Status("你要访问的ip地址")# 写入log文件内with open(file_name,'a') as f:f.write("{}: GGG: {} \n".format(current_time, Status))time.sleep(10)
browser.close()
http://www.dinnco.com/news/86006.html

相关文章:

  • 长春美容网站建设武汉新一轮疫情
  • 网站设计报告广州引流推广公司
  • 大什么的网站建设公司加盟培训机构
  • 公司网站建设的优化教程网
  • 企业做网站价钱建站abc官方网站
  • 网站建设服务费标准排名公式
  • 网站权重如何做创意营销新点子
  • 成都今日事件落实20条优化措施
  • 公司关键词排名优化陕西seo快速排名
  • 金华市建设技工学校教育培训网站天天网站
  • 广州番禺网站公司免费的黄冈网站代码
  • 乡村旅游网站建设的意义百度指数明星搜索排名
  • 上外国黄色网站seo上排名
  • ps做网站页面搜索引擎的工作原理是什么?
  • 玉雕网站建设公司网站怎么建立
  • wordpress 文章title佛山旺道seo优化
  • 稳定的网站服务器租用宝鸡百度seo
  • 诸城做网站公司推广网站排名
  • 北欧做的比较好的网站seo外包公司需要什么
  • 怎么做微商的微网站广告营销案例100例
  • 手机网站版面设计百度官方网站
  • 设计自学网站哪个好seo网站关键词优化价格
  • 网站 团队网络营销策划书1000字
  • 有哪些企业网站株洲seo优化哪家好
  • wordpress建站 防攻击论坛推广技巧
  • 域名还没备案可以做网站吗网站推广内容
  • 郑州哪里有做网站如何快速推广一个app
  • 制作广告莆田百度快照优化
  • 长安营销型网站建设郑州seo顾问阿亮
  • 做食品那些网站十大网站排行榜