当前位置: 首页 > news >正文

免费做那个的视频网站站长百度

免费做那个的视频网站,站长百度,wordpress函数大全,微信手机营销软件网站建设Python使用Beautiful Soup及解析html获取元素并提取内容值 1. 包括解析获取标题2. 根据标签及id获取所有元素3. 根据标签及class获取所有元素4. 获取元素下的标签的值5. 获取元素下的parent及child的元素的值参考 1. 包括解析获取标题 2. 根据标签及id获取所有元素 3. 根据标…

Python使用Beautiful Soup及解析html获取元素并提取内容值

    • 1. 包括解析获取标题
    • 2. 根据标签及id获取所有元素
    • 3. 根据标签及class获取所有元素
    • 4. 获取元素下的标签的值
    • 5. 获取元素下的parent及child的元素的值
    • 参考

1. 包括解析获取标题

2. 根据标签及id获取所有元素

3. 根据标签及class获取所有元素

4. 获取元素下的标签的值

5. 获取元素下的parent及child的元素的值

# 使用Python解析html元素的值from bs4 import BeautifulSoupfile_html = 'test/demo.html'
file = open(file_html, "rb")
html = file.read().decode("utf-8")# 通过html.parser解析器把我们的HTML解析成了一棵树
bs = BeautifulSoup(html, "html.parser")print("获取文章title")
print(bs.title)# 根据标签 和 id名称获取所有元素
id_list = bs.find_all('input', id='mSearchInput')# 根据标签 和 class名称获取所有元素
div_class_list = bs.find_all('div', class_='view-num-box')
for i, div in enumerate(div_class_list):# 获取元素的父元素的值print(i, div.text, ' parent: ', div.parent.text)print('-----------------------------------------------------------')
blog_list = bs.find_all('article', class_='blog-list-box')
for i, blog in enumerate(blog_list):print(i, blog.text, '\ntitle: ', bs.find_all('div', class_='blog-list-box-top')[i].text)print(blog.h4.text)  # 获取blog的标签下的h4标签的文本print(blog.span.text)print(blog.div, blog.div.next)# 获取contentfor j, content in enumerate(blog.contents):print('contents: ', j, content.text)# 获取childfor j, child in enumerate(blog.children):print('child: ', j, child.text)div_list = bs.find_all('div', class_='user-profile-head-address')
print('div_list: ', div_list[0].text)meta_list = bs.find_all('meta')
for j, meta in enumerate(meta_list):print(j, meta.text, meta.attrs['content'])# 2.NavigableString
print("2. NavigableString的例子:获取title的string内容和div的属性")
print(bs.title.string)
print(bs.div.attrs)  # 获取标签中的所有属性,并返回一个字典
# 3.BeautifulSoup
print("3. BeautifulSoup的例子:获取整个html文档的name")
print(bs.name)
# 4.Comment
print("4. Comment的例子:获取a的string")
print(bs.a.string)

参考

  • https://blog.csdn.net/qq_42732153/article/details/81105725
  • https://blog.csdn.net/qq_50587771/article/details/123870433
http://www.dinnco.com/news/63739.html

相关文章:

  • 南昌做网站流程天津放心站内优化seo
  • 中小学生做试卷的网站未来网络营销的发展趋势
  • 广东哪里网站建设seo资料网
  • 教你做网站免费顶级域名申请网站
  • 做游戏的网站个人seo怎么赚钱
  • 门户网站手机版企业seo自助建站系统
  • 如何做网站内链百度号注册官网
  • 意见反馈的网站怎么做太原网络推广公司哪家好
  • 做网站 做推广需要知道什么公司seo排名优化
  • 做网站一般链接什么数据库seo顾问张智伟
  • 网站备案更改吗免费网站申请注册
  • 商城网站模板免费下载培训机构排名前十
  • 专业网站优化报价推蛙网络
  • 深圳设计公司企业网站百度极速版下载安装最新版
  • 深圳市测绘建设局网站合肥百度推广优化
  • 网站开发人员主要干什么的seo优化排名易下拉用法
  • wordpress怎么迁移到空间优化法治化营商环境
  • 网站建设怎么搞新型实体企业100强
  • 广州各类外贸网站制作链接的小程序
  • 福州企业网站开发网站排名优化软件哪家好
  • 连云港 网站设计网络营销渠道的特点
  • 2017年到2018年建设的网站免费个人网站建站
  • 黑龙江龙采做网站如何宣传软文
  • 温州模板网站建站广州谷歌优化
  • 怎么做一个网站的logo设计图广州seo
  • wordpress自定义前端网络优化器免费
  • 网站优化推广方案网站怎么被百度收录
  • 广西建设局网站首页广州新闻热点事件
  • 网站维护有文化建设费百度推广官方网站登录入口
  • 广告推广网站怎么做站长之家端口扫描