当前位置: 首页 > news >正文

做b2b网站有没有用bt种子磁力搜索引擎

做b2b网站有没有用,bt种子磁力搜索引擎,电商付费推广方式,怎么自己做卡盟网站Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库,命令如下: pip install pdfminer3K 安装过程如下: 引入类库 需要引入很多的类库。 示例如下: import sys import importlib importlib.reload(sys)fr…

Python 实现读取pdf文件简单示例。

安装命令

需要安装操作pdf的三方类库,命令如下:

pip install pdfminer3K

安装过程如下:

引入类库

需要引入很多的类库。

示例如下:

import sys
import importlib
importlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import  PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

 

读取pdf实现

实现步骤为:先通过二进制方式打开测试pdf文档,创建pdf文档解析测试文档内容,

最后读取文件内容,保存到另一个文件中。

示例如下:

import sys
import importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
import osdef read_pdf(path, toPath):# 以二进制方式打开pdf文件f = open(path, 'rb')# 创建一个pdf文档分析器parser = PDFParser(f)# 创建pdf文档pdfFile = PDFDocument()# 链接分析器与文档对象parser.set_document(pdfFile)pdfFile.set_parser(parser)# 提供初始化密码pdfFile.initialize()# 检测文档是否提供txt转换if not pdfFile.is_extractable:raise PDFTextExtractionNotAllowedelse:# 解析数据# 数据管理器manager = PDFResourceManager()# 创建一个PDF设备对象laparams = LAParams()device = PDFPageAggregator(manager, laparams=laparams)# 解释器对象interpreter = PDFPageInterpreter(manager, device)for page in pdfFile.get_pages():interpreter.process_page(page)layout = device.get_result()for x in layout:if isinstance(x, LTTextBoxHorizontal):with open(toPath, 'a', encoding='utf-8') as f:print(x.get_text())f.write(x.get_text() + "\n")path = os.path.join(os.getcwd(), 'test_1.pdf')
toPath = os.path.join(os.getcwd(), 'test_2.txt')
read_pdf(path, toPath)

注意:无法读取中文,貌似需要加载中文字体。还有就是在写入pdf文件,格式不对无法打开暂时没找到原因。

总结

本篇只是使用Python 实现读取pdf文件简单示例,因为时间关系没有做深入的扩展,等之后有时间再做补充。

http://www.dinnco.com/news/69137.html

相关文章:

  • 做电影网站用什么格式好手机维修培训班学校
  • 网站开发json解析如何发布自己的广告
  • 保险公司网站建设方案厦门网站建设公司名单
  • 营销型企业网站建设流程关键词免费
  • 做网站还是app好合肥网站制作
  • 外贸网络推广培训重庆seo薪酬水平
  • 文化旅游做的好的网站seo网站优化培训
  • 仙游县住房和城乡建设局网站app下载推广
  • 企业做网站多少钱怎么做营销推广方案
  • 哪些网络公司可以做机票预订网站网站改进建议有哪些
  • 城阳网站开发公司电话爱站网域名查询
  • 外贸型网站开发怎么注册自己公司的网址
  • wordpress站内搜索统计西安抖音seo
  • 山西防疫最新信息长沙网站优化
  • 把网站内的文本保存到txt怎么做可以免费发广告的网站
  • 重庆网站制作企业怎么注册网站免费的
  • 您的网站空间即将过期上海网络推广服务公司
  • 网站建设的原因有什么大型网站制作
  • 网站建设操作网站优化推广培训
  • 电商型企业网站建设百度一下就会知道了
  • 专业网站建设最权威发布任务注册app推广的平台
  • 合肥网站制作网站上街网络推广
  • 政民互动平台武汉关键词seo
  • wordpress cms 主题appstore关键词优化
  • 商城网站有哪些全网最好的推广平台
  • ui设计做网站2345软件为什么没人管
  • 浙江商城网站建设做互联网项目怎么推广
  • 安装宝塔之后wordpress首页打不开seo培训讲师招聘
  • 自己如何创立网站百度推广和优化哪个好
  • 青州网站建设公司宁波网站建设方案推广