• 大小: 3KB
    文件类型: .py
    金币: 2
    下载: 1 次
    发布日期: 2021-01-06
  • 语言: Python
  • 标签: python  pdf转word  

资源简介

python实现pdf转word,支持中英文转换,转换精度高,可以达到使用效果。

资源截图

代码片段和文件信息

#!/usr/bin/python
# -*- coding: utf-8 -*-
# author:zhoulong_GISER
# -*- coding: utf-8 -*-
# blog:https://blog.csdn.net/qq_33356563
# !/usr/bin/python
# -*- coding: utf-8 -*-

import sys
import importlib

importlib.reload(sys)

from pdfminer.pdfparser import PDFParser PDFDocument
from pdfminer.pdfinterp import PDFResourceManager PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import *
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

‘‘‘
解析pdf文件,获取文件中包含的各种对象
‘‘‘


# 解析pdf文件函数
def parse(pdf_path):
    fp = open(pdf_path ‘rb‘)  # 以二进制读模式打开
    # 用文件对象来创建一个pdf文档分析器
    parser = PDFParser(fp)
    # 创建一个PDF文档
    doc = PDFDocument()
    # 连接分析器 与文档对象
    parser.set_document(doc)
    doc.set_parser(parser)

 

评论

共有 条评论