亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

幫忙找錯。謝謝了

# -*- coding: utf-8 -*-
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LAParams
from pdfminer.pdfparser import PDFParser,PDFDocument
from pdfminer.pdfinterp import PDFResourceManager,PDFPageInterpreter
from pdfminer.pdfdevice import PDFDevice
from urllib.request import urlopen

# fp = open("ReferenceCard.pdf","rb") # 獲取文檔對象,“rb”表示以二進制讀的方式打開
fp = urlopen("http://www.tencent.com/zh-cn/articles/8003251479983154.pdf")
parser = PDFParser(fp) #創建一個與文檔關聯的解釋器

doc = PDFDocument() # PDF文檔的對象

parser.set_document(doc) # 鏈接文檔對象
doc.set_parser(parser) # 鏈接解釋器

doc.initialize("") # 初始化文檔,如果該文檔有加密,則密碼寫在“”里

resource = PDFResourceManager # 創建PDF資源管理器

laparam = LAParams() # 創建參數分析器

device = PDFPageAggregator(resource,laparams=laparam) # 創建一個聚合器,接收PDF資源管理器和參數解析器

interpreter = PDFPageInterpreter(resource,device) # 創建PDF頁面解釋器,需要PDF資源管理器和聚合器

for page in doc.get_pages(): # 使用文檔對象得到頁面的集合
? ?interpreter.process_page(page) # 使用頁面解釋器來讀取
? ?layout = device.get_result() # 使用聚合器來獲取內容
? ?for out in layout:
? ? ? ?if hasattr(out,"get_text"):
? ? ? ? ? ?print(out.get_text())


以下是報錯:

http://img1.sycdn.imooc.com//59be4ed90001983611870330.jpg


(忽略下面這張圖)

正在回答

2 回答

resource?=?PDFResourceManager()#?創建PDF資源管理器

缺括號

0 回復 有任何疑惑可以回復我~

忽略最后一張圖

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消

幫忙找錯。謝謝了

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號