亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

拆分 PDF 的特定頁面并使用 Python 保存

拆分 PDF 的特定頁面并使用 Python 保存

江戶川亂折騰 2022-01-05 20:01:30
我正在嘗試將 20 頁的 pdf 文件(單個)拆分為五個各自的 pdf 文件,第 1 個 pdf 包含 1-3 頁,第 2 個 pdf 文件僅包含第 4 頁,第 3 個 pdf 包含 5 到 10 頁,第 4 個 pdf 包含 11-17頁,第 5 個 pdf 包含 18-20 頁。我需要python中的工作代碼。下面提到的代碼將整個 pdf 文件拆分為單個頁面,但我想要分組頁面..    from PyPDF2 import PdfFileWriter, PdfFileReader    inputpdf = PdfFileReader(open("input.pdf", "rb"))    for i in range(inputpdf.numPages):    j = i+1        output = PdfFileWriter()    output.addPage(inputpdf.getPage(i))    with open("page%s.pdf" % j, "wb") as outputStream:    output.write(outputStream)
查看完整描述

1 回答

?
RISEBY

TA貢獻1856條經驗 獲得超5個贊

對我來說,它看起來像是pdfrw使用GitHub 上的這個例子的任務,我編寫了以下示例代碼:


from pdfrw import PdfReader, PdfWriter

pages = PdfReader('inputfile.pdf').pages

parts = [(3,6),(7,10)]

for part in parts:

    outdata = PdfWriter(f'pages_{part[0]}_{part[1]}.pdf')

    for pagenum in range(*part):

        outdata.addpage(pages[pagenum-1])

    outdata.write()

這一次創建兩個文件:pages_3_6.pdf和pages_7_10.pdf每3頁,即3,4,5和7,8,9。注意pagenum-1在代碼中,-1用于因事實PDF頁面記數開始于1而不是0。我還使用所謂的 f-strings 來獲取輸出文件的名稱。在我看來,這是一種巧妙的方法,但它在 Python2 中不可用,而且我不確定它是否在所有 Python3 版本中都可用(我在 中測試了我的代碼3.6.7),因此如果您愿意,可以改用舊的格式化方法。請記住根據您的需要更改文件名和范圍。


查看完整回答
反對 回復 2022-01-05
  • 1 回答
  • 0 關注
  • 259 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號