我在合并多個 pdf 時遇到問題,因為我必須在文件夾之間循環并合并兩個匹配的文件。這很容易完成,但是當我:input1.append(file1)input2.append(file2)PDFFileMerger.write(output)合并發生,但下一次迭代包括之前的輸入等,使最后一個迭代成為一個巨大的 pdf 文件,而出現的事件彼此重復for i in range(nPdfs): abr = onlypdf[i] abr = abr.replace('.pdf', '') for j in range(nXl): pdf_file = open('SEPTIEMBRE DE 2020/' + onlyfiles[j], 'rb') read_pdf = pdf.PdfFileReader(pdf_file) number_of_pages = read_pdf.getNumPages() page = read_pdf.getPage(0) page_content = page.extractText() if abr in page_content: file1 = onlypdf[i] file2 = onlyfiles[j] print(file1) print(file2) print(file1+' esta en '+file2) input1 = open('Combinadora/documentos/'+file1, 'rb') input2 = open('SEPTIEMBRE DE 2020/'+file2, 'rb') merger.append(input1) merger.append(input2) input1.close() input2.close() print('archivo creado') output = open(abr+'-'+file2, 'wb') merger.write(output) output.close()這是我的代碼,我是否將其擰入循環中?
1 回答

Qyouu
TA貢獻1786條經驗 獲得超11個贊
PyPDF 是一個很棒的庫,但我也遇到了一些內存問題。因此,通常我使用單獨的進程來創建合并(在作業后終止),或者您可以刪除 (del) 實際對象。請記住,即使您找到解決此問題的棘手方法,也可能會發生內存泄漏,因此我強烈建議創建和終止進程。
添加回答
舉報
0/150
提交
取消