亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

辦公自動化:輕松提取PDF頁面數據,并生成Excel文件(代碼實戰)!

標簽:
Python

发现网上有专门做文档格式转换的网站,不过是要充会员才可以。今天来做一篇PDF转换成Excel文档的代码实战,希望大佬喜欢,哈哈,话不多说,马上进入实战环节。

file

首先,我们一如既往的介绍一下需要用到的第三方库。

import pdfplumber  # 专门处理PDF文档格式的文件对象
import pandas as pd  # 数据处理库,常见的DtaFrame、Series数据对象处理

然后,再把相应的PDF数据提取出来并且保存在DataFrame数据对象中。

# 打开PDF文件、得到PDF数据文件对象
pdf_obj = pdfplumber.open('data.pdf')

# 这里我们以获取第一页的PDF数据为例
page_1 = pdf_obj.pages[0]

# 从得到的第一页数据中提取表格数据
data_table = page_1.extract_table()

# 将提取到的数据表格转换为DataFrame数据对象
data_frame = pd.DataFrame(data_table)

# 打印查看DataFrame数据
print(data_frame)

得到DataFrame数据对象之后,需要进行数据处理的话可以参考前面的文章DataFrame数据处理相关的知识点。

最后,将准备好的DataFrame数据对象保存成Excel格式的数据文件就大功告成啦。

writer = pd.ExcelWriter('C:\\data.xlsx') # 设置文档路径

data_frame.to_excel(writer, index=None, startrow=1, encoding='utf-8',sheet_name='数据统计')  # 设置Excel对象

ws = writer.sheets['数据统计']  # 写入工作表名称

ws.write_string(0, 0, '我是一个标题')  # 添加标题

writer.save()  # 保存
點擊查看更多內容
1人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消