亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

將 pandas 輸出格式化為 csv

將 pandas 輸出格式化為 csv

開滿天機 2022-06-28 16:55:05
我是 python 和 pandas 的新手,并創建了一個帶有 html 代碼的測試網頁,用于幫助學習如何提取數據,然后格式化為 CSV 以在 excel 中使用。下面是我想出的代碼,它把它變成了一個很好的格式,但我被困在如何將它格式化成一個 CSV 文件來導入。代碼:# Importing pandas import pandas as pd # The webpage URL whose table we want to extract url = "/home/dvm01/e007"# Assign the table data to a Pandas dataframe table = pd.read_html(url,**index_col=0**)[0]#table2 = pd.read_html(url)[0],pd.read_html(url)[1],pd.read_html(url)[6]# Print the dataframe print(table)#print(table2)# Store the dataframe in Excel file #table.to_excel("data.xlsx") 輸出:            Account                                          Account.1ID:                                         e007Description:  ABST: 198, SUR: J DOUTHITGeo ID:                            014.0198.0000我想弄清楚的是如何刪除行的索引并使第一個之前的文本:成為列標題。在第 1 行中,我有兩個:但第一個之后的所有內容:應該是列標題的數據。我想采用上述當前輸出,并將 ID、描述和地理 ID 作為列標題,將“:”之后的文本作為每個標題的數據。我不需要 'Account' 和 'Account.1' 我相信這些被識別為列標題。下面是我希望輸出在 Excel 中的樣子,但我不知道如何正確格式化它以導出到可以導入的 CSV。也許我什至不需要導入或格式化為 CSV,'table.to_excel' 函數似乎不需要這一步。+------+---------------------------+---------------+| ID   | Description               | Geo ID        |+------+---------------------------+---------------+| e007 | ABST: 198, SUR: J Douthit | 014.0198.0000 |+------+---------------------------+---------------+通過使用上面定義 dfs 變量的 index_col=0 ,我能夠刪除索引號。不確定這是最好的方法,但它確實做了我試圖為那部分完成的事情。由于我是 python 新手,我很難將我的問題格式化為 Google 或 StackOverflow 以獲得我正在尋找的答案。如果有人能指出我正在尋找的正確方向,那會奏效,但例子也會很好。
查看完整描述

1 回答

?
江戶川亂折騰

TA貢獻1851條經驗 獲得超5個贊

因此,要格式化您的問題,您可以向我們展示您想要的示例。嘗試這樣的事情:


|id|name|data1|data2|date3|-url-|

|--|----|-----|-----|-----|-----|

|1 |xyz |datax|datay|dataz|x:url|

|2 |xyz |datax|datay|dataz|x:url|

|3 |xyz |datax|datay|dataz|x:url|

...

然后您可以詢問有關如何創建適合您所需設計的正確 Dataframe 輸出的問題:)


您也可以在線使用此生成器:https ://www.tablesgenerator.com/text_tables


+----+------+-------+-------+-------+------+

| Id | Name | Data1 | Data2 | Data3 | Url  |

+----+------+-------+-------+-------+------+

| 1  | xyz  | datax | datay | dataz | xurl | 

+----+------+-------+-------+-------+------+

| 2  | xyz  | datax | datay | dataz | xurl |

+----+------+-------+-------+-------+------+

| 3  | xyz  | datax | datay | dataz | xurl |

+----+------+-------+-------+-------+------+

好的,現在您已經完成了數據表設計。接下來我會請您嘗試使用 Jupyter Notebook。這將讓您逐行測試數據框。每個測試都應該是數據集的新遷移。


我如何看待工作流將滿足您的需求: 1. 查看測試并查看您當前的 DF 列是什么:


print(df.columns)

2. 使用此命令編輯您的列:


df.rename(columns={'old column 1':'ID',

                          'old column 2':'Description',

                          'old column 3':'Geo ID'}, 

                 inplace=True)

使用此命令更改索引數據


df.rename(index={0:'zero',1:'one'}, inplace=True)


使用此命令更改行


df.loc['--insert_Column_here--', '--insert_row_here--'] = new_value


查看完整回答
反對 回復 2022-06-28
  • 1 回答
  • 0 關注
  • 188 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號