亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python 中的 Linux 命令在子文件夾中執行

Python 中的 Linux 命令在子文件夾中執行

PHP
慕容森 2023-11-09 10:16:12
這是我的文件夾結構:ORDERNO'S  YEAR'S  MONTH'S  DATE'S  CSVFILES408------->2010---->01-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ----->02-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ...    ------->201101-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ----->02-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV    ------->201201-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ----->02-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ...    ------->2013--01-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ----->02-->21--->1.CSV                           --->2.CSV                      --->22--->1.CSV                           --->2.CSV               ...因為它們在特定日期內有許多 csv 文件。我想將每個日期文件夾內的所有 csv 文件與第一個文件的標題合并到一個文件中,名稱為 orderno_year_month_date.csv。意味著每個日期文件夾將只有一個以其父文件夾命名的 csv。所以,我想要在 linux 中執行此命令,我可以在 ORDERNO 目錄之外運行或使用 python 腳本執行相同的命令,這樣我就不必再去一次再次進入文件夾并手動執行命令。**同樣的問題3個月前在askubuntu上發布過,但沒有答案。預期的結構應該是這樣的ORDERNO'S  YEAR'S  MONTH'S  DATE'S  CSVFILES408------->2010---->01-->21--->408_2010_01_21.CSV                      --->22--->408_2010_01_22.CSV                      ...以前,我要轉到每個訂單號的每年文件夾的每個日期文件夾。并用于為標頭的單個文件運行此命令。awk '(NR == 1) || (FNR > 1)' *.csv > 4011_2020_07_16.csv  (example)
查看完整描述

1 回答

?
嗶嗶one

TA貢獻1854條經驗 獲得超8個贊

我將使用這個模擬文件結構(使用tree命令繪制,并保存~/test/在我的計算機中):


test

└── 408

    └── 2010

        └── 01

            ├── 21

            │   ├── 1.csv

            │   └── 2.csv

            ├── 22

            │   ├── 1.csv

            │   └── 2.csv

            └── 23

                ├── 1.csv

                └── 2.csv

您可以使用 Python 重命名文件,并使用以下命令pathlib將它們連接起來pandas:


import pandas as pd


from pathlib import Path


def getfolders(files):

    return sorted(list(set([file.parent for file in files])))


def getpathproperty(folder, prop):

    properties = {"orderno": 3, "year": 2, "month": 1, "day": 0}

    for i in range(properties[prop]):

        folder = folder.parent

    return folder.stem


path = Path("~/test").expanduser()

allfiles = list(path.rglob("*.csv")) # Each file in allfiles is a Path object


folders = getfolders(allfiles)


for folder in folders:

    files = sorted(list(folder.glob("*.csv")))

    df = pd.concat([pd.read_csv(file) for file in files])


    # Get the values from the path to rename the files

    orderno = getpathproperty(folder, "orderno")

    year = getpathproperty(folder, "year")

    month = getpathproperty(folder, "month")

    day = getpathproperty(folder, "day")


    # Save the new CSV file

    df.to_csv(folder/f"{orderno}_{year}_{month}_{day}.csv", index=False)


    # Delete old files, commented for safety

    # for file in files:

        # file.unlink(missing_ok=True)

這產生:


test

└── 408

    └── 2010

        └── 01

            ├── 21

            │   └── 408_2010_01_21.csv

            ├── 22

            │   └── 408_2010_01_22.csv

            └── 23

                └── 408_2010_01_23.csv


查看完整回答
反對 回復 2023-11-09
  • 1 回答
  • 0 關注
  • 167 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號