我想創建一個 DataFrame 來解析某些具有特定格式的文件的名稱。文件名格式: event_A_(number)_(start datetime)_(end datetime)_(code)_(category).txt日期時間格式:YYYY-MM-DD_HH-MM_SS名稱文件示例:event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt我嘗試過使用拆分,然后是簡單的正則表達式,然后是合并字符串,但它必須是一種簡單的方法。關于如何做到這一點的任何建議?這就是我設法做到的方式,但我相信應該有一種更簡單的方法:lst_split = file.split('_')#number = re.findall(r"_A_(..)",file)number = lst_split[2]start_date = lst_split[3]tmp = lst_split[4] + ":" + lst_split[5]start_time = tmp.replace('-',':')end_date = lst_split[6]tmp = lst_split[7] + ":" + lst_split[8]end_time = tmp.replace('-',':')code = lst_split[9]tmp = (lst_split[10]).split('.')category = tmp[0]print(number,start_date,start_time,end_date,end_time,code,category)
1 回答

GCT1015
TA貢獻1827條經驗 獲得超4個贊
您可以使用解包將所有部分放入變量中。然后您將擁有更清晰的代碼和更少的轉換:
file = "event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt"
_,_,number,start_date,startHM,startS,end_date,endHM,endS,code,category = file.split("_")
start_time = f"{startHM}:{startS}".replace("-",":")
end_time = f"{endHM}:{endS}".replace("-",":")
category = category.strip(".txt")
print(number,start_date,start_time,end_date,end_time,code,category)
# 12 2019-01-22 01:35:20 2019-01-22 19:15:13 b123 aa
請注意,您也可以使用(相當笨拙的)正則表達式將其分解,但您仍然必須對組件進行分隔符替換。
添加回答
舉報
0/150
提交
取消