亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

檢查字符串是否包含任何文件格式的最有效方法?

檢查字符串是否包含任何文件格式的最有效方法?

阿波羅的戰車 2023-06-13 15:02:07
我有一個包含數十萬條路徑的 .txt,我只需要檢查每一行是文件夾還是文件。硬盤不在身邊,無法使用os功能模塊os.path.isdir()。我試過下面的代碼,但它并不完美,因為.最后包含一些文件夾。for row in files:    if (row[-6:].find(".") < 0):        folders_count += 1如果字符串的結尾包含任何已知的文件格式(.zip、.pdf、.doc ...),則不值得測試,因為此 HD 中有數十種不同的文件格式。當我的代碼讀取 .txt 時,它會將每一行作為字符串存儲在數組中,因此我的代碼應該使用字符串格式。文件夾路徑示例:'path1/path2/truckMV.34'文件路徑示例:'path1/path2/certificates.pdf'
查看完整描述

1 回答

?
慕勒3428872

TA貢獻1848條經驗 獲得超6個贊

我們不可能僅通過字符串來判斷它是文件還是路徑,因為擴展名只是程序選擇以某種方式解碼的任意可接受的字符串。

話雖如此,如果我遇到同樣的問題,我會盡力使用以下偽代碼進行估計:

  1. 創建一個哈希映射(或像在 Python 中那樣的字典)

  2. 對于文件的每一行,讀取最后一位并查看是否有“.”。在最后一條路上

  3. 在散列映射上為它創建一個密鑰,其中包含您遇到“可能的擴展”次數的計數器。

  4. 在瀏覽完所有列表后,您將獲得可能的擴展名以及您遇到過的擴展名的集合。假設只有 1 次出現(或任何其他低任意數)的是路徑而不是擴展。

這種啟發式的基礎是,一個人不太可能在他們的桌面上有很多獨特的擴展——但這只是我提出的一個假設。


查看完整回答
反對 回復 2023-06-13
  • 1 回答
  • 0 關注
  • 136 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號