我有一個包含數十萬條路徑的 .txt,我只需要檢查每一行是文件夾還是文件。硬盤不在身邊,無法使用os功能模塊os.path.isdir()。我試過下面的代碼,但它并不完美,因為.最后包含一些文件夾。for row in files:
if (row[-6:].find(".") < 0):
folders_count += 1如果字符串的結尾包含任何已知的文件格式(.zip、.pdf、.doc ...),則不值得測試,因為此 HD 中有數十種不同的文件格式。當我的代碼讀取 .txt 時,它會將每一行作為字符串存儲在數組中,因此我的代碼應該使用字符串格式。文件夾路徑示例:'path1/path2/truckMV.34'文件路徑示例:'path1/path2/certificates.pdf'
1 回答

慕勒3428872
TA貢獻1848條經驗 獲得超6個贊
我們不可能僅通過字符串來判斷它是文件還是路徑,因為擴展名只是程序選擇以某種方式解碼的任意可接受的字符串。
話雖如此,如果我遇到同樣的問題,我會盡力使用以下偽代碼進行估計:
創建一個哈希映射(或像在 Python 中那樣的字典)
對于文件的每一行,讀取最后一位并查看是否有“.”。在最后一條路上
在散列映射上為它創建一個密鑰,其中包含您遇到“可能的擴展”次數的計數器。
在瀏覽完所有列表后,您將獲得可能的擴展名以及您遇到過的擴展名的集合。假設只有 1 次出現(或任何其他低任意數)的是路徑而不是擴展。
這種啟發式的基礎是,一個人不太可能在他們的桌面上有很多獨特的擴展——但這只是我提出的一個假設。
添加回答
舉報
0/150
提交
取消