我有幾個要使用的文本文件(本地文件夾),并且要從此文件夾中的每個文件中刪除停用詞,然后將新文件保存在一個子文件夾中。一個文件的代碼:import iofrom nltk.corpus import stopwordsfrom nltk.tokenize import word_tokenizestop_words = set(stopwords.words('english'))file1 = open("1_1.txt")line = file1.read()words = line.split()for r in words: if not r in stop_words: appendFile = open('subfolder/1_1.txt','a') appendFile.write(" "+r) appendFile.close()我想我必須嘗試使用glob嗎?但是我似乎并不了解文檔。我也許應該降低文本的文本?一定有一種超級簡單的方法,但是我只為一個句子或一個文件找到教程,從不為多個文件找到教程。
添加回答
舉報
0/150
提交
取消