由于我有一個很大的文件(幾個 GB),我不想將整個文件加載到內存中,而是使用 *generators 逐行加載。我的文件是這樣的:# millions of lines....................................keyw 288992233 121 ee 0o90 jjsl2321 232 qq 0kj9 jkslkeyw 289003433 124 rr 8hu9 jkas4532 343 ww 3ko9 aslk1098 115 uy oiw8 reklkeyw 29891....................................# millions more到目前為止,我在這里找到了類似的答案。但我迷失了如何實施它。因為 ans 有特定的標識符Startand Stop,而我的文件有一個帶有相同關鍵字的增量編號。我想在這方面得到一些幫助。
1 回答

婷婷同學_
TA貢獻1844條經驗 獲得超8個贊
如果您想調整該答案,這可能會有所幫助:
bucket = []
for line in infile:
if line.split()[0] == 'keyw':
for strings in bucket:
outfile.write( strings + '\n')
bucket = []
continue
bucket.append(line.strip())
添加回答
舉報
0/150
提交
取消