亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

寫入文件直到達到一定大小,然后開始新文件

寫入文件直到達到一定大小,然后開始新文件

江戶川亂折騰 2023-10-05 16:53:23
我正在使用命令行工具twarc將 Twitter 數據下載為 csv。我已經設置了 twarc 命令,它們在命令行上成功執行,沒有問題。命令示例:twarc dosomething > outputfile.jsonl雖然我想在較長時間內執行收集過程,但運行一天多后輸出文件變得有點太大(10+GB)。我想運行一個執行 twarc 命令的 bash 腳本,運行直到輸出文件達到一定限制,然后啟動一個新文件。這些問題是相關的...當文件達到一定大小時將數據添加到新文件寫入文件直到達到一定大小...盡管我的翻譯運氣不佳。任何人都可以提供一些有關設置基本 bash 腳本來執行命令、等待文件增長到 X 大小,然后重新開始處理新文件的見解嗎?可以從那里拿走...
查看完整描述

2 回答

?
撒科打諢

TA貢獻1934條經驗 獲得超2個贊

您正在尋找的工具的名稱很恰當split

twarc dosomething | split -b 10G

如果您想避免在文件之間分割行,您也可以通過行計數來執行此操作,但您無法指定大小:

twarc dosomething | split -l 10000000


查看完整回答
反對 回復 2023-10-05
?
慕容森

TA貢獻1853條經驗 獲得超18個贊

另一個工具是logrotate.

它通常按計劃運行,cron并在其配置文件中指定要拆分的日志文件、如何、何時、存檔、郵件以及要保留多少歷史記錄。

這樣做的好處logrotate是您的應用程序根本不需要實現任何日志輪換策略。他們只需要將日志寫入文件或stdout重定向到文件中。


查看完整回答
反對 回復 2023-10-05
  • 2 回答
  • 0 關注
  • 121 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號