首頁猿問基于日期范圍篩選日志文件條目

基于日期范圍篩選日志文件條目

Linux

九州編程 2019-07-01 10:08:24

基于日期范圍篩選日志文件條目我的服務器擁有異常高的CPU使用率，我可以看到Apache使用的內存太多了。我有種感覺，我正被一個IP所迷惑-也許你能幫我找到他？我使用了下面的一行，以找到10個最“活躍”的IP：cat access.log | awk '{print $1}' |sort |uniq -c |sort -n |tail前5個IP對服務器的請求大約是“平均”用戶的200倍。然而，我不知道這5是非常頻繁的訪客，還是他們攻擊服務器。是否有辦法，指定上述搜索的時間間隔，例如。最近兩個小時還是今天10點到12點之間？干杯!2011年10月23日更新-我需要的命令：在最后X小時內獲取條目(在這里)awk -vDate=`date -d'now-2 hours' +[%d/%b/%Y:%H:%M:%S` ' { if ($4 > Date) print Date FS $4}' access.log在最后的X小時內獲得大多數活躍的IP(這里有兩個小時)awk -vDate=`date -d'now-2 hours' +[%d/%b/%Y:%H:%M:%S` ' { if ($4 > Date) print $1}' access.log | sort |uniq -c |sort -n | tail在相對時間范圍內獲取條目awk -vDate=`date -d'now-4 hours' +[%d/%b/%Y:%H:%M:%S` -vDate2=`date -d'now-2 hours' +[%d/%b/%Y:%H:%M:%S` ' { if ($4 > Date && $4 < Date2) print Date FS Date2 FS $4}' access.log在絕對時間范圍內獲取條目awk -vDate=`date -d '13:20' +[%d/%b/%Y:%H:%M:%S` -vDate2=`date -d'13:30' +[%d/%b/%Y:%H:%M:%S` ' { if ($4 > Date && $4 < Date2) print $0}' access.log在絕對時間內獲取最活躍的IPawk -vDate=`date -d '13:20' +[%d/%b/%Y:%H:%M:%S` -vDate2=`date -d'13:30' +[%d/%b/%Y:%H:%M:%S` ' { if ($4 > Date && $4 < Date2) print $1}' access.log | sort |uniq -c |sort -n | tail

查看完整描述

3 回答

慕容708150

TA貢獻1831條經驗獲得超4個贊

是的，有多種方法可以做到這一點。我會這么做的。對于初學者來說，不需要管cat的輸出，只需用awk.

awk -vDate=`date -d'now-2 hours' +[%d/%b/%Y:%H:%M:%S` '$4 > Date {print Date, $0}' access_log

假設您的日志看起來像我的日志(它們是可配置的)，而不是存儲在字段4中的日期。我在上面所做的是在過去的2小時內找到所有的東西。Note the -d'now-2 hours'或者從字面上說是減2小時，對我來說是這樣的：[10/Oct/2011:08:55:23

所以我要做的是存儲兩個小時前格式化的值，并與字段四進行比較。條件表達式應該是直接向前的，然后打印日期，然后是輸出字段分隔符(在本例中是OFS-或空格)，后面是整行$0。您可以使用以前的表達式，只需打印$1(IP地址)。

awk -vDate=`date -d'now-2 hours' +[%d/%b/%Y:%H:%M:%S` '$4 > Date {print $1}' | sort  |uniq -c |sort -n | tail

如果要使用范圍，請指定兩個日期變量并適當地構造表達式。

所以，如果您想在2到4小時前找到一些東西，您的表達式可能會如下所示

awk -vDate=`date -d'now-4 hours' +[%d/%b/%Y:%H:%M:%S` -vDate2=`date -d'now-2 hours' +[%d/%b/%Y:%H:%M:%S` '$4 > Date && $4 < Date2 {print Date, Date2, $4} access_log'

下面是我回答的關于bash中日期的一個問題，您可能會發現這很有幫助。當周星期一的打印日期(以bash為單位)

反對回復 2019-07-01

飲歌長嘯

TA貢獻1951條經驗獲得超3個贊

因為這是共同 Perl任務

因為這和從日志文件中提取最后10分鐘直到日志文件結束的時候。

因為我需要他們，所以我(很快)寫到：

#!/usr/bin/perl -ws# This script parse logfiles for a specific period of timesub usage {
    printf "Usage: %s -s=<start time> [-e=<end time>] <logfile>\n";
    die $_[0] if $_[0];
    exit 0;}use Date::Parse;usage "No start time submited" unless $s;my $startim=str2time($s) or die;my $endtim=str2time($e) if $e;$endtim=time() unless $e;usage "Logfile not submited" unless $ARGV[0];open my $in, "<" . $ARGV[0] or usage "Can't open '$ARGV[0]' for reading";$_=<$in>;exit unless $_; # empty file# Determining regular expression, depending on log formatmy $logre=qr{^(\S{3}\s+\d{1,2}\s+(\d{2}:){2}\d+)};$logre=qr{^[^\[]*\[(\d+/\S+/(\d+:){3}\d+\s\+\d+)\]} unless /$logre/;while (<$in>) {
    /$logre/ && do {
        my $ltim=str2time($1);
        print if $endtim >= $ltim && $ltim >= $startim;
    };};

這可以用作：

./timelapsinlog.pl -s=09:18 -e=09:24 /path/to/logfile

用于在09H18和09H24之間打印日志。

./timelapsinlog.pl -s='2017/01/23 09:18:12' /path/to/logfile

供印刷用january 23th, 9h18'12"上至現在.

為了減少Perl代碼，我使用了-s切換到允許從命令行自動分配變量：-s=09:18將填充一個變量$s夾住09:18..注意不要錯過等號。=沒有空位！

諾塔：這有兩種不同的雷吉兩種不同的日志標準。如果需要不同的日期/時間格式解析，可以發布自己的regex，或者從日志文件中發布格式化日期的示例。

^(\S{3}\s+\d{1,2}\s+(\d{2}:){2}\d+)         # ^Jan  1 01:23:45^[^\[]*\[(\d+/\S+/(\d+:){3}\d+\s\+\d+)\]    # ^... [01/Jan/2017:01:23:45 +0000]

反對回復 2019-07-01

Cats萌萌

TA貢獻1805條經驗獲得超9個贊

如果有人遇到awk: invalid -v option，下面是一個腳本，用于在預定義的時間范圍內獲取最活躍的IP：

cat <FILE_NAME> | awk '$4 >= "[04/Jul/2017:07:00:00" && $4 < "[04/Jul/2017:08:00:00"' | awk '{print $1}' | sort -n | uniq -c | sort -nr | head -20

反對回復 2019-07-01

3 回答
0 關注
410 瀏覽

關注

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

基于日期范圍篩選日志文件條目

基于日期范圍篩選日志文件條目

3 回答

因為這是共同 Perl任務

相關問題推薦

添加回答

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

基于日期范圍篩選日志文件條目

基于日期范圍篩選日志文件條目

3 回答

因為這是共同 Perl任務

相關問題推薦

添加回答