首頁猿問根據字符串中的特定值進行排序。

根據字符串中的特定值進行排序。

Linux

ABOUTYOU 2021-04-06 12:31:11

我有一個內容如下的文件： 666500872101_002.log 738500861101_003.log 738500861101_002.log 666500872101_001.log 741500881101_001.log 738500861101_001.log 741500881101_002.log 666500872101_003.log 741500881101_003.log 666500872101_004.log我需要首先基于字段5至8中的值對行進行排序，即7415 0088 1101_003.log，然后基于日志的部件號即741500881101_ 003 .log來獲得如下所示的內容：738500861101_001.log738500861101_002.log738500861101_003.log666500872101_001.log666500872101_002.log666500872101_003.log666500872101_004.log 741500881101_001.log741500881101_002.log741500881101_003.log使用無法獲得任何良好的結果sort。

查看完整描述

2 回答

繁星coding

TA貢獻1797條經驗獲得超4個贊

您可以sort在以下選項中使用命令wit：

sort -n -k1.5,1.8 -n -k1.14,1.16 fileToSort.log

選項：

-n 用于數字排序
-k1.5,1.8并-k1.14,1.16定義您的排序鍵

例子：

$ sort -n -k1.5,1.8 -n -k1.14,1.16 fileToSort

738500861101_001.log

738500861101_002.log

738500861101_003.log

666500872101_001.log

666500872101_002.log

666500872101_003.log

666500872101_004.log

741500881101_001.log

741500881101_002.log

741500881101_003.log

反對回復 2021-04-16

斯蒂芬大帝

TA貢獻1827條經驗獲得超8個贊

在學習SPARK的過程中，我解決了這個問題。我不是UNIX shell程序員。因此想到了用火花解決問題

val logList = Array("666500872101_002.log","738500861101_003.log","738500861101_002.log","666500872101_001.log","741500881101_001.log","738500861101_001.log","741500881101_002.log","666500872101_003.log","741500881101_003.log","666500872101_004.log")

val logListRDD = sc.parallelize(logList)

logListRDD.map(x=>((x.substring(4,8), x.slice(x.indexOfSlice("_") +1, x.indexOfSlice("."))),x)).sortByKey().values.collect.take(20)

輸出：

Array [String] = Array（738500861101_001.log，738500861101_002.log，738500861101_003.log，666500872101_001.log，666500872101_002.log，666500872101_003.log，666500872101_004.log，741500881101_001.log，741500881101_1500.002

解釋我做了什么

sc.parallelize（logList） -是創建RDD的步驟，該RDD是spark的核心組件。

map（x =>（（（x.substring（4,8），x.slice（x.indexOfSlice（“ _”）+1，x.indexOfSlice（“?！保?，x）） -這將提取內容從Array生成鍵值對。在我們的例子中，value是***。log值，鍵是我們要排序的子字符串數組（0086，001）。KeyValue對將看起來像[（0086，001），738500861101_001.log]

sortByKey（） -根據上面生成的Key對數據進行排序

values-獲取與鍵對應的值

collect.take（20） ->在屏幕上顯示o / p

反對回復 2021-04-16

2 回答
0 關注
378 瀏覽

關注

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

根據字符串中的特定值進行排序。

根據字符串中的特定值進行排序。

2 回答

相關問題推薦

添加回答

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

根據字符串中的特定值進行排序。

根據字符串中的特定值進行排序。

2 回答

相關問題推薦

添加回答