亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何更改我的正則表達式以匹配/替換第二個、第三個……單詞,但不匹配第一個單詞?

如何更改我的正則表達式以匹配/替換第二個、第三個……單詞,但不匹配第一個單詞?

慕村225694 2023-10-12 17:08:51
該任務必須使用正則表達式來解決,而不使用容器類。輸入:文本(可能由拉丁字母和西里爾字母組成,不包含_)輸出:源文本,但在所有重復單詞之前添加下劃線_將單詞視為僅包含字母的序列(所有其他字符不包含在單詞中)。創建一個將輸入轉換為輸出的靜態轉換方法。完成方法:public static String convert (String input) {    ...}輸入示例:This is a testAnd this is also a testAnd these are also teststestЭто тестЭто также тестИ это также тесты輸出示例:This _is _a _test_And this _is _also _a _test_And these are _also tests_test_Это _тест_Это _также _тестИ это _также тесты我的嘗試:public static void convert(String input) {        Pattern p = Pattern.compile("(\\b\\w+\\b)(?=[\\s\\S]*\\b\\1\\b[\\s\\S]*\\b\\1\\b)", Pattern.UNICODE_CHARACTER_CLASS);        String res = p.matcher(input+" "+input).replaceAll("_$1");        res = res.substring(0, res.length() - 1 - p.matcher(input).replaceAll("_$1").length());        System.out.println(res);    }我的輸出:在此處輸入圖像描述This _is _a _test_And this _is _also _a test_And these are _also tests_test_Это _тест_Это _также _тестИ это _также тесты第二行中的單詞“test”沒有“_”,但我需要“_test”
查看完整描述

1 回答

?
呼如林

TA貢獻1798條經驗 獲得超3個贊

您可以收集所有重復的單詞,然后在它們前面加上_:


// Java 9+

String s = "This is a test\nAnd this is also a test\nAnd these are also tests\ntest\nЭто тест\nЭто также тест\nИ это также тесты";

String rx = "(?sU)\\b(\\w+)\\b(?=.*\\b\\1\\b)";

String[] results = Pattern.compile(rx).matcher(s).results().map(MatchResult::group).toArray(String[]::new);

System.out.println(s.replaceAll("(?U)\\b(?:" + String.join("|", results) + ")\\b", "_$0"));


// Java 8

String s = "This is a test\nAnd this is also a test\nAnd these are also tests\ntest\nЭто тест\nЭто также тест\nИ это также тесты";

String rx = "(?sU)\\b(\\w+)\\b(?=.*\\b\\1\\b)";

List<String> matches = new ArrayList<>();

Matcher m = Pattern.compile(rx).matcher(s);

while (m.find()) {

    matches.add(m.group());

}

System.out.println(s.replaceAll("(?U)\\b(?:" + String.join("|", matches) + ")\\b", "_$0"));

請參閱在線 Java 演示第二個片段演示。輸出:

This _is _a _test

_And this _is _also a _test

And these are _also tests

test

_Это _тест

_Это _также тест

И это _также тесты

注意,我用與 DOTALL 嵌入標志選項組合替換了[\s\S]解決方法構造(這樣也可以匹配換行符),使用 Java 9+方法返回所有匹配項,并根據與OR 交替運算符連接的找到的匹配項構建最終模式。.s..results()|

細節

  • (?sU)\b(\w+)\b(?=.*\b\1\b):

    • (?sU)- 嵌入的 DOTALL (.也使匹配換行符)和 UNICODE_CHARACTER_CLASS (使所有速記 Unicode 感知)標志選項

    • \b- 字邊界

    • (\w+)- 第 1 組:1+ 個單詞、字符、字母、數字或_s

    • \b- 字邊界

    • (?=.*\b\1\b)- 緊鄰右側,必須有 0+ 個字符,盡可能多,后面跟有與第 1 組中相同的值作為整個單詞。

  • (?U)\\b(?:" + String.join("|", results) + ")\\b":這個圖案看起來像(?U)\b(?:test|is|Это|тест|также)\b

    • (?U)- 嵌入的 UNICODE_CHARACTER_CLASS 標志選項

    • \b- 字邊界

    • (?:test|is|Это|тест|также)- 非捕獲交替組

    • \b- 字邊界

替換是_$0第二個正則表達式,因為_附加到整個匹配值$0


查看完整回答
反對 回復 2023-10-12
  • 1 回答
  • 0 關注
  • 119 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號