亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

僅使用具有多個 SSN 的文件中的部分掩碼來屏蔽所有 SSN

僅使用具有多個 SSN 的文件中的部分掩碼來屏蔽所有 SSN

Helenr 2023-06-21 14:55:45
首先聲明我對正則表達式很糟糕。我想在字符串中查找社會保障號的每個實例,并屏蔽除破折號 (-) 和 SSN 的最后 4 個之外的所有實例。例子String someStrWithSSN = "This is an SSN,123-31-4321, and here is another 987-65-8765";Pattern formattedPattern = Pattern.compile("^\\d{9}|^\\d{3}-\\d{2}-\\d{4}$");Matcher formattedMatcher = formattedPattern.matcher(someStrWithSSN);while (formattedMatcher.find()) {    // Here is my first issue.  not finding the pattern}// my next issue is that I need to my String should look like this//     "This is an SSN,XXX-XX-4321, and here is another XXX-XX-8765"預期結果是找到每個 SSN 并替換。上面的代碼應生成字符串“這是一個 SSN,XXX-XX-4321,這里是另一個 XXX-XX-8765”
查看完整描述

1 回答

?
慕仙森

TA貢獻1827條經驗 獲得超8個贊

您可以通過執行以下操作來簡化此操作:


String initial = "This is an SSN,123-31-4321, and here is another 987-65-8765";

String processed = initial.replaceAll("\\d{3}\\-\\d{2}(?=\\-\\d{4})","XXX-XX");

System.out.println(initial);

System.out.println(processed);

輸出:


這是一個 SSN,123-31-4321,這里是另一個 987-65-8765

這是一個 SSN,XXX-XX-4321,這里是另一個 XXX-XX-8765


正則表達式\d{3}\-\d{2}(?=\-\d{4})捕獲三個數字后跟兩個數字,用破折號分隔(然后是破折號和 4 位數字,非捕獲)。與此正則表達式一起使用replaceAll將創建所需的掩蔽效果。


編輯:


如果您還希望此替換針對 9 個連續數字,您可以執行以下操作:


String initial = "This is an SSN,123-31-4321, and here is another 987658765";

String processed = initial.replaceAll("\\d{3}\\-\\d{2}(?=\\-\\d{4})","XXX-XX")

                       .replaceAll("\\d{5}(?=\\d{4})","XXXXX");

System.out.println(initial);

System.out.println(processed);

輸出:


這是一個 SSN,123-31-4321,這里是另一個 987658765

這是一個 SSN,XXX-XX-4321,這里是另一個 XXXXX8765


正則表達式\d{5}(?=\d{4})捕獲 5 位數字(后跟 4 位數字,非捕獲)。使用第二次調用replaceAll將使用適當的替換來定位這些序列。


編輯: 這是以前的正則表達式的更強大的版本,以及新正則表達式如何工作的更長演示:


String initial = "123-45-6789 is a SSN that starts at the beginning of the string,

    and still matches. This is an SSN, 123-31-4321, and here is another 987658765. These

    have 10+ digits, so they don't match: 123-31-43214, and 98765876545.

    This (123-31-4321-blah) has 9 digits, but is followed by a dash, so it doesn't match.

    -123-31-4321 is preceded by a dash, so it doesn't match as well. :123-31-4321 is 

    preceded by a non-colon/digit, so it does match. Here's a 4-2-4 non-SSN that would've

    tricked the initial regex: 1234-56-7890. Here's two SSNs in parentheses: (777777777) 

    (777-77-7777), and here's four invalid SSNs in parentheses: (7777777778) (777-77-77778)

    (777-778-7777) (7778-77-7777). At the end of the string is a matching SSN:

    998-76-4321";

String processed = initial.replaceAll("(?<=^|[^-\\d])\\d{3}\\-\\d{2}(?=\\-\\d{4}([^-\\d]|$))","XXX-XX")

                       .replaceAll("(?<=^|[^-\\d])\\d{5}(?=\\d{4}($|\\D))","XXXXX");

System.out.println(initial);

System.out.println(processed);

輸出:

123-45-6789 是從字符串開頭開始的 SSN,并且仍然匹配。這是一個 SSN,123-31-4321,這是另一個 987658765。這些有 10 多個數字,因此它們不匹配:123-31-43214 和 98765876545。這個(123-31-4321-blah)有9 位數字,但后面有破折號,因此不匹配。-123-31-4321 前面有破折號,因此也不匹配。:123-31-4321 前面有一個非冒號/數字,因此它確實匹配。這是一個 4-2-4 非 SSN,它會欺騙初始正則表達式:1234-56-7890。括號中有兩個 SSN:(777777777) (777-77-7777),括號中有四個無效 SSN:(7777777778)(777-77-77778) (777-778-7777) (7778-77-7777)。字符串末尾是匹配的 SSN:998-76-4321

XXX-XX-6789 是從字符串開頭開始的 SSN,并且仍然匹配。這是 SSN,XXX-XX-4321,這是另一個 XXXXX8765。它們有 10 個以上的數字,所以它們不匹配:123-31-43214 和 98765876545。這個 (123-31-4321-blah) 有 9 個數字,但后面跟著一個破折號,所以它不匹配。-123-31-4321 前面有一個破折號,所以它也不匹配。:XXX-XX-4321 前面有一個非冒號/數字,所以它匹配。這是一個 4-2-4 非 SSN,它會欺騙初始正則表達式:1234-56-7890。括號中有兩個 SSN:(XXXXX7777) (XXX-XX-7777),括號中有四個無效 SSN:(7777777778)(777-77-77778) (777-778-7777) (7778-77-7777)。字符串末尾是匹配的 SSN:XXX-XX-4321


查看完整回答
反對 回復 2023-06-21
  • 1 回答
  • 0 關注
  • 188 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號