我已按照以下格式輸入數據,但并非由我決定key1: value1 key2: value2 key3: value3 key4 { key11: val11 key22: value22 } key5: value5 ............輸入字符串將具有用冒號或大括號括起來的鍵值。我想對它進行標記化,我有以下想法:首先要有一個正則表達式來解析數據,直到找到a:或{優先于{over為止。:然后拆分并讀取,直到達到我說的空白模式,然后遞歸遍歷整個字符串我想知道是否可以編寫正則表達式,例如(some_string)(特殊字符模式)(特殊字符模式可以是:或{優先于{)(字符串的其余部分)如果它是a,:那么對于其余的字符串,請從“ value1”中獲取字符串部分并捕獲它。處理剩余的字符串如果是{遍歷,直到找到}并內部使用:上面定義的邏輯。例如a: 1 b: 2 c { d: 3 e: 4 } f: 5這應該給a:1b:2c { d: 3 e: 4 }f: 5
1 回答
慕仙森
TA貢獻1827條經驗 獲得超8個贊
您可以使用以下模式:
[^ ]+(?:: [^ ]+| \{[^}]+\})
例子:
import re
test = "a: 1 b: 2 c { d: 3 e: 4 } f: 5"
pattern = re.compile(r"[^ ]+(?:: [^ ]+| \{[^}]+\})")
for match in pattern.findall(test):
print match
添加回答
舉報
0/150
提交
取消
