亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

根據唯一值列表拆分列表

根據唯一值列表拆分列表

哈士奇WWW 2022-05-24 09:28:18
假設我有一個名為的列表split_on_these,我想使用它來拆分另一個列表text。我首先填充split_on_these以免刪除自然發生的split_on_these條目實例:split_on_these = ['iv', 'x', 'v']text = ["random iv text x hat v", "cat", "dog iv", "random cat x"]padding = [" " + i + " " for i in split_on_these]我正在嘗試new_text在其中包含的所有項目上創建拆分,padding如下所示:["random", "text", "hat", "cat", "dog", "random cat"]我嘗試將包含在其中的所有文本條目替換為padding某個字符~,然后拆分該字符,但問題是當您迭代文本中的條目時,有時它會是單詞塊,而有時它會是個別字母。請注意,應保留分隔符之前的整個塊(例如隨機貓)。
查看完整描述

2 回答

?
慕運維8079593

TA貢獻1876條經驗 獲得超5個贊

您已經通過填充分割詞完成了“重拆分”。你剩下的是一個拆分和過濾序列


text = ["random iv text x hat v", "cat", "dog iv"]

[word for sent in text for word in sent.split() if word not in split_on_these]

這會將您的填充句子拆分為單個單詞并過濾掉不需要的單詞。結果:


['random', 'text', 'hat', 'cat', 'dog']


查看完整回答
反對 回復 2022-05-24
?
至尊寶的傳說

TA貢獻1789條經驗 獲得超10個贊

您可以使用 Python 的re 。它具有更強大的split功能,可讓您在正則表達式而不是單個字符上進行拆分。

您可以創建一個匹配任何一個填充字符串的正則表達式,如下所示:

re.split("iv|x|v", text)

上面的正則表達式并不完美 - 您還必須考慮何時/是否匹配每個填充序列周圍的空格。


查看完整回答
反對 回復 2022-05-24
  • 2 回答
  • 0 關注
  • 148 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號