我正在嘗試按字符串中是否有單詞來過濾數據框,我嘗試了以下方法:text="Abacus and androgeny and for"tokenized = tknzr.tokenize(text.lower())pattern= "|".join(tokenized)lexicon = lexicon[lexicon["English (en)"].str.match(pattern, na = False)]這實際上不起作用,因為以“for”開頭的單詞(如偽造)會匹配。為了清楚起見,我只需要與文本中的某個單詞完全匹配的行。
1 回答

牧羊人nacy
TA貢獻1862條經驗 獲得超7個贊
如果我正確理解你,你只是使用匹配來確定列中的單詞是否是文本中的單詞之一?如果是這樣 - 我會嘗試:
lexicon = lexicon[lexicon["English (en)"].isin(tokenized)]
這樣,匹配項將出現在確切的單詞上,因為它會將其與單詞列表進行比較。
添加回答
舉報
0/150
提交
取消