已解決430363個問題，去搜搜看，總會有你想問的

在 spaCy 文檔中訪問超出范圍的詞：為什么它有效？

首頁猿問在 spaCy...

在 spaCy 文檔中訪問超出范圍的詞：為什么它有效？

Python

心有法竹 2023-05-23 16:17:55

我正在學習 spaCy 并且正在玩Matchers。我有：一個非?；镜木渥樱?amp;ldquo;白色牧羊犬”）匹配器對象，搜索模式（“white shepherd”）顯示匹配項的打印件，以及該匹配項之前的單詞和 POS我只是想檢查如何處理我期望得到的索引超出范圍異常，因為在匹配之前沒有任何內容。我沒想到它會起作用，但它確實起作用了，并且在比賽結束后返回“狗”……現在我很困惑。看起來 spaCy 使用循環列表（或者我認為的雙端隊列）？這需要一個語言模型來運行，如果你想重現它，你可以使用以下命令行安裝它：python -m spacy download en_core_web_md這是代碼import spacyfrom spacy.matcher import Matcher?# Loading language modelnlp = spacy.load("en_core_web_md")# Initialising with shared vocabmatcher = Matcher(nlp.vocab)# Adding statistical predictionsmatcher.add("DOG", None, [{"LOWER": "white"}, {"LOWER": "shepherd"}])? # searching for white shepherddoc = nlp("white shepherd dog")for match_id, start, end in matcher(doc):? ? span = doc[start:end]??? ? print("Matched span: ", span.text)? ?? ? # Get previous token and its POS? ? print("Previous token: ", doc[start - 1].text, doc[start - 1].pos_) # I would expect the error here我得到以下信息：>>> Matched span:? white shepherd>>> Previous token:? dog PROPN有人可以解釋發生了什么嗎？謝謝！

查看完整描述

1 回答

小怪獸愛吃肉

TA貢獻1852條經驗獲得超1個贊

您在索引 0-1 處尋找一個評估為 -1 的標記，這是最后一個標記。

我建議使用該Token.nbor方法在跨度之前查找第一個標記，如果不存在先前的標記，則將其設置為 None 或空字符串。

import spacy

from spacy.matcher import Matcher

# Loading language model

nlp = spacy.load("en_core_web_md")

# Initialising with shared vocab

matcher = Matcher(nlp.vocab)

# Adding statistical predictions

matcher.add("DOG", None, [{"LOWER": "white"}, {"LOWER": "shepherd"}]) # searching for white shepherd

doc = nlp("white shepherd dog")

for match_id, start, end in matcher(doc):

span = doc[start:end]

print("Matched span: ", span.text)

try:

nbor_tok = span[0].nbor(-1)

print("Previous token:", nbor_tok, nbor_tok.pos_)

except IndexError:

nbor_tok = ''

print("Previous token: None None")

反對回復 2023-05-23

1 回答
0 關注
226 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

在 spaCy 文檔中訪問超出范圍的詞：為什么它有效？

在 spaCy 文檔中訪問超出范圍的詞：為什么它有效？

1 回答

添加回答

在 spaCy 文檔中訪問超出范圍的詞：為什么它有效？

在 spaCy 文檔中訪問超出范圍的詞：為什么它有效？