亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在 spaCy 文檔中訪問超出范圍的詞:為什么它有效?

在 spaCy 文檔中訪問超出范圍的詞:為什么它有效?

心有法竹 2023-05-23 16:17:55
我正在學習 spaCy 并且正在玩Matchers。我有:一個非?;镜木渥樱?amp;ldquo;白色牧羊犬”)匹配器對象,搜索模式(“white shepherd”)顯示匹配項的打印件,以及該匹配項之前的單詞和 POS我只是想檢查如何處理我期望得到的索引超出范圍異常,因為在匹配之前沒有任何內容。我沒想到它會起作用,但它確實起作用了,并且在比賽結束后返回“狗”……現在我很困惑。看起來 spaCy 使用循環列表(或者我認為的雙端隊列)?這需要一個語言模型來運行,如果你想重現它,你可以使用以下命令行安裝它:python -m spacy download en_core_web_md這是代碼import spacyfrom spacy.matcher import Matcher?# Loading language modelnlp = spacy.load("en_core_web_md")# Initialising with shared vocabmatcher = Matcher(nlp.vocab)# Adding statistical predictionsmatcher.add("DOG", None, [{"LOWER": "white"}, {"LOWER": "shepherd"}])? # searching for white shepherddoc = nlp("white shepherd dog")for match_id, start, end in matcher(doc):? ? span = doc[start:end]??? ? print("Matched span: ", span.text)? ?? ? # Get previous token and its POS? ? print("Previous token: ", doc[start - 1].text, doc[start - 1].pos_) # I would expect the error here我得到以下信息:>>> Matched span:? white shepherd>>> Previous token:? dog PROPN有人可以解釋發生了什么嗎?謝謝 !
查看完整描述

1 回答

?
小怪獸愛吃肉

TA貢獻1852條經驗 獲得超1個贊

您在索引 0-1 處尋找一個評估為 -1 的標記,這是最后一個標記。


我建議使用該Token.nbor方法在跨度之前查找第一個標記,如果不存在先前的標記,則將其設置為 None 或空字符串。


import spacy

from spacy.matcher import Matcher 


# Loading language model

nlp = spacy.load("en_core_web_md")


# Initialising with shared vocab

matcher = Matcher(nlp.vocab)


# Adding statistical predictions

matcher.add("DOG", None, [{"LOWER": "white"}, {"LOWER": "shepherd"}])  # searching for white shepherd

doc = nlp("white shepherd dog")


for match_id, start, end in matcher(doc):

    span = doc[start:end]

    print("Matched span: ", span.text)

    try:

        nbor_tok = span[0].nbor(-1)

        print("Previous token:", nbor_tok, nbor_tok.pos_)

    except IndexError:

        nbor_tok = ''

        print("Previous token: None None")


查看完整回答
反對 回復 2023-05-23
  • 1 回答
  • 0 關注
  • 226 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號