亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何從nltk pos_tag獲取標簽集?

如何從nltk pos_tag獲取標簽集?

qq_遁去的一_1 2023-08-22 17:47:55
我正在嘗試從 nltk pos_tag 獲取完整標簽,但我找不到使用 nltk 執行此操作的簡單方法。例如,使用tagsets='universal'.from nltk.tokenize import word_tokenizedef nltk_pos(text):    token = word_tokenize(text)    return (nltk.pos_tag(token)[0])[1]nltk_pos('home')output: 'NN'expected output: 'NOUN'
查看完整描述

1 回答

?
慕絲7291255

TA貢獻1859條經驗 獲得超6個贊

我在為自己寫的一篇論文做 NLP 分析時也遇到了同樣的問題。我必須使用這樣的映射函數:


import nltk

from nltk.tokenize import word_tokenize


def get_full_tag_pos(pos_tag):

    tag_dict = {"J": "ADJ",

                "N": "NOUN",

                "V": "VERB",

                "R": "ADV"}

    # assuming pos_tag comes in as capital letters i.e. 'JJR' or 'NN'

    return tag_dict.get(pos_tag[0], 'NOUN')


# example

words = word_tokenize(text)

words_pos = nltk.pos_tag(words)

full_tag_words_pos = [word_pos[0] + "/" + get_full_tag_pos(word_pos[1]) for word_pos in words_pos]



查看完整回答
反對 回復 2023-08-22
  • 1 回答
  • 0 關注
  • 159 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號