亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

<var id="ysx6k"><form id="ysx6k"></form></var>

已解決430363個問題，去搜搜看，總會有你想問的

如何在gensim的word2vec模型中嵌入用戶名

關注

首頁猿問如何在gensim的word2ve...

如何在gensim的word2vec模型中嵌入用戶名

Python

牧羊人nacy 2022-10-18 16:56:32

我有一些志愿論文寫作，格式如下：volunteer_names, essay["emi", "jenne", "john"], [["lets", "protect", "nature"], ["what", "is", "nature"], ["nature", "humans", "earth"]]["jenne", "li"], [["lets", "manage", "waste"]]["emi", "li", "jim"], [["python", "is", "cool"]].........我想根據他們的論文寫作來識別相似的用戶。我覺得 word2vec 更適合這樣的問題。但是，由于我也想在模型中嵌入用戶名，我不知道該怎么做。我在互聯網上找到的示例僅使用單詞（參見示例代碼）。import gensim sentences = [['first', 'sentence'], ['second', 'sentence']]# train word2vec on the two sentencesmodel = gensim.models.Word2Vec(sentences, min_count=1)在這種情況下，我想知道在 word2vec 中是否有特殊的方法可以做到這一點，或者我可以簡單地將用戶名視為輸入模型的單詞。請讓我知道您對此的看法。如果需要，我很樂意提供更多詳細信息。

查看完整描述

1 回答

素胚勾勒不出你

TA貢獻1827條經驗獲得超9個贊

Word2vec 從周圍的詞中推斷詞的表示：相似的詞經常出現在相似的公司中，最終得到相似的向量。通常，考慮 5 個單詞的窗口。因此，如果您想破解 Word2vec，您需要確保學生姓名出現的頻率足夠高（可能出現在句子的開頭和結尾或類似的地方）。

或者，您可以查看 Doc2vec。在訓練期間，每個文檔都獲得一個 ID 并學習該 ID 的嵌入，它們在查找表中，就好像它們是詞嵌入一樣。如果您使用學生姓名作為文檔 ID，您將獲得學生嵌入。如果您有來自一個學生的多篇論文，我想您需要稍微破解 Gensim 才能使每篇論文都沒有唯一的 ID。

反對回復 2022-10-18

1 回答
0 關注
108 瀏覽

關注

添加回答

舉報

0/150

提交

取消

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

<fieldset id="x3rm5"></fieldset>

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何在gensim的word2vec模型中嵌入用戶名

如何在gensim的word2vec模型中嵌入用戶名

1 回答

添加回答