亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用具有 3D 張量輸入的 keras 嵌入層?

如何使用具有 3D 張量輸入的 keras 嵌入層?

慕絲7291255 2021-08-24 15:09:02
我在使用 Keras 嵌入層和輸入數據的一種熱編碼時遇到困難。以下是玩具代碼。導入包from keras.models import Sequentialfrom keras.layers import Densefrom keras.layers import Flattenfrom keras.layers.embeddings import Embeddingfrom keras.optimizers import Adamimport matplotlib.pyplot as pltimport numpy as npimport openpyxlimport pandas as pdfrom keras.callbacks import ModelCheckpointfrom keras.callbacks import ReduceLROnPlateau輸入數據是基于文本的,如下所示。訓練和測試數據X_train_orignal= np.array(['OC(=O)C1=C(Cl)C=CC=C1Cl', 'OC(=O)C1=C(Cl)C=C(Cl)C=C1Cl',       'OC(=O)C1=CC=CC(=C1Cl)Cl', 'OC(=O)C1=CC(=CC=C1Cl)Cl',       'OC1=C(C=C(C=C1)[N+]([O-])=O)[N+]([O-])=O'])X_test_orignal=np.array(['OC(=O)C1=CC=C(Cl)C=C1Cl', 'CCOC(N)=O',       'OC1=C(Cl)C(=C(Cl)C=C1Cl)Cl'])Y_train=np.array(([[2.33],       [2.59],       [2.59],       [2.54],       [4.06]]))Y_test=np.array([[2.20],   [2.81],   [2.00]])創建字典現在我創建了兩個字典,用于索引副的字符。唯一的字符號存儲在len(charset),字符串的最大長度以及 5 個附加字符存儲在embed. 每個字符串的開頭將被填充,!結尾將是E.charset = set("".join(list(X_train_orignal))+"!E")char_to_int = dict((c,i) for i,c in enumerate(charset))int_to_char = dict((i,c) for i,c in enumerate(charset))embed = max([len(smile) for smile in X_train_orignal]) + 5print (str(charset))print(len(charset), embed)一熱編碼我將所有火車數據轉換為一種熱編碼,如下所示。def vectorize(smiles):        one_hot =  np.zeros((smiles.shape[0], embed , len(charset)),dtype=np.int8)        for i,smile in enumerate(smiles):            #encode the startchar            one_hot[i,0,char_to_int["!"]] = 1            #encode the rest of the chars            for j,c in enumerate(smile):                one_hot[i,j+1,char_to_int[c]] = 1            #Encode endchar            one_hot[i,len(smile)+1:,char_to_int["E"]] = 1        return one_hot[:,0:-1,:]X_train = vectorize(X_train_orignal)print(X_train.shape)X_test = vectorize(X_test_orignal)print(X_test.shape)當它將輸入的訓練數據轉換為一種熱編碼時,一種熱編碼數據的形狀變為(5, 44, 14)訓練和(3, 44, 14)測試。對于火車,有 5 個示例,0-44 是最大長度,14 是唯一字符。字符數較少的示例被填充E到最大長度。
查看完整描述

2 回答

  • 2 回答
  • 0 關注
  • 146 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號