我正在構建一個 OCR。為此,我正在使用CNN,RNN和CTC損失函數。我的輸入層獲取圖像,輸出層預測該圖像上寫的內容。標簽被轉換為整數。['A', 'B', 'C'] -> A = 0, B = 1, C = 2如果圖像是 ABC,則訓練標簽將為 0,1,2(單行向量)我能夠在單行上完成此操作。例如。' ABCDE' 寫在圖像上,模型效果很好。但如果圖像是'ABC'
'CAB'那么訓練標簽應該是什么?我如何告訴模型下一行?我想在多行上訓練一個模型。
添加回答
舉報
0/150
提交
取消
