亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何提取答題紙中的書面數字(圖片)

如何提取答題紙中的書面數字(圖片)

C#
慕姐8265434 2022-12-31 11:24:41
我試過 tesseract 但它只適用于純文本文檔,任何人都可以建議我該怎么做嗎? 這是我的 vb.net 代碼Dim pic = New Bitmap(OpenFileDialog1.FileName) Dim ocr = New TesseractEngine("./dataset", "eng", EngineMode.TesseractAndCube) Dim page = ocr.Process(pic) TextBox1.Text = page.GetText
查看完整描述

1 回答

?
喵喔喔

TA貢獻1735條經驗 獲得超5個贊

看起來你的答題紙結構合理。我會專注于為每個答案提取子圖像,然后在該圖像上以單字符模式運行 Tesseract。我不確定你如何在你使用的任何 Tesseract 包裝器中獲得單字符模式,但通過命令行它是參數:--psm 10。

要提取每個圖像,我會使用 OpenCV(嘗試Emgu for .NET)。您可能需要先應用透視環繞以獲得正方形圖像。然后您可以使用一個簡單的滑動窗口來獲取每個子圖像。

我不確定在答案被劃掉的情況下這將如何執行。



查看完整回答
反對 回復 2022-12-31
  • 1 回答
  • 0 關注
  • 106 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號