亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python - pytesseract 對于相似圖像不一致

Python - pytesseract 對于相似圖像不一致

LEATH 2022-07-12 10:32:48
例如,此圖像返回 Sieteary ear雖然此圖像返回正確答案兩個圖像之間的唯一區別是高度為 2 個像素。我嘗試過應用一些閾值,但似乎沒有幫助......from PIL import Imageimport pytesseractpytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"image = Image.open(path)print(pytesseract.image_to_string(image,))
查看完整描述

1 回答

?
嚕嚕噠

TA貢獻1784條經驗 獲得超7個贊

您可以使用 OpenCV 執行一些預處理。這個想法是用 imutils 放大圖像,使用 Otsu 的閾值獲得二值圖像,然后添加輕微的高斯模糊。為了獲得最佳檢測效果,圖像的格式應該是,要檢測的文本為黑色,背景為白色。這是兩張圖片的預處理結果:

之前->之后

在此處輸入圖像描述 

在此處輸入圖像描述 

兩個圖像的 Pytesseract 輸出結果是相同的

BigBootyHunter2

代碼

代碼


import cv2

import pytesseract

import imutils


pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"


image = cv2.imread('1.jpg')

image = imutils.resize(image, width=500)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

thresh = cv2.GaussianBlur(thresh, (3,3), 0)

data = pytesseract.image_to_string(thresh,,config='--psm 6')

print(data)


cv2.imshow('thresh', thresh)

cv2.waitKey()


查看完整回答
反對 回復 2022-07-12
  • 1 回答
  • 0 關注
  • 166 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號