已解決430363個問題，去搜搜看，總會有你想問的

Python - pytesseract 對于相似圖像不一致

首頁猿問 Python -...

Python - pytesseract 對于相似圖像不一致

Python

LEATH 2022-07-12 10:32:48

例如，此圖像返回 Sieteary ear雖然此圖像返回正確答案兩個圖像之間的唯一區別是高度為 2 個像素。我嘗試過應用一些閾值，但似乎沒有幫助......from PIL import Imageimport pytesseractpytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"image = Image.open(path)print(pytesseract.image_to_string(image,))

查看完整描述

1 回答

嚕嚕噠

TA貢獻1784條經驗獲得超7個贊

您可以使用 OpenCV 執行一些預處理。這個想法是用 imutils 放大圖像，使用 Otsu 的閾值獲得二值圖像，然后添加輕微的高斯模糊。為了獲得最佳檢測效果，圖像的格式應該是，要檢測的文本為黑色，背景為白色。這是兩張圖片的預處理結果：

之前->之后

兩個圖像的 Pytesseract 輸出結果是相同的

BigBootyHunter2

代碼

import cv2

import pytesseract

import imutils

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = cv2.imread('1.jpg')

image = imutils.resize(image, width=500)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

thresh = cv2.GaussianBlur(thresh, (3,3), 0)

data = pytesseract.image_to_string(thresh,,config='--psm 6')

print(data)

cv2.imshow('thresh', thresh)

cv2.waitKey()

反對回復 2022-07-12

1 回答
0 關注
166 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Python - pytesseract 對于相似圖像不一致

Python - pytesseract 對于相似圖像不一致

1 回答

添加回答