已解決430363個問題，去搜搜看，總會有你想問的

在 cv2.resize() 之后找到新坐標

首頁猿問在 cv2.resize()...

在 cv2.resize() 之后找到新坐標

Python

忽然笑 2022-01-18 21:11:30

我正在關注text-detection-ctpn。該項目的作者resize()在進行計算之前的圖像。如果不調整圖像大小，內存就會爆炸。我設法使用此功能將調整大小的框轉換回原始框def transform_boxes(boxes: np.ndarray, h, w, rh, rw): """ Transform back the original coordinate :param boxes: :param h: height of the original :param w: width of the original :param rh: re-sized height :param rw: re-sized height :return: """ z = np.copy(boxes) z[:, 0] = z[:, 0] / rh z[:, 2] = z[:, 2] / rh z[:, 4] = z[:, 4] / rh z[:, 6] = z[:, 6] / rh z[:, 1] = z[:, 1] / rw z[:, 3] = z[:, 3] / rw z[:, 5] = z[:, 5] / rw z[:, 7] = z[:, 7] / rw return z變換誤差在大坐標數上顯著

查看完整描述

2 回答

MMTTMM

TA貢獻1869條經驗獲得超4個贊

當您嘗試反轉框上的調整大小操作時，您除以rhandrw但您永遠不會乘以hand w。

z[:, 0] = h * z[:, 0] / rh

z[:, 1] = w * z[:, 1] / rw

這解釋了為什么您的錯誤會隨著更大的圖像而變大。

作為旁注，您可以使用 numpy 索引來避免每行重復四次：

z[:, 0::2] = h * z[:, 0::2] / rh

z[:, 1::2] = w * z[:, 1::2] / rw

反對回復 2022-01-18

喵喵時光機

TA貢獻1846條經驗獲得超7個贊

我必須轉換坐標而不是我正在處理的像素。

坐標，而不是像素....

def transform_boxes(boxes: np.ndarray, im):

"""

Transform back the original coordinate

:param boxes:

:param im: The original image

:return:

"""

z = np.copy(boxes)

(height, width, colors) = im.shape

new_h, new_w, img_size = get_float_new_wh(im)

z[:, 0::2] = height * z[:, 0::2] / new_h

z[:, 1::2] = width * z[:, 1::2] / new_w

return z

def get_new_wh(img):

"""

Get only new width and new height

:param img:

:return:

"""

new_h, new_w, img_size = get_float_new_wh(img)

new_h = int(new_h)

new_w = int(new_w)

new_h = new_h if new_h // 16 == 0 else (new_h // 16 + 1) * 16

new_w = new_w if new_w // 16 == 0 else (new_w // 16 + 1) * 16

return new_h, new_w, img_size

反對回復 2022-01-18

2 回答
0 關注
367 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

在 cv2.resize() 之后找到新坐標

在 cv2.resize() 之后找到新坐標

2 回答

添加回答