我正在學習使用 R-CNN 進行對象檢測...我有圖像和注釋文件,它給出了對象的邊界框我了解 R-CNN 中的這些步驟,使用選擇性搜索來獲取建議的區域使所有區域大小相同在 CNN 中輸入這些圖像保存特征圖并饋送到 SVM 進行分類在訓練中,我將所有對象(僅來自圖像的對象而不是背景)輸入到 CNN,然后在 SVM 中訓練特征圖進行分類。在每個博客中,都在說R-CNN,分為三個部分,1st -selective search 2nd -CNN 3rd -BBox Regression但是,我沒有得到 BBox 回歸的深入解釋。我了解 IOU(Intercept over Union)來檢查 BBox 的準確性。您能否幫我了解如何使用此 BBox 回歸來獲取對象的坐標。
1 回答

嚕嚕噠
TA貢獻1784條經驗 獲得超7個贊
解釋如下所述的 BBox 回歸工作。
就像你提到的那樣,它發生在多個階段。
選擇性搜索:
生成初始子分割,我們生成許多候選或部分區域。
使用貪心算法遞歸地將相似區域組合成更大的區域。
使用生成的區域來生成最終的候選區域建議。
CNN 和 BBox 回歸:
回歸器是具有卷積層和全連接層的 CNN,但在最后一個全連接層中,它不應用通常用于分類的 sigmoid 或 softmax,因為這些值對應于概率。相反,這個 CNN 輸出的是四個值 (??,??,?,??),其中 (??,??) 指定左角位置的值,(?,??) 指定窗口的高度和寬度。為了訓練這個 NN,當 NN 的輸出與訓練集中標記的 (??,??,?,??) 非常不同時,損失函數將進行懲罰。
添加回答
舉報
0/150
提交
取消