我正在開發一個系統來簡化我們的圖像庫,該系統每周會增加 7k 到 20k 新圖片。具體應用是識別圖片中的賽車(所有汽車的形狀相似,但涂裝方案不同)。我計劃在這部分項目中使用 python 和 tensorflow。我最初的想法是使用圖像分類來按汽車對圖像進行分類;但是,圖片中包含多輛汽車的概率非常高。我的下一個想法是使用對象檢測來檢測汽車編號(出現在所有汽車的固定位置 [鼻子、尾巴、兩個門和屋頂] 和每周一致的字體)。最后是整車物體識別的方法。從表面上看,這似乎是最實用的;然而,油漆方案變化很大,可能沒有。哪種方法會給我最好的結果?我已經提取了大量圖像進行訓練,顯然不同的方法需要非常不同的訓練數據集。
1 回答

慕的地8271018
TA貢獻1796條經驗 獲得超4個贊
最好的方法是使用所有 3 種方法作為整體。您訓練所有 3 個模型,并將輸入圖像傳遞給所有 3 個模型。然后,有幾種方法可以評估輸出。
您可以總結所有 3 個模型的所有類別的概率,然后根據最高概率得出結論。
您可以從每個模型中獲得預測并根據投票數做出決定:1. 模型 - class1,2. 模型 - class2,3. 模型 - class2 ==> class2
你可以做一些類似加權決策的事情。所以,假設第一個模型是最好的和最健壯的模型,但您不能 100% 相信它,并想看看其他模型會怎么說。您可以將第一個模型的輸出權重為 0.6,其他兩個模型的輸出權重為 0.2。
我希望這有幫助 :)
添加回答
舉報
0/150
提交
取消