我有一個簡單的問題要問你們中的一些人。我從事過一些圖像分類教程。只有像 MNIST 數據集這樣更簡單的。然后我注意到他們這樣做train_images = train_images / 255.0現在我知道矩陣(即圖像)中的每個值都除以 255.0。如果我沒記錯的話,這就是所謂的規范化吧?(如果我錯了,請糾正我,否則告訴我我是對的)。我只是好奇是否有“更好的方法”、“另一種方法”或“最好的方法”來預處理或清理圖像,然后將這些清理過的圖像提供給網絡進行訓練。如果您想提供示例源代碼,請提供。請!別客氣。我很想看看代碼示例。謝謝你!
1 回答

慕哥9229398
TA貢獻1877條經驗 獲得超6個贊
在圖像分類之前預處理圖像可以包括以下內容:
規范化:你已經提到過
重塑為統一分辨率(img 高度 x img 寬度):更高的分辨率會帶來更好的學習效果,而較小的分辨率可能會丟失重要特征。某些模型具有默認輸入大小,您可以參考。也可以使用所有圖像的平均大小。
顏色通道:1指的是灰度,3指的是rgb-scale。根據您的應用程序,您可以設置它。
數據擴充:如果你的模型過度擬合或你的數據集很小,你可以通過改變原始圖像(翻轉、旋轉、裁剪、縮放......)來增加你的數據集來重現你的數據集
圖像分割:可以執行分割以突出顯示可能有益于您的應用程序的區域或邊界。例如,在醫學圖像分類中,身體的某些部分可能被遮蓋以提高分類性能。
例如,我最近從事肺部 CT 掃描圖像的圖像分類。為了進行預處理,我重新調整了圖像的形狀并將它們設為灰度。然后我執行圖像分割以突出顯示圖像中的肺部。然后我將圖像像素歸一化以放入我的分類模型中。根據您的應用程序,您可能還需要考慮其他更多的預處理技術。
添加回答
舉報
0/150
提交
取消