我有一個圖像分類任務,其中我為每個圖像創建了多個裁剪圖以及翻轉/翻轉版本以擴展我的有限數據集。我已將數據集寫入tfrecords文件,其中每個記錄均由文件組成(這里簡化為兩個農作物,只有一個翻轉的版本): { lbl: int, crop_0: np.ndarray, crop_1: np.ndarray, crop_0_flipped: np.ndarray, crop_1_flipped: np.ndarray }基本上每張輸入4張圖片。在訓練過程中,我想將每個圖像都分開對待,即將每個記錄作為具有相同標簽的4個圖像饋入,并與數據集中的其余圖像混排,以使N幅圖像變為4N幅圖像。在測試過程中(使用單獨的但結構類似的數據集),我想拍攝每張圖像,僅使用crop_0和crop_1圖像,并對softmax輸出進行平均以進行分類。我的問題是-訓練這種數據集的最佳,最有效的方法是什么?如果這會使培訓效率降低,我愿意改變我的方法,而且似乎最簡單的方法是將每個版本的tfrecords文件(裁切和翻轉/翻頁圖像)分開并將文件交織到一個文件中數據集,但如果能提供幫助,我不想擁有一堆文件。
添加回答
舉報
0/150
提交
取消