我有大量帶有標簽 (.mat) 文件(不能使用tf.data.Dataset.from_tensor_slices())的圖像,我想使用tf.dataAPI 從中制作 tensorflow 數據集。正如我在文檔中讀到的,我可以使用tf.data.TextLineDataset大量數據(我必須有一個包含所有圖像地址的 txt 文件,并將 txt 文件的路徑作為tf.data.TextLineDataset參數發送)。然后,我可以使用map方法讀取 txt 文件 ( tf.read_file) 解碼 jpg 圖像 ( tf.image.decode_jpeg) 并對圖像進行一些基本的轉換。但是,我無法scipy.io.loadmat在map方法的任何部分使用,因為我沒有指示 mat 文件路徑的字符串。我所擁有的只是tf.Tensor.我不認為在這種情況下讀取所有圖像并從中制作 TFRecord 有那么高的效率,因為那樣我基本上每件事都會做兩次。一次,讀取整個圖像并制作 TFRecord,再一次,讀取 TFRecord 以制作 tensorflow 數據集。知道如何解決這個問題嗎?這是我的代碼:dataset = tf.data.TextLineDataset(txt_file).map(read_img_and_mat)接著:def read_img_and_mat(path): image_string = tf.read_file(path) image_decoded = tf.image.decode_jpeg(image_string, channels=3) label = ... # get label from mat file return image_decoded, label
添加回答
舉報
0/150
提交
取消