我正在從事醫學成像中的數據增強工作。我在 Pandas 數據框中有 100 個帶有標簽(0 和 1)的原始圖像名稱。我添加了新圖像和它們的名稱,并帶有一些后綴。我的原始圖像具有以下名稱:Image1、Image2、Image3、Image4,而我的增強數據具有以下名稱:Image1_1、Image1_2、Image2_1、Image2_2、Image3_1、Image3_2、Image4_1、Image4_2 等。我的 Pandas DataFrame 包含兩列注釋:文件名和標簽。我的另一個 Pandas Dataframe 僅包含原始文件名和沒有標簽的增強文件名。filename = [f for f in os.listdir(path_to_dir_with_augmented_images)]annotations = pd.read_csv("annotations.csv", names=["filename", "label"])filenames = []for file in filename: filenames.append(file)data = pd.DataFrame(filenames, columns=["filename"]我的注釋文件有 100 個長度,數據文件有 1000 以上。我想要輸出,例如:filename, labelImage1, 0Image1aa1, 0Image1aa2, 0Image2, 1Image2baa1, 1Image2baasa2, 1如何在熊貓中做到這一點?
1 回答

有只小跳蛙
TA貢獻1824條經驗 獲得超8個贊
import pandas as pd
#create dummy data
data = pd.DataFrame([['Image1aa1'], ['Image1aa2'], ['Image2baa1'], ['Image2baasa2']], columns=['filename'])
annotations = pd.DataFrame([['Image1',1],['Image2',0]], columns=['filename','label'])
for name, l in zip(annotations.filename,annotations.label):
temp = data[data['filename'].str.match(name)]
temp['label'] = l
annotations = annotations.append(temp)
添加回答
舉報
0/150
提交
取消