通過閱讀掩碼 rcnn 氣球示例(https://engineering.matterport.com/splash-of-color-instance-segmentation-with-mask-r-cnn-and-tensorflow-7c761e238b46),現在:我的目標:將帶有方向和根位置注釋信息的氣球數據集提供給修改后的 mask_rcnn,然后它最終可以學習如何檢測 val 數據集中每個氣球的方向(以度為單位)和根位置。狀態:對于訓練數據集,我使用 VIA 繪制一條線(從根/處理程序到每個氣球的最底部),可以指示圖像中每個氣球實例的方向,因為在 VIA 中,一條線包含 2 個點,因此第一個json 文件中的點將是每個氣球實例的根坐標。下圖顯示了我的想法: 示例圖片我開發了一些可以:從 json 文件中獲取圖像中所有氣球實例的根坐標(浮點值)通過所有氣球的線的 2 個點計算方向(以度為單位的角度,帶有 2 位數字的浮點值)我想將獲取的角度和根位置信息發送到掩碼rcnn,在balloon.py中,我需要將它們添加到```class BalloonDataset(utils.Dataset): def load_balloon(self, dataset_dir, subset): ....... self.add_image( "balloon", image_id=a['filename'], # use file name as a unique image id path=image_path, width=width, height=height, polygons=polygons, angles=angles, roots=roots )``` 對嗎?我想我還需要在model.py中定義root和orientation的損失函數,但我認為我應該使用與掩碼損失或盒子損失相同的類型,有人能給我一些提示嗎?有人可以給我一些想法我應該在model.py或其他地方更改什么?
添加回答
舉報
0/150
提交
取消