2 回答

TA貢獻1807條經驗 獲得超9個贊
以下是我對您的問題的意見:
1)在理想的世界中,您應該能夠使用適合您需要的大小的相機拍攝任何東西的照片/視頻。然而,這種方法并不實用,盡管可以產生相當好的性能。實際上,您提供的無噪音功能越多,您的神經網絡就越準確。但是,您將在哪里使用具有如此大相機的網絡作為其輸入生成器?出于所有實際目的,您使用帶有不大于網球大小的鏡頭的相機。同時,訓練尺寸大于 64x64 像素的圖像非常昂貴。你幾乎買不起帶有任何下降神經網絡的單個 GPU 的批次 2。同時,這會增加培訓時間,您最終可能要等待幾天才能完成。
2)更多的層不會產生更好的結果,還有其他方法可以實現。這樣做的一個問題是,您擁有的層數越多,您就會面臨梯度爆炸或消失的問題。還要確保你正在規范你的數據,提供足夠的訓練數據,并且它的分布類似于有效/測試集分布。如您所見,神經網絡的準確性有很多方面,而這些只是其中的一部分。
3)是的,你可以做到。徹底寫完需要一些時間,所以我給你留下了一個來自媒體的鏈接。它更詳細,并具有您需要的內容:

TA貢獻1786條經驗 獲得超11個贊
讓我嘗試回答您的疑問。
減小圖像大小有助于模型更快地學習并減少內存需求。150 X 150 像素在單層神經網絡中需要更多節點,因此需要更多內存。我不確定 Squashing 與 Center Cropping 的準確性統計數據。
節點數量的增加可能與準確性的提高沒有直接關系。在許多情況下,Bagging 和 Boosting 可以比增加層數更好地提高準確性。輟學是深度神經網絡中的一個問題,但適當的數據歸一化以及適當的激活函數和足夠的訓練數據應該有助于提高多層的準確性。
簡短的回答是肯定的。您可以通過在必須定義自己的神經網絡的每一層的末尾將特征向量重塑為原始圖像形狀來做到這一點。
添加回答
舉報