為什么 FASHION MNIST 問題的 keras 模型第二層正好有 128 個節點?https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/tutorials/keras/classification.ipynb#scrollTo=9ODch-OFCaW4model = keras.Sequential([ keras.layers.Flatten(input_shape=(28, 28)), keras.layers.Dense(128, activation='relu'), keras.layers.Dense(10, activation='softmax')])
2 回答

慕少森
TA貢獻2019條經驗 獲得超9個贊
在本教程中,我們只是制作一個簡單的神經網絡,因此 128 個節點就足夠了,一些神經網絡建議如果神經元或節點的數量是 2 的冪,那么很容易計算 128 是 2 的冪 (2^ 7)因為它不是太小或太大,因此對于簡單的神經網絡來說已經足夠了。
但是您也可以嘗試任何其他數字,更正式地說,節點的數量取決于數據大小,您可以給它任何數字,但是如果您為更大的數據提供更大的量級,則有可能過度擬合。
過度擬合:當一個模型接受了這么多數據的訓練時,它開始從我們數據集中的噪聲和不準確的數據條目中學習。然后模型沒有正確分類數據,因為太多的細節和噪音。
參考:https ://www.geeksforgeeks.org/underfit-and-overfitting-in-machine-learning/
添加回答
舉報
0/150
提交
取消