我正在微調一個 BERT 模型,每個 epoch 大約需要 1 小時 20 分鐘。我很好奇在遷移到 g3s.xlarge 后我可以期望這個模型運行多快。尋找節省時間的百分比/運行時間的非常粗略的估計。 查看完整描述