我正在嘗試對一些音頻剪輯進行分類,為此,我必須將每 30 秒長的音頻剪輯分成 1 秒的剪輯。然后我想將這個 1 秒音頻片段放入分類器中,并對所有 30 個一秒音頻文件的輸出進行平均以獲得最終響應。我想要每 30 個輸入有 1 個輸出。我的問題是我不知道如何將它們輸入到我的分類器中,我無法按照此處的建議使用多個輸入,因為我有 30 個輸入,而不僅僅是 2 個輸入,這會很混亂。
1 回答

三國紛爭
TA貢獻1804條經驗 獲得超7個贊
您提到的鏈接是關于擁有 2 個獨立的輸入管道,而不是 2 個輸入音頻剪輯。您需要將30 個一秒音頻數據包裝在一個Tensor
(如果您使用的是 Tensorflow,如果沒有,則使用您正在使用的框架的等效框架)
然后可以將其Tensor
輸入到深度學習模型的一個輸入管道中。
添加回答
舉報
0/150
提交
取消