我正在 Web 瀏覽器中錄制音頻并將其發送到 Flask 后端。從那里,我想使用 Watson Speech to Text 轉錄音頻。我無法弄清楚我正在接收音頻的數據格式以及如何將其轉換為適用于 watson 的格式。我相信 watson 需要像 b'\x0c\xff\x0c\xffd 這樣的字節串。我從瀏覽器收到的數據看起來像 [ -4 -27 -34 -9 1 -8 -1 2 10 -28],由于負值(使用 bytes() 給我),我不能直接轉換為字節那個錯誤)。我真的不知道我需要在這里進行什么樣的轉換。Watson 不會為我拋出的任何類型的數據返回任何錯誤,只是沒有響應。
這是什么音頻數據類型,如何將其轉換為 wav/l16?
幕布斯6054654
2022-01-05 12:07:42