我正在嘗試使用 NAudio 接收實時語音并將它們以字節數組的形式發送到 bing 語音 API。我使用事件處理程序接收音頻并發送到 Bing Speech API。下面是我試過的代碼。private void Source_DataAvailable(object sender, WaveInEventArgs e) { //convert the sound into a byte array writer.Write(e.Buffer, 0, e.BytesRecorded); memoryStream = new MemoryStream(e.Buffer); CallSpeechAPI(memoryStream); }當我嘗試執行時,我們最終得到了以下響應。響應:OK {"RecognitionStatus":"InitialSilenceTimeout","Offset":5000000,"Duration":0} End Rec當我嘗試將現有的 .wav 文件轉換為字節數組并將它們發送到工作正常的 API 時。但是對于實時音頻,我們正面臨這個問題。有人可以請幫助是什么問題以及如何解決它。另外,如果有任何選項可以將實時音頻作為字節數組接收,請告訴我?如果有任何示例代碼,請與我們分享。
2 回答

慕容森
TA貢獻1853條經驗 獲得超18個贊
新的語音 SDK v0.4.0 中現在提供對音頻輸入流的支持:。您可以在此處找到示例。你只需要根據這里描述的接口實現你自己的 AudioInputStream::Read() 和 ::GetFormat() 。
- 2 回答
- 0 關注
- 196 瀏覽
添加回答
舉報
0/150
提交
取消