有什么方法可以通過算法確定.wav或.mp3文件的音頻質量?基本上,我的用戶使用了多種錄音設置(即,他們來自世界各地,我無法控制它們)將音頻錄音到mp3 / wav文件中。在這一點上,軟件應確定其設置是否正確(可悲的是,由于某些原因,他們不能僅通過聽自己的錄音來做出確定,因此,有時由于以下原因,我們基本上無法理解錄音:低音量或高噪音)。我正在做一個音量檢查,以確保麥克風的音量還可以。不幸的是,這錯過了體積大但清晰度低的情況。我想知道是否可以進行某種標準掃描(最好在Python中),以檢測何時存在大量背景噪音。我意識到一種可能的解決方案是讓他們錄制完全靜音,然后與語音錄音進行比較,如果“靜音”錄音的音量與語音錄音的音量太接近,則認為音頻“不良”。但這取決于兩次都從演講者那里獲得好的樣本,這可能是我可能依賴的,也可能不是。因此,我想知道是否只有一種方法可以掃描音頻文件(大約10秒鐘長),并識別聲音文件是否“嘈雜”或清晰。
3 回答

HUX布斯
TA貢獻1876條經驗 獲得超6個贊
這完全取決于您的質量問題,問題尚不完全清楚,但這里有一些建議:
在音量高而清晰度低的情況下,我猜問題是用戶輸入增益過高。錄制后,您可以簡單地檢查是否失真。更好的是,您可以在錄制過程中使用自動增益控制(AGC)來防止這種情況的發生。
如果噪音太大,我假設問題是揚聲器離麥克太遠了。在這種情況下,史蒂夫(Steve)的建議可能有用,但要使其真正起作用,您需要做大量工作來比較樣本記錄和開發統計數據,以了解如何進行區分。在實踐中,我認為這是太多的工作。我認為一個更簡單且更可行的替代方法(盡管不一定保證)將是創建信號的包絡,然后從中創建直方圖,并查看直方圖與現有的好壞錄音之間的比較。如果我們僅談論語音,則可以將信號分為三個頻段(使用時域濾波器,
再次,盡管如此,我將使用AGC在錄制過程中進行錄音,如果AGC發現需要將輸入增益設置得過高,則可能是不好的錄音。

狐的傳說
TA貢獻1804條經驗 獲得超3個贊
不完全是我的專業領域,但我懷疑如果您獲得了頻譜(可能進行了傅立葉變換),并比較了“好”和“有噪聲”的錄音,您會發現噪聲對交叉頻譜的影響更大,而壞頻譜的影響更大。錄音比好??匆幌耂ciPy中的信號處理部分-這可能會有所幫助。
添加回答
舉報
0/150
提交
取消