阿波羅的戰車
2022-11-11 14:20:32
我正在嘗試使用 Webkit Speech Recognition API 來識別單個音節,而不是完整的單詞或句子。由于這個API需要“語法”定義,不知道有沒有辦法實現單音節識別。像“啊”或“bi”之類的東西。
1 回答

青春有我
TA貢獻1784條經驗 獲得超8個贊
不幸的是,這對于 Web Speech API 是不可能的。盡管您可以創建自定義語法(它們是單詞的集合),但您不能定義自定義詞典或詞匯表(它們是單詞本身)。在您的情況下,您需要定義一個自定義詞匯表,其中包含單個音素作為單詞,然后將您的語法限制為僅從您的自定義詞匯表中選擇單詞。有一些付費的基于云的服務可以讓你做到這一點。
例如,使用 IBM Watson,您可以創建自定義語言模型,然后向模型中添加單詞(在您的情況下,每個音素都是一個“單詞”)。通常,自定義語言模型與通用語言模型混合,但您不希望這樣,因此您將自定義權重設置為 1.0(這意味著它只會使用您的自定義語言模型)。
您也可以通過其他方式來解決此問題,但我懷疑您會找到一個不涉及付費服務的純基于 Web 的解決方案。如果您能夠遷移到本機平臺(或在服務器上創建自己的基于 Web 的服務),那么您還有更多選擇。例如,CMUSphinx 將允許您創建自定義字典以與服務器上的 Sphinx4 或移動設備上的 PocketSphinx 一起使用。盡管 CMUSphinx 不是用于大型詞匯表應用程序的最準確系統,但您的自定義詞匯表會很小,因此 CMUSphinx 會表現得非常好。
添加回答
舉報
0/150
提交
取消