我需要找到一種相當有效的方法來檢測單詞中的音節。例如,看不見-> in-vi-sib-le有一些音節化規則可以使用:V CV VC CVC CCV CCCV CVCC*其中V是元音,C是輔音。例如,發音(5個專業名詞; CV-CVC-CV-V-CVC)我嘗試了幾種方法,其中包括使用正則表達式(僅在您要計算音節時才有用)或硬編碼規則定義(被證明是效率很低的蠻力方法),最后使用了有限狀態自動機(沒有任何有用的結果)。我的應用程序的目的是創建給定語言的所有音節的字典。該詞典稍后將用于拼寫檢查應用程序(使用貝葉斯分類器)和文本到語音合成。如果能在我以前的方法之外給我提示另一種解決此問題的方法,我將不勝感激。我使用Java,但是使用C / C ++,C#,Python,Perl的任何技巧都可以為我工作。
檢測單詞中的音節
慕尼黑8549860
2019-10-23 16:19:31