我有一個奇怪的問題。我從 Google Cloud Vision 獲取包含非英文字符的文本,但它們實際上是英文字符。這是谷歌云視覺OCR的一個錯誤。我得到這樣的角色:HélloNotice that é is non English character.我想轉換成simple "Hello"這樣我可以處理這個詞。我不是在尋找編程答案。我只是在尋找方法來做到這一點。任何提示都會有用。謝謝!
1 回答

慕蓋茨4494581
TA貢獻1850條經驗 獲得超11個贊
如果 Apache Commons 適合您,您可以使用他們的 StringUtils 庫。該stripAccents
方法應適合您的需要。從源代碼中您可以看到它實際上使用了java.text.Normalizer
,因此您也可以查看它。
- 1 回答
- 0 關注
- 146 瀏覽
添加回答
舉報
0/150
提交
取消