亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何檢測文件的編碼?

如何檢測文件的編碼?

Go
瀟瀟雨雨 2021-04-30 18:17:18
我正在嘗試找出使用Go在Windows上文件的編碼。經過一些研究,我發現了許多關于Mozilla的字符集檢測器(chardet)的建議,但是它們很難編譯,而且我沒有運氣。我還發現了libguess,它似乎已在Linux中廣泛使用,但我無法使其在Windows中工作。最好的方法是什么?在Windows上是否可以使用事實上的標準庫?
查看完整描述

2 回答

?
函數式編程

TA貢獻1807條經驗 獲得超9個贊

您可以使用pythonpackage:chardet。


查看完整回答
反對 回復 2021-05-10
?
jeck貓

TA貢獻1909條經驗 獲得超7個贊

您可能對Enca(極端幼稚的字符集分析器)感興趣。我猜您可以嘗試使用所有候選編碼讀取文件,并計算每種嘗試與該語言的“標準”字符頻率分布之間的距離。Enca需要一些語言信息,但是我不確定它是否使用這種方法。(這只是一個主意,可能會被誤導。)

查看完整回答
反對 回復 2021-05-10
  • 2 回答
  • 0 關注
  • 255 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號