亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

hadoop讀取GBK編碼文件,中文亂碼問題求助?

hadoop讀取GBK編碼文件,中文亂碼問題求助?

寶慕林4294392 2018-11-18 08:04:30
hadoop讀取GBK編碼文件,中文亂碼問題求助
查看完整描述

1 回答

?
MMMHUHU

TA貢獻1834條經驗 獲得超8個贊

1、hadoop內部默認的文本讀取編碼設置為utf-8,你的源文件為gbk,在讀取時遇到中文時是肯定要出現亂碼。
解決方法有二:
(1)將你的GBK編碼的文件在生成時,統一成utf-8,這是最好的方式,方便國際化。
(2)重寫一個你的hadoop讀文件的FileInputFormat對象,在其中進行傳相應的編碼值與編碼轉換的工作,這個是比較麻煩,實際當中用得很少。

查看完整回答
反對 回復 2018-12-08
  • 1 回答
  • 0 關注
  • 1340 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號