我有500G的數據,分別存儲在機器A、B上,為了快速分析數據,我使用A,B,C,D四臺機器做了一個hadoop集群。A是master。請問我是否需要將這500G的數據先上傳到hadoop中?如果需要的話,那么我的系統中豈不是會存儲兩份? 查看完整描述