求教各位大神:本人用scalas+spark開發,用RDD實現以下需求時遇到困難!數據:用戶 位置 天數user1 L1 28user1 L2 20user1 L3 15user2 L1 30user2 L2 15user3 L5 3user3 L6 18user4 L7 4通過spark RDD怎樣實現按用戶分組提取每個用戶天數最大的位置希望數據結果:RDD:array((user1,L1,28),(user2,L1,30),(user3 , L6,18),(user4,,7 4))這里主體是根據用戶分組計算最大天數,并把位置帶出來,研究半天無果,求大神指教
添加回答
舉報
0/150
提交
取消