#!/bin/pythonfrom pyspark import SparkConf, SparkContextif __name__ == "__main__":conf = SparkConf().setMaster("local").setAppName("Challenge")sc = SparkContext(conf = conf)sc.setLogLevel("ERROR")input = sc.textFile("/home/shiyanlou/data/")words = input.flatMap(lambda line: line.split(' '))counts = words.map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)top5 = counts.sortBy(xxxxx, ascending = False).take(5)for x in top5:print(x)sc.stop()想要統計詞頻前五的,請問這行top5 = counts.sortBy(xxxxx, ascending = False).take(5)代碼的參數如何修改
1 回答

哈士奇WWW
TA貢獻1799條經驗 獲得超6個贊
首先打開“Microsoft Sql Server Management Studio”,然后再打開“Tool->SQL Server Profiler”,如圖:
如果應用比較多的話,界面可能一下子就滿了,不好找對應的SQL,你可以按照下面的步驟做:
1、先將程序運行到數據庫操作的前一步。
2、清除界面內容。
3、繼續運行源碼,直到數據庫相關操作的源碼執行完。
4、暫?!甋QL Server Profiler’的運行。
5、Ctrl+F,輸入你想查找的表名、存儲過程名等。
選中該行,在最下面就可以看到生成的SQL語句了。
- 1 回答
- 0 關注
- 215 瀏覽
添加回答
舉報
0/150
提交
取消