3 回答

TA貢獻1852條經驗 獲得超7個贊
索引是您真正需要的:
db.temperature.ensureIndex({ 'station': 1, 'dt': 1 })
for s in db.temperature.distinct('station'):
db.temperature.find({ station: s }).sort({ dt : -1 }).limit(1)
當然使用實際上對您的語言有效的任何語法。
編輯:您是對的,像這樣的循環會導致每個站往返,這對幾個站來說非常有用,而對于1000個站則不太好。不過,您仍然希望station + dt上的復合索引能夠取降序排序的優點:
db.temperature.aggregate([
{ $sort: { station: 1, dt: -1 } },
{ $group: { _id: "$station", result: {$first:"$dt"}, t: {$first:"$t"} } }
])

TA貢獻1802條經驗 獲得超10個贊
至于您發布的聚合查詢,我將確定您在dt上有一個索引:
db.temperature.ensureIndex({'dt': 1 })
這將確保聚合管道開始時的$ sort盡可能高效。
至于是否是最有效的獲取數據的方法,與循環查詢相比,這可能取決于您擁有多少數據點。首先,我認為使用“成千上萬個站點”以及可能成千上萬個數據點,聚合方法會更快。
但是,隨著您添加越來越多的數據,一個問題是聚合查詢將繼續接觸所有文檔。隨著您擴展到數百萬或更多的文檔,這將變得越來越昂貴。這種情況的一種方法是在$ sort之后添加$ limit以限制所考慮的文檔總數。這有點hacky和不精確,但它將有助于限制需要訪問的文檔總數。
- 3 回答
- 0 關注
- 833 瀏覽
添加回答
舉報