亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在 Pandas 中對 Window PartitionBy 進行排名

在 Pandas 中對 Window PartitionBy 進行排名

慕桂英3389331 2023-10-11 15:38:52
我接觸了一些需要在面向 Pandas 的處理中進行翻譯的 PySpark 代碼。任何幫助都會非常受歡迎,因為我正在努力尋找 Pandas 等價物的方法:PySpark代碼:window = Window.partitionBy(df["timestamp"]).orderBy(df["timestamp"].desc())df = df.select('*', F.rank().over(window).alias('rank')) \       .filter(F.col('rank') <= 1) \       .orderBy(df["timestamp"].desc()) \       .limit(int(window_int))謝謝
查看完整描述

1 回答

?
ABOUTYOU

TA貢獻1812條經驗 獲得超5個贊

您可以使用sqldffrompandasql來實現簡單的sql類似窗口的體驗。該庫實際上使用sqlite支持窗口函數的語法,每個變量/數據幀都可以被視為一個表。該函數sqldf還返回一個DataFrame


from pandasql import sqldf


df = sqldf("""

 SELECT * FROM (

     SELECT 

        * ,

        RANK() OVER (PARTITION BY timestamp ORDER  BY timestamp ) as rank

     FROM

        df

     ORDER BY timestamp desc

 ) dfsub

 WHERE

    rank <= 1

 LIMIT %d

""" % (int(window_int)))


查看完整回答
反對 回復 2023-10-11
  • 1 回答
  • 0 關注
  • 150 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號