亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

Python數據分析之dataframe的groupby

標簽:
Java Python

大家都知道数据库有groupby函数,今天给大家讲讲dataframe的groupby函数。

groupby函数

还是以上文的数据为例子,进行讲解,首先读入数据,通过groupby聚合数据。(该数据为简书it互联网一段时间的文章收录信息)

import pandas as pdimport pymysql
conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8')
jianshu = pd.read_sql('select * from jianshu1',conn)
group_user = jianshu.groupby('user')
group_user.groups

https://img1.sycdn.imooc.com//5d53f9860001a20705810449.jpg


可以看出返回的有用户id和所在的索引位置以及数据类型。通过下面代码计算有多少用户。

len(group_user.groups)#result 543

通过size方法进行统计显示:

size_user = group_user.size()
size_user

https://img1.sycdn.imooc.com//5d53f98a000167da02690720.jpg


进行排序,取前十的用户。

sort_user = size_user.sort_values(ascending=False)
sort_user[0:10]

https://img1.sycdn.imooc.com//5d53f98f0001ff2c02510289.jpg

highcharts绘图

import charts
series = [{'name': 'Apple','data': [10],'type': 'column'},{'name': 'Android','data': [5],'type': 'column'},{'name': 'Other','data': [5],'type': 'column'}]
charts.plot(series,show='inline')

https://img1.sycdn.imooc.com//5d53f99400013f4508570610.jpg


我们需要把数据整合为highcharts能识别的数据结构,然后进行绘制。

series1 = []for i in a.index:
    data = {        'name':i,        'data':[a[i]],        'type':'column'
    }
    series1.append(data)
charts.plot(series1,options=dict(title=dict(text='投稿前十用户')))

https://img1.sycdn.imooc.com//5d53f9970001140208860593.jpg


这里的a是前十的用户数据,也就是sort_user[0:10]。
最后祝愿全天下母亲节日快乐



作者:罗罗攀
链接:https://www.jianshu.com/p/7032d7f33ff4


點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消