亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

一列數據是頻率的統計問題?

一列數據是頻率的統計問題?

白衣染霜花 2018-07-12 14:34:33
有一個樣本,a列是數字,b列是該數字出現的次數,樣本很大,要求這個樣本的標準差和正態分布圖,請問用python應該怎樣處理?查了很多,還是不太懂...A B100 2200 3300 4
查看完整描述

1 回答

?
幕布斯7119047

TA貢獻1794條經驗 獲得超8個贊

關于數據

A?B
100?2
200?3
300?4
...

可以看成一個長這樣[100,100,200,200,200,300,300,300,300,...]list。

標準分布

可以使用numpystd()來計算標準差,當然自己寫公式也可以。比如

In?[1]:?import?numpy?as?np
In?[2]:?np.std([100,100,200,200,200,300,300,300,300])
Out[2]:?78.56742013183862

分布圖

正態分布圖只是正態分布的數據的分布圖。是否正態分布取決于你的數據。可以考慮用seaborn來繪制分布圖。

import?seaborn?as?sns
sns.distplot([100,100,200,200,200,300,300,300,300])

分布圖長這樣:

https://img1.sycdn.imooc.com/5b49c1f00001d8f703860255.jpg

大數據量

可以用pandas讀取。用一個循環將數據表轉為list:


import?pandas?as?pd
df?=?pd.DataFrame({'A':[100,200,300],'B':[2,3,4]})"""
df?像這樣

?????A??B
0??100??2
1??200??3
2??300??4
"""l?=?[]for?i,?j?in?zip(df['A'],df['B']):
????tmp?=?[i]*j
????l.extend(tmp)????
"""
l?像這樣
[100,?100,?200,?200,?200,?300,?300,?300,?300]
"""


查看完整回答
1 反對 回復 2018-07-14
  • 1 回答
  • 0 關注
  • 808 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號