首頁手記 Pandas知識點匯總（2）—&mdash...

Pandas知識點匯總（2）——布爾索引

標簽：

Python 數據分析&挖掘

数据集地址：https://github.com/PacktPublishing/Pandas-Cookbook

1.计算布尔值统计信息

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')

#判断电影时长是否超过两个小时    #Figure1
movie_2_hours = movie['duration'] > 120

#统计时长超过两小时的电影总数
print(movie_2_hours.sum())  #result:1039
#统计时长超过两小时的电影的比例
print(movie_2_hours.mean())
#统计False和True的比例 
print(movie_2_hours.value_counts(normalize = True)) 
#比较同一个DataFrame中的两列
actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna()
print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2

运行结果：

Figure1

Figure2

2. 构建多个布尔条件

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')

#创建多个布尔条件
criteria1 = movie.imdb_score > 8
criteria2 = movie.content_rating == "PG-13"
criteria3 = (movie.title_year < 2000) | (movie.title_year >= 2010)

"""
print(criteria1.head())
print(criteria2.head())
print(criteria3.head())
运行结果：Figure1
"""

#将多个布尔条件合并成一个
criteria_final = criteria1 & criteria2 & criteria3 

print(criteria_final.head())
#运行结果：Figure2

运行结果：

Figure1

Figure2

3.用布尔索引过滤

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建第一个布尔条件
crit_a1 = movie.imdb_score > 8 
crit_a2 = movie.content_rating == 'PG-13'
crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)
final_crit_a = crit_a1 & crit_a2 & crit_a3

#创建第二个布尔条件
crit_b1 = movie.imdb_score < 5
crit_b2 = movie.content_rating == 'R'
crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)
final_crit_b = crit_b1 & crit_b2 & crit_b3

#将两个条件用或运算合并起来
final_crit_all = final_crit_a | final_crit_b
print(final_crit_all.head())  #Figure 1 

#用最终的布尔条件过滤数据
print(movie[final_crit_all].head()) #Figure2

运行结果：

Figure1

Figure2

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 

#读取movie,设定行索引是movie_title 
pd.options.display.max_columns = 50 
movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')
#创建第一个布尔条件
crit_a1 = movie.imdb_score > 8 
crit_a2 = movie.content_rating == 'PG-13'
crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)
final_crit_a = crit_a1 & crit_a2 & crit_a3

#创建第二个布尔条件
crit_b1 = movie.imdb_score < 5
crit_b2 = movie.content_rating == 'R'
crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)
final_crit_b = crit_b1 & crit_b2 & crit_b3

#将两个条件用或运算合并起来
final_crit_all = final_crit_a | final_crit_b

#使用loc,对指定的列做过滤操作，可以清楚地看到过滤是否起作用
cols = ['imdb_score','content_rating','title_year']
movie_filtered = movie.loc[final_crit_all,cols]
print(movie_filtered.head(10))

运行结果：

参考教程：
https://github.com/PacktPublishing/Pandas-Cookbook
https://www.jianshu.com/p/5809f6cf78ca

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

Coder_zheng

算法工程師

手記
篇

粉絲

23

獲贊與收藏

46

關注作者，訂閱最新文章

閱讀免費教程

Python 辦公自動化教程

17個小節 26993 912

Python 算法入門教程

15個小節 29452 1133

Python 進階應用教程

38個小節 71066 1109

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Pandas知識點匯總（2）——布爾索引

閱讀免費教程