我有一些關于年齡與年齡的多元數據。年齡范圍為20至40,間隔為2(20,22,24 .... 40),對于每條數據記錄,年齡和美容等級均為1-5。當我對這些數據進行箱形圖繪制(X軸上的年齡,Y軸上的美容等級)時,每個框的晶須外都繪制了一些離群值。我想從數據框本身中刪除這些離群值,但不確定R如何計算其箱形圖的離群值。以下是我的數據的示例
3 回答

慕斯709654
TA貢獻1840條經驗 獲得超5個贊
boxplot函數返回用于進行繪圖的值(實際上是由bxp()完成:
bstats <- boxplot(count ~ spray, data = InsectSprays, col = "lightgray")
#need to "waste" this plot
bstats$out <- NULL
bstats$group <- NULL
bxp(bstats) # this will plot without any outlier points
我故意不回答具體問題,因為我認為刪除“異常值”是統計錯誤。我認為不將它們繪制在箱線圖中是可以接受的做法,但是僅由于它們超出了一些標準偏差或一定數量的四分位數寬度而將其刪除是對觀測記錄的系統性和不科學的處理。
- 3 回答
- 0 關注
- 1556 瀏覽
添加回答
舉報
0/150
提交
取消