亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何從數據集中刪除離群值

如何從數據集中刪除離群值

一只斗牛犬 2019-10-15 09:13:04
我有一些關于年齡與年齡的多元數據。年齡范圍為20至40,間隔為2(20,22,24 .... 40),對于每條數據記錄,年齡和美容等級均為1-5。當我對這些數據進行箱形圖繪制(X軸上的年齡,Y軸上的美容等級)時,每個框的晶須外都繪制了一些離群值。我想從數據框本身中刪除這些離群值,但不確定R如何計算其箱形圖的離群值。以下是我的數據的示例
查看完整描述

3 回答

?
慕斯709654

TA貢獻1840條經驗 獲得超5個贊

boxplot函數返回用于進行繪圖的值(實際上是由bxp()完成:


bstats <- boxplot(count ~ spray, data = InsectSprays, col = "lightgray") 

#need to "waste" this plot

bstats$out <- NULL

bstats$group <- NULL

bxp(bstats)  # this will plot without any outlier points

我故意不回答具體問題,因為我認為刪除“異常值”是統計錯誤。我認為不將它們繪制在箱線圖中是可以接受的做法,但是僅由于它們超出了一些標準偏差或一定數量的四分位數寬度而將其刪除是對觀測記錄的系統性和不科學的處理。


查看完整回答
反對 回復 2019-10-15
  • 3 回答
  • 0 關注
  • 1556 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號