我有許多大型數據集,共有?10列和?200000行。并非所有列都包含每一行的值,盡管至少一列必須包含要存在的行的值,但我想為NA一行中允許的s 設置一個閾值。我的數據框看起來像這樣: ID q r s t u v w x y z A 1 5 NA 3 8 9 NA 8 6 4 B 5 NA 4 6 1 9 7 4 9 3 C NA 9 4 NA 4 8 4 NA 5 NA D 2 2 6 8 4 NA 3 7 1 32 我希望能夠刪除包含2個以上包含NA的單元格的行以獲取ID q r s t u v w x y z A 1 5 NA 3 8 9 NA 8 6 4 B 5 NA 4 6 1 9 7 4 9 3 D 2 2 6 8 4 NA 3 7 1 32 complete.cases刪除所有包含any的行NA,并且我知道一個人可以刪除NA某些列中包含的行,但是有一種方法可以對其進行修改,以使它對包含哪些列是不確定的NA,但是總數中有多少呢?或者,通過使用以下方法合并幾個數據框來生成此數據框 file1<-read.delim("~/file1.txt") file2<-read.delim(file=args[1]) file1<-merge(file1,file2,by="chr.pos",all=TRUE)也許合并功能可以更改?謝謝
- 3 回答
- 0 關注
- 1099 瀏覽
添加回答
舉報
0/150
提交
取消