-
填充矩陣時是按照列來填充的查看全部
-
因子
????分類數據/有序?vs.無序
????整數向量+標簽(label)(優于整數向量)
????常用于lm(),glm()
????創建因子
????factor()
????table()/unclass()
查看全部 -
列表 list
????????可以包含不同類型的對象
????????創建列表 list()
????????dimnames(x) <- list()
查看全部 -
1、矩陣
????向量+緯度屬性(整數向量:nrow,ncol)
????創建矩陣
????????matrix()先列后行
????????vector()+dim()
????????cbind(),rbind()
????????attributes()
2、數組
????與矩陣類似,但是緯度可以大于2
????創建數組 array()
查看全部 -
向量
????只能包含同一類型的對象
????創建向量
????vector()
????c()
?????as.logical()/as.numeric()/as.character()
查看全部 -
對象的屬性:名稱、緯度、類型、長度
查看全部 -
對象的5種基本類型
字符、數值、整數、復數、邏輯
查看全部 -
清晰,簡練查看全部
-
#rnorm(100) 隨機從正態分布的總體里抽取100個數
x <- matrix(rnorm(100), 10, 10)
#quantile函數求百分位點的值,probs參數設置具體求哪些百分位點
#apply的第2個參數,1表示行,2表示列
apply(x, 1, quantile, probs = c(0.25, 0.75))
查看全部 -
rnorm(2*3*4)是什么意思?
查看全部 -
> strptime(x1,"%B %d, %Y %H:%M")
[1] NA
為什么得到的是缺失值?
查看全部 -
NaN屬于NA,NaN一般指數字的缺失值
查看全部 -
描述factor可以用table函數,如
x<-factor("female","female","male","male","male")
table(x)
x female? male
? ?? 2 ? ? ? ? ? 3
levels用在factor內描述其水平 如levels=c("male","female")
查看全部 -
#一句話函數
#遍歷列表的函數 lapply,總是返回列表
str(lapply)
x<-list(a=1:10,b=c(11,21,31,41,51))
lapply(x,mean)
x<-1:4
lapply(x, runif)#默認從0-1抽取
lapply(x, runif,min=0,max=100)x<-list(a=matrix(1:6,2,3),b=matrix(4:7,2,2))
lapply(x,function(m) m[1,])
#sapply,結果列表元素長度都是1返回向量,
#結果列表長度相同且大于1時返回矩陣
x<-list(a=1:10,b=c(11,21,31,41,51))
sapply(x, mean)#apply
x<-matrix(1:16,4,4)
x
apply(x, 2,mean)#對第2維度進行操作
x<-matrix(rnorm(100),10,10)
x
apply(x,1,quantile,probs=c(0.25,0.75))x<-array(rnorm(2*3*4),c(2,3,4))
apply(x,c(1,3),mean)#第1維和第2維的平面沿著第3維求均值
apply(x,c(1,2),mean)
apply(x,c(2,3),mean)#mapply ,lapply的多元版本
list(rep(1,4),rep(2,3),rep(3,2),rep(4,1))
mapply(rep,1:4,4:1)s<-function(n,mean,std){rnorm(n,mean,std)}
s(4,0,1)#從均值為0,標準差為1的正態分布里抽取4個數據
mapply(s,1:5,5:1,2)
list(s(1,5,2),s(2,4,2),s(3,3,2),s(4,2,2),s(5,1,2))#tapply對向量的子集進行操作
#tapply(向量,因子/因子列表,函數/函數名)
x<-c(rnorm(5),runif(5),rnorm(5,1))
x
f<-gl(3,5)#生成因子水平,3個水平每個水平5個元素
f
#對向量X按照因子的水平進行分組,對每組求均值
tapply(x,f,mean)
tapply(x,f,mean,simplify = FALSE)#split函數
#根據因子或因子列表將向量或其他對象分組,
#通常與lapply一起使用
#aplit(向量/列表/數據框,因子/因子列表)
x<-c(rnorm(5),runif(5),rnorm(5,1))
f<-gl(3,5)#生成因子水平,3個水平每個水平5個元素
split(x,f)
lapply(split(x,f), mean)head(airquality)
s<-split(airquality,airquality$Month)
s
table(airquality$Month)
lapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')]))
sapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')]))
lapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')],na.rm = TRUE))
sapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')],na.rm=TRUE))#排序
x<-data.frame(v1=1:5,v2=c(10,7,9,6,8),v3=11:15,v4=c(1,1,2,2,1))
x
sort(x$v2)#升序
sort(x$v2,decreasing = TRUE)
order(x$v2)
x[order(x$v2),]
x[order(x$v4,x$v2),]
#總結數據信息
head(airquality)
head(airquality,10)
tail(airquality)
summary(airquality)
str(airquality)
table(airquality$Ozone)
table(airquality$Ozone,useNA = 'ifany')
table(airquality$Month,airquality$Day)
is.na(airquality$Ozone)
any(is.na(airquality$Ozone))#是否有缺失值
sum(is.na(airquality$Ozone))
all(airquality$Month<12)
tianic<-as.data.frame(Titanic)
head(tianic)
dim(tianic)
summary(tianic)
x<-xtabs(Freq~Class +Age ,data = tianic)
ftable(x)#排版扁平化object.size(airquality)
print(object.size(airquality),units = kb)
print(object.size(airquality),units = 'kb')
print(object.size(airquality),units = 'Kb')查看全部 -
列表(元素可以不同)
查看全部
舉報