-
Sys.data()獲取的時間格式為Data
data()獲取的時間格式為字符
weekdays(data)判斷日期是星期幾
months(data)判斷月份是幾月
quarters(data)判斷是這一年的第幾個季度
julian(data)返回距離1970-01-01過去了多少天
查看全部 -
構建子集:[ ] / [[ ]] / $ / [[ ]] [ ] / [[ ]] [[ ]]?
處理缺失值:is.na() / complete.cases()
向量化操作:向量x+y,x*y,x/y??? 矩陣x%*%y
查看全部 -
兩個向量,選取對應位置都不是缺失值的-用complete選出一個新變量z,只有兩者都不是缺失值才會返回true,然后再用x【z】 y【z】選出都不是缺失值的
library加載數據集,dataset是r里自帶的數據包
head是取數據集的前六行看看數據及有哪些變量,基本情況。這個數據集有六個變量,目前只看到 6次記錄,通常我們希望選取所有變量都沒有缺失值的記錄
用complete輸出的判斷 第二行的13表示第二行的第一個true是原數據集的第十三個數據
數據框與向量還是不一樣,返回輸出非缺失值是考慮行和列,這里我們要每行數據都完整,所以g放在行上,列都留下,所以列的位置空著,后面再加一顆括號就依舊是行列的格式,前10行,列空著。最后輸出的數據框左邊數字表示選出來的數據在原數據集是第幾行
查看全部 -
創建一個數據框:df<-data.frame(id = c(1,2,3,4),name = c("a","b","c","d"), gender = c(TRUE,TRUE,FALSE,FALSE))
當數據框只有一個數據類型時可以轉換為一個矩陣:
df2<-data.frame(id = c(1,2,3,4),score = c(80,86,90,100))
data.matrix(df2)
查看全部 -
1、創建因子:x<-factor(c("male","female","femal","male"),levels = c("male","femal"))
2、level查看因子的基礎值,在統計分析的時候用處較大。
3、unclass(x),去除分類
4、table(x):查看元素的頻數
查看全部 -
列表:
1、l<-list("a",2,10L,3+4i,TRUE) #列表可以包含各種類型的數據
2、l2<-list(a = 1,b= 2,c = 3)#給列表的元素命名
3、l3<-list(c(1,2,3),c(4,5,6)) #列表中每個元素的內容個數>1
4、x<-matrix(1:6,nrow = 2,ncol = 3) dimnames(x) <- list(c("a","b"),c("c","d","e"))#矩陣的維度只能用列表來引入??
5、列表和向量都可以包含不同類型的數據,但是列表中的元素可以是向量。
查看全部 -
1、matrix填充先填充列,再填充行;
2、創建矩陣有兩種方式:1),y<-1:6 dim(y)<-c(2,3)??
2)y2<-matrix(1:6,nrow = 2,ncol = 3);
3、attributes()查看矩陣的信息;
5、矩陣只有行和列連個維度,但是數組的維度可以大于2,所以dim參數都是為數組設計的
查看全部 -
方括號中的[]代表的 是x所賦值對象的第一個元素
查看對象類型的函數class()?
numeric--代表的是一個數值型變量 可以是整數也可以是小數
要強調整形的數值在數字后面L integer
character--代表的是字符型
邏輯型 (logical)TRUE FALSE 在R語言中邏輯型必須用大寫表示
復數 complex
數據結構 屬性{名稱 維度 類型 長度
查看全部 -
C()函數會將三個不同類型的數全都轉換成character類型
如 x3 <- c(TRUE,10,"a")
x3 為 chr [1:3] "TRUE" "10" "a"
查看全部 -
//了解數據有多大
object.size(數據)
print(object.size(數據),units="Kb")
查看全部 -
交叉表
xtabs(Freq~Class+Age,data=titanic)//計算哪兩個數據交叉起來的頻率
ftable()//使排版變得更加扁平化
查看全部 -
smmary(數據名稱)//包括最大值最小值、25%、50%、75%位點,空值個數
str()//總結數據,變量個數、記錄數、變量名稱
table(airquality$Ozone,useNA="ifany")//將缺失值總結出來
is.na()//求缺失值
查看全部 -
sort:對向量進行排序,返回排好的內容
order:返回排好序的內容的下標/多個排序標準
sort(x$列名字)//按升序排列
sort(x$列名字,decreasing=TRUE)//按降序排列
x[order(x$列名字1,x$列名字2),]//先排列1,再排列2
查看全部 -
split(x,f)//將x按照f因子分為組,組數由f定
lapply(split(x,f),mean)//傳入分好組之后的列表,對列表進行的操作
sapply(s,function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm=TRUE))//除去缺失值
查看全部 -
tapply:對向量的子集進行操作
rnorm(5)//正態分布
rnorm(5,1)//均值為1標準差為0的正態分布
runif(5)//均勻分布
tapply(x,f,mean)//對向量x按照F因子的水平進行分組,對每一組求均值
查看全部
舉報