-
table(條件,useNA="ifany")表示可以顯示缺失值,該函數還可以對兩個變量進行總結,返回結果是一個二維的列表
查看全部 -
str(數據框)以一種簡潔的方式總結數據,包括變量數,記錄數,變量名稱及其類型,以及前面幾個取值
查看全部 -
head(數據框)表示看該數據框的前六行內容,head(數據框,10)表示看該數據框的前10行內容;tail表示看后六行內容
summary(數據框)返回每個變量的最小值,最大值,25%的分位點,75%的分位點,中位數,均值,以及是否存在缺失值(如果有,有幾個),該函數使得我們對數據分布有一個整體把握
查看全部 -
關于排序的兩個函數:1)sort:對向量進行排序,返回排好序的內容;2)order:返回排好序的內容的下標/可有多個排序標準
sort默認升序排列,若要降序,添加decreasing=TRUE
查看全部 -
na.rm=TRUE的含義是在處理參數時不要包括缺失值
查看全部 -
split(向量/列表/數據框,因子/因子列表)可以根據因子或因子列表將向量或其他對象分組,通常與lapply一起使用,可對列表中的元素進行運算
查看全部 -
tapply(向量,因子/因子列表,函數名)可以對向量的子集進行操作,其中向量的參數量為n,每個參數的元素個數為k,要與gl()相對應
gl(n,k)產生因子水平的函數,其中n表示有幾個水平,k表示每個水平下有幾個元素
查看全部 -
mapply(函數名,數據,函數相關的參數)是lapply的多元版本,對列表(如正態分布)進行操作
rep(a,b)意思是b個a
rnorm(n,mean,std)表示從均值為mean,標準差為std的正態分布中抽取n個數據
查看全部 -
apply(數組,維度,函數名)沿著數組的某一維度處理數據,例如將函數用于矩陣的行或列求和sum。
rnorm(100)意思是隨機從正態分布的總體里抽取100個數據
quantile()是求數據的百分位點,probs是對quantile進行限定,求多少的百分位點
查看全部 -
function()代表匿名函數
sapply()能把lappy的結果進行化解,例如把列表化解成向量,使結果更加清晰:1)當結果列表元素長度均為1 ,返回向量;2)當長度相同且大于1,返回矩陣。反之,返回結果和lapply一樣
查看全部 -
循環函數:for/while()語句(需要多行代碼),此外還有“一句話”函數(一行代碼即可)
lapply(參數):可以循環處理列表中的每一個元素,參數可以是列表,函數名等,其結果總是返回一個列表
求平均mean(),runif()代表從一個均勻分布的總體里抽取若干個數出來,該函數默認從0到1進行抽取
查看全部 -
構建子集所用符號,處理缺失值,向量化操作
查看全部 -
rep函數中的兩個變量(a,b)含義:把a重復b次
建立兩個矩陣(x,y),進行運算(對應元素)
真正的矩陣乘法:x%*%y
查看全部 -
向量化操作:輸入兩個向量(x,y),并對其進行運算(對應元素)
查看全部 -
得到向量中非缺失值的元素:x[!is.na(x)],!代表取反
選取兩個向量(x,y)中對應位置都不是缺失值的元素:用complete.cases()函數給z賦值,得到邏輯向量,然后用x[z]和y[z]得到最終結果
看數據集長什么樣用head()函數,數據集中每一行叫做一次記錄,每一列叫做一個變量,通常會選擇在所有變量中都沒有缺失值的記錄,這時可用complete.cases(數據集)函數給z(任一字母)賦值
查看全部
舉報