首頁猿問分組函數（tapply，by，ag...

分組函數（tapply，by，aggregate）和* apply系列

R語言

嚕嚕噠 2019-05-22 15:31:24

分組函數（tapply，by，aggregate）和* apply系列每當我想在R中做一些“map”py時，我通常會嘗試在apply家族中使用一個函數。但是，我從來沒有完全理解它們之間的區別 - 如何{ sapply，lapply等}將函數應用于輸入/分組輸入，輸出將是什么樣的，甚至輸入可以是什么 - 所以我經常只要仔細檢查它們，直到我得到我想要的東西。有人可以解釋如何使用哪一個？我當前（可能不正確/不完整）的理解是......sapply(vec, f)：輸入是一個向量。output是一個向量/矩陣，其中element i是f(vec[i])一個矩陣，如果f有一個多元素輸出lapply(vec, f)：相同sapply，但輸出是一個列表？apply(matrix, 1/2, f)：輸入是一個矩陣。output是一個向量，其中element i是f（矩陣的row / col i）tapply(vector, grouping, f)：output是一個矩陣/數組，其中矩陣/數組中的元素是向量f分組g的值，并g被推送到行/列名稱by(dataframe, grouping, f)：讓我們g成為一個分組。適用f于組/數據框的每一列。漂亮打印分組和f每列的值。aggregate(matrix, grouping, f)：類似于by，但不是將輸出打印得很漂亮，而是將所有內容都粘貼到數據幀中。側問題：我還沒有學會plyr或重塑-將plyr或reshape更換所有這些完全？

查看完整描述

4 回答

UYOU

TA貢獻1878條經驗獲得超4個贊

首先從Joran的優秀答案開始 - 懷疑任何事情都可以更好。

然后，以下助記符可能有助于記住每個之間的區別。雖然有些是顯而易見的，但有些可能不那么明顯 - 對于這些，你會在Joran的討論中找到理由。

助記符

lapply是一個列表應用，它作用于列表或向量并返回一個列表。
sapply是一個簡單的 lapply（函數默認為在可能的情況下返回向量或矩陣）
vapply是經過驗證的申請（允許預先指定退貨對象類型）
rapply是嵌套列表的遞歸應用，即列表中的列表
tapply是標記應用，其中標記標識子集
apply 是 通用的：應用一個函數的矩陣的行或列（或者，更一般地，以陣列的尺寸）

建立正確的背景

如果使用這個apply家庭仍然覺得你有點陌生，那么可能是你錯過了一個關鍵的觀點。

這兩篇文章可以提供幫助。它們提供了激發函數apply族提供的函數式編程技術的必要背景。

Lisp的用戶將立即認識到這種范式。如果你不熟悉Lisp，一旦你了解了FP，你就會獲得一個強大的觀點來使用R - 并且apply會更有意義。

高級R：功能編程，由Hadley Wickham撰寫
R的簡單函數式編程，作者：Michael Barton

反對回復 2019-05-22

回首憶惘然

TA貢獻1847條經驗獲得超11個贊

因為我意識到這篇文章的（非常優秀的）答案缺乏by和aggregate解釋。這是我的貢獻。

通過

by但是，如文檔中所述，該函數可以作為“包裝器” tapply。by當我們想要計算tapply無法處理的任務時，會產生這種力量。一個例子是這段代碼：

ct <- tapply(iris$Sepal.Width , iris$Species , summary )

cb <- by(iris$Sepal.Width , iris$Species , summary )

iris$Species: setosa