向量x里最后5個數是從正態分布里抽取均值為1的5個數,那為什么最終結果第三個水平下的均值不是1?
>x<- c(rnorm(5),runif(5),rnorm(5,1))
> x
?[1] -0.90345261 ?1.39910875 ?0.05362229 -0.23041832 -0.16534230 ?0.15003609
?[7] ?0.67598238 ?0.97964256 ?0.88347497 ?0.33474777 ?0.79609395 ?0.89146970
[13] ?2.63441958 ?0.90107896 ?1.42849207
> # rnorm(5)是從正態分布里抽取5個數,runif(5)是從均勻分布里抽取5個數,rnorm(5,1)正態分布里抽取均值為1的5個數。
> f<- gl(3,5) ? ? ? ? ? ? ? ? ? ? ? ? ? ?#創建3個水平,每個水平含有5個元素的因子。
> f
?[1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
Levels: 1 2 3
> tapply(x,f,mean) ? ? ? ? ? ? ? ? ? ? ? ? ? ? #求x里的數據在每因子水平下的均值。
? ? ? ? ?1 ? ? ? ? ?2 ? ? ? ? ?3?
0.03070356 0.60477676 1.33031085?
向量x里最后5個數是從正態分布里抽取均值為1的5個數,那為什么最終結果第三個水平下的均值不是1?
2018-10-10
因為rnorm代表是隨機抽取的,抽到的數的均值不一定是原本的數據的均值。比如有1:10的數,其均值為5.5,但是我從中隨機抽了五個數,比如是1,2,3,4,5。其均值為3