-
3-5Lattice 繪圖系統之基礎知識
lattice包:xyplot/bwplot/histogram等
? ? ? ? ? ? ? ? 格式:xyplot(y~x|f*g,data)(f*g的含義是分類變量)
? ? ? ? ? ? ? ? panel函數,用于控制每個面板內的繪圖
grid包:實現了獨立于base的繪圖系統
? ? ? ? ? ? ? lattice包是基于grid創建的;很少直接從grid包調用函數
Lattice與Base的重要區別:
Base繪圖函數直接在圖形設備上繪圖
Lattice繪圖函數返回trellis類對象,而不是直接繪圖(打印函數真正執行了在設備上繪圖,命令執行時,trelllis類對象會被自動打印)
查看全部 -
3-4R語言 基本繪圖系統之全局參數
par("bg")(作圖面板的背景顏色)
par("col")(圖的顏色為黑色)
par("mar")(圖的邊距)
par("mfrow")(1行1列,只能做一個圖)
par("mfcol")(同上,以列的方式做填充)
?par
舉例:
1.par(mfrow=c(1,2))
? ?hist(airquality$Temp)
? ?hist(airquality$Wind)
2.par(mfcol=c(2,1))
? ?hist(airquality$Temp)
? ?hist(airquality$Wind)
查看全部 -
3-3 R語言 基本繪圖系統之實踐
hist(airquality$Wind,xlab="Wind")(數值型變量風速的柱狀圖)
boxplot(airquality$Wind,xlab="Wind",ylab="Speed(mph)")(箱圖)
boxplot(Wind~Month,airquality,xlab="Month",ylab="Speed(mph)")(一個分類變量和一個數值變量的關系,每個月份的風速)
plot(airquality$Wind,airquality$Temp)(風速和溫度的散點圖)=with(airquality,plot(Wind,Temp))
title(main="Wind and Temp in NYC")(加標題,可以直接將括號中的命令放入with命令中)
with(airquality,plot(Wind,Temp,main="Wind and Temp in NYC",type="n"))(除了點以外其他的信息都有)
with(subset(airquality,Month==9),points(Wind,Temp,col="red"))(按月份畫點,不同月份顯示的點有不同的顏色)
with(subset(airquality,Month%in%c(6,7,8)),points(Wind,Temp,col="red"))
fit<-lm(Temp~Wind,airquality)(擬合模型)
abline(fit,lwd=2)
legend("topright",pch=1,col=c("red","blue","black"),legend=c("Sep","May","Other"))(點的顏色代表的含義)
查看全部 -
3-2 基本繪圖系統之基礎知識
繪圖函數(graphics包):
plot/hist(柱狀圖)/boxplot/points/lines/text(指定位置添加文字)/title/axis(添加坐標軸)
調用函數會啟用一個圖形設備(如果沒有正在運行的圖形設備),并設備上繪圖
基本繪圖系統+屏幕設備
plot():plot(x,y,.....)? ?重要參數:xlab/ylab/lwd/lty/pch/col
?par(了解更多重要參數)
par():用于設置全局參數(作用于R中的所有plot繪圖)
bg(背景顏色)/mar(作圖時與邊界的邊距)/las(呈現x的坐標的話 輸入的漢字是橫排版或豎排版)/mfrow(當前的畫板分為幾行幾列,并且作圖時按照行來填充)/mfcol(當前的畫板分為幾行幾列,并且作圖時按照列來填充)
這些參數可以在每次plot之前進行修改
查看全部 -
第3章 R的繪圖系統
3-1R語言 三大繪圖系統簡介
基本繪圖系統(Base Plotting System ):
特點是繪圖始于空白帆布,所以有人稱為藝術家的調色板。需要事先計劃(圖里的點線以及坐標軸都是人為加上去的);直觀地實時反映繪圖和分析數據的邏輯
兩步=圖+修飾/添加=執行一系列函數
適合繪制2D圖
Lattice繪圖系統(Lattice Plotting System):
繪圖=使用一次函數調用(一次成圖)
特別適用于觀測變量間的交互:在變量z的不同水平,變量y如何隨變量x變化
ggplot2繪圖系統(ggplot2 Plotting System):
The Grammar of Graphics
圖:動詞、名詞、形容詞等
本質是把數據映射到幾何客體(points/lines/bars)的美學屬性(顏色/形狀/大小)
可以視為基本繪圖系統+Lattice繪圖系統的合體
既可以像Lattice繪圖系統一樣自動處理標題/文字說明/空間等,但也像基本繪圖系統允許通過添加注釋進行修改
查看全部 -
2-3分類變量的特征和可視化
一個分類變量的可視化:頻率表(frequency table)、條形圖(bar plot)
兩個分類變量的關系:關聯表(contingency table)、相對頻率表(relative frequencies)、分段條形圖、相對頻率分段條形圖、馬賽克圖(mosaicplot)
一個分類變量、一個數值變量的關系:并排箱圖(side-by-side box plot)
查看全部 -
2-2數值變量的特征和可視化
集中趨勢
分散趨勢
x<-c(1,9,2,8,3,9,4,5,7,6)
mean(x)
median(x)
var(x)
sd(x)
summary(x)
穩健統計量(robust statistics):中位數、四分位差(受極端值影響?。?/p>
一個變量的可視化:
柱狀圖(histogram)、點圖(dot plot)(分布)、箱圖(box plot)(中位數、分位點、極端值)
兩個變量的關系:
散點圖(scatter plot):方向、形狀、強度、極端值
查看全部 -
第2章 了解數據特征
2-1R語言數據基礎
以上為1個數據矩陣
變量的類型:數值(quantitative):連續性和離散型
? ? ? ? ? ? ? ? ? ? 分類:無序(不可比較)? ?有序(順序有意義)
變量間的關系(對應不同的可視化方法和統計分析方法)
? ? ? ? ? ? ? ? ? ??
查看全部 -
1-3完整的數據分析流程
定義研究問題
定義理想的數據集
確定能夠獲取什么數據
獲取數據
清理數據
探索性分析(數據可視化)
統計分析/建模(機器學習)等
解釋/交流結果(數據可視化)
挑戰結果(有沒有其他可能)
書寫報告(Reproducibe原則)
假設驅動 vs? 數據驅動
查看全部 -
ggplot
查看全部 -
3-6沒看懂
查看全部 -
side-by-side box plot
查看全部 -
兩個邊線的含義不是值域。是Q1-1.5IQR
Q3+1.5IQR。
豎線外是極端值。??異常值
查看全部 -
11111
查看全部 -
11111111
查看全部
舉報