-
原來數據可視化就是探索性分析中的一個重要部分查看全部
-
R-可視化-注意事項 DO-6steps查看全部
-
R-可視化-注意事項 DO NOT查看全部
-
R-可視化-注意事項 報告書寫要信息層級化。查看全部
-
不用月份的點用不同顏色表示 實例 type=n subset %in%查看全部
-
plot hist boxplot with title函數查看全部
-
r語言的基本繪圖系統分為三大塊 基本繪圖系統 lattice繪圖系統 ggplot2繪圖系統查看全部
-
異常值界定查看全部
-
#Lattice繪圖系統 #xyplot/bwplot/histgram/stripplot/dotplot/splom/levelplot/contourplot #格式:xyplot(y ~ x|f * g, data) #panel,用來控制每個面板內的繪圖 #lattice和Base的重要區別 #Base繪圖函數直接在圖形設備上繪圖 #Lattice繪圖函數返回trellis類對象 # 打印函數真正執行了在設備上繪圖 # 命令執行時, trellis類對象會被自動打印.查看全部
-
#全局參數 par("bg")#背景顏色 par("col")#顏色 par("mar")#(bottom,left,right, right) par("mfrow") par("mfcol") par(mfrow = c(1,2)) hist(airquality$Temp) hist(airquality$Wind) par(mfrow = c(1,1)) boxplot(airquality$Temp)查看全部
-
hist(airquality$Wind,xlab="wind") boxplot(airquality$Wind,xlab="wind",ylab="speed(mph)") plot(airquality$Wind,airquality$Temp) with(airquality,plot(Wind,Temp,main="Wind and Temp in NYC")) title(main="Wind and Temp in NYC") with(airquality,plot(Wind,Temp, main="Wind and Temp in NYC", type = "n")) with(subset(airquality,Month==9), points(Wind,Temp,col = "red")) with(subset(airquality,Month==5), points(Wind,Temp,col = "blue")) with(subset(airquality,Month==8), points(Wind,Temp,col = "black")) with(subset(airquality,Month %in% c(6,7,8)), points(Wind,Temp,col = "black")) fit <- lm(Temp ~ Wind,airquality) abline(fit,lwd=2)查看全部
-
#基本繪圖系統 #繪圖函數:plot/hist/boxplot/ points/lines/text/title/axis #調用函數會啟用一個圖形設備(如果沒有正在運行的圖形設備)并在設備上繪圖 # 基本繪圖系統+屏幕設備 plot() #-plot(x,y,....) #重要參數:xlab/ylab/lwd/lty/pch/col par() #-通常用語設置全局參數(作用于R中所有的plot繪圖) # bg/mar/las/mfrow/mfcol查看全部
-
#R三大繪圖系統 #1.基本繪圖系統 #1)藝術家的調色板:繪圖始于空白帆布 #需要事先計劃;支管地實時反映繪圖個分析數據的邏輯 #2)兩部=圖+修飾/添加=執行一系列函數 #3)適于繪制2D圖形 #2.Lattice繪圖系統 #1)特別適用于變量之間的交互:在變量Z不同水平,變量Y如何隨著變量X變化 #2)繪圖=使用一次函數調用 #3.ggplot2 #1)The Grammar of Graphics # 圖:動詞,名詞,形容詞等. # 數據映射到幾何客體的美學屬性 #2)基本繪圖系統+Lattice繪圖系統 # 自動處理標題/文字說明/空間等,但也允許通過添加注釋進行修改.查看全部
-
數值變量就是可以進行加減乘除的,其中分為離散型變量跟連續變量 比如說一二三四五六七八九十 分類變量又分為有序變量跟無序變量 其中無序變量比如說蘋果桃子梨他們就不能進行比較 也不能進行哦加減乘除 然后有序變量就比如說大一大二大三 他們雖然不能進行加減乘除 但是我們就知道大二的比大一的多上了一年學 他們是其中是有一些邏輯關系的查看全部
-
學術界比較多假設驅動:先定義研究的問題,然后用數據來驗證你研究的問題 而在工業界數據驅動比較多:數據驅動就是你剛開始不知道你要研究什么問題,通過一大堆數據分析的結果來得出一些結論,。而這些結論他們有可能是相互矛盾的,也有可能你什么都得不到,如果在相互矛盾的一大堆結論中你選擇了一些結論的話,那么你就犯了一個錯誤,就是你有可能只選擇了對你有利的那些結論而你忽視了那些對你不利的結論,所以你得出的結果就是不可靠的。 在現實在實際情況下,我們一般是假設驅動和數據驅動結合的情況比較多。 挑戰結果的意思是:不論你最后得出的結論是多么符合你之前的預期,或者是你多么認為你的這個數據分析的過程是沒有錯的,但是這時候你還是要對你自己的結果保留一個懷疑的態度,要思考還有沒有沒有考慮到的問題或者是有可能你還是會犯了一些錯誤。查看全部
舉報
0/150
提交
取消