-
如果是要看兩個變量之間的關系的話 我們可以用散點圖 散點圖主要看四個方面 方向 形狀 強度和極端值 從第二副圖和第三副圖可以看出他的方向是向上的和向下的 而形狀了第一幅圖是一個橢圓形 然后第二副第三副是直線的 第四幅圖是拋物線的形狀 可以知道他們是有線性關系還是非線性關系 強度就是看他們之間的相關系數 第一副圖我們可以看出相關系數很低的 234副圖的相關系數就很高 第二副圖的上面有一個異常值也就是他的極端值 我們在做數據分析的時候要特別觀察那個極端值對我們的整體分析是不是會有影響查看全部
-
不是為了分析問題而進行分析,而是為了解決一定的問題或者為某些決策提供一定的依據。查看全部
-
箱圖一般是豎著放的 豎著放就可以看到它左邊的y軸上面的數值查看全部
-
箱圖是最適合來檢驗極端值的圖 q1是25%分位點 q3是75%分位點查看全部
-
圖上是一個左偏分布一個正態分布一個右偏分布和一個點圖 點圖和柱狀圖的區別是點圖就是一個一個點來清晰的表示出每個數字出現的頻率 比如說在這幅圖中最左邊有四個點 那么最左邊的那四個數字每個數字只出現了一次頻率 如果這種情況下我用柱狀圖來表示的話 即便是我畫出了一個比較均勻的四根相同高度的柱子 我也不敢清晰的說肯定的這個就是他們出現了同樣的頻率 所以我們在使用點圖跟柱狀圖的時候就可以根據自己的需求看看自己到底需要哪一種圖形查看全部
-
rstudio里面的x的均值方差眾數中位數和summary的計算查看全部
-
數值變量就是可以進行加減乘除的,其中分為離散型變量跟連續變量 比如說一二三四五六七八九十 分類變量又分為有序變量跟無序變量 其中無序變量比如說蘋果桃子梨他們就不能進行比較 也不能進行哦加減乘除 然后有序變量就比如說大一大二大三 他們雖然不能進行加減乘除 但是我們就知道大二的比大一的多上了一年學 他們是其中是有一些邏輯關系的查看全部
-
關系小節查看全部
-
分散趨勢查看全部
-
我在CSDN上做了筆記。查看全部
-
學術界比較多假設驅動:先定義研究的問題,然后用數據來驗證你研究的問題 而在工業界數據驅動比較多:數據驅動就是你剛開始不知道你要研究什么問題,通過一大堆數據分析的結果來得出一些結論,。而這些結論他們有可能是相互矛盾的,也有可能你什么都得不到,如果在相互矛盾的一大堆結論中你選擇了一些結論的話,那么你就犯了一個錯誤,就是你有可能只選擇了對你有利的那些結論而你忽視了那些對你不利的結論,所以你得出的結果就是不可靠的。 在現實在實際情況下,我們一般是假設驅動和數據驅動結合的情況比較多。 挑戰結果的意思是:不論你最后得出的結論是多么符合你之前的預期,或者是你多么認為你的這個數據分析的過程是沒有錯的,但是這時候你還是要對你自己的結果保留一個懷疑的態度,要思考還有沒有沒有考慮到的問題或者是有可能你還是會犯了一些錯誤。查看全部
-
剛剛給查看全部
-
本章小結查看全部
-
數據分析流程查看全部
-
par()的參數查看全部
舉報
0/150
提交
取消