![]() |
From Udacity: Intro to Descriptive Statistics |
這兩個圖表的差異到底為何?剛好最近開始上Udacity的Intro to Descriptive Statistics裡在Visualizing data的單元裡,針對這兩個圖表有詳細的解釋與描述。
左:直方圖(Histogram )
- 描述的是連續性的數據資料(x-axis: Numerical/Quantitative)
- 資料間隔 Interval(Bin size) 可以隨意調整,而隨意調整並不會打壞想要呈現的數據。只是讓你更容易瀏覽不同分法下,呈現出不同資料樣的樣貌。如上圖Sample of Udacity studenets’ ages,為5歲為一個級距,但可以隨意調整成15歲為一個級距,或者50歲為一個級距來看不同級距資料的變化。Bin size 的概念,可以想成想裝多少個箱子,或者是把什麼東西放到這個箱子內。
- 直方圖的級距有邏輯與順序性,因為是描述連續性的資料,如數字等。
右:柱狀圖(Bar graph)
- 描述的是確切的類別(x:axis: Categorical/qualitative)
- 無法調整級距,因為是屬於category類型資料的呈現,如右圖,呈現的是各州學生的分佈。由於是顯示不同的類別的資料,雖然是描述同一件事情(頻率)但Bar的顏色各自代表其類別。
- 級距之間的排序較不嚴謹,可以隨意調整想要排列的順序,如把Europe, North America, Aisa改成Aisa, North America, Europe等。
沒有留言:
張貼留言