R語言盒形圖(箱形圖)

盒形圖是數據集中數據分佈情況的衡量標準。它將數據集分爲三個四分位數。盒形圖表示數據集中的最小值,最大值,中值,第一四分位數和第四四分位數。 通過爲每個數據集繪製箱形圖,比較數據集中的數據分佈也很有用。

R中的盒形圖通過使用boxplot()函數來創建。

語法

在R中創建盒形圖的基本語法是 -

boxplot(x, data, notch, varwidth, names, main)

以下是使用的參數的描述 -

  • x - 是向量或公式。
  • data - 是數據幀。
  • notch - 是一個邏輯值,設置爲TRUE可以畫出一個缺口。
  • varwidth - 是一個邏輯值。設置爲true以繪製與樣本大小成比例的框的寬度。
  • names - 是將在每個箱形圖下打印的組標籤。
  • main - 用於給圖表標題。

示例

我們使用R環境中已經存在的數據集 - mtcars來創建一個基本的盒形圖。下面來看看mtcars數據集中的mpgcyl列。

input <- mtcars[,c('mpg','cyl')]
print(head(input))

當我們執行上面的代碼,它產生以下結果 -

                   mpg cyl
Mazda RX4         21.0   6
Mazda RX4 Wag     21.0   6
Datsun 710        22.8   4
Hornet 4 Drive    21.4   6
Hornet Sportabout 18.7   8
Valiant           18.1   6

創建盒形圖

以下腳本將爲mpg(每加侖英里)和cyl(氣缸數)列之間的關係創建一個盒形圖。

setwd("F:/worksp/R")
# Give the chart file a name.
png(file = "boxplot.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "氣缸數",
   ylab = "每加侖里程", main = "里程數據")

# Save the file.
dev.off()

當我們執行上述代碼時,會產生以下結果 -
R語言盒形圖(箱形圖)

盒形圖與凹口

我們可以繪製帶有凹槽的盒形圖,以瞭解不同數據組的中位數如何相互匹配。以下腳本將爲每個數據組創建一個帶有凹槽的盒形圖形。

setwd("F:/worksp/R")
# Give the chart file a name.
png(file = "boxplot_with_notch.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, 
   xlab = "氣缸數",
   ylab = "每加侖里程", 
   main = "里程數據",
   notch = TRUE, 
   varwidth = TRUE, 
   col = c("green","yellow","purple"),
   names = c("高","中","低")
)
# Save the file.
dev.off()

當我們執行上述代碼時,會產生以下結果 -

R語言盒形圖(箱形圖)