箱线图(boxplot),又称盒须图、盒式图、箱线图,用于显示数据分散情况的统计图,它利用数据中的五个统计量:最小值,最大值,中位数,第一四分位数,第三四分位数来描述数据。
- 画数轴
- 画矩形盒,矩形盒两边分别对应数据的两个四分位数(Q1和Q3),在矩形盒的内部中位数位置附近画一条黑色的条带。
- 在Q3+1.5xIQR(IQR表示四分位距)和Q1-1.5xIQR这两处的位置画一条与中位数位置一样的线段,这两个线段表示异常值(outliers)截断点,这两个线段位置表示的是最大非异常值和最小非异常值,两者之间称为內限;在Q3+3xIQR和Q3-3xIQR处画两条线段,称其为外限。处于內限以外的都是异常值,在內限与外限之间的异常值为温和异常值(mild outliers),在外限之外的都是极端异常值(extreme outliers)。
箱线图结合其他统计工具比如:均值、标准差、偏度、分布函数来描述数据的分布。

