中位数(Median)是统计学中用来表示一组数据的“中间值”的概念。它的具体含义和计算方法如下:
1. 定义
中位数是将一组数据按大小顺序排列后,位于正中间的那个数。它能够避免极端值(过高或过低的数值)对整体数据的影响,因此比平均值(Mean)更能反映数据的“典型情况”。
2.如何计算中位数?
- 如果数据数量是奇数:直接取中间的那个数。
例子:数据组[3.5, 3.7, 3.9, 4.0, 4.3] 的中位数是 3.9(第三个数值)。
- 如果数据数量是偶数:取中间两个数的平均值。
例子:数据组[3.6, 3.8, 3.9, 4.0] 的中位数是(3.8 + 3.9) / 2 = 3.85。
3. 在GPA统计中的意义
在你提供的表格中,转校生GPA的中位数是3.90,说明:
- 所有被录取学生的GPA按从低到高排序后,排在中间的那名学生的GPA是3.90。
- 中位数比平均值更可靠,因为它不受少数extremely高或极低GPA的影响(例如,即使有学生GPA为2.0或4.3,中位数也不会剧烈波动)。
4. 中位数 vs. 平均值(Mean)
- 平均值:所有数据的总和除以数量,容易受极端值影响。
例子:[3.0, 3.5, 3.9, 4.0, 4.3] 的平均值是(3.0+3.5+3.9+4.0+4.3)/5 = 3.74,但中位数是3.9。
- 中位数:更稳定,能反映“大多数人的水平”。
5. 为什么学校公布中位数?
学校更倾向于公布中位数而非平均值,是因为:
- 避免个别超高分或超低分扭曲整体数据。
- 让申请者更直观地了解“典型被录取学生”的水平(例如,表格中50%的学生GPA在3.77-4.00之间)。
总结
中位数是描述数据集中趋势的重要指标,尤其适合分析像GPA这类可能包含极端值的数据。在你的例子中,3.90的中位数表明被录取的转校生整体学术表现非常出色,竞争激烈。