1. 平均分:描述一组数据平均水平高低的统计量,其计算公式为:
其中 表示这组数据的均值。例如,有5个考试分数分别为:98,85,70,60,51,则它们的平均分是 等于 73。
2. 方差:描述一组数据离散程度的统计量,其计算公式为:
其中σ表示这组数据的方差,方差越大,说明数据分散程度越大。例如,有 5 个考试分数分别为:98、85、70、60、51,它们的平均分等于 73,则它们的方差是
等于 286.2。
3. 标准差:方差的算术平方根,其计算公式为:
其中σ就表示标准差。标准差在描述一组数据离散程度时比方差使用得更广泛,它有着与平均分数相同的计量单位。在语言测试领域里,考试分数通常近似正态分布,并且分数总是分布在大约 6 个标准差的范围内。
4. 差异系数:一组数据的标准差与其算术平均数的百分比,计算公式为: ![]()
其中 CV 就表示差异系数。差异系数也是表示一组数据离散程度的,但它没有计量单位而只是一个百分比,因此更多地用于两组平均数差异比较大的数据之间离散程度大小的比较。
5. 百分位数:将一组数据从大到小按顺序排列起来,并计算相应的累计百分位。那末,某一百分位所对应的数据的值就叫这一百分位的百分位数。例如,在一次大学英语考试中,分数的累积频数分布如下表(部分):

从表中可以看出, 10%这一累积百分位所对应的百分位是 94,一般可记为 P 10 = 94。
6. 加权分数:大学英语考试中的一种分数形式。通常大学英语考试由听力理解、阅读理解、词汇结构、综合考查和作文五个部分组成,总分为 100 分。根据这五个部分在英语语言能力中的重要程度分别给予不同的权重,即听力理解 20%、阅读理解 40%、词汇结构 15%、综合考查 10%和作文 15%。在计算总分时各部分成绩要按这一权重进行加权,计算公式为: ![]()
其中 SCO 表示加权分数,X i 表示第 i 部分的分数,W i 表示 X i 的权重。
7. 正态分数:大学英语考试中的报告分数形式。为了使大学英语考试的报告分数有一个明确的解释,从一开始,大学英语考试便建立了自己的分数常模,它们是由来自全国六所重点大学的近千名本科生组成,常模的均值为 67.80,标准差为 12.08。考生的考试分数经过常模转换为报告分数,计算公式为:
其中 SCO 表示报告分数,X 表示考试分数。经过常模变换后产生的报告分数均值设定为 72,标准差设定为 12。这样考生的报告分数由于有常模作参照就有了明确的含义。例如,某一考生报告分数为 72 分,说明其英语语言能力位于常模考生的平均水平,上下各有 50%的人。由于报告分数近似正态分布,通常被称之为正态分数。
8. 通过率:某一考生群体中通过考试的人数与总考生数的百分比。大学英语考试设定的通过标准是报告分数 ≥60 分。通过率描述了某一考生群体达到大学英语四级教学大纲要求的比例,是评价学校外语教学的一个参考指标。值得提醒的是通过率不是描述
9. 优秀率:某一考生群体中优秀人数与总考生数的百分比。大学英语考试设定的优秀标准是报告分数 ≥85 分。优秀率也是评价学校外语教学的一个参考指标,但不是描述某一考生群体总体英语水平的良好指标,应慎重使用。
10.平均级点分:对某一考生群体成绩进行综合评估的统计指标,其计算公式为:![]()
其中 G 表示平均级点分,G i 表示某一考生的级点分,N 表示考试人数。G i 按下表计算:
![]() | 从平均级点分的计算方法可知,所有考试分数被划分为六个等级,各个等级被给予不同的级点分。考分越高,级点分也越高,不及格分数的级点分为 0。不同等级分数的级点分之间形成一定比例关系,反映了评判者对不同分数等级的重视程度。例如,一个考试分数在 85~94.5 之间的考生所得级点分相当于两个 60~64.5 之间考生所得级点分之和。因此,评判者意在鼓励考生取得更好的考试分数而不是仅仅满足于通过考试。平均级点分是评估某一群体英语总体水平的良好指标。 |
11.题目难度:对于 0-1 记分的试题,经典测量理论的题目难度是某一题目答对人数与总人数的比值;对于非 0-1 记分的试题,经典测量理论的题目难度是某一题目平均得分与题目满分的比值。由于经典测量理论的题目难度是根据样本数据计算的,因此在解释难度指标时不能脱离所依据的样本考生的实际能力水平,所抽样本应该对总体具有良好的代表性。
12. 题目区分度:经典测量理论的题目区度是某题得分与全卷分数间的相关系数。对于 0-1 记分的题目(例如选择题),通常使用二列相关( r bis )系数表示题目区分度。对于非 0-1 记分的题目,可用题目得分与全卷得分之间的积差相关系数来表示。一般认为,题目区分度的 r bis 值应 ≥0.2 才能够在正式考试中使用。
13. 试卷平均难度:试卷平均得分除以试卷满分的比值。大学英语考试通常将试卷平均难度控制在 0.5~0.6 之间。
14. 试题平均区分度:试卷中所有题目区分度的平均值。一般来说,所有题目的平均区分度指标
应控制在 0.4 以上为宜。
15. 试卷内部一致性信度(KR20 或 a 系数):反映测验内部题目得分一致性程度的统计指标,主要包括有 KR20 和 a 系数。其中 KR20 的计算方法是: 
式中 K表示题目数,σt 2 表示测验总分方差,p 表示每一道题答对人数比率,q=1-p。KR20主要适用于 0-1 记分题目测验的一致性信度计算。如果测验中包括有非 0-1 记分的题目,可选用 a 系数来计算一致性信度系数, a 系数的计算方法是: 
其中的σi 2 表示每个题目得分的方差。在大规模标准化测验中,一致性信度系数 KR20 应大于 0.9, a 系数也应在 0.80 以上。大学英语考试的这两项指标一直稳定地位于 0.85 以上。
16. 标准测量误差:表示测验分数与测量对象的真分数之间偏离程度的一种指标,测量误差越大,分数的可信度就越小,测量误差越小,就意味测量越精确。当已知测验的信度系数和测验分数的标准差时,计算测量标准误差公式为: ![]()
其中 s E 表示测量标准误差, s T 表示测验分数标准差, r tt 表示测验的一致性信度系数(可 KR20 或 a 系数来表示)。标准测量误差的大小与题目的质量、测验的长度等因素都有密切联系,在编制测验时,应根据设计的要求和考试的目的精确控制标准测量误差的大小,使之在可接受的范围之内。

RSS订阅