04698_1: 1.语言测试的信度

1.语言测试的信度

信度包括试题的信度和评分员的信度。

试题信度

指试题本身可靠，即同一份试题在不同的时间测试同一群学生，其结果应大体一致。

影响试题信度的因素为试题选样的广泛性和有效性。一般说来，试题选样越广越有效，对学生知识和能力的测量就越可靠。

评分员信度

指评分员两次或多次评估同样试卷所得结果相对稳定的信度。

根据测量原理，测试考试信度的方法有很多，语言测试领域主要用以下几种方法：

第一种是重复测试法，也叫“再测信度”。

重复测验的内涵

用同一考试对同一群学生在不同时间内先后施测两次，这两次考试分数的相关系数就是再测信度。

这一系数反映了同一个考试在同一群考生上跨时间的一致性程度，所以又叫稳定性系数。

测试的信度系数介于1和0之间。系数越大，信度越高。任何大规模标准化考试的信度系数至少应为 0.90。

存在问题

重复测试法简单好用，但也有很多弊端，多数测试不能或不适合实施两次：

如果间隔时间过长，考生的水平会发生变化；如果间隔时间短，受试者对上次考试仍有记忆。

任何一次施测中都会有偶然因素的干扰，如记忆错误、情绪波动、健康状况、考试动机的变化等都会影响稳定系数。

第二，平行卷测试法，也称为“复本信度”。

即用两份题型、内容等值但具体题目不同的平行试卷，对同一批受试者在时间间隔不太长的情况下进行测试，然后计算出两次测试的相关系数。

最大难题：如何保证两份平行试卷的难易程度完全相同

第三，对半测试法。

对半测试法是把一份试卷作为两个相对独立的部分，通过对这两部分分数的比较来获得整份试卷的信度。

两个部分的分数一致性越高，试卷的信度也就越高。

对半测试法是用来评估一份试题内部一致性的程度。

这种方法避免了重复测试法和平行卷测试法因施两次考试所带来的问题，只需一份试卷，而且只需测试一次。但是同一份试卷折半的方法不同，得出的信度也会有所不同。

(1)测试的题目。题目的取样、长度、难度、区分度等都是影响信度的因素。例如题量太少,被试答对或者答错题目的偶然性就比较大,测验也就不可靠。一般来讲，测验题目数量越多，信度越高。但是题目的数量也不能无限增加，过多的题目容易导致被试疲劳或厌倦，信度反而会下降。

(2)被试的多样性。被试的水平差异越大,测验分数的变异范围就越大，测验的可靠性就越高。

(3)阅卷评分。这是影响信度的重要因素。即使客观性测试，若采用人工阅卷，也会有误判的情况存在。采用阅卷机评卷，会大大降低误判率。