ERIC - Search Results

Descriptor

Interrater Reliability	2
Measurement Techniques	2
Scores	2
Test Reliability	2
Test Validity	2
Criteria	1
Educational Assessment	1
Evaluation Methods	1
Generalization	1
Performance Based Assessment	1
Performance Tests	1
Public Policy	1
Quality Control	1
Scoring	1
Student Evaluation	1
Test Construction	1
Test Interpretation	1
Test Use	1
More ▼

Source

Applied Measurement in…

Author

Dunbar, Stephen B.	1
Fisher, Steve	1
Johnson, Robert L.	1
Kuhs, Therese	1
Penny, Jim	1

Publication Type

Journal Articles	2
Reports - Evaluative	1
Reports - Research	1
Speeches/Meeting Papers	1

Education Level

Audience

Location

Laws, Policies, & Programs

Assessments and Surveys

What Works Clearinghouse Rating

Showing all 2 results Save | Export

Score Resolution: An Investigation of the Reliability and Validity of Resolved Scores

Peer reviewed

Direct link

Johnson, Robert L.; Penny, Jim; Fisher, Steve; Kuhs, Therese – Applied Measurement in Education, 2003

When raters assign different scores to a performance task, a method for resolving rating differences is required to report a single score to the examinee. Recent studies indicate that decisions about examinees, such as pass/fail decisions, differ across resolution methods. Previous studies also investigated the interrater reliability of…

Descriptors: Test Reliability, Test Validity, Scores, Interrater Reliability

Quality Control in the Development and Use of Performance Assessments.

Peer reviewed

Dunbar, Stephen B.; And Others – Applied Measurement in Education, 1991

Issues pertaining to the quality of performance assessments, including reliability and validity, are discussed. The relatively limited generalizability of performance across tasks is indicative of the care needed to evaluate performance assessments. Quality control is an empirical matter when measurement is intended to inform public policy. (SLD)

Descriptors: Educational Assessment, Generalization, Interrater Reliability, Measurement Techniques