ERIC - Search Results

Publication Date

In 2026	0
Since 2025	0
Since 2022 (last 5 years)	0
Since 2017 (last 10 years)	2
Since 2007 (last 20 years)	2

Descriptor

Performance Based Assessment	3
Data Analysis	2
Evaluators	2
Generalizability Theory	2
Interrater Reliability	2
Reliability	2
Scores	2
Scoring	2
Accuracy	1
Bias	1
Discussion	1
English	1
English for Academic Purposes	1
Error of Measurement	1
Evaluation Methods	1
Foreign Countries	1
Item Response Theory	1
Japanese	1
Language Tests	1
Medicine	1
Mixed Methods Research	1
Monte Carlo Methods	1
Performance Tests	1
Second Language Learning	1
Second Languages	1
More ▼

Source

Language Testing

Author

Janssen, Gerriet	1
Kozaki ,Y.	1
Lin, Chih-Kai	1
Meier, Valerie	1
Trace, Jonathan	1

Publication Type

Journal Articles	3
Reports - Research	3

Education Level

Audience

Location

Colombia

Laws, Policies, & Programs

Assessments and Surveys

What Works Clearinghouse Rating

Showing all 3 results Save | Export

Working with Sparse Data in Rated Language Tests: Generalizability Theory Applications

Peer reviewed

Direct link

Lin, Chih-Kai – Language Testing, 2017

Sparse-rated data are common in operational performance-based language tests, as an inevitable result of assigning examinee responses to a fraction of available raters. The current study investigates the precision of two generalizability-theory methods (i.e., the rating method and the subdividing method) specifically designed to accommodate the…

Descriptors: Data Analysis, Language Tests, Generalizability Theory, Accuracy

Measuring the Impact of Rater Negotiation in Writing Performance Assessment

Peer reviewed

Direct link

Trace, Jonathan; Janssen, Gerriet; Meier, Valerie – Language Testing, 2017

Previous research in second language writing has shown that when scoring performance assessments even trained raters can exhibit significant differences in severity. When raters disagree, using discussion to try to reach a consensus is one popular form of score resolution, particularly in contexts with limited resources, as it does not require…

Descriptors: Performance Based Assessment, Second Language Learning, Scoring, Evaluators

Using GENOVA and FACETS to Set Multiple Standards on Performance Assessment for Certification in Medical Translation from Japanese into English

Peer reviewed

Direct link

Kozaki ,Y. – Language Testing, 2004

This article presents a standard-setting procedure for performance assessment in a foreign language, through which some of the major problems facing performance assessment in criterion-referenced testing can be addressed. The procedure, which was geared to revealing and accommodating inter-judge variability, employed the synergy of multiple…

Descriptors: Data Analysis, Testing, Performance Tests, Generalizability Theory