ERIC - Search Results

Publication Date

In 2025	0
Since 2024	0
Since 2021 (last 5 years)	0
Since 2016 (last 10 years)	1
Since 2006 (last 20 years)	2

Source

Applied Measurement in…	1
Educational Research and…	1
Evaluation and Program…	1

Author

Solano-Flores, Guillermo	2
Li, Min	1
Phillips, Gary W., Ed.	1
Ruiz-Primo, Maria Araceli	1
Rupp, André A.	1
Shavelson, Richard J.	1

Publication Type

Reports - Descriptive	4
Journal Articles	3

Education Level

Audience

Location

Laws, Policies, & Programs

Assessments and Surveys

What Works Clearinghouse Rating

Showing all 4 results Save | Export

Designing, Evaluating, and Deploying Automated Scoring Systems with Validity in Mind: Methodological Design Decisions

Peer reviewed

Direct link

Rupp, André A. – Applied Measurement in Education, 2018

This article discusses critical methodological design decisions for collecting, interpreting, and synthesizing empirical evidence during the design, deployment, and operational quality-control phases for automated scoring systems. The discussion is inspired by work on operational large-scale systems for automated essay scoring but many of the…

Descriptors: Design, Automation, Scoring, Test Scoring Machines

Generalizability Theory and the Fair and Valid Assessment of Linguistic Minorities

Peer reviewed

Direct link

Solano-Flores, Guillermo; Li, Min – Educational Research and Evaluation, 2013

We discuss generalizability (G) theory and the fair and valid assessment of linguistic minorities, especially emergent bilinguals. G theory allows examination of the relationship between score variation and language variation (e.g., variation of proficiency across languages, language modes, and social contexts). Studies examining score variation…

Descriptors: Measurement, Testing, Language Proficiency, Test Construction

Toward a Science Performance Assessment Technology.

Peer reviewed

Shavelson, Richard J.; Solano-Flores, Guillermo; Ruiz-Primo, Maria Araceli – Evaluation and Program Planning, 1998

Research on developing technology for large-scale performance assessments in science is reported briefly, and a conceptual framework is presented for defining, generating, and evaluating science performance assessments. Types of tasks are discussed, and the technical qualities of performance assessments are discussed in the context of…

Descriptors: Educational Technology, Generalizability Theory, Models, Performance Based Assessment

Technical Issues in Large-Scale Performance Assessment.

Download full text

Phillips, Gary W., Ed. – 1996

Recently, there has been a significant expansion in the use of performance assessment in large scale testing programs. Although there has been significant support from curriculum and policy stakeholders, the technical feasibility of large scale performance assessments has remained a question. This report is intended to contribute to the debate by…

Descriptors: Comparative Analysis, Generalizability Theory, Performance Based Assessment, Psychometrics

Generalizability Theory	4
Test Construction	4
Performance Based Assessment	2
Test Validity	2
Automation	1
Best Practices	1
Bilingualism	1
Comparative Analysis	1
Computer Assisted Testing	1
Culture Fair Tests	1
Data Collection	1
Data Interpretation	1
Decision Making	1
Design	1
Educational Technology	1
English (Second Language)	1
Error of Measurement	1
Essay Tests	1
Information Management	1
Interdisciplinary Approach	1
Language Minorities	1
Language Proficiency	1
Language Variation	1
Measurement	1
Models	1
More ▼