ERIC - Search Results

Publication Date

In 2025	0
Since 2024	0
Since 2021 (last 5 years)	0
Since 2016 (last 10 years)	1
Since 2006 (last 20 years)	2

Descriptor

Generalizability Theory	3
Test Construction	3
Alternative Assessment	1
Automation	1
Best Practices	1
Child Development	1
Cognitive Tests	1
Computer Assisted Testing	1
Data Collection	1
Data Interpretation	1
Decision Making	1
Design	1
Disabilities	1
Educational Assessment	1
Error of Measurement	1
Essay Tests	1
Evaluation Criteria	1
Evaluation Methods	1
Grade 10	1
Grade 5	1
Grade 8	1
Information Management	1
Interdisciplinary Approach	1
Mathematics Tests	1
Metacognition	1
More ▼

Source

Applied Measurement in…

Author

Pastor, Dena A.	1
Quellmalz, Edys S.	1
Rupp, André A.	1
Taylor, Melinda Ann	1

Publication Type

Journal Articles	3
Reports - Descriptive	1
Reports - Evaluative	1
Reports - Research	1

Education Level

Elementary Education	1
Elementary Secondary Education	1
Grade 10	1
Grade 5	1
Grade 8	1
High Schools	1
Intermediate Grades	1
Junior High Schools	1
Middle Schools	1
Secondary Education	1

Audience

Location

Laws, Policies, & Programs

Assessments and Surveys

What Works Clearinghouse Rating

Showing all 3 results Save | Export

Designing, Evaluating, and Deploying Automated Scoring Systems with Validity in Mind: Methodological Design Decisions

Peer reviewed

Direct link

Rupp, André A. – Applied Measurement in Education, 2018

This article discusses critical methodological design decisions for collecting, interpreting, and synthesizing empirical evidence during the design, deployment, and operational quality-control phases for automated scoring systems. The discussion is inspired by work on operational large-scale systems for automated essay scoring but many of the…

Descriptors: Design, Automation, Scoring, Test Scoring Machines

An Application of Generalizability Theory to Evaluate the Technical Quality of an Alternate Assessment

Peer reviewed

Direct link

Taylor, Melinda Ann; Pastor, Dena A. – Applied Measurement in Education, 2013

Although federal regulations require testing students with severe cognitive disabilities, there is little guidance regarding how technical quality should be established. It is known that challenges exist with documentation of the reliability of scores for alternate assessments. Typical measures of reliability do little in modeling multiple sources…

Descriptors: Generalizability Theory, Alternative Assessment, Test Reliability, Scores

Developing Criteria for Performance Assessments: The Missing Link.

Peer reviewed

Quellmalz, Edys S. – Applied Measurement in Education, 1991

It is proposed that criteria for evaluating the quality of performance should be defined, at least tentatively, during the initial design of a performance assessment. Six characteristics of sound criteria are (1) significance; (2) fidelity; (3) generalizability; (4) developmental appropriateness; (5) accessibility; and (6) utility. (SLD)

Descriptors: Child Development, Cognitive Tests, Educational Assessment, Evaluation Criteria