The importance of reading competence for both individuals and society underlines the strong need to understand the gender gap in reading achievement. Beyond mean differences in reading comprehension, research has indicated that girls possess specific advantages on constructed‐response items compared with boys of the same reading ability. Moreover, it was shown that differences in intrinsic motivation in the tested domain might affect test scores. Differential item functioning was used to analyze the complex relationships among gender, item format, and intrinsic reading motivation in two samples taken from large‐scale German assessments of reading comprehension (PIRLS 2011 and PISA 2009). In line with prior research, results showed that compared with equally skilled boys, both 10‐ and 15‐year‐old girls performed better on constructed‐response items. Furthermore, findings suggest an advantage of 15‐year‐old but not 10‐year‐old students with high levels of intrinsic reading motivation when responding to constructed‐response items. Results are discussed in relation to the design and interpretation of (large‐scale) assessments, the increasing use of constructed‐response items in new assessments in response to the Common Core State Standards, and gender‐sensitive educational practice.
Zusammenfassung. Die vorliegende Studie befasst sich mit Entwicklung eines Itempools für einen computeradaptiver Test (CAT) zur Erfassung von Textverständnis in der Grundschule. Der Effizienzgewinn von CATs im Vergleich zu Tests mit festgelegter Itemabfolge (FITs) wird untersucht. Für die Kalibrierung eines Textverständnisitempools wurden Stichproben von N = 1 975 Schülerinnen und Schülern aus der 3. und 4. Klassenstufe erhoben. Der finale Itempool umfasst 132 auf Messgüte geprüfte Items. Eine CAT Simulation mit 25 Items zeigte, dass ein CAT das Textverständnis mit sehr guter Reliabilität ( Releap ≈ .92) erfassen kann. Ein CAT mit 8 Items erreichte eine gute Reliabilität ( Releap ≈ .80). Analysen zur Konstruktvalidierung werden berichtet. Ein CAT basierend auf dem Itempool misst bis zu 19 % effizienter als ein vergleichbarer FIT und wäre besonders für die Erfassung von Textverständnis bei Schülerinnen und Schülern eines breiten Leistungsspektrums und für die Lernverlaufsdiagnostik geeignet.
A multidimensional Bayesian item response model is proposed for modeling item position effects. The first dimension corresponds to the ability that is to be measured; the second dimension represents a factor that allows for individual differences in item position effects called persistence. This model allows for nonlinear item position effects on the item side as well as on the person side. Moreover, a flexible loading structure on the two dimensions is allowed. A fully Bayesian estimation procedure is proposed, and its performance is investigated by a simulation study. Further, the model is applied to empirical data collected in the Programme for International Student Assessment 2000 in the reading domain. The additional value of the model’s extended flexibility compared to more restrictive models is shown. The findings show that the linear hypothesis of change in performance during a test does not hold in general.
A matrix of discrimination measures (discrimination probabilities, numerical estimates of dissimilarity, etc.) satisfies Regular Minimality (RM) if every row and every column of the matrix contains a single minimal entry, and an entry minimal in its row is minimal in its column. We derive a formula for the proportion of RM-compliant matrices among all square matrices of a given size and with no tied entries. Under a certain “meta-probabilistic” model this proportion can be interpreted as the probability with which a randomly chosen matrix turns out to be RM-compliant.
Schulleistungsstudien zeigen für verschiedene Altersstufen und Kompetenzbereiche absolute Leistungsrückstände bei Kindern mit im Vergleich zu Kindern ohne Migrationshintergrund. Ausgehend von der Annahme, dass die betrachteten Schülergruppen in ihren Lesekompetenzen unterschiedliche Profile aufweisen, untersucht der vorliegende Beitrag anhand der Lesetestaufgaben von IGLU 2001 mit differentiellen Item-Analysen, ob bei Kontrolle von Fähigkeitsunterschieden subgruppenspezifische Differenzen in den Lösungswahrscheinlichkeiten bestimmter Itemgruppen bestehen. Die Befunde weisen auf relative Stärken und Schwächen beider Schülergruppen in Abhängigkeit vom Antwortformat der Aufgaben, nicht jedoch von der Textgattung hin. Die Ergebnisse werden mit Blick auf mögliche Handlungsansätze im schulischen Kontext diskutiert.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.