Site menu:

Sprache auf englisch umschalten

Diskrepanzvergleiche und Konfidenzintervalle bei psychometrischen Testergebnissen



Die Seite enthält verschiedene Werkzeuge zur Analyse der Ergebnisse psychometrischer Testverfahren, wie z.B. zur Berechnung von Konfidenzintervallen und Diskrepanzvergleichen.

  1. Konfidenzintervalle von psychometrischen Testergebnissen
  2. Test auf Unterschied von festem Wert
  3. Test auf Unterschiede bei Messwiederholung (Reliable Change)
  4. Diskrepanz zweier Testergebnisse einer Person
  5. Profilanalyse: Test auf Gleichheit, Struktur und Profilhöhe zweier Profile
  6. Quellenangaben


1. Konfidenzintervalle von psychometrischen Testergebnissen

Die Ergebnisse psychometrischer Testverfahren sind mit einer Ungenauigkeit behaftet. Konfidenzintervalle sind eine Schätzung des Bereichs, in dem der wahre Wert mit einer bestimmten Sicherheitswahrscheinlichkeit liegt. Die folgende Berechnung ermittelt das Konfidenzintervall auf der Basis des Standardschätzfehlers. Das Ergebnis kann zusätzlich um den Effekt der Regression zur Mitte korrigiert werden. In diesem Fall wird auch der geschätzte Wert ausgegeben.

Art des Wertes
Wert
Reliabilität
Konfidenz
Regression zur Mitte
Geschätzter Wert
Konfidenzintervall

Die Berechnung erfolgt nach folgender Formel (Korrektur durch Regression zur Mitte mit Schätzwert zpredicted = zscore * rel; Standardschätzfehler siehe Krum et al., 2022, S. 149):

conf = score ± SD z 1 - α 2 rel ( 1 rel )

Im Falle von Prozenträngen werden diese zunächst in z-Werte umgewandelt und anschließend die Intervallgrenzen neu berechnet. Bitte beachten Sie, dass diese Vorgehensweise nur für Reliabilitätskoeffizienten > .5 sinnvoll ist. Liegt der Wert darunter, wird der Standardmessfehler statt des Standardschätzfehlers verwendet.



2. Test auf Unterschied von festem Wert

Wenn gegen einen festen Wert getestet werden soll, genügt es, das einseitige Konfidenzintervall zu verwenden und mit z1-α zu testen (Krum et al., 2022, S. 151 f.). Es muss dann allerdings spezifiziert werden, in welche Richtung das Ergebnis abgesichert werden soll. Außerdem ist die genaue Formulierung der Hypothese wichtig. Aufgrund der höheren Genauigkeit der Berechnung sollte auch hier die Regressionskorrektur zur Mitte angewendet werden.

Erreicht eine Person beispielsweise einen IQ von 135, kann geprüft werden, ob das Ergebnis signifikant über einem Wert von 130 liegt, der als Schwelle für Hochbegabung gilt. In diesem Fall müsste das Ergebnis signifikant höher als 130 sein (als Richtung ist "... ist höher als ..." anzugeben). Eine andere Frage kann sein, ob Hochbegabung ausgeschlossen werden kann, z. B. bei einem Ergebnis von 122. In diesem Fall würde man nach oben absichern (Richtung "... ist kleiner als ...") und ein nicht signifikantes Ergebnis benötigen, was der Aussage entsprechen würde, dass eine Hochbegabung nicht ausgeschlossen werden kann.


Art des Wertes
Ergebnis
Richtung der Absicherung
Schwelle
Reliabilität
Signifikanzniveau
Regression zur Mitte
Ergebnis des Hypothesentests

Die Prüfung erfolgt einseitig auf der Basis des Standardmessfehlers nach folgender Formel (Regressionskorrektur zur Mitte erfolgt mit dem Schätzwert zpredicted = zscore * rel):

cutoff = score ± SD z 1 - α 1 rel

Im Falle von Prozenträngen werden diese zunächst in z-Werte umgewandelt und anschließend die Intervallgrenzen neu berechnet.





3. Test auf Unterschiede bei Messwiederholung (Reliable Change)

Wird ein Test bei einer Person wiederholt, kann der sogenannte Reliable Change Index (RCI; Jacobson & Truax, 1991; siehe auch Krum et al., 2022, S. 153) ermittelt werden. Der RCI kann als Testvariable eines z-Tests interpretiert werden. Mit ihm kann ausgedrückt werden, ob es signifikante Unterschiede zwischen zwei Testergebnissen gibt, d.h. ob z.B. eine Intervention zu einer signifikanten Veränderung von Merkmalen geführt hat.

Art des Ergebnisses
Ergebnis 1
Ergebnis 2
Reliabilität
Prüfgröße
Interpretation

Wie bei Rechner 1 und 2 werden die Prozentränge vor der Berechnung in z-Werte der inversen kumulativen Normalverteilung umgewandelt. Die Formel zur Berechnung des RCI nach Jacobson und Truax (1991; basierend auf Krum et al., 2022, S. 153):

RCI = x 1 x 2 SD 2 ( 1 rel )





4. Diskrepanz zweier Testergebnisse einer Person

Wenn eine Person mit verschiedenen Testverfahren oder Skalen eines Testverfahrens untersucht wird, kann es interessant sein, die Ergebnisse zu vergleichen. Beispielsweise kann untersucht werden, ob das logische Denkvermögen besser ausgeprägt ist als das Sprachverständnis - sofern entsprechende Intelligenztests nicht bereits Analysemöglichkeiten bieten. Oder man möchte klären, ob sich die Belastungswerte verschiedener klinischer Symptome in ihrer Höhe unterscheiden.

Art des Ergebnisses
Ergebnis 1
Ergebnis 2
Reliabilität 1
Reliabilität 2
Prüfgröße
Interpretation

Wie bei den vorhergehenden Berechnungen werden die Prozentränge vor der Berechnung wieder mittels der inversen kumulativen Normalverteilung in z-Werte umgewandelt. Generell ist das Verfahren auch für Rohwerte geeignet, sofern der Populationsmittelwert bekannt ist. Dies ist bei der Verwendung von Normwerten per se gegeben. Für beide Prüfergebnisse muss zunächst ein Wert Yi berechnet werden. Danach kann die Prüfgröße z berechnet werden. Die Formeln zur Berechnung der Prüfgröße für den Vergleich der Prüfergebnisse (Krum et al., 2022, S. 154f.):

Y i = X i rel i + M ( 1 - 1 rel i )

und

z diff = Y 1 - Y 2 SD 1-rel1 rel1 + 1-rel2 rel2





5. Profilanalyse: Test auf Gleichheit, Struktur und Profilhöhe zweier Profile

Profile psychometrischer Ergebnisse können auf Gleichheit (= Profilidentität), Struktur (= Profilgestalt) oder Ausprägung (= Profilhöhe) überprüft werden (vgl. Huber 1973, Kap. 10). Eine solche Vorgehensweise lässt sich beispielsweise auf Intelligenzprofile oder ein klinisches Belastungsspektrum vor und nach einer Therapie anwenden. Huber (1973, S.) gibt als Beispiel das Ergebnis einer 35jährigen Person im Intelligenzstrukturtest (IST; Amthauer, 1953) mit den folgenden Ergebnissen:

Untertest Messung 1 Messung 2
Satzergänzung 92 113
Wortauswahl 103 96
Analogie 93 113
Gemeinsamkeiten 100 116
Merkaufgaben 94 103
Rechenaufgaben 102 104
Würfelaufgaben 109 98

Die Ergebnisse sind als Standardwerte (M = 100, SD = 10) angegeben und die Untertests haben eine einheitliche Reliabilität von r = .9. Die Ergebnisse können nun darauf geprüft werden, ob beide Profile identisch sind und falls nein, ob sie sich in der Höhe, der Struktur oder beidem unterscheiden (Formeln s.u.).

Hypothesentest
Normskala
Anzahl an Untertests
Reliabilität
Gesamtreliabilität
Testergebnisse
Skala 1 Skala 2
Wert 1
Wert 2



Literatur

Zur Generierung der Chi2-Verteilung für die Profilanalyse wurde auf die Bibliothek jStat zurückgegriffen.

Zitierbare Quelle:
Lenhard, W. & Lenhard, A. (2023). Confidence intervals, test of discrepancy and profile analysis for psychometric results. available: https://www.psychometrica.de/discrepancy.html. Psychometrica.