Immer wieder stoßen wir in unserem physiotherapeutischen Alltag z.B. in Fachzeitschriften, Fortbildungen und Studien auf die Begriffe Reliabilität und Validität. Ebendiese stellen die Hauptgütekriterien in der quantitativen Forschung dar und mit ihnen lässt sich die Qualität eines Tests oder eines Fragebogens bewerten (Bortz und Döring 2006).
Empirische Studien zu diesen Gütekriterien spielen eine große Rolle für Assessments in der Physiotherapie. Assessments bzw. klinische Testverfahren dienen zur Beurteilung des Zustandes und der Funktionsfähigkeit unserer Patienten. Standardisierte Assessments setzen wir in der Praxis ein zur Behandlungsplanung, Ergebnismessung und teilweise zur Prognose für ein Behandlungsergebnis. Des Weiteren helfen sie uns, effizienter mit anderen Berufsgruppen zu kommunizieren und geben dem Patienten die Möglichkeit, eine eigene Bewertung der Behandlung vorzunehmen. Mit der zunehmenden Akademisierung in der Physiotherapie werden sie mit wissenschaftlichen Studien untersucht und stellen somit eine Möglichkeit dar, den Inhalt und die Ergebnisse unserer physiotherapeutischen Arbeit professionell nach außen zu tragen (Scherfer 2003, Westerhuis et al. 2011). Im Folgenden werden die Gütekriterien Reliabilität und Validität kurz näher erläutert.
Reliabilität wird auch als Reproduzierbarkeit oder Zuverlässigkeit bezeichnet. Diese kennzeichnet bei einem Test den Grad der Genauigkeit, mit dem das zu prüfende Merkmal gemessen wird. Ein Test bzw. Messverfahren gilt dann als reliabel, wenn wiederholte Messungen unter gleichen Bedingungen zum gleichen Ergebnis führen. Es wird zwischen der Intratester-Reliabilität und der Intertester-Reliabilität unterschieden (Oesch et al. 2011).
Während bei der Intratester-Reliabilität (auch Intrarater-Reliabilität) eine Messung immer vom gleichen Untersucher wiederholt wird, wird bei der Intertester-Reliabilität (auch Interrater-Reliabilität) die gleiche Messung von mindestens zwei Untersuchern wiederholt (Oesch et al. 2011).
Die Validität (auch Gültigkeit genannt) ist das bedeutendste Testgütekriterium. Diese gibt an, ob ein Test bzw. ein Testinstrument tatsächlich das misst, was es messen soll bzw. was es zu messen vorgibt. Validität kann noch weiter in Augenscheinvalidität, Inhaltsvalidität, Kriteriumsvalidität und Konstruktvalidität eingeteilt werden. Da jedoch bei physiotherapeutischen Studien meist nur von der Validität gesprochen bzw. diese untersucht wird, wird an dieser Stelle nicht weiter darauf eingegangen. Für eine Vertiefung dieser Thematik und für Interessierte kann ich euch das Buch „Forschungsmethoden und Evaluation“ von Bortz und Döring empfehlen.
Wichtig ist es zu wissen, dass Reliabilität und Validität sich bedingen. Dies bedeutet, dass Instrumente bzw. Messungen oder Tests, die nicht reliabel sind, auch nicht valide sein können. Jedoch kann eine Messung oder ein Test hoch reliabel und dennoch nicht valide sein. Somit ist Reliabilität eine notwendige, aber nicht hinreichende Voraussetzung für die Validität von Messungen oder Tests (Scherfer 2004).