Was macht einen guten Test aus? Part 1

In unserem Alltag spielen sie eine wichtige Rolle: Tests, die helfen können, Beschwerden unserer Patient*innen einzuordnen und im Verlauf der Behandlungen Veränderungen zeigen zu können. Doch bei all den Tests, die einem so über den Weg laufen: Wie soll man wissen, welche wirklich hilfreich sind? Natürlich wird erstmal jeder, der euch einen Test zeigt, davon ausgehen, dass dieser auch wirklich aussagekräftig ist. Leider ist das aber nicht immer der Fall. Und aus diesem Grund gibt es verschiedene Kriterien, die uns als Leitfaden dienen können, wenn wir die Qualität von Tests recherchieren wollen. Bevor ich jetzt einfach alle Kriterien runter rattere, werde ich ein paar Tests auswählen, anhand derer sich die Merkmale für einen guten Test erklären lassen.

Fangen wir mit den „Ottawa Ankle Rules“ an. Diese sind eine Testmöglichkeit, die sehr hilfreich sein kann, wenn es um die Beurteilung des Schweregrades bei einem Supinationstrauma des Sprunggelenks geht. Kurz zusammengefasst geht es um den Ausschluss von knöchernen Verletzungen ohne den Einsatz von Röntgenuntersuchungen. Dafür wird der betroffene Fuß an verschiedenen Punkten (siehe Bild) untersucht

Bachmann et al. (2003)

Zusätzlich wird die betroffene Person gefragt, ob es ihr möglich war, direkt nach dem Verletzungsgeschehen vier Schritte zu gehen. Wenn die vier Palpationspunkte unauffällig sind und auch die vier Schritte möglich waren,  ist kein Röntgen nötig. Eine knöcherne Verletzung kann nahezu ausgeschlossen werden. Um bei einem Test eine Aussage mit so hoher Sicherheit treffen zu können, muss er eine sehr hohe Sensitivität haben. Und schon sind wir beim ersten wichtigen Kriterium, über das wir sprechen wollen:

Die Sensitivität eines Tests ist entscheidend dafür, wie gut er ist, sodass keine Patient*innen übersehen werden, die tatsächlich verletzt oder krank sind. In diesem Fall können uns die „Ottawa Ankle Rules“ sehr gut dabei helfen, dass niemand unentdeckt bleibt, der sich beim Umknicken auch knöcherne Begleitverletzungen zugezogen hat. Der Sensitivitätswert liegt bei fast 100 Prozent. 

Ganz anders sieht es bei Kriterium Nummer zwei aus: Die Spezifität. Hiermit ist die Fähigkeit eines Tests gemeint, eine ganz bestimmte Verletzung oder Krankheit festzustellen. Hätten die „Ottawa Ankle Rules“ einen sehr hohen Wert bei der Spezifität, wären sie dazu in der Lage uns zu sagen, ob jemand eine knöcherne Verletzung hat. Leider liegt die Spezifität hier je nach Studie nur bei 25-50%.

Wenn man zum ersten Mal mit diesen beiden Begriffen in Berührung kommt, mag das erstmal sehr ähnlich klingen. Allerdings ist der Unterschied sehr wichtig, um zu wissen, wofür ein Test geeignet ist. 

Hilfreich ist vielleicht folgende Einteilung:

Spezifität:

  • Ein Test kann richtig positiv sein: Bezogen auf unser Beispiel hätte ein*e Patient*in eine im Röntgen bestätigte Fraktur, nachdem auch unsere Untersuchung auf eine knöcherne Verletzung hat schließen lassen (hohe Spezifität)
  • Der Test kann falsch positiv sein: Wir glauben nach der Durchführung unseres Tests, dass eine Verletzung vorliegt. Diese Vermutung bestätigt sich dann aber nicht auf den Röntgenbildern.

Sensitivität:                                                                                                              

  • Er kann richtig negativ sein: Unser Test ist unauffällig. Bei der Palpation ist nichts auffällig und auch vier Schritte sind möglich. Demnach ist kein Röntgen notwendig. Würde man aber Bilder machen, würde sich das Testergebnis bestätigen.
  • Der Test kann falsch negativ sein: Wir kommen bei unserer Untersuchung zum selben Schluss wie zuvor. Nur sind beim anschließenden Röntgen knöcherne Verletzungen zu erkennen.         

Im Idealfall hat ein Test also sowohl eine hohe Sensitivität, als auch eine hohe Spezifität. Man könnte also zum einen sicher sein, dass ein positiver Test auch wirklich positiv ist. Zum anderen würde bei einem negativem Test niemand durchrutschen, der tatsächlich nicht negativ ist. 

Nun gibt es aber genug Tests, die ihre Stärke nur in einem der beiden Bereiche haben (siehe wieder die „Ottawa Ankle Rules“). Es ist also sehr wichtig zu wissen, wo die Stärken und Schwächen der Tests liegen, die wir in unserem Alltag nutzen. Wenn wir also jeder Person erzählen, die einen positiven Test hat, dass sie wahrscheinlich eine knöcherne Begleitverletzung hat, überschätzen wir seine Aussagekraft eindeutig. Vielmehr wäre es richtig zu sagen, dass eine Fraktur nicht ausgeschlossen werden kann und deswegen eine Kontrolluntersuchung per Röntgen gemacht werden sollte. Also erst, wenn man die Stärken und Schwächen seiner Tests kennt, werden sie in unserem Alltag wirklich hilfreich sein. 

Zum Abschluss von Teil 1 noch ein wichtiger Punkt. Um einen Test bewerten zu können, benötigt man den sogenannten Goldstandard. Damit ist ein Test gemeint, der mit größter Wahrscheinlichkeit die korrekte Diagnose angibt. Wenn wir uns wieder auf unser Beispiel beziehen, wäre die Untersuchung per Röntgen der Goldstandard. Dementsprechend wird auch in der Berechnung von Sensitivität und Spezifität der Ottawa Ankle Rules die Ergebnisse der Untersuchung mit Ergebnissen des Goldstandards verglichen. Der ist wiederum auch nur der gängige bzw. aktuell beste Test auf dem Markt für die jeweilige Fragestellung. Und ist die Qualität hier nicht besonders hoch, so hat das auch negative Auswirkungen auf die Aussagekraft der Tests, die mit ihm verglichen werden. 

Hoffentlich ist mit diesem ersten Artikel  etwas klarer geworden, dass nicht jeder Test ein Allrounder ist und wir wissen sollten, wobei sie uns genau helfen können. Im nächsten Teil geht es dann weiter mit Reliabilität und Co. 

Quellen/ Was ich gelesen habe:

Assessments in der Rehabilitation, Band 2: Bewegungsapparat; Peter Oesch (Hrsg.)

Einführung in die Medizinische Statistik; Hilgers, Bauer, Schreiber 

Bachmann et al. (2003) Accuracy of Ottawa ankle rules to exclude fractures of the ankle and mid-foot: systematic review

Fritz & Wainner (2001) Examining Diagnostic Tests: An Evidence-Based Perspective

Shojaee et al. (2016) Screening Characteristics of Ultrasonography in Detec- tion of Ankle Fractures

Marder (1994) Current Methods for the Evaluation of Ankle Ligament Injuries

 Jenkin et al. (2010) Clinical Usefullness of the Ottawa Ankle Rules for detecting Fractures of the Ankle and Mitfoot

Kamper (2019) Reliability and Validity: Linking Evidence to Practice