Glossar

Absolutes Risiko (AR)

  • Das absolute Risiko schätzt die Wahrscheinlichkeit des Auftretens eines (in der Regel negativ bewerteten) Ereignisses bei einem bestimmten Menschen in einem bestimmten Zeitraum und leitet sich aus dessen Ereignisrate in der beobachteten (untersuchten) Gruppe ab. Der Bereich liegt zwischen 0 (= das Ereignis wird überhaupt nicht auftreten) und 1 (= das Ereignis wird auf jeden Fall auftreten).

Absolute Risikoreduktion (ARR)

  • Die ARR ist die (absolute) Differenz zweier Ereignisraten (Event Rates), eine z. B. aus der Interventionsgruppe (Verumgruppe), die andere aus der Kontrollgruppe (Placebogruppe). Die ARR wird berechnet als Ereignisrate in der Kontrollgruppe (Control Event Rate) minus die Ereignisrate in der Interventionsgruppe (Experimental Event Rate).
  • Beispiel: In einer mit Marcumar® behandelten Gruppe traten bei 2%, in der Placebogruppe bei 5% der Patienten Thrombosen auf. Das Risiko eine Thrombose zu erleiden konnte in der Interventionsgruppe um 3% gesenkt werden.

Absolute Risikozunahme (ARI, Absolute Risk Increase)

  • Beschreibt die absolute Differenz der Rate an ungünstigen Ereignissen in der experimentellen Gruppe (E) im Vergleich zur Kontrollgruppe (K), wenn die experimentelle Behandlung schlechter ist (ARI = K – E). Der Kehrwert der ARI ergibt die Number-Needed-to-Harm (1/ARI = NNH).

Alpha-Fehler (Fehler erster Art)

  • Der Alpha-Fehler (Fehler 1. Art) bezeichnet die Wahrscheinlichkeit, die Nullhypothese (z. B. es bestehe zwischen zwei Variablen kein überzufälliger Zusammenhang) nach der Untersuchung einer Stichprobe ab-zulehnen (also einen Zusammenhang anzunehmen), obwohl sie wahr ist (also in der Grundgesamtheit keiner existiert). Gewöhnlich werden der Alpha-Fehler und damit das Signifikanzniveau (P-Wert) mit 5% festgelegt, d. h. es wird in Kauf genommen dass 5 von 100 Testergebnissen „falsch positiv“ sind.

Assoziation (Zusammenhang, Beziehung)

 Ausschlusskriterien

 Behandlungseffekt (therapeutischer Effekt)

  • Ergebnis einer therapeutischen Intervention, welches in unterschiedlichen Maßzahlen ausgedrückt werden kann:
  • CER = Control Event Rate (Ereignisrate in der Kontrollgruppe)
  • EER = Experimental Event Rate (Ereignisrate in der Interventionsgruppe)
  • RRR = Relativ Risk Reduction = CEREER/CER
  • ARR = Absolute Risk Reduction = CEREER
  • NNT = Number Needed to Treat = 1/ARR

Behandlungsgruppe (Interventionsgruppe, Verumgruppe)

Beobachtervariabilität (Observer Variability)

  • Schwankungen von Mess- oder Untersuchungsergebnissen, die mit der Person des Beobachters in Zusammenhang stehen. Sie ist umso größer, je geringer die Reliabilität des verwendeten Messinstruments ist (z. B. Auskultation von Herztönen); Befunderhebung und/oder -interpretation sind ggf. beeinflussbar durch die subjektive Wahrnehmung, Erfahrung und Ausbildung, evtl. auch durch Wunschdenken des Untersuchers. Es werden unterschieden: 1. Die Intraobserver-Variabilität bezeichnet die Schwankungen der Ergebnisse, wenn eine Person den gleichen (unveränderten) Untersuchungsgegenstand mehrfach untersucht. 2. Die Interobserver-Variabilität bezeichnet die Schwankungen der Ergebnisse, wenn mehrere Personen denselben Untersuchungsgegenstand untersuchen.

 Beobachtungsgleichheit (Consistency of Observation)

 Beobachtungsstudie (Observational Study, nicht-experimentelle Studie)

  • Studien, in denen seitens der Untersucher keine aktive Zuordnung der Studienteilnehmer zu einer Expositionsbedingung oder Intervention vorgenommen wird.

Beta-Fehler (Fehler zweiter Art

  • Beta bezeichnet die Wahrscheinlichkeit, die Nullhypothese zu akzeptieren, obwohl sie falsch ist. (Fehler 2. Art). Gewöhnlich wird der Beta-Fehler mit 20% festgelegt, d. h. es besteht dann eine 80%ige Wahrscheinlichkeit einen in der Grundgesamtheit vorhandenen Gruppenunterschied in der Stichprobe als statistisch signifikant zu erkennen. Power = 1 – ß.

 Bias (systematischer Fehler)

  • Als Bias (engl. Plural: Biases; systematische Fehler) werden Einflüsse bezeichnet, die zu systematischen Verzerrungen der Studienergebnisse und der aus ihnen abgeleiteten Schlüsse führen. Sie können zu Unter- oder Überschätzung von Risiken führen. Ein Bias hat immer eine Richtung und ein Ausmaß.
  • Faktoren, die solche Abweichungen bewirken können, liegen im Studiendesign, in der Durchführung einer Studie, der Datenanalyse und –publikation. Üblicherweise werden zwei Kategorien von Biases unterschieden:
  • 1. Selektions-Bias: entstehen durch Fehler bei der Auswahl der Beobachtungseinheiten, wenn eine differenzielle Zuordnung nach Intervention/Exposition und Risikofaktor bzw. Erkrankung erfolgt.
  • 2. Informations-Bias (Syn. Observations-Bias): tritt dann auf, wenn differenzielle Fehler bei der Datenerhebung, -erfassung, oder Analyse wirksam werden.

 Carry-over-Effekt

  • Störender Effekt in Interventionsstudien mit Cross-over-Design, wenn die Behandlung der 1. Phase über das Ende dieser Phase hinaus und in die zweite Phase hinein wirkt. So kann das Ergebnis der Behandlung in der 2. Phase beeinflusst und der Vergleich verzerrt werden. Zur Vermeidung dieses Effekts kann vor die 2. Studienphase eine sogenannte Wash-out-Phase gesetzt werden, in der die Wirkungen vorangegangener Therapien abklingen.

 Confounder (Confounding, Störvariablen, Störgrößen)

  •  Confounder sind Faktoren, die nicht unmittelbar Gegenstand einer Untersuchung sind, aber sowohl un-abhängige Risikofaktoren des Outcomes als auch mit der Exposition assoziiert sind. Confounder können deshalb einen Zusammenhang zwischen zwei Faktoren vortäuschen, der real nicht existiert.
  • Ein Beispiel: Man findet eine Assoziation zwischen Kaffeetrinken und der Entwicklung von Pankreaskarzinomen. Bei genauerer Betrachtung fällt auf, dass in der Gruppe der Exponierten (Kaffeetrinker) das Durchschnittsalter höher ist. Alter ist in diesem Fall ein Confounder, weil es mit Kaffeetrinken assoziiert ist und gleichzeitig ein Risikofaktor für das Pankreaskarzinom ist.
  • Eine Kontrolle von Confoundern ist durch geeignete Maßnahmen (Restriktion, Randomisierung, Matching) im Studiendesign oder durch die Anwendung geeigneter statistischer Verfahren (Stratifizierung, Adjustierung bei multivariaten Analysen) bei der Datenauswertung möglich.
  • Ein Confounder unterscheidet sich dadurch von anderen Biases, dass sein Effekt in der Datenauswertung statistisch kontrolliert werden kann.

 Control Event Rate (CER, Ereignisrate der Kontrollgruppe)

  • Ereignisrate in der Kontrollgruppe von kontrollierten Studien. Die CER wird berechnet als die Anzahl der Ereignisse, dividiert durch die Gesamtzahl aller Studienteilnehmer in dieser Gruppe. Die CER wird für die Berechnung der absoluten Risikoreduktion und der relativen Risikoreduktion benötigt.

 Critical Appraisal

  • Kritische Bewertung der methodischen Studienqualität, die eine unverzichtbare Basis für die Validität der Studienergebnisse bildet. Critical Appraisal gehört zu den Kernkompetenzen für das Praktizieren von evidenzbasierter Medizin. Durch sie werden Daten zu Evidenzen.

 Cross-over – Design (Überkreuz-Design)

  • Kontrolliertes Studiendesign, in dem die Vergleichsgruppen nacheinander sowohl die Verumbehandlung(en), als auch die Kontrolltherapie erhalten. Zum Beispiel erhält Gruppe 1 zuerst Therapie A und setzt mit Therapie B fort. Gruppe 2 erhält zunächst Therapie B und setzt mit Therapie A fort. Neben dem Gruppenvergleich wird somit auch ein intraindividueller Vergleich der Wirksamkeit unterschiedlicher Interventionen möglich (cave Übertragungseffekte).

 Dichotome Variable

 Diskrete Variablen

  • Diskrete Variablen weisen im Gegensatz zu kontinuierlichen Variablen nur eine begrenzte Zahl eindeutig voneinander abgrenzbarer Zuständen auf (z. B. Augenfarbe: blau, grau, braun, grün). Eine Sonderform sind dichotome Variablen, die lediglich zwei Alternativen aufweisen, z. B. Raucher/Nichtraucher, lebend oder tot, Test-positiv oder Test-negativ.

 EbHC (Evidence based Health Care, Evidenzbasierte Gesundheitsversorgung)

  • EbHC bezeichnet die Lösung von Versorgungsfragen für ganze Bevölkerungsgruppen und die Entwicklung von Steuerungsinstrumenten für das Gesundheits- und Sozialsystem auf der Basis der besten verfügbaren, systematisch aufgearbeiteten externen Evidenz, v. a. aus evaluativen klinischen und Versorgungsstudien.

 EbM (Evidenzbasierte Medizin, Evidence based Medicine)

  • EbM ist der gewissenhafte, explizite und vernünftige Gebrauch der gegenwärtig besten externen, wissenschaftlichen Evidenz für Entscheidungen in der medizinischen Versorgung individueller Patienten. Die Praxis der EbM bedeutet die Integration individueller klinischer Expertise mit der bestmöglichen externen Evidenz aus systematischer Forschung (Sackett et al, 1996). Haynes et al haben (2002) auf die zusätzliche Bedeutung der jeweils gegebenen „clinical states and circumstances“ und „patients’ preferences and actions“ hingewiesen.

 Effectiveness (Effektivität, Wirksamkeit unter Alltagsbedingungen)

  • Die unter Alltagsbedingungen beobachtete Wirksamkeit einer medizinischen Intervention/Therapie. Sie ist oft (aber nicht zwangsläufig) niedriger als die „efficacy“.

 Effektgröße (Effect Size)

  • Effektgrößen quantifizieren die Auswirkungen eines bestimmten Faktors (Exposition) auf die Häufigkeit oder das Risiko einer Zielgröße (z. B. Erkrankung). Im engeren Sinne standardisieren sie beobachtete Mittelwert-differenzen (z. B. mittlerer Gewinn von Lebensqualität in der Verum- minus Kontrollgruppe) an einer dazugehörenden Standardabweichung (z. B. der Initialmessung in der KG oder der Differenzwerte).

 Effektmaß

 Efficacy (Wirksamkeit unter Idealbedingungen)

  • Die unter Idealbedingungen (in einer klinischen Studie à RCT) beobachtete Wirksamkeit einer medizinischen Intervention/Therapie

Efficiency (Effizienz)

  • Wirksamkeit einer Therapie unter Alltags- oder Studienbedingungen in Relation zu den aufgewendeten geldwerten Ressourcen. Eine effiziente Leistung erzielt den größtmöglichen Nutzen zu den geringstmöglichen Kosten. Effizienz kann durch Erhöhung der Effektivität und/oder durch Erniedrigung von Kosten gesteigert werden.

 Einschlusskriterien

 Empfehlungsstärke (Grade of Recommendation)

  • In evidenzbasierten Leitlinien wird die Stärke von Empfehlungen zur Durchführung von diagnostischen oder therapeutischen Maßnahmen in unterschiedlichen Stufen angegeben. Es ist hauptsächlich die Qualität der jeweiligen Evidenzbasis, die die Stärke der Empfehlung bestimmt, wobei die Einteilung nach guter, mäßiger oder geringer Evidenz von Design und Durchführungsqualität der Studie abhängt. Wichtig sind weiter die Nützlichkeit der Maßnahmen und ihre jeweilige Akzeptanz und Realisierbarkeit.

 Entscheidungsanalyse (Decision Analyses)

  •  Eine systematische Vorgehensweise zur Entscheidungsfindung unter „unsicheren“ Bedingungen in drei Schritten
  1. Identifizierung aller Handlungsalternativen für ein vorliegendes Gesundheits- oder Versorgungsproblem. Aufarbeitung und Analyse der verfügbaren Datenbasis (Literatur, Studiendaten, Expertenvoten etc.).
  2. Schätzung der Wahrscheinlichkeiten mit denen die identifizierten Handlungsmöglichkeiten zu einem erwünschten Ergebnis führen.
  3. Bewertung der Handlungsalternativen aus unterschiedlichen Perspektiven (z. B. gesundheitlich, ökonomisch).

 Entscheidungsbaum (Decision Tree)

 Epidemiologie

  • Die Epidemiologie befasst sich mit der Häufigkeit und der Verteilung von Krankheiten, der Identifikation von Krankheitsdeterminanten und der Bereitstellung von Daten für die Planung, Durchführung und Beurteilung von Maßnahmen zur Vorbeugung, Behandlung und Bekämpfung von Krankheiten sowie der Festlegung von Prioritäten hinsichtlich unterschiedlicher Maßnahmen (nach Kunz et al, 2000).
  • Nach Last (2001) ist Epidemiology „the study of the distribution and determinants of health-related states or events in specified populations, and the application of this study to control of health problems”.

 Ereignisrate (ER, Risk Rate, Event Rate, Risk)

  • Die Anzahl der Personen in einer Population unter Beobachtung, die in einem definierten Zeitraum ein definiertes (Krankheits-)Ereignis erleidet, geteilt durch die Gesamtzahl der beobachteten (oder auch randomisierten) Personen. Die Ereignisrate entspricht der Inzidenz eines Ereignisses in einer Population bzw. dem Risiko. Die Ereignisrate wird angegeben als Bruch (25/1000) oder als Prozentwert (2.5%) oder Proportion (0.025)

 Evidenz (Evidence)

  • Aus dem Englischen stammender Begriff. „Evidence“ bedeutet übersetzt: Nachweis, Beweis im Kontext einer umstrittenen Behauptung. In der EbM verweist Evidenz (externe Evidenz) auf das Vorliegen von wissenschaftlichen Studien und deren mehr oder weniger überzeugenden Ergebnisse. Evidenz steht hier am Ende einer kritischen Erörterung, sie ist nicht unmittelbare Gewissheit.
  • Die Überzeugungskraft der Evidenz ist u. a. abhängig von der methodischen Qualität der zugrunde liegenden Studien.

Evidenzbasierte Gesundheitsversorgungà siehe EbHC

Evidenzbasierte Medizinà siehe EbM

Evidenzstufen (Levels of Evidence)

  • Hierarchische Ordnung von Studientypen in Abhängigkeit von ihrer methodischen und Durchführungsqualität. Sie reflektieren die damit interne Validität ihrer Ergebnisse.

Experimentalgruppe

Experimentelle Ereignisrate ( Experimental Event Rate, EER)

  • Ereignisrate in der Interventionsgruppe einer kontrollierten Studie.

Externe Validität à siehe Validität

Fagan-Nomogramm  (Likelihood Ratio Nomogramm)

  • Nomogramm zur Interpretation von diagnostischen Testergebnissen (nach Fagan et al, 1975). Bei bekannter Vortestwahrscheinlichkeit und bekanntem Wahrscheinlichkeitsverhältnis eines diagnostischen Testverfahrens (positives oder negatives Likelihood Ratio), lässt sich im Nomogramm durch die Verlängerung der Verbindungslinie zwischen der Vortestwahrscheinlichkeit und dem Wahrscheinlichkeitsverhältnis die Nachtestwahrscheinlichkeit ablesen.

Fall-Kontroll-Studie

  • Epidemiologischer Studientyp. Analytische Beobachtungsstudie, bei der eine Gruppe von „Fällen“ (Erkrankte) mit einer Gruppe von „Kontrollen“ (gesunde Personen) hinsichtlich des Vorhandenseins (Häufigkeit) von einer oder mehrerer Expositionen verglichen wird. Die Erfassung der Exposition erfolgt retrospektiv
  • (siehe auch Studiendesign). Der beobachtete Zusammenhang zwischen Exposition und Krankheit wird als Odds Ratio quantifiziert.
  • Fall-Kontroll-Studien sind vor allem dann geeignet, wenn die zu untersuchende Erkrankung sehr selten auftritt oder der Zeitraum zwischen Exposition und Ausbruch der Erkrankung sehr lang ist.

Fallstudie/Fallserie (Case Report/Case Series)

  • Eine Fallstudie (Kasuistik) berichtet von einem ungewöhnlichen oder besonders interessanten klinischen Fall. Fallserien berichten von einer Reihe ungewöhnlicher oder besonders interessanter klinischer Fälle, die zeitlich und/oder örtlich gehäuft auftreten (siehe auch Studiendesign).

Generalisierbarkeit à siehe Validität, externe

Gewichtete mittlere Differenz (Weighted Mean Difference, WMD)

  • Effektmaß für kontinuierliche Endpunkte (siehe Effektmaß), die auf derselben Skala gemessen werden (z. B. Größe) zur Beschreibung des Gesamteffekts, wenn Studien in Meta-Analysen gepoolt werden. Dabei erhalten die Einzelstudien ein unterschiedliches Gewicht, um wichtige Studieninformationen, wie z. B. Größe der Studie oder Präzision des Effekts, zu berücksichtigen.

Goldstandard

  • Verfahren, das allgemein akzeptiert als die beste und verlässlichste Methode zur Erreichung des jeweiligen Zweckes angesehen wird. Die Tauglichkeit von neuen Verfahren lässt sich durch den Vergleich mit dem jeweils geltenden Goldstandard messen.

Handsuche

  • Systematische manuelle Literaturrecherche z. B. in Kongressbänden und Zeitschriften (siehe auch systematische Übersichtsarbeit).

Hawthorne-Effekt/Hawthorne-Experiment

Heterogenität/Homogenität

  • In systematischen Reviews (systematische Übersichtsarbeiten)oder Meta-Analysen bezeichnet Homogenität (Heterogenität), inwieweit die in den eingeschlossenen Studien gefundenen Effekte ähnlich (homogen) oder verschieden (heterogen) sind. Mit statistischen Heterogenitätstests kann festgestellt werden, ob die Unterschiede zwischen den Studien größer sind, als zufallsbedingt zu erwarten wäre. Als Ursachen für Heterogenität kommen Unterschiede in den Patientencharakteristika, Intervention oder Endpunkte zwischen den Studien in Frage, was aus klinischer Sicht beurteilt werden muss. Die Durchführung einer Meta-Analyse aus heterogenen Studien ist problematisch.

Homogenität

HTA (Health Technology Assessment)

  • HTA ist die Abkürzung für Health Technology Assessment. Unter HTA versteht man eine umfassende und systematische Bewertung neuer oder bereits auf dem Markt befindlicher Technologien der medizinischen Versorgung (Medikamente, Medizinprodukte, Prozeduren, Organisationssysteme etc.) hinsichtlich ihrer vor allem medizinischen, sozialen und finanziellen Wirkungen. Die zentrale Aufgabe von HTA-Berichten besteht in der Bereitstellung von Informationen zur Unterstützung von Systementscheidungen im Gesundheitswesen. HTA ist ein Mittel der Politikberatung.

Hypothese

  • Aussage, Behauptung, oder Theorie, deren Zutreffen oder Nicht-Zutreffen mit Hilfe einer Studie oder eines Experimentes geprüft werden soll.

Hypothesengenerierung

  • Prozess des Ableitens von Hypothesen, die in einer Studie oder mithilfe eines Experimentes überprüft werden können. Überprüfbare Hypothesen werden aus theoretischen Ableitungen, zufälligen oder systematischen Beobachtungen oder Pilotstudien gewonnen.

Intention-to-Treat Analyse

  • Methode der Auswertung experimenteller (konfirmatorischer) Studien: die Studienteilnehmer werden in der Gruppe analysiert, der sie beim Studienbeginn zugeteilt wurden, unabhängig davon, ob sie im Verlauf tat-sächlich die zugeordnete (intendierte) Therapie erhalten haben.
  • In der Regel führt die ITT zu einer konservativeren Schätzung der Wirksamkeit der untersuchten Verfahren (Alternativen: Analysis as Actually Treated, Analysis Per Protocol). Die Intention-to-Treat Analyse verhindert, dass die initial hergestellte Vergleichbarkeit der Gruppen (idealerweise durch Randomisierung) durch ausscheidende oder die Gruppe wechselnde Probanden gestört wird.

Interne Validität à siehe Validität

Intervention

Interventionsgruppe

  • In einer kontrollierten Studie werden die Patienten entweder einer Interventionsgruppe oder einer Kontrollgruppe zugeordnet. Die Interventionsgruppe erhält die zu untersuchende (experimentelle) Therapie.

Inzidenz

  • Anzahl der in einer Population innerhalb eines bestimmten Zeitraumes auftretenden Neuerkrankungen. Eine Inzidenzrate setzt sich aus Zähler und Nenner zusammen. Dieser enthält entweder alle eingangs eingeschlossenen Fälle (Modell der geschlossenen Kohorte) oder die Summe aller Beobachtungszeiten (Personenjahre, Personenmonate). In diesem Fall spricht man von einer Inzidenzdichte (Incidence Density). Unterschieden werden rohe, gruppenspezifische und standardisierte Inzidenzraten.

Kausalität

  • Ist die Feststellung, dass ein Ereignis ein anderes bedingt. Aus einer einfachen Assoziation lässt sich keine Kausalität ableiten.

Kausalitätskriterien (Guidelines for Causation) nach Bradford und Hill

  • Von Bradford erarbeiteter und Hill (1956) weiterentwickelter Kriterienkatalog, zur systematischen Prüfung auf Kausalität.
Zeitliche Beziehung: Geht die Ursache der Wirkung voraus?
Plausibilität: Stimmt die Assoziation mit anderen Erkenntnissen überein? (z. B. Wirkungsmechanismen, Ergebnissen aus Tierversuchen u. s. w.)
Konsistenz: Führten andere Studien zum gleichen Ergebnis?
Stärke: Wie stark ist der Zusammenhang zwischen der Ursache und der Wirkung? (RR)
Dosis-Wirkungs-Beziehung: Ist die Wirkung bei erhöhter Exposition gegenüber der vermuteten Ursachestärker?
Reversibilität: Führt die Beseitigung der vermuteten Ursache zu einem geringeren Krankheitsrisiko?
Studienplan: Basieren die Ergebnisse auf einem überzeugenden Studienplan?
Beurteilung der Evidenz für Kausalität: Auf wie vielen Nachweisen/Beweisen beruhen die Ergebnisse?

(Quelle: Beaglehole, R.; Bonita,R.; Kjellström, T.: Einführung in die Epidemiologie, 1997)

Klinische Endpunkte

  • Zielgrößen mit unmittelbarer klinischer Bedeutung . Zum Beispiel: Morbidität, Mortalität, Lebensqualität (im Gegensatz zu Surrogatparametern).

Klinische Studie

  • Im engeren Sinne eine Studie, die die Folgen und Determinanten von klinischen Urteilen, Entscheidungen und Handlungen untersucht.

Kohorte

  • Gruppe von Personen mit gemeinsamen Charakteristika (z. B. Alter, Geschlecht, Gesundheitszustand), die in klinischen und epidemiologischen Studien beobachtet werden (siehe Kohortenstudie). Einteilung: 1. geschlossene Kohorte: Alle Probanden werden zum gleichen Zeitpunkt in die Beobachtung eingeschlossen und verbleiben dort bis zum Eintritt des Zielereignisses oder bis zum Ende der Studie; 2. offene Kohorte: Personen werden nach und nach in die Beobachtung aufgenommen und/oder scheiden nach einer definierten Beobachtungsdauer wieder aus der Studie aus; 3. Sonderform Geburtskohorte: enthält alle Personen einer umschriebenen Region, die im gleichen, meist eng definierten Zeitraum geboren wurden.

Kohortenstudie

  • In der Epidemiologie Typ einer Beobachtungsstudie mit dem Ziel, den Zusammenhang zwischen einer Exposition und einem (oder mehreren) Krankheitsereignis(sen) zu analysieren. Dabei wird die Häufigkeit des Auftretens der Zielereignisse in einer homogenen, exponierten Gruppe (exponierte Kohorte) innerhalb eines Beobachtungszeitraumes mit der Häufigkeit in einer homogenen nicht-exponierten Gruppe (nicht-exponierte Kohorte) verglichen. Idealerweise entstammen die Vergleichsgruppen der gleichen Grundgesamtheit und unterscheiden sich lediglich durch die Exposition. Effektgröße zur Quantifizierung des Zusammenhangs zwischen der Exposition und dem Zielereignis ist üblicherweise das relative Risiko (siehe auch relatives Risiko). Kohortenstudien können retrospektiv (zurück verlagerter Ausgangspunkt) oder prospektiv durchgeführt werden.
  • In der klinischen Forschung Typ einer prognostischen Studie. Dies kann einarmig oder kontrolliert durchgeführt werden. In diesem Fall werden die Kontrollen in der Regel ex post durch Stratifikation der gesamten Kohorte gewonnen, z. B. auf der Basis eines genetischen Merkmals. Die Studie führt ihre Kontrollen sozusagen mit.

Konfidenzintervall ( 95% Konfidenz-Intervall, Vertrauensbereich, Confidence Interval, KI, CI)

  • Das Konfidenzintervall ist ein Maß für die Genauigkeit (Sicherheit) der Schätzung von Studienergebnissen.
  • Die exakte Definition des 95%-Konfidenzintervalls besagt, dass bei unendlich häufiger Wiederholung der gleichen Studie 95% der berechneten Konfidenzintervalle den wahren Wert für die Grundgesamtheit (Population) überdecken würden (und 5% nicht). Das Konfidenzintervall berücksichtigt allein den Stichproben-fehler, keine verzerrenden Einflüsse (Biases).
  • Je größer die Stichprobe, desto enger wird das Konfidenzintervall und desto kleiner ist die Schwankungsbreite der Schätzung (bzw. desto sicherer ist die Schätzung der Effektgröße).
  • Gegenüber dem p-Wert haben Konfidenzintervalle den Vorteil, dass sie einen Bereich plausibler Werte für das Effektmaß anbieten.

Konsensusverfahren

  • Methoden (informelle und formelle), um bei divergierenden Meinungen zu einem Problem eine von der Mehrzahl bzw. von allen akzeptierte Kompromisslösung (Konsens) zu finden (z. B. Delphi-Methode, RAND Appropriateness-Methode).
  • In der Gesundheitsversorgung spielen Konsensusverfahren z. B. bei Entwicklung von Leitlinien eine bedeutende Rolle.

Kontinuierliche/stetige Variablen

  • Im Gegensatz zu diskreten Variablen können kontinuierliche Variablen theoretisch eine unendlich große Zahl von Werten entlang eines Kontinuums annehmen. Körpergröße, Gewicht und viele Laborwerte sind kontinuierliche Variablen.

Kontrollgruppe

  • In einer kontrollierten Studie werden die Patienten entweder einer Interventions- oder einer Kontrollgruppe zugeordnet. Die Ergebnisse in der Kontrollgruppe dienen als Referenzwerte zur Beschreibung der Wirksamkeit der untersuchten Intervention.

Kritische Bewertung à siehe Critical Appraisal

Längsschnittstudie (Longitudinalstudie)

  • Oberbegriff für Studien, die Studienteilnehmer über einen längeren Zeitraum oder zu mehreren Zeitpunkten untersuchen bzw. beobachten (siehe auch Kohortenstudie).

Leitlinien (Clinical Practice Guidelines)

  • Leitlinien sind systematisch entwickelte, wissenschaftlich begründete und praxisorientierte Entscheidungshilfen über eine angemessene Vorgehensweise bei speziellen gesundheitlichen Problemen. Sie sind Orientierungshilfen im Sinne von Handlungs- und Entscheidungskorridoren, von denen in begründeten Fällen abgewichen werden kann oder sogar muss.

Levels of Evidenceà siehe Evidenzstufen

Likelihood Ratio (LR, Wahrscheinlichkeitsverhältnis)

  • Maß für die Fähigkeit eines Tests, zwischen gesund und krank zu unterscheiden. Die Wahrscheinlichkeit, ein positives Testergebnis bei Gesunden zu erhalten, wird ins Verhältnis gesetzt zur Wahrscheinlichkeit, ein positives Testergebnis bei Kranken zu finden (LR eines positiven Tests = Sensitivität/(1 – Spezifität)). Das pos. LR beschreibt damit, um wie viel wahrscheinlicher es ist, dass ein positives Testergebnis von einem Kranken und nicht von einem Gesunden stammt (siehe auch Fagan-Nomogramm).

Meta-Analyse

  • Die Meta-Analyse ist ein Sonderfall einer systematischen Zusammenfassung (Systematic Review). Sie versucht eine zusammenfassende quantitative Analyse von Einzelergebnissen klinisch und statistisch homogener Originaluntersuchungen. Der Gewinn der MA liegt vor allem in der Erhöhung der Fallzahl. Sie steigert die statistische Sicherheit der Effektschätzer.

Matching

  • Ein vornehmlich in Fall-Kontroll-Studien eingesetztes Verfahren, welches Personen der Studiengruppe Kontrollpersonen zuordnet, die diesen in ausgewählten, die Zielgröße beeinflussenden, Merkmalen entsprechen („statistische Zwillinge“). Die Angleichung kann individuell oder (schwächer) gruppenweise erfolgen. In diesem Fall weisen beide Gruppen die gleiche Geschlechtszusammensetzung oder ein gleiches mittleres Alter auf. Die bei einem Matching berücksichtigten Variablen werden somit als potenzielle Confounder (Störgrößen z. B. Alter, Geschlecht, Rauchen) ausgeschaltet.

Morbidität

  • Alle Krankheitsfälle innerhalb einer Population innerhalb eines definierten Zeitraumes (inzidente und prävalente Fälle). Zu Morbiditätsrate s. o. Inzidenz.

Mortalität (Sterblichkeit)

  • Die Mortalität beschreibt die Anzahl der Verstorbenen in einer Population innerhalb eines definierten Zeitraums. Zu Mortalitätsrate s. o. Inzidenz

Multivariate Analysen

  • Statistische Verfahren, in denen die Einflüsse von mehreren Variablen auf eine bestimmte Zielgröße gleichzeitig untersucht werden.

Nachtestwahrscheinlichkeit à siehe Posttestwahrscheinlichkeit

Negativer prädiktiver Wert ( NPV, Negative Predictive Value)

  • Bei der Interpretation von Ergebnissen diagnostischer Tests beschreibt der NPV den Anteil der gesunden Personen unter den Test-Negativen, d. h. er drückt die Wahrscheinlichkeit aus, dass bei negativem Testergebnis die untersuchte Erkrankung nicht vorliegt.

Nullhypothese

  • Bei der Durchführung statistischer Signifikanztests wird die Hypothese aufgestellt, dass zwischen den verschiedenen Gruppen einer Studie kein Unterschied besteht. Aus statistischer Sicht ist z. B. eine Behandlung wirksam, wenn man durch den statistischen Test die Nullhypothese, dass es zwischen den Ergebnissen der experimentellen und der Kontrollgruppe keinen Unterschied gibt, verwerfen kann (siehe auch statistische Signifikanz).

Number-Needed-to-Harm (NNH)

  • Anzahl von Patienten, die behandelt werden müssen, um ein zusätzliches unerwünschtes Ergebnis im Ver-gleich zur Kontrollgruppe zu produzieren. Auch „Number needed to treat to produce one episode of harm“.

Number-Needed-to-Treat (NNT)

  • Anzahl von Patienten, die die untersuchte Intervention erhalten müssten (auch „Number needed to be treated“), um ein zusätzliches unerwünschtes Ergebnis im Vergleich zur Kontrollgruppe zu verhindern. Die NNT wird berechnet als 1/ARR (siehe auch absolute Risikoreduktion).

Ökologische Studie (Korrelationsstudie)

  • Studientyp, bei dem Daten ganzer Bevölkerungsgruppen verwendet werden, um Zusammenhänge zwischen Krankheitshäufigkeiten und Expositionen zu beschreiben. Ökologische Studien erlauben keine Aussagen zur Kausalität von Zusammenhängen, da ihre Ergebnisse auf der Analyse aggregierter Daten beruhen.

Odds (Chance)

  • Die „Odds“ bezeichnet das Verhältnis der Wahrscheinlichkeit, dass ein Ereignis eintritt zu der Wahr-scheinlichkeit, dass dieses Ereignis nicht eintritt (Odds = p/(1 – p)).

Odds Ratio (OR, Chancenverhältnis)

  • Die Odds Ratio ist ein gängiges Risiko- oder Assoziationsmaß in klinischen und epidemiologischen Studien. Sie beschreibt das Verhältnis (Ratio) von zwei Odds (s. o.) für ein bestimmtes Ereignis (z. B. Odds exponierter Personen)/Odds nicht-exponierter Personen.

Outcome (Ergebnis, Endpunkt)

  • Als “Outcomes” werden im klinischen Kontext jegliche Zielgrößen, Endpunkte oder Ergebnisse von Behandlungen oder Krankheiten bezeichnet.

Parallelgruppen-Studie

  • Klassisches Design von kontrollierten Interventionsstudien, bei denen die Studienarme zeitlich parallel laufen.

Peer Review

  • Begutachtung von Manuskripten, Forschungsarbeiten, Leitlinien etc. durch interne oder externe Fachgutachter.

Per Protocol Analyse

  • Analyse der Ergebnisse nach Art der tatsächlich erfolgten Intervention (siehe auch Intention-to-Treat Analyse)

Placebo

  • „Scheinmedikament“, das meist zu Studienzwecken eingesetzt wird und keine pharmakologisch aktive Substanz enthält. Das Placebo darf sich äußerlich vom Verum-Präparat nicht unterscheiden.

Positiv prädiktiver Wert (PPV, Positive Predictive Value)

  • Bezeichnet bei diagnostischen Tests und Screeningverfahren den Anteil der erkrankten Personen unter den Testpositiven. Der positive prädiktive Wert beantwortet also die Frage: Falls mein Patient einen positiven Test hat, wie hoch ist die Wahrscheinlichkeit, dass er die Krankheit tatsächlich hat? Der positive prädiktive Wert ist immer abhängig von der Prävalenz der untersuchten Erkrankung (siehe auch negativer prädiktiver Wert und Vier-Felder-Tafel).

Posttestwahrscheinlichkeit (Nachtestwahrscheinlichkeit, Posttest-Probability)

  • Die Wahrscheinlichkeit für das Vorliegen einer bestimmten Erkrankung nach Kenntnis des Ergebnisses eines diagnostischen Tests. Die Posttestwahrscheinlichkeit berechnet sich aus der Multiplikation der Vortestwahrscheinlichkeit und des Likelihood Ratios (Posttest Odds = Pretest Odds x lLR).

Power (statistische Trennschärfe)

  • Die Power einer Studie oder eines Tests bezeichnet die statistische Fähigkeit einen in der Grundgesamtheit tatsächlich vorhandenen Unterschied zwischen Vergleichsgruppen als signifikant zu erkennen. Eine Power von 80% in einer klinischen Studie bedeutet, dass eine Wahrscheinlichkeit von 80% besteht, einen Unterschied, der tatsächlich existiert als statistisch signifikant nachzuweisen. Die Power einer Studie ist abhängig vom Stichprobenumfang, der gewählten Irrtumswahrscheinlichkeiten erster und zweiter Art, der Effektgröße und der Prävalenz oder Inzidenz des untersuchten Ereignisses.

Prädiktion

  • Vorhersage, dass mit einer beschreibbaren Wahrscheinlichkeit ein Zustand oder ein Ereignis eintreten wird.

Prädiktoren/Risikofaktoren

Prävalenz (Prävalenzrate)

  • Anteil von Personen mit einem bestimmten Merkmal (z. B Erkrankung) zu einem bestimmten Zeitpunkt in einer bestimmten Population (Punktprävalenz) (siehe auch Querschnittsstudie, Inzidenz).

Primärliteratur (Originalarbeit, Originalartikel)

  • Systematische Veröffentlichung von Ergebnisse einer klinischen Studie mit individuellen Patienten, Versuchspersonen etc., am besten in einer Zeitschrift mit formalem Begutachtungssystem.

Prospektive Studie

  • In einer prospektiven Studie werden Probanden über einen definierten Zeitraum hinweg („in die Zukunft gerichtet“) beobachtet. Das interessierende Ereignis (z. B. eine bestimmte Krankheit) ist zu Studienbeginn noch nicht eingetreten. RCTs sind immer prospektiv, Kohortenstudien sind im Regelfall ebenfalls prospektiv angelegt.

Publikations-Bias (Publication Bias)

p-Wert (statistische Signifikanz)

  • Der p-Wert gibt im Zusammenhang mit statistischen Tests bzw. Studienergebnissen die Wahrscheinlichkeit an, dass das beobachtete Test-, bzw. Studienergebnis auf Zufall beruht. Ein Ergebnis wird konventionell dann als „statistisch signifikant“ bezeichnet, wenn der p-Wert kleiner oder gleich 0,05 ist (der Fehler erster Art, der Alpha-Fehler also kleiner oder gleich 5% ist).
  • Ist ein Ergebnis statistisch signifikant, so sagt dies nur, dass die Wahrscheinlichkeit gering ist, dass ein Resultat nur zufällig zustande gekommen ist. Aussagen über die Größe der Differenz zwischen zwei zu vergleichenden Gruppen können damit nicht gemacht werden (siehe auch 95%-Konfidenzintervall). Große Fallzahlen machen auch geringfügige Differenzen bzw. Assoziationen „signifikant“.

Querschnittstudie (Cross-Sectional-Study, Survey)

  • In der Epidemiologie eine deskriptive, nicht-experimentelle Studie (Beobachtungsstudie, Prävalenzstudie, Survey) die eine definierte Population zu einem bestimmten Zeitpunkt untersucht (beobachtet). Querschnittsstudien lassen Aussagen über die Prävalenz bestimmter Faktoren in der untersuchten Population zu und können Assoziationen beschreiben.

Randomisierte kontrollierte Studie (Randomised Controlled Trial, RCT)

  • Der RCT ist eine experimentelle Studie, bei der Patienten/Probanden nach dem Zufallsprinzip einer Therapiegruppe bzw. einer Kontrollgruppe zugeordnet werden (siehe auch Randomisierung).
  • Dadurch werden zwei Gruppen gebildet, die idealerweise bis auf die Intervention in allen bekannten und unbekannten Risiko-, und Prognosefaktoren vergleichbar sind. Bekannte aber auch bisher unbekannte Störgrößen (Confounder) werden zufallsbedingt auf die Gruppen verteilt. Der RCT ist Goldstandard zur Feststellung der Wirksamkeit von Interventionen.

Randomisierung (Random Allocation, Randomisation)

  • Zufällige Zuteilung von Patienten/Probanden zur Interventions- oder Kontrollgruppe. Eine randomisierte Zuordnung bedeutet für jede Person die gleiche Chance, einer der Vergleichsgruppen zugeordnet zu werden. Dies ist beispielsweise mit Hilfe von computergenerierten Zufallszahlen möglich.

Referenzstandard (Goldstandard)

  • Bei der Erfassung der Testgenauigkeit („accuracy“) von diagnostischen Tests gilt als Referenzstandard das Verfahren, das die derzeit beste zur Verfügung stehende Methode beschreibt und an dem neue bzw. alternative Methoden gemessen werden.

Relative Risiko Reduktion (RRR)

  • Die proportionale Reduktion des Risikos in der experimentellen Gruppe im Vergleich zur Kontrollgruppe. Die RRR wird berechnet als: CEREER/CER. Die RRR ermöglicht eine Vergleichbarkeit zwischen Gruppen oder Studien mit unterschiedlichen absoluten Risiken und Risikodifferenzen.

Relatives Risiko (RR)

  • Das relative Risiko bezeichnet das Verhältnis des absoluten Risikos (einer Erkrankung) in einer exponierten Gruppe zum Risiko (einer Erkrankung) in einer nicht-exponierten Gruppe. Ist das RR >1, so bedeutet dies, dass die Exposition das Risiko erhöht. Ist das RR<1, so ist die Exposition ein protektiver Faktor und geht mit einem verringerten Erkrankungsrisiko einher. In der retrospektiven Fall-Kontroll-Gruppe wird als Schätzer für das RR die Odds Ratio berechnet.

Reliabilität

  • Die Reliabilität beschreibt die Zuverlässigkeit (Reproduzierbarkeit, Wiederholbarkeit) einer Messung bzw. eines Messinstrumentes. Es werden zwei Arten der Reliabilität unterschieden.
  1. Test-Retest- bzw. Intra-Rater-Reliabilität (Stabilität): 
  • Hier wird dieselbe Messung zu verschiedenen Zeitpunkten durchgeführt, um zu prüfen, ob die Messwiederholung zum gleichen Ergebnis führt. Unterstellt wird eine Stabilität des gemessenen Merkmals.

2.   Inter-Rater-Reliabilität (Konsistenz):

  • Hier wird dieselbe Messung zu verschiedenen Zeitpunkten durchgeführt, um zu prüfen, ob die Messwiederholung zum gleichen Ergebnis führt. Unterstellt wird eine Stabilität des gemessenen Merkmals.

 

  •  Im Falle der Inter-Rater-Reliabiltät beurteilen zwei oder mehrere unabhängige Beobachter denselben Sachverhalt. Die Reliabilität ist hoch, wenn alle Beobachter gleiche Ergebnisse erzielen.
  • Ein Maß für die Quantifizierung der Übereinstimmung (Agreement) bei der Messung vorzugsweise dichotomer Testergebnisse ist der Kappa-Koeffizient.

Responder

  1. Personen, die auf eine spezifische Behandlung (z. B. Medikamente) in der erwünschten Weise reagieren, z. B. Anteil von Patienten mit diabetischer Proteinurie, die auf ACE-Hemmer mit dem erwarteten Rückgang der Proteinurie reagiert (vergl. auch Therapieversager).
  2. Personen einer Studienpopulation, die sich aktiv an der Studie, z. B. durch Rücksenden eines ausgefüllten Fragebogens, beteiligen.

Responserate

  1. Anteil von Patienten, die auf eine Behandlung mit dem angestrebten Ergebnis reagieren (z. B. Rückgang der Tumorgröße).
  2. Anteil der Studienpopulation , der sich aktiv an der Studie, z. B. einer Umfrage, beteiligt. Schicken beispielsweise die Hälfte der angeschriebenen Personen in einem Survey einen Fragebogen zurück, beträgt die Responserate 50%. Die Responserate sagt nichts über die Gültigkeit der Antworten aus – z. B. ob der Fragebogen korrekt ausgefüllt wurde. Je höher die Responserate in einer Studie ist, als desto valider sind die Ergebnisse zu bewerten. Bei niedrigen Responseraten besteht immer die Gefahr von systematisch verzerrten Ergebnissen, da Charakteristika der nicht antwortenden Studienpopulation möglicherweise in Beziehung zur Untersuchungsgröße der Studie stehen.

Retrospektive Studie

  • In einer retrospektiven Studie ist das Ereignis (die Erkrankung) zu Beginn der Studie schon eingetreten. Es wird versucht, bereits in der Vergangenheit stattgefundene Expositionen rückblickend zu erfassen.

Fall-Kontroll-Studien sind immer retrospektiv (siehe auch Kohortenstudie, retrospektive).

Richtlinien

  • Richtlinien sind Regeln des Handelns oder Unterlassens, die von einer rechtlich legitimierten Institution konsentiert, schriftlich fixiert und veröffentlicht wurden und für den Rechtsraum dieser Institution verbindlich sind. Die Nicht-Beachtung von Richtlinien kann definierte Sanktionen nach sich ziehen.

Risiko (Rate, Ereignisrate)

  •  Der Anteil von Personen in einer Gruppe, bei denen ein bestimmter Endpunkt auftritt. Wenn z. B. in einer Gruppe von 100 Personen 30 einen bestimmten Endpunkt entwickeln (und bei 70 Personen das Ereignis nicht auftritt), ist das Risiko (oder die Ereignisrate) 0.3 oder 30% (siehe auch Odds).

Risikofaktor

  • Ein Merkmal, das kausal an der Entstehung einer Erkrankung (Ereignis) beteiligt ist. Durch die Modifikation des Risikofaktors wird das Risiko des Ereignisses (der Erkrankung) reduziert (siehe auch Kausalkriterien). So ist z. B. ein hoher Blutdruck ein Risikofaktor für einen Schlaganfall. Menschen mit höheren Blutdruckwerten haben ein erhöhtes Schlaganfallrisiko. Durch eine Blutdrucksenkung wird dieses Risiko reduziert
  • Risikoindikatoren sind Merkmale, die auf Risikoerhöhungen hinweisen, diese aber nicht selbst bewirken. Ein bedeutsamer Risikoindikator ist Sozialschicht.

Risikomarker

  • Merkmal, welches auf ein erhöhtes Risiko für eine Krankheit oder ein negatives Outcome hinweist, ohne selber kausal an der Entstehung beteiligt zu sein bzw. den Krankheitsverlauf zu beeinflussen. Die Beseitigung eines Risikomarkers verringert nicht das Krankheitsrisiko oder das Risiko eines ungünstigen Verlaufs. Ein typisches Beispiel für Risikomarker sind HLA-Antigene wie z. B. HLA-B-27 für die Entwicklung eines Morbus Bechterew.

 Risikostratifikation

  • Aufteilung („Schichtung“) einer Studienpopulation in mehrere Untergruppen (Strata) in Abhängigkeit vom Risikostatus der Probanden. Die Risikostratifikation wird verwendet, um die Verzerrung von Studienergebnissen durch unterschiedliche Risikoexposition der Studienteilnehmer zu vermeiden. Zum Beispiel ist bei vielen Krebserkrankungen ein fortgeschrittenes Krankheitsstadium ein bekannter Risikofaktor für ungünstige Behandlungsergebnisse (= schlechte Prognose). Daher werden die Auswertungen in Therapiestudien nach Krankheitsstadium stratifiziert, was eine Verzerrung der Gesamtergebnisse durch den Einschluss von Probanden mit unterschiedlichen Prognosen vermeidet und eine präzise Aussage zur Wirksamkeit innerhalb der jeweiligen Risikogruppe sicherstellt.

 Score

  • Punktwert, der aus der Erfassung einer Anzahl von Einzelinformationen in einem definierten Erfassungssystem nach einem festgelegten Algorithmus gebildet wird. Ein bekanntes Beispiel ist der APGAR-Score zur schnellen und systematischen Erfassung des Vitalzustands eines Neugeborenen nach der Geburt. Für Atmung, Herztätigkeit, Hautfarbe, Muskeltonus und Reflexe werden je 0 bis 2 Punkte vergeben und bilden aufsummiert den APGAR-Score. Ein APGAR-Score von 6 oder weniger zeigt einen behandlungsbedürftigen Zustand des Neugeborenen an.

Sekundärliteratur

  • Publikationen, in denen über die Werke anderer berichtet wird. Die Literaturübersicht, zu der auch systematische Übersichtsarbeiten und Meta-Analysen gehören, ist eine Sonderform der Sekundärliteratur. Literaturübersichten fassen die wissenschaftlichen Erkenntnisse aus mehreren Einzelveröffentlichungen (Primärliteratur) zusammen.

Sensitivität

  • Die Wahrscheinlichkeit beim Vorliegen einer Erkrankung ein positives diagnostisches Testergebnis zu haben oder: „Wie sicher erkennt der Test Kranke als krank“? In der Vier-Felder-Tafel „Anteil der Testpositiven unter den Erkrankten“. Mit einem Test hoher Sensitivität lässt sich bei einem negativen Testergebnis eine gesuchte Zielerkrankung mit großer Wahrscheinlichkeit ausschließen (siehe Nachtestwahrscheinlichkeit).

Sensitivitätsanalyse

  • Analyseverfahren, das feststellt, wie stabil sich eine Modellrechnung oder eine Meta-Analyse gegenüber Schwankungen der Eingangsparameter oder Veränderungen in der Berechnungsmethodik verhält. In gesundheitsökonomischen Modellrechnungen werden in einer Sensitivitätsanalyse mögliche Unterschiede in den Eingangsparametern (leichter versus schwerer Krankheitsschweregrade, gute versus schlechte Compliance, großer versus kleiner Behandlungseffekt) in ihren Auswirkungen auf die Endergebnisse untersucht und beschrieben.

Signifikanz

  • Hier werden die statistische und die klinische Signifikanz unterschieden:
  • Statistisch signifikant bedeutet, dass die Ergebnisse einer Studie sehr wahrscheinlich nicht zufallsbedingt sind. Die Grenze für diese Wahrscheinlichkeit wird meist mit 5% angegeben (eine Wahrscheinlichkeit von p<0,05 gilt als statistisch signifikant).
  • Klinisch signifikant bedeutet, dass das Studienergebnis klinisch „bedeutend“ oder „wichtig“ ist. Die Einschätzung der klinischen Signifikanz einer Studie setzt klinisches Urteilsvermögen voraus.

Spezifität

  • Die Wahrscheinlichkeit beim Nicht-Vorliegen einer Erkrankung ein negatives diagnostisches Testergebnis zu haben oder: “Wie sicher erkennt der Test Gesunde als gesund“. In der Vier-Felder-Tafel:“ Anteil der Test-negativen unter den Gesunden“.

Standardabweichung

  • Maß für die Streuung von Messwerten um den Durchschnittswert.

Statistische Signifikanz

  • Ein statistisch signifikantes Ergebnis einer Studie ist ein Ergebnis, das gegen die Nullhypothese spricht. Die Aussage basiert auf einem statistischen Test, der zur Prüfung einer vorab festgelegten Hypothese mit vorab festgelegter Irrtumswahrscheinlichkeit durchgeführt wird. Statistische Signifikanz darf nicht mit klinischer Relevanz gleich gesetzt werden (siehe auch p-Wert).

Stichprobe

  • Teilmenge der Gesamtpopulation, über die mit einer Studie eine Aussage gemacht werden soll. In der Stichprobe werden Daten erhoben, anhand derer Schlussfolgerungen für die gesamte Population gezogen werden (z. B. sollen von einer Studie über 200 Diabetiker mit Nierenbeteiligung Rückschlüsse gezogen werden auf alle Diabetiker mit Nierenbeteiligung.). Um valide Aussagen für die gesamte Population zu erhalten, muss die Stichprobe 1. ausreichend groß sein, um den Stichprobenfehler klein zu halten und 2. repräsentativ für die gesamte Population sein, damit sie Strukturgleichheit mit der Population aufweist, für die die Aussage gemacht werden soll. Idealerweise wird dies durch eine zufällig gezogene Stichprobe erreicht.

Stichprobenfehler

  • Unsicherheit der Schätzung in einer Stichprobe. Jedes Merkmal einer Stichprobe liegt in der Gesamtpopulation mit einer “wahren Häufigkeit“ oder in einer „wahren Größe“ vor. Da die Stichprobe nur einen Teil der Population umfasst, ist damit zu rechnen, dass die Schätzung von Häufigkeit oder Größe des Merkmals in der Stichprobe von der Häufigkeit oder Größe der Gesamtpopulation abweicht. Diese Abweichung wird als Stichprobenfehler bezeichnet. Der Stichprobenfehler ist umso größer, je kleiner die Stichprobe ist und je seltener das zu messende Merkmal in der Population vorkommt. Das Ausmaß des Stichprobenfehlers lässt sich durch Angabe des Konfidenzintervalls um den Punktschätzer beschreiben.

Stratifizierung

  • Methode zur Kontrolle von Confoundern oder Prognosefaktoren /-indikatoren. Vor der Datenanalyse werden Untergruppen gebildet, innerhalb derer sich die untersuchten Personen hinsichtlich solcher Merkmale (z. B. Alter, Geschlecht) gleichen, von denen ein Einfluss auf das Ergebnis anzunehmen ist.

Studiendesign (Research Design)

  • Meint die Architektur einer Studie. Die Auswahl des Studiendesign ist abhängig von der Forschungsfrage. Grundsätzlich unterscheidet man zwischen nicht-experimentellen und nicht-experimentellen, beobachtenden Studiendesigns (siehe Übersicht und Tabelle folgender Seite).

Übersicht: Algorithm for Classification of Types of Clinical Research
(Quelle: DA Grimes and KF Schulz: An Overview of Clinical Research. The Lay of the Land. Lancet 2002; 359:57-61) 

Surrogatendpunkte

  • Endpunkte, die selbst nicht von unmittelbarer Bedeutung für die Patienten sind, aber stellvertretend für wichtige Endpunkte stehen können (z. B. Blutdrucksenkung als Surrogatparameter für Vermeidung eines Schlaganfalls). Surrogatendpunkte sind oft physiologische oder biochemische Marker, die sich relativ schnell und einfach messen lassen und denen eine Vorhersagefunktion für spätere klinische Ereignisse zugestanden wird. Voraussetzung für zuverlässige Aussagen über die Wirksamkeit einer Behandlung ist ein enger kausaler Zusammenhang zwischen Surrogatparameter und dem eigentlichen Endpunkt. Für die allermeisten Surrogatparameter ist ein kausaler Zusammenhang nicht belegt, was den Nutzen von Surrogatparametern für die Vorhersagekraft von klinisch relevanten Endpunkten in Frage stellt. So haben z. B. in einer Studie mit antiarrhythmisch wirkenden Medikamenten (CAST-Studie) die geprüften Antiarrhythmika gefürchtete Herzrhythmusstörungen (Surrogat) verhindert – mittelfristig traten aber, im Vergleich zu den Kontrollgruppen, vermehrt Todesfälle (klinisch relevanter Endpunkt) auf.

Surrogatparameter

  • Ergebnisparameter, die nicht von unmittelbarer Bedeutung für das Schicksal von Patienten sind. Surrogat-parameter sind Stellvertreter für klinisch wichtige Endpunkte. Häufig handelt es sich bei diesen Parametern um physiologische oder biochemische Marker, die einfach und schnell gemessen werden können. Beispielsweise wird der Surrogatparameter „Blutdruck“ in Studien zur Messung der Effekte von Antihypertensiva als Ersatz für klinische Endpunkte (kardio- und zerebrovaskuläre Morbidität und Mortalität) verwendet. Die Analyse von Surrogatparametern kann auch zu Fehlschlüssen über die Effektivität von Interventionen führen.

Systematischer Fehler à siehe Bias

Systematische Literaturübersicht (Systematic Review, systematische Übersichtsarbeit)

  • Übersichtsarbeit zu einer klar formulierten Fragestellung, bei der systematisch und anhand expliziter Kriterien relevante Literatur identifiziert, kritisch bewertet und einer qualitativen evtl. auch quantitativen Analyse (siehe auch Meta-Analyse) unterzogen wird.

Unkontrollierte Studien

  • Unkontrollierte Studien sind Untersuchungen, die einen Effekt ohne eine direkte Vergleichsgruppe untersuchen, dazu gehören u. a. viele Querschnittstudien und Fallserien.

Validität (Gültigkeit, Glaubwürdigkeit)

  • Gültigkeit eines Testergebnisses, Tests oder einer Studie. Die Validität gibt das Ausmaß an, in dem ein Ergebnis die Wirklichkeit widerspiegelt und frei von systematischen Fehlern (Biases) ist.
  • Interne Validität einer Studie: Bezieht sich auf die Gültigkeit der Ergebnisse innerhalb der Studie bzw. für die untersuchte Population.
  • Externe Validität einer Studie: Bezieht sich auf die Gültigkeit der Ergebnisse in der Übertragung auf Gruppen außerhalb der Studienpopulation (siehe auch Generalisierbarkeit).

Verblindung (innerhalb von Studien)

  • Durch Verblindung sollen systematische Verzerrungen (Bias) verhindert werden, die durch die Erwartungen oder Voreingenommenheit der Patienten/Probanden oder Studienärzte entstehen können. Weiß z. B. ein Arzt in einer Hypertoniestudie, dass der Patient die Studienmedikation bekommen hat und die Blutdruckmessung fiel wider erwarten hoch aus, so misst er möglicherweise mehrmals, weil er der Messung nicht glaubt.

Verdeckte Zuordnung (Concealment of Allocation)

Verum

  • Eine biologisch wirksame Substanz, die die Patienten der Interventionsgruppe erhalten. (siehe auch Placebo).

Vier-Felder-Tafel (2×2-Table)

  • Eine Vier-Felder-Tafel stellt eine Matrix für dichotome Ereignisse dar (siehe Grafik).
    Outcome(z. B. Krankheit)    
     eingetreten  nicht eingetreten Gesamt
Exposition(Gruppen-merkmal) gegeben  a b a+b
nicht gegeben  c d c+d
    Gesamt a+c b+d a+b+c+d (N)
             

 Vortestwahrscheinlichkeit ( Prävalenz, Pretest Probability, Prätest-Wahrscheinlichkeit)

  • Die Wahrscheinlichkeit für das Vorliegen einer bestimmten Erkrankung bei einem Patienten vor Kenntnisnahme der Ergebnisse eines diagnostischen Tests (siehe auch Posttestwahrscheinlichkeit).
  • Die Vortestwahrscheinlichkeit kann aus der Prävalenz der Erkrankung in der entsprechenden Bevölkerungsgruppe sowie anamnestischen und klinischen Befunden geschätzt werden.

Wahrscheinlichkeit (Probability)

  • Relative Häufigkeit eines Ereignisses bezogen auf eine definierte Grundgesamtheit (siehe auch Odds)

Wahrscheinlichkeitsverhältnisà siehe Likelihood Ratio (LR)

Zufallsstichprobe (Random Sample)à siehe Randomisierung

Zufallszahlen (Random Numbers)

Quellen

der Lübecker Evidenzgruppe:

Literatur

  • Last, JM: A dictionary of Epidemiology. Fourth Edition. Oxford University Press, New York, 2001.
  • Pereira-Maxwell, F: A-Z of Medical Statistics – a companion for critical appraisal. Arnold, London, 1998.

Internet

  • Horten-Zentrum für praxisorientierte Forschung und Wissenstransfer, CH

http://www.evimed.ch/JournalClub/Glossar/glossar.asp?record=1           (Zugriff am: 25.07.2002)

  • AOK Bundesverband

http://212.227.33.34/bundesverband/politik/dmp_glossar.html                    (Zugriff am: 25.07.2002)

  • Deutsches Netzwerk Evidenzbasierte Medizin e. V.

http://www.ebm-netzwerk.de/grundlagen/glossar                                     (Zugriff am: 03.04.2008)

Die Kommentarfunktion ist geschlossen.