Interne und externe Gültigkeit verstehen

Interne und externe Validität sind Konzepte, die widerspiegeln, ob die Ergebnisse einer Studie vertrauenswürdig und aussagekräftig sind oder nicht. Während sich die interne Validität darauf bezieht, wie gut eine Studie durchgeführt wird (ihre Struktur), bezieht sich die externe Validität darauf, wie anwendbar die Ergebnisse auf die reale Welt sind.

Interne Gültigkeit

Interne Validität ist das Ausmaß, in dem eine Studie eine vertrauenswürdige Ursache-Wirkungs-Beziehung zwischen einer Behandlung und einem Ergebnis herstellt. Es spiegelt auch wider, dass eine bestimmte Studie es ermöglicht, alternative Erklärungen für einen Befund zu eliminieren. Wenn Sie beispielsweise mit einer Gruppe von Personen ein Programm zur Raucherentwöhnung durchführen, können Sie sicher sein, dass eine Verbesserung der Behandlungsgruppe auf die von Ihnen verabreichte Behandlung zurückzuführen ist?

Die interne Gültigkeit hängt in hohem Maße von den Verfahren einer Studie ab und davon, wie streng sie durchgeführt wird.

Interne Gültigkeit ist kein "Ja oder Nein" -Konzept. Stattdessen überlegen wir, wie sicher wir mit den Ergebnissen einer Studie sein können, basierend darauf, ob dabei Fallen vermieden werden, die die Ergebnisse möglicherweise in Frage stellen.

Je geringer die Wahrscheinlichkeit einer "Verwechslung" in einer Studie ist, desto höher ist die interne Validität und desto sicherer können wir uns auf die Ergebnisse verlassen. Verwirrung bezieht sich auf eine Situation, in der andere Faktoren ins Spiel kommen, die das Ergebnis einer Studie verwirren. Zum Beispiel könnte eine Studie unsicher machen, ob wir darauf vertrauen können, dass wir das oben genannte "Ursache-und-Wirkung" -Szenario identifiziert haben.

Kurz gesagt, Sie können nur dann sicher sein, dass Ihre Studie intern gültig ist, wenn Sie alternative Erklärungen für Ihre Ergebnisse ausschließen können. Als kurze Zusammenfassung können Sie Ursache und Wirkung nur annehmen, wenn Sie die folgenden drei Kriterien in Ihrer Studie erfüllen:

Die Ursache ging der Wirkung zeitlich voraus.
Ursache und Wirkung sind unterschiedlich.
Es gibt keine anderen wahrscheinlichen Erklärungen für diese Beziehung, die Sie beobachtet haben.

Faktoren, die die interne Gültigkeit verbessern

Wenn Sie die interne Validität einer Studie verbessern möchten, sollten Sie Aspekte Ihres Forschungsdesigns berücksichtigen, die es wahrscheinlicher machen, dass Sie alternative Hypothesen ablehnen können. Es gibt viele Faktoren, die die interne Validität verbessern können.

Randomisierung bezieht sich auf die zufällige Zuordnung von Teilnehmern zu Behandlungs- und Kontrollgruppen und stellt sicher, dass keine systematische Verzerrung zwischen den Gruppen besteht.
Zufällige Auswahl Teilnehmerzahl bezieht sich auf die Auswahl Ihrer Teilnehmer nach dem Zufallsprinzip oder auf eine Art und Weise, die für die Bevölkerung repräsentativ ist, die Sie studieren möchten.
Blendung In einer Studie wird darauf hingewiesen, dass die Teilnehmer - und manchmal auch die Forscher - nicht wissen, welche Intervention sie erhalten (z. B. durch die Verwendung eines Placebos in einer Medikamentenstudie), um zu vermeiden, dass dieses Wissen ihre Wahrnehmung und ihr Verhalten und damit das Ergebnis der Studie beeinträchtigt.
Experimentelle Manipulation bezieht sich auf die Manipulation einer unabhängigen Variablen in einer Studie (z. B. die Abgabe eines Raucherentwöhnungsprogramms), anstatt nur einen Zusammenhang zu beobachten, ohne ein Eingreifen vorzunehmen (Untersuchung des Zusammenhangs zwischen Bewegung und Rauchverhalten).
Studienprotokoll bezieht sich auf das Befolgen spezifischer Prozeduren für die Verabreichung einer Behandlung, um keine Auswirkungen einzuführen, wenn beispielsweise Dinge mit einer Gruppe von Menschen anders als mit einer anderen Gruppe von Menschen gemacht werden.

Wie funktioniert die zufällige Auswahl??

Faktoren, die die innere Gültigkeit bedrohen

Ebenso wie es viele Möglichkeiten gibt, um die interne Gültigkeit einer Studie sicherzustellen, gibt es auch eine Liste potenzieller Bedrohungen für die interne Gültigkeit, die bei der Planung einer Studie berücksichtigt werden sollten.

Verwirrendbezieht sich auf eine Situation, in der angenommen werden kann, dass Änderungen an einer Ergebnisvariablen auf eine dritte Variable zurückzuführen sind, die mit der von Ihnen verabreichten Behandlung zusammenhängt.
Historische Ereignisse kann das Ergebnis von Studien beeinflussen, die über einen bestimmten Zeitraum durchgeführt wurden. Beispiele für diese Ereignisse könnten ein Wechsel der politischen Führung oder eine Naturkatastrophe sein, die Einfluss darauf hat, wie sich die Studienteilnehmer fühlen und handeln.
Reifungbezieht sich auf den Einfluss der Zeit als Variable in einer Studie. Wenn eine Studie über einen Zeitraum stattfindet, in dem es möglich ist, dass sich die Teilnehmer auf natürliche Weise verändert haben (älter wurden, müde wurden), kann möglicherweise nicht ausgeschlossen werden, dass die in der Studie beobachteten Auswirkungen einfach auf die Wirkung zurückzuführen sind von Zeit.
Testenbezieht sich auf den Effekt der wiederholten Prüfung von Teilnehmern mit denselben Maßnahmen. Wenn Sie jemandem dreimal den gleichen Test geben, ist es nicht wahrscheinlich, dass er es besser macht, wenn er den Test lernt oder sich an den Testprozess gewöhnt, sodass er anders antwortet?

Instrumentierung bezieht sich auf die Auswirkungen der in einer Studie verwendeten tatsächlichen Testinstrumente auf die Reaktion der Teilnehmer. Es mag ungewöhnlich klingen, aber es ist möglich, die Teilnehmer einer Studie auf bestimmte Weise mit den von Ihnen verwendeten Maßnahmen "vorzubereiten", wodurch sie anders reagieren, als dies sonst der Fall wäre.
Statistische Regressionbezieht sich auf den natürlichen Effekt von Teilnehmern an extremen Enden einer Maßnahme, die nur aufgrund des Zeitablaufs in eine bestimmte Richtung fallen, und nicht auf den Effekt einer Intervention.
Attrition bezieht sich auf Teilnehmer, die die Studie abbrechen oder verlassen, was bedeutet, dass die Ergebnisse auf einer voreingenommenen Stichprobe von nur Personen basieren, die sich nicht dafür entschieden haben, die Studie zu verlassen (und möglicherweise alle etwas gemeinsam haben, z. B. eine höhere Motivation)..
Diffusionbezieht sich auf die Behandlung in einer Studie, die sich von der Behandlungsgruppe auf die Kontrollgruppe ausbreitet, indem die Gruppen interagieren und miteinander sprechen oder sich gegenseitig beobachten. Dies kann auch zu einem anderen Problem führen, das als Demoralisierung bezeichnet wird und bei dem sich eine Kontrollgruppe weniger anstrengt, weil sie sich über die Gruppe, in der sie sich befinden, empört.

Experimenter Biasbezieht sich auf einen Experimentator, der sich in einer Studie mit verschiedenen Gruppen unterschiedlich verhält, was sich auf die Ergebnisse dieser Studie auswirkt (und durch Verblindung eliminiert wird).

Externe Validität

Externe Validität bezieht sich darauf, wie gut das Ergebnis einer Studie auf andere Einstellungen angewendet werden kann. Mit anderen Worten bezieht sich diese Art der Gültigkeit darauf, wie verallgemeinerbar die Ergebnisse sind. Zum Beispiel gelten die Ergebnisse für andere Personen, Einstellungen, Situationen und Zeiträume?

Ökologische Validität, ein Aspekt der externen Validität, bezieht sich darauf, ob die Ergebnisse einer Studie auf die reale Welt übertragen werden können.

Während rigorose Forschungsmethoden die interne Validität sicherstellen können, kann die externe Validität andererseits durch diese Methoden eingeschränkt werden.

Ein anderer Begriff, der als Übertragbarkeit bezeichnet wird, bezieht sich auf die externe Gültigkeit und bezieht sich auf das qualitative Forschungsdesign. Übertragbarkeit bezieht sich darauf, ob Ergebnisse auf Situationen mit ähnlichen Merkmalen übertragen werden.

Faktoren, die die externe Gültigkeit verbessern

Was können Sie tun, um die externe Validität Ihres Studiums zu verbessern??

Einschluss und Ausschluss Kriterien sollte verwendet werden, um sicherzustellen, dass Sie die Population, die Sie in Ihrer Forschung untersuchen, klar definiert haben.
Psychologischer Realismus bezieht sich darauf, sicherzustellen, dass die Teilnehmer die Ereignisse einer Studie als ein echtes Ereignis erleben und dass sie eine "Titelgeschichte" über das Ziel der Studie erzählen können. Andernfalls können sich die Teilnehmer in einigen Fällen anders verhalten als im realen Leben, wenn sie wissen, was sie zu erwarten haben oder was das Ziel der Studie ist.
Replikation Bezieht sich auf die erneute Durchführung der Studie mit verschiedenen Proben oder in verschiedenen Einstellungen, um festzustellen, ob Sie die gleichen Ergebnisse erhalten. Wenn viele Studien durchgeführt wurden, Meta-Analyse kann auch verwendet werden, um festzustellen, ob die Wirkung einer unabhängigen Variablen zuverlässig ist (basierend auf der Untersuchung der Ergebnisse einer großen Anzahl von Studien zu einem Thema).
Feldversuchekann auch verwendet werden, wenn Sie eine Studie außerhalb des Labors in einer natürlichen Umgebung durchführen.
Aufbereitung oder Kalibrierung bezieht sich auf die Verwendung statistischer Methoden zur Anpassung an Probleme im Zusammenhang mit der externen Validität. Wenn in einer Studie beispielsweise für bestimmte Merkmale (z. B. das Alter) ungerade Gruppen vorhanden sind, kann eine Neugewichtung verwendet werden.

Faktoren, die die externe Gültigkeit bedrohen

Die externe Validität ist gefährdet, wenn eine Studie die Wechselwirkungen von Variablen in der realen Welt nicht berücksichtigt.

Situative faktoren Wie Tageszeit, Ort, Lärm, Forschermerkmale und wie viele Maßnahmen verwendet werden, kann die Generalisierbarkeit der Ergebnisse beeinträchtigen.
Pre- und Post-Test-Effekte beziehen sich auf die Situation, in der der Vor- oder Nach-Test in irgendeiner Weise mit dem in der Studie beobachteten Effekt zusammenhängt, sodass die Ursache-Wirkungs-Beziehung ohne diese zusätzlichen Tests verschwindet.
Beispielfunktionen beziehen sich auf die Situation, in der ein Merkmal der jeweiligen Stichprobe für den Effekt verantwortlich war (oder teilweise verantwortlich war), was zu einer eingeschränkten Generalisierbarkeit der Ergebnisse führte.
Auswahlverzerrung bezieht sich auf das Problem der Unterschiede zwischen Gruppen in einer Studie, die sich auf die unabhängige Variable beziehen können (wiederum etwa auf die Motivation oder die Bereitschaft, an der Studie teilzunehmen, wobei bestimmte demografische Merkmale von Personen mit größerer Wahrscheinlichkeit an einer Online-Umfrage teilnehmen). Dies kann auch als Bedrohung für die interne Gültigkeit angesehen werden.

Ähnlichkeiten und Unterschiede

Interne und externe Gültigkeit sind wie zwei Seiten einer Medaille. Sie können eine Studie mit guter interner Validität haben, aber insgesamt könnte sie für die reale Welt irrelevant sein. Auf der anderen Seite könnten Sie eine Feldstudie durchführen, die für die reale Welt von hoher Relevanz ist, die jedoch keine zuverlässigen Ergebnisse liefert, wenn Sie wissen, welche Variablen die angezeigten Ergebnisse verursacht haben.

Ähnlichkeiten

Was sind die Gemeinsamkeiten zwischen interner und externer Gültigkeit? Beides sind Faktoren, die beim Entwerfen einer Studie berücksichtigt werden sollten, und beide haben Auswirkungen darauf, ob die Ergebnisse einer Studie eine Bedeutung haben. Bei beiden handelt es sich nicht um Entweder-Oder-Konzepte. Sie werden also immer entscheiden, inwieweit Ihr Studium hinsichtlich beider Gültigkeitstypen Leistungen erbringt.

Über jedes dieser Konzepte wird in der Regel in einem Forschungsartikel berichtet, der in einer Fachzeitschrift veröffentlicht wird. Auf diese Weise können andere Forscher die Studie auswerten und Entscheidungen darüber treffen, ob die Ergebnisse nützlich und gültig sind.

Unterschiede

Der wesentliche Unterschied zwischen interner und externer Validität besteht darin, dass sich die interne Validität auf die Struktur einer Studie und ihre Variablen bezieht, während sich die externe Validität darauf bezieht, wie universell die Ergebnisse sind. Es gibt noch weitere Unterschiede zwischen den beiden.

Interne Gültigkeit

Konzentrieren Sie sich auf Genauigkeit und starke Forschungsmethoden
Steuert fremde Variablen
Schlussfolgerungen sind gerechtfertigt
Eliminiert alternative Erklärungen

Externe Validität

Die Ergebnisse lassen sich auf die ganze Welt übertragen
Die Ergebnisse sind verallgemeinerbar
Ergebnisse gelten für praktische Situationen
Ergebnisse können in einen anderen Kontext übersetzt werden

Die interne Validität konzentriert sich auf die Darstellung eines Unterschieds, der allein auf die unabhängige Variable zurückzuführen ist, während die Ergebnisse der externen Validität auf die ganze Welt übertragen werden können.

Beispiele

Ein Beispiel für eine Studie mit guter interner Validität wäre die Hypothese eines Forschers, dass die Verwendung einer bestimmten Achtsamkeits-App die negative Stimmung mindert. Um diese Hypothese zu testen, ordnet der Forscher eine Stichprobe von Teilnehmern zufällig einer von zwei Gruppen zu: denjenigen, die die App über einen definierten Zeitraum nutzen, und denjenigen, die eine Kontrollaufgabe übernehmen.

Der Forscher stellt sicher, dass die Zuordnung der Teilnehmer zu den Gruppen nicht systematisch verzerrt ist, und macht seine wissenschaftlichen Mitarbeiter blind für die Gruppen, in denen sich die Schüler während des Experimentierens befinden.

Es wird ein striktes Studienprotokoll verwendet, das die Verfahren der Studie umreißt. Potenzielle Störgrößen werden zusammen mit der Stimmung gemessen, wie unter anderem der sozioökonomische Status der Teilnehmer, Geschlecht, Alter. Wenn Teilnehmer die Studie abbrechen, werden ihre Merkmale untersucht, um sicherzustellen, dass keine systematische Verzerrung hinsichtlich des Verbleibs in der Studie besteht.

Ein Beispiel für eine Studie mit guter externer Validität wäre im obigen Beispiel, der Forscher stellte auch sicher, dass die Studie externe Validität hat, indem die Teilnehmer die App zu Hause und nicht im Labor verwenden. Der Forscher definiert klar die interessierende Population und wählt eine repräsentative Stichprobe aus und repliziert die Studie für verschiedene technologische Geräte.

Ein Wort von Verywell

Wenn Sie ein Experiment so einrichten, dass es eine solide interne und externe Gültigkeit hat, müssen Sie von Anfang an die Faktoren berücksichtigen, die jeden Aspekt Ihrer Forschung beeinflussen können. Am besten verbringen Sie zusätzliche Zeit mit dem Entwerfen einer strukturell soliden Studie, die weitreichende Auswirkungen hat, anstatt sich schnell durch die Entwurfsphase zu beeilen, um später Probleme zu entdecken. Nur wenn sowohl die interne als auch die externe Validität hoch ist, können aussagekräftige Rückschlüsse auf Ihre Ergebnisse gezogen werden.

Ein Überblick über die wissenschaftliche Methode