So funktionieren Bewehrungspläne

Operante Konditionierung ist ein Lernprozess, bei dem neue Verhaltensweisen erworben und durch ihre Verknüpfung mit Konsequenzen modifiziert werden. Die Verstärkung eines Verhaltens erhöht die Wahrscheinlichkeit, dass es in Zukunft erneut auftritt, während die Bestrafung eines Verhaltens die Wahrscheinlichkeit verringert, dass es wiederholt wird.

In der Operantenkonditionierung sind Verstärkungspläne ein wichtiger Bestandteil des Lernprozesses. Wann und wie oft wir ein Verhalten verstärken, kann einen dramatischen Einfluss auf die Stärke und Geschwindigkeit der Reaktion haben.

Die 3 Haupttheorien des Lernens

Zeitplan der Verstärkung

Ein Verstärkungsplan ist im Grunde eine Regel, die angibt, welche Instanzen eines Verhaltens verstärkt werden. In einigen Fällen kann ein Verhalten bei jedem Auftreten verstärkt werden. Manchmal kann es vorkommen, dass ein Verhalten überhaupt nicht verstärkt wird.

Es kann entweder eine positive Verstärkung oder eine negative Verstärkung als Teil der operanten Konditionierung verwendet werden. In beiden Fällen besteht das Ziel der Verstärkung darin, ein Verhalten so zu verstärken, dass es wahrscheinlich wieder auftritt.

Verstärkungspläne finden sowohl in natürlich vorkommenden Lernsituationen als auch in strukturierteren Trainingssituationen statt.

In realen Umgebungen werden Verhaltensweisen wahrscheinlich nicht jedes Mal verstärkt, wenn sie auftreten. In Situationen, in denen Sie absichtlich versuchen, eine bestimmte Aktion zu verstärken (z. B. in der Schule, beim Sport oder beim Tiertraining), befolgen Sie einen bestimmten Zeitplan für die Verstärkung.

Einige Stundenpläne sind für bestimmte Trainingssituationen besser geeignet. In einigen Fällen erfordert das Training einen Zeitplan und wechselt dann zu einem anderen, sobald das gewünschte Verhalten vermittelt wurde.

Die beiden Grundformen der Bewehrungspläne werden als bezeichnet kontinuierliche Verstärkung und teilweise Verstärkung.

Kontinuierliche Verstärkung

Bei der kontinuierlichen Verstärkung wird das gewünschte Verhalten jedes Mal verstärkt, wenn es auftritt. Dieser Zeitplan wird am besten in der Anfangsphase des Lernens verwendet, um eine starke Assoziation zwischen Verhalten und Reaktion herzustellen.

Stellen Sie sich zum Beispiel vor, Sie wollen einem Hund beibringen, sich die Hand zu geben. Während der Anfangsphasen des Lernens würden Sie sich an einen kontinuierlichen Verstärkungsplan halten, um das Verhalten zu lehren und zu etablieren.

Dies kann bedeuten, dass Sie die Pfote des Hundes ergreifen, sie schütteln, "schütteln" sagen und dann jedes Mal, wenn Sie diese Schritte ausführen, eine Belohnung anbieten. Irgendwann wird der Hund die Handlung selbstständig ausführen.

Kontinuierliche Bewehrungspläne sind am effektivsten, wenn Sie versuchen, ein neues Verhalten zu vermitteln. Es bezeichnet ein Muster, auf das jeder eng definierten Antwort eine eng definierte Konsequenz folgt.

Teilbewehrung

Sobald die Antwort feststeht, wird ein fortlaufender Bewehrungsplan normalerweise auf einen Teilbewehrungsplan umgestellt.

Bei teilweiser (oder intermittierender) Verstärkung wird die Reaktion nur teilweise verstärkt. Gelerntes Verhalten wird langsamer mit teilweiser Verstärkung erlernt, die Reaktion ist jedoch widerstandsfähiger gegen Aussterben.

Denken Sie an das frühere Beispiel, in dem Sie einen Hund zum Schütteln und Schütteln trainiert haben. Während Sie anfänglich eine kontinuierliche Verstärkung verwendet haben, ist es einfach unrealistisch, das Verhalten jedes Mal zu verstärken. Mit der Zeit würden Sie zu einem Teilzeitplan wechseln, um zusätzliche Verstärkung bereitzustellen, sobald das Verhalten festgestellt wurde oder nachdem eine beträchtliche Zeit verstrichen ist.

Es gibt vier Zeitpläne für die teilweise Verstärkung:

Zeitpläne mit festem Verhältnis

Zeitpläne mit festem Verhältnissind solche, bei denen eine Antwort erst nach einer festgelegten Anzahl von Antworten verstärkt wird. Dieser Zeitplan erzeugt eine hohe, gleichmäßige Reaktionsrate mit nur einer kurzen Pause nach der Abgabe des Verstärkers.

Ein Beispiel für einen Zeitplan mit festem Verhältnis wäre die Abgabe eines Lebensmittelpellets an eine Ratte, nachdem diese fünf Mal einen Riegel gepresst hat.

Variable-Ratio-Zeitpläne

Zeitpläne mit variablem Verhältnistritt auf, wenn eine Antwort nach einer unvorhersehbaren Anzahl von Antworten verstärkt wird. Dieser Zeitplan führt zu einer hohen konstanten Antwortrate. Glücksspiele und Lotteriespiele sind gute Beispiele für eine Belohnung, die auf einem Zeitplan mit variablem Verhältnis basiert.

In einer Laborumgebung kann dies die Abgabe von Lebensmittelpellets an eine Ratte nach einem Pressvorgang, erneut nach vier Pressvorgängen und erneut nach zwei Pressvorgängen umfassen.

Zeitpläne mit festen Intervallen

Zeitpläne mit festen Intervallen sind solche, bei denen die erste Antwort erst nach Ablauf einer bestimmten Zeitspanne belohnt wird. Dieser Zeitplan führt dazu, dass gegen Ende des Intervalls große Mengen an Antworten eingehen, jedoch unmittelbar nach der Abgabe des Verstärkers viel langsamer.

Ein Beispiel hierfür in einer Laborumgebung wäre die Verstärkung einer Ratte mit einem Laborpellet für die erste Stangenpresse nach Ablauf eines Intervalls von 30 Sekunden.

Zeitpläne mit variablen Intervallen

Zeitpläne mit variablen Intervallen treten auf, wenn eine Antwort belohnt wird, nachdem eine unvorhersehbare Zeitspanne verstrichen ist. Dieser Zeitplan führt zu einer langsamen und gleichmäßigen Antwortrate.

Ein Beispiel hierfür wäre die Abgabe eines Nahrungspellets an eine Ratte nach der ersten Riegelpresse nach einem einminütigen Intervall. ein zweites Pellet für die erste Antwort nach einem Fünf-Minuten-Intervall; und ein drittes Pellet für die erste Antwort nach einem Drei-Minuten-Intervall.

Verwenden des entsprechenden Zeitplans

Die Entscheidung, wann ein Verhalten verstärkt werden soll, kann von einer Reihe von Faktoren abhängen. In Fällen, in denen Sie speziell versuchen, ein neues Verhalten zu vermitteln, ist ein kontinuierlicher Zeitplan oft eine gute Wahl. Sobald das Verhalten erlernt wurde, ist es oft vorzuziehen, zu einem Teilzeitplan zu wechseln.

Im täglichen Leben treten partielle Verstärkungspläne viel häufiger auf als kontinuierliche. Stellen Sie sich zum Beispiel vor, Sie würden jedes Mal eine Belohnung erhalten, wenn Sie pünktlich zur Arbeit erscheinen. Im Laufe der Zeit kann die Ablehnung der Belohnung als negative Verstärkung angesehen werden, anstatt dass die Belohnung eine positive Verstärkung darstellt.

Stattdessen werden Belohnungen wie diese in der Regel nach einem weniger vorhersehbaren Zeitplan für die teilweise Verstärkung verteilt. Diese sind nicht nur viel realistischer, sondern neigen auch dazu, höhere Rücklaufquoten zu erzielen, während sie weniger vom Aussterben bedroht sind.

Teilpläne verringern das Sättigungsrisiko, sobald ein Verhalten festgestellt wurde. Wenn eine Belohnung ohne Ende gegeben wird, kann der Proband die Ausführung des Verhaltens einstellen, wenn die Belohnung nicht mehr gewünscht oder benötigt wird.

Stellen Sie sich zum Beispiel vor, Sie wollen einem Hund das Sitzen beibringen. Wenn Sie jedes Mal Futter als Belohnung verwenden, wird der Hund möglicherweise die Leistung einstellen, sobald er voll ist. In solchen Fällen kann so etwas wie Lob oder Aufmerksamkeit effektiver sein, um ein bereits etabliertes Verhalten zu verstärken.

Was ist ein Sekundärverstärker??

Ein Wort von Verywell

Operante Konditionierung kann ein leistungsfähiges Lerninstrument sein. Der Zeitplan für die Verstärkung, der während des Trainings- und Wartungsprozesses verwendet wird, kann einen großen Einfluss darauf haben, wie schnell ein Verhalten erfasst wird, wie stark die Reaktion ist und wie häufig das Verhalten angezeigt wird.

Um festzustellen, welcher Zeitplan vorzuziehen ist, müssen Sie verschiedene Aspekte der Situation berücksichtigen, einschließlich der Art des Verhaltens, das vermittelt wird, und der Art der gewünschten Reaktion.

Wie soziale Stärkung das Verhalten beeinflusst