Verstärkung (Psychologie)
Verstärkung ist ein Begriff aus der Verhaltensbiologie und der Psychologie, speziell aus dem Behaviorismus.
Bei der Konditionierung bezeichnet man ein Ereignis, das die Wahrscheinlichkeit erhöht, dass ein bestimmtes Verhalten gezeigt wird, als Verstärkung. Unterschieden wird zwischen „positiver“ und „negativer“ Verstärkung. Beide bewirken, dass ein Verhalten häufiger gezeigt wird, mit dem Unterschied, dass bei dem positiven Verstärker – auch Belohnung genannt – ein angenehmer Reiz auf ein gewünschtes Verhalten zugefügt wird (z. B. Anerkennung, Zuwendung, Geld, Schokolade) und bei dem negativen Verstärker ein unangenehmer Reiz entfernt wird (z. B. die Entfernung von Angst, Lärm, einer unangenehmen Tätigkeit). Ein negativer Verstärker darf also nicht (wie es oft passiert) mit einer Bestrafung verwechselt werden. Als Bestrafung bezeichnet man ein Ereignis, bei dem die Auftretenswahrscheinlichkeit eines Verhaltens gesenkt wird. Unterschieden wird dabei zwischen Bestrafungstyp I, der Zufügung eines unangenehmen, also aversiven Reizes (z. B. Schläge, Beschimpfungen, Hausarrest) und dem Bestrafungstyp II, der Entfernung eines angenehmen Reizes bzw. Entzug eines Privilegs (z. B. Fernsehverbot, Wegnehmen eines Spielzeugs, Ignorieren), auch Deprivation genannt.
Der Fachbegriff für diese Formen des Lernens, bei denen der Organismus durch Reaktionen der Umwelt auf sein Verhalten lernt, lautet instrumentelle oder operante Konditionierung. Die Konsequenzen eines Verhaltens wirken also auf das Verhalten zurück. Nach Skinner ist allein das zeitliche Aufeinanderfolgen entscheidend („conditioning takes place presumably because of the temporary relation only“, S. 168).[1] Die Verhaltensanalyse definiert Verstärkung und Verstärker rein formal, über den Effekt auf die Rate des Verhaltens. Bezüglich der Theorien, warum ein Verstärker als solcher wirkt, siehe den Artikel Verstärker (Psychologie). Die Verstärkung kann auch in der Vorstellung ablaufen, was man als verdeckte Verstärkung bezeichnet (siehe verdeckte Konditionierung).[2]
Positive Verstärkung
Man spricht von positiver Verstärkung, wenn auf ein Verhalten ein Ereignis in der Umwelt des Organismus folgt und die Auftretenswahrscheinlichkeit dieses Verhaltens daraufhin ansteigt. Das Ereignis in der Umwelt des Organismus wird als positiver Verstärker bezeichnet. Was ein positiver Verstärker ist, kann nur an den Folgen, die er für die Auftretenswahrscheinlichkeit des Verhaltens hat, erkannt werden. Positive Verstärker sind somit nur formal definiert, nicht inhaltlich. Man kann strenggenommen nicht im Voraus sagen, ob ein bestimmtes Ereignis ein positiver Verstärker, ein negativer Verstärker oder irrelevant ist. Dennoch kann man begründete Vorannahmen machen: Ob ein Ereignis (z. B. eine Futtergabe) ein positiver Verstärker ist, hängt u. a. davon ab, ob der Organismus davon depriviert ist, d. h. das Ereignis (z. B. der Futtergabe) längere Zeit nicht mehr eingetreten ist. Verstärker können primär (artspezifisch angeboren, z. B. Nahrung, angemessene Temperatur, Gelegenheit zu sexueller Aktivität) oder sekundär sein (konditioniert bzw. erlernt; bei Menschen z. B. Erfolg, Geld, Anerkennung). Als umgangssprachliches Äquivalent zu „positiver Verstärker“ wird oft „Belohnung“ oder „angenehme Konsequenz“ verwendet. Dies widerspricht jedoch der rein formalen Definition von „positiver Verstärker“ nach Skinner, da diese Begriffe Mutmaßungen über vermeintliche mentale Zustände des Organismus enthalten.
- Beispiel: Eine 24 Stunden ohne Futter gehaltene Ratte sitzt in einem Käfig mit einheitlich glatten Wänden, in dem sich als einziges abweichend gestaltetes Objekt ein kleiner beweglicher Hebel befindet und in dessen Nähe ein Ausgabeschacht für Futter angebracht ist. Wenn die Ratte diesen Hebel drückt, fallen automatisch einige Futterkörner in den Ausgabeschacht: Das Verhalten (= zufälliges Hebeldrücken) der hungrigen Ratte hat also (in Form der Futterausgabe) eine (für die Ratte) positive Konsequenz. Dies hat mittelfristig zur Folge, dass die Ratte sich häufiger als zuvor in der Nähe des Ausgabeschachts aufhalten wird und sich so auch die Wahrscheinlichkeit erhöht, dass die Ratte erneut den Hebel drückt. Nach zwei oder drei Dutzend Hebeldrücken hat der Beobachter den Eindruck, dass die Ratte gezielt den Hebel drückt, um Futter zu bekommen. – Das Verhalten des Hebeldrückens wurde verstärkt, oder umgangssprachlich formuliert: Die Ratte hat „gelernt“, wie sie sich Futter beschaffen kann. Der Verstärker war dabei das Ereignis der Futtergabe.
Diese kontingente Verstärkung wird auch als Dreifachkontingenz bezeichnet, da wie folgt gelernt wird: Bei Vorhandensein von Stimulus A folgt auf Reaktion B der Verstärker C. Die Organismen lernen somit, dass bei Vorliegen des Reizes A, nicht aber eines anderen Reizes, ihre Reaktion (ihr Verhalten) mit großer Wahrscheinlichkeit eine bestimmte – angenehme – Konsequenz seitens der Umwelt haben wird.
Negative Verstärkung
Von negativer Verstärkung wird gesprochen, wenn ein unangenehmer Reiz entfernt wird. Die negative Verstärkung führt – wie die positive Verstärkung – zu einer Erhöhung der Auftretenswahrscheinlichkeit von Verhalten. Eine Verstärkung kann auch darin bestehen, dass ein (z. B. angstauslösendes) Ereignis in der Umwelt des Organismus vermieden wird und die Rate des Verhaltens daraufhin ansteigt.
Achtung: Negative Verstärkung darf nicht mit Bestrafung verwechselt werden, die die Auftretenshäufigkeit von Verhalten reduzieren (!) soll! Die Negative Verstärkung wird nicht deshalb als „negativ“ bezeichnet, weil etwas „Negatives“ (z. B. ein Stromstoß oder die Anwesenheit eines angstauslösenden Objekts) beendet wurde. Vielmehr leitet sich der Begriff von der gewissermaßen inversen Anwendung (etwas wird weggenommen) der Verstärkungsprozedur her.
- Beispiel: Eine Ratte sitzt im Käfig, der Eisenboden steht unter Strom. Die Ratte zeigt nun verschiedene Verhaltensweisen, u. a. drückt sie den Hebel. Als Konsequenz auf das Verhalten „Hebel drücken“, wird der Strom abgeschaltet. Wird in späteren Durchgängen wieder der Boden unter Strom gesetzt, drückt die Ratte den Hebel früher als zuvor (und beendet damit den Stromstoß). Schließlich drückt die Ratte den Hebel, noch bevor Strom fließt, der aversive Reiz (der Stromstoß) wird somit vermieden.
Aus verhaltenstherapeutischer Sicht kann auch die Aufrechterhaltung von Phobien als ein Fall von negativer Verstärkung angesehen werden. Ein Mensch mit einer Hundephobie wechselt z. B. die Straßenseite, wenn ihm ein Hund entgegenkommt. Durch das Wechseln der Straßenseite beendet oder vermeidet er den angstauslösenden Kontakt mit dem Hund. Das phobische Verhalten „Wechseln der Straßenseite“ wird dadurch jedoch verstärkt, d. h. hier: aufrechterhalten.
Vermeidung
Bei der Vermeidung handelt es sich um eine Form der negativen Verstärkung, bei der eine Reaktion verhindert, dass ein aversiver Reiz überhaupt auftritt.[3] Beispielsweise vermeidet man durch Zahlung eines Strafzettels unangenehme Folgen eines Zahlungsverzuges. Zur Erklärung von Vermeidungsverhalten gibt es zwei einflussreiche Theorien: die Zwei-Faktoren-Theorie und die Einfaktortheorie.[4]
Zwei-Faktoren-Theorie
Die Zwei-Faktoren-Theorie von Orval Hobart Mowrer postuliert, wie der Name schon andeutet, zwei Komponenten einer Vermeidungsreaktion:
- Klassische Konditionierung: einen zuvor neutralen Reiz zu fürchten lernen.
- Operante Konditionierung: zu reagieren, um dem Reiz zu entkommen.
Einige experimentelle Befunde stützen die Zwei-Faktoren-Theorie[5][6][7] andere dagegen kritisieren die Zwei-Faktoren-Theorie: Individuen führen weiterhin Vermeidungsreaktionen aus, obwohl sie keine Anzeichen von Angst zeigen[8] und Vermeidungsreaktionen sind im Allgemeinen löschungsresistent.[9]
Einfaktortheorie
Diese wurde als Alternative zur Zwei-Faktoren-Theorie vorgeschlagen. Sie geht im Gegensatz zur Zwei-Faktoren-Theorie davon aus, dass für das Vermeidungsverhalten das Entfernen des erlernten angstauslösenden Reizes nicht erforderlich ist. Die Vermeidung des aversiven Ereignisses an sich ist der Verstärker.[4] In Experimenten konnte gezeigt werden, dass Versuchstiere Vermeidungsreaktionen erlernen können, ohne dass es einen Reiz gibt, der einen bevorstehenden aversiven Stimulus ankündigt.[10]
Bestrafung
Direkte Bestrafung – Strafe Typ I (auch „positive“ Bestrafung) liegt vor, wenn das operante Verhalten ein Ereignis herbeiführt, das zur Abnahme der Verhaltensrate in dieser Situation führt. Als Bestrafung (im verhaltenswissenschaftlichen Sinn) kann beispielsweise der Stromschlag bezeichnet werden, den ein Weidetier erhält, wenn es den Draht des elektrischen Weidezauns berührt (sofern das Tier das Verhalten „Berühren des Weidezauns“ in Zukunft seltener zeigt; man spricht dann von einer „Bestrafung“, wenn aufgrund einer Verhaltenskonsequenz die Rate dieses Verhaltens sinkt). Ein anderes Beispiel für Bestrafung ist das laute „Pfui!“, wenn ein Hund etwas Unerlaubtes tut (sofern das "Pfui" ein konditionierter Strafreiz für den Hund ist) oder ein fester Ruck an der Leine.
Indirekte Bestrafung – Strafe Typ II (auch „negative“ Bestrafung) liegt vor, wenn aufgrund des operanten Verhaltens ein zuvor vorliegendes Ereignis beendet wird und damit die Verhaltensrate abnimmt. In der „Skinner-Box“ bekommt die Ratte auf Hebeldruck kein Futter mehr, wie noch zuvor. Die Ratte wird langsam aufhören, den Hebel zu drücken. Oder Eltern verbieten ihrem Kind fernzusehen (sofern das Fernsehen für das Kind einen angenehmen Reiz darstellt), wenn es sich nicht an bestimmte Familienregeln gehalten hat.
Von der Bestrafung ist die Löschung zu unterscheiden. Dabei wird ein Verstärker, der bislang auf ein Verhalten folgte, nicht mehr gegeben. Die Rate des Verhaltens sinkt daraufhin.
Bestrafung stellt das Gegenteil von Verstärkung dar: während Verstärkung eine Zunahme des Verhaltens bewirkt, bewirkt Bestrafung eine Abnahme. Wenn ein bestimmtes Verhalten bestraft wird, geht die Häufigkeit dieses Verhaltens zurück, während andere nicht-bestrafte Verhaltensweisen im Wesentlichen unverändert bleiben.[3]
Strafreize
Ähnlich wie Verstärker können auch Strafreize in primäre und konditionierte Reize unterteilt werden.[11]
- Primäre Strafreize sind Reize, welche meist direkt auf den Organismus einwirken und physischen Schaden verursachen (z. B. Schläge).
- Sekundäre Strafreize werden erst durch die individuelle Lerngeschichte zum Strafreiz (z. B. Ermahnungen).
- Generalisierte Strafreize sind Reize, die mit einer Vielzahl von anderen Strafreizen gekoppelt sind (z. B. sozialer Ausschluss).
Faktoren, welche die Effektivität von Bestrafung beeinflussen
Im Rahmen der Experimentellen Verhaltensanalyse wurden die Auswirkungen von Bestrafung auf das Verhalten ausgiebig erforscht. Die Effektivität von Bestrafung hängt von mehreren Faktoren ab:[12]
Intensität
Soll es zu einem dauerhaften Abbau eines Verhaltens kommen, so sollte Bestrafung sofort mit voller Intensität eingesetzt werden. Individuen können sich an eine milde Strafe gewöhnen (Habituation) und können diese Habituation auch auf höhere Bestrafungsintensitäten generalisieren. Fängt man also mit einer milden Bestrafung an und steigert diese sukzessive, sind die Auswirkungen auf das Verhalten gering. Bei einer hinreichend hohen Bestrafungsintensität kommt es hingegen zu einer vollständigen Einstellung des Verhaltens. So wurde beispielsweise in einem Experiment[13] beobachtet, dass ein Stromstoß mit 80 Volt ausreichte, um bei Tauben eine dauerhafte Unterdrückung einer Verhaltensweise zu erreichen. Wurde dagegen mit niedrigeren Spannungen begonnen, gewöhnten sich die Tauben an die Bestrafung und führten das Verhalten sogar bei Stromschlägen mit 130 Volt aus.
Unmittelbarkeit
Ähnlich wie ein Verstärker ist auch ein Bestrafungsreiz dann am wirksamsten, wenn er unmittelbar auf das zu bestrafende Verhalten folgt. Je mehr Zeit zwischen Verhalten und Bestrafung liegt, desto ineffektiver ist die Bestrafung. Experimentell wurde dies etwa bei Ratten nachgewiesen.[14] In einer anderen Untersuchung wurde festgestellt, dass es im Schulunterricht effektiver ist, wenn eine Lehrkraft schlechtes Betragen sofort rügt, anstatt einige Zeit verstreichen zu lassen.[15]
Bestrafungsplan
Analog zu den verschiedenen Verstärkerplänen lassen sich auch bei unterschiedlichen Bestrafungsplänen unterschiedliche Auswirkungen auf das Verhalten feststellen. In Experimenten mit verschiedenen Bestrafungsplänen wurde festgestellt, dass es am effektivsten ist, jede Verhaltensweise zu bestrafen.[16] Prinzipiell zeigt sich bei Bestrafungsplänen das Gegenteil von Verstärkerplänen: Wo zum Beispiel ein bestimmter Verstärkungsplan zu einem beschleunigten Reaktionsmuster führt, führt ein dementsprechender Bestrafungsplan zu einem verlangsamten Reaktionsmuster.[3]
Verhaltensmotivation
Die Effektivität von Bestrafung verhält sich umgekehrt proportional zur Verhaltensmotivation. Ist ein Verstärker „unattraktiv“, so ist die Motivation, zur Erlangung dieses Verstärkers Bestrafung in Kauf zu nehmen, gering. Beispielsweise reagieren hungrige Tauben nur wenig auf Bestrafung, wenn sie durch ihr Verhalten Futter erhalten können. Sind die Tauben dagegen „satt“, so stellen sie ihr Verhalten bei Bestrafung rasch ein, da Futter keinen wirksamen Verstärker darstellt.[17]
Verfügbare Verhaltensalternativen
Bestrafung einer Verhaltensweise ist dann effektiv, wenn eine alternative Verhaltensweise zur Verfügung steht, um sich den Verstärker zu beschaffen, welcher die unerwünschte Reaktion aufrechterhalten hat. Daher wird bei Verhaltensmodifikationen meist eine Verhaltensweise bestraft, während gleichzeitig eine alternative Verhaltensweise verstärkt wird.
Diskriminativer Hinweisreiz
Bestrafung kann auch als diskriminativer Hinweisreiz wirken, als Signal, welches die Verfügbarkeit von anderen (angenehmen oder unangenehmen) Reizen ankündigt. Folgt kontingent auf einen Strafreiz eine Verstärkung, wird der Strafreiz zu einem Hinweisreiz auf die Verstärkung und die Reaktionsraten steigen nach der Gabe des Strafreizes, statt zu sinken. Möglicherweise lassen sich dadurch Formen von Masochismus und selbstverletzendem Verhalten erklären, bei denen auf den eigentlich schmerzhaften Reiz eine Verstärkung (z. B. Aufmerksamkeit) erfolgt.[12]
Nachteile von Bestrafung
Obwohl Bestrafung im Experiment ein wirksames Instrument zur Beeinflussung von Verhalten sein kann, haben Verhaltensanalytiker eine Reihe von Nachteilen herausgearbeitet, welche insbesondere die Effektivität von Bestrafung in der menschlichen Gesellschaft in Frage stellen.
Bestrafung kann emotionale Folgen wie Angst und Wut haben, was wiederum negative Auswirkungen auf verschiedene Leistungen haben kann. So arbeiteten etwa Studenten in einem Experiment schlechter und langsamer, wenn jeder Fehler mit einem Stromschlag bestraft wurde, wurden Fehler hingegen nur durch einen Ton signalisiert, war die Leistung deutlich besser.[18]
Eine noch bedenklichere Nebenwirkung von Bestrafung stellt Aggressivität dar. Aggressionen können sich nach einer Bestrafung gegen den Strafenden oder gegen andere Organismen oder Dinge wenden. Beispielsweise begannen in einem Experiment[19] Ratten, welche zuvor friedlich zusammenlebten, nach der Gabe von Elektroschocks miteinander zu kämpfen. Ähnliche Beobachtungen wurden bei Tauben, Mäusen, Katzen und Affen gemacht.
Des Weiteren kann Bestrafung zu einer allgemeinen Abnahme von Verhalten führen, statt nur zu einer Abnahme des bestraften Verhaltens.[3] So kann etwa ein strenger Tadel eines Lehrers auf eine falsche Antwort eines Schülers dazu führen, dass sich der Schüler überhaupt nicht mehr meldet, selbst wenn er eine eindeutig richtige Antwort weiß.
Ein weiterer Nachteil ist, dass eine Bestrafung eine ständige Überwachung des Verhaltens erfordert, während dies bei Verstärkung nicht der Fall ist.[3] Dies liegt zum einen daran, dass Bestrafung am effektivsten ist, wenn sie konsequent auf das Verhalten folgt, zum anderen, weil es nicht im Interesse eines Individuums liegt, auf zu bestrafendes Verhalten aufmerksam zu machen. So wird ein Kind seine Eltern eher nicht darauf hinweisen, dass es seine Hausaufgaben nicht erledigt hat, wenn es dafür eine Strafe zu befürchten hat. Umgekehrt wird es seine gemachten Hausaufgaben den Eltern präsentieren, wenn hierfür eine Verstärkung erfolgt.
Es ist für Individuen verstärkend, Bestrafung zu vermeiden (Negative Verstärkung). Daher kann es vorkommen, dass versucht wird, Regeln zu umgehen oder die Situation ganz zu vermeiden. Beispielsweise entzieht sich ein Schüler dem Nachsitzen, indem er die Schule komplett schwänzt. Noch problematischer ist es, wenn der Strafende selbst zu einem konditionierten Strafreiz wird.[11] Unter Umständen wird die Strafe dann eher mit der Person des Strafenden verbunden als mit dem bestraften Verhalten.
Zu diesen empirisch festgestellten Einschränkungen gibt es noch ethische Bedenken gegen die Anwendung von Bestrafung insbesondere gegenüber Menschen. Wenn mit positiver Verstärkung ähnlich gute oder sogar bessere Ergebnisse erzielt werden können, stellt sich die Frage, warum man auf Bestrafung zurückgreifen sollte. Aus diesen Gründen wird Bestrafung als Mittel zur Verhaltenskontrolle in der Verhaltensanalyse nur in Ausnahmefällen, und wenn positive Verstärkung keine Alternative darstellt, eingesetzt.[20]
Das Kontingenzschema
Holland und Skinner[21] veranschaulichen die genannten Begriffe im sogenannten Kontingenzschema:
Darbietung | Beseitigung | |
---|---|---|
positiver Verstärker | positive Verstärkung | Bestrafung (Typ II) |
negativer Verstärker | Bestrafung (Typ I) | negative Verstärkung |
Umgangssprachlich könnte man diese Begriffe so umschreiben:
- Positive Verstärkung heißt: Man tut etwas häufiger, weil man etwas Angenehmes dafür bekommt (Bsp.: Ein Schüler meldet sich und wird gelobt; er meldet sich in Zukunft häufiger).
- Negative Verstärkung heißt: Man tut etwas häufiger, weil etwas Unangenehmes dadurch beendet oder vermieden wird (Bsp.: Ein Schüler macht seine Hausaufgaben vollständig und ein zuvor bestehendes Fernsehverbot wird aufgehoben; er macht seine Hausaufgaben in Zukunft häufiger vollständig).
- Bestrafung (Typ I, auch „direkte Bestrafung“) heißt: Man tut etwas seltener oder gar nicht mehr, weil einem dann etwas Unangenehmes widerfahren würde und bereits einmal widerfahren ist (Beispiel: Ein Kind lügt, wird dafür geschimpft und lügt in Zukunft seltener; oder: ein Kind berührt eine heiße Herdplatte und verbrennt sich die Finger, das Kind berührt in Zukunft die heiße Herdplatte nicht mehr).
- Bestrafung durch Verlust (Typ II, auch „indirekte Bestrafung“) heißt: Man tut etwas seltener, weil man ansonsten etwas Angenehmes verlieren würde (Bsp.: Ein Kind lügt und bekommt dafür Taschengeldentzug und lügt in Folge seltener).
Verhaltenswissenschaftliche und laienpsychologische Terminologie
Die genannten umgangssprachlichen Umschreibungen dienen lediglich der Verdeutlichung und vereinfachen die Dinge notwendigerweise. Sie ersetzen nicht die korrekten Definitionen (siehe oben) und können auch nicht synonym zu diesen verwendet werden.[22][23]
Das (umgangssprachliche) „Belohnen“ führt nicht immer zu einem Anstieg der Rate eines Verhaltens. Nicht jede (als solche gemeinte) Belohnung ist also ein Verstärker. Zudem wird eine Person belohnt, verstärkt werden kann nur ein Verhalten.[24] Ebenso verhält es sich mit dem (umgangssprachlichen) Bestrafen: Nicht jede als solche gemeinte Bestrafung hat den Effekt, dass die Rate des Verhaltens sinkt. Zudem sind (umgangssprachliches) Belohnen und Bestrafen immer aktive Handlungen einer Person an einer anderen: die Mutter belohnt das Kind mit einer Tafel Schokolade, der Lehrer bestraft den Schüler mit einer Strafarbeit. Verstärkung findet aber auch in der Natur, ohne das Zutun eines Menschen statt. Das Umdrehen des Zündschlüssels durch den Autofahrer wird durch das Anspringen des Motors positiv verstärkt: Niemand muss neben dem Autofahrer sitzen und ihn dafür loben o. Ä. Dass dies ein Fall von positiver Verstärkung ist, kann man erkennen, wenn der gewohnte Verstärker „Motor springt an“ ausbleibt: Der Autofahrer wird nun das Verhalten „Zündschlüsselumdrehen“ nicht mehr zeigen, das Verhalten wird extingiert (nicht ohne dass zuvor der übliche Extinktionsausbruch gezeigt wurde, d. h. der Autofahrer versucht es zunächst noch eine Weile wiederholt, ehe er den Versuch, das Auto zu starten, aufgibt).
Siehe auch
Einzelnachweise
- B. F. Skinner: Superstition in the pigeon. In: Journal of Experimental Psychology. Princeton NJ 38.1948, S. 168–172 ISSN 0022-1015
- Michael Linden, Martin Hautzinger: Verhaltenstherapie: Techniken und Einzelverfahren. Springer-Verlag, 2013, ISBN 978-3-662-22591-2, S. 325 (eingeschränkte Vorschau in der Google-Buchsuche).
- James E. Mazur:: Lernen und Verhalten. 6. Auflage. Pearson Studium, Hallbergmoos, ISBN 3-8273-7218-6, S. 278.
- R. J. Herrnstein: Method and theory in the study of avoidance. In: Psychological Review. Band 76, Nr. 1, 1. Januar 1969, ISSN 0033-295X, S. 49–69, PMID 5353378.
- R. L. Solomon, L. J. Kamin, L. C. Wynne: Traumatic avoidance learning: the outcomes of several extinction procedures with dogs. In: Journal of Abnormal Psychology. Band 48, Nr. 2, 1. April 1953, ISSN 0021-843X, S. 291–302, PMID 13052353.
- N. E. Miller: Studies of fear as an acquirable drive fear as motivation and fear-reduction as reinforcement in the learning of new responses. In: Journal of Experimental Psychology. Band 38, Nr. 1, 1. Februar 1948, ISSN 0022-1015, S. 89–101, PMID 18910262.
- R. G. Weisman, J. S. Litner: Positive conditioned reinforcement of Sidman avoidance behavior in rats. In: Journal of Comparative and Physiological Psychology. Band 68, Nr. 4, 1. August 1969, ISSN 0021-9940, S. 597–603, doi:10.1037/h0027682.
- P. J. Bersh, J. M. Notterman, W. N. Schoenfeld: Extinction of a human cardiac-response during avoidance-conditioning. In: The American Journal of Psychology. Band 69, Nr. 2, 1. Juni 1956, ISSN 0002-9556, S. 244–251, PMID 13327085.
- R. L. Solomon, L. C. Wynne: Traumatic avoidance learning: the principles of anxiety conservation and partial irreversibility. In: Psychological Review. Band 61, Nr. 6, 1. November 1954, ISSN 0033-295X, S. 353–385, PMID 13215688.
- R. J. Herrnstein, P. N. Hineline: Negative reinforcement as shock-frequency reduction. In: Journal of the Experimental Analysis of Behavior. Band 9, Nr. 4, 1. Juli 1966, ISSN 0022-5002, S. 421–430, PMID 5961510, PMC 1338243 (freier Volltext).
- Christoph Bördlein: Einführung in die Verhaltensanalyse (behavior analysis). 1. Auflage. Alibri, Aschaffenburg 2015, ISBN 978-3-86569-232-0, S. 145.
- Nathan H. Azrin, William C. Holz: Punishment. In: Werner K. Honig (Hrsg.): Operant Behavior: Areas of Research and Application. 1966. Auflage. Appleton-Century-Crofts, New York 1966, S. 380–447.
- N. H. Azrin, W. C. Holz, D. F. Hake: Fixed-ratio punishment. In: Journal of the Experimental Analysis of Behavior. Band 6, Nr. 2, 1. April 1963, S. 141–148, doi:10.1901/jeab.1963.6-141, PMID 13965779, PMC 1404287 (freier Volltext).
- Alan Baron, Arnold Kaufman, Dan Fazzini: Density and delay of punishment of free-operant avoidance. In: Journal of the Experimental Analysis of Behavior. Band 12, Nr. 6, 1. November 1969, ISSN 0022-5002, S. 1029–1037, doi:10.1901/jeab.1969.12-1029, PMID 16811408, PMC 1338715 (freier Volltext).
- Ann J. Abramowitz, Susan G. O'Leary: Effectiveness of delayed punishment in an applied setting. In: Behavior Therapy. Band 21, Nr. 2, 1. Januar 1990, S. 231–239, doi:10.1016/S0005-7894(05)80279-5 (sciencedirect.com [abgerufen am 7. März 2017]).
- Ennio Cipani, Janet Brendlinger, Linda McDowell, Stacey Usher: Continuous vs. Intermittent punishment: A case study. In: Journal of Developmental and Physical Disabilities. Band 3, Nr. 2, ISSN 1056-263X, S. 147–156, doi:10.1007/BF01045930.
- N. H. Azrin, W. C. Holz, D. F. Hake, T. Ayllon: Fixed-ratio escape reinforcement. In: Journal of the Experimental Analysis of Behavior. Band 6, Nr. 3, 1. Juli 1963, ISSN 0022-5002, S. 449–456, doi:10.1901/jeab.1963.6-449, PMID 13965780, PMC 1404469 (freier Volltext).
- Marie T. Balaban, Dell L. Rhodes, Allen Neuringer: Orienting and defense responses to punishment: Effects on learning. In: Biological Psychology. Band 30, Nr. 3, 1. Juni 1990, S. 203–217, doi:10.1016/0301-0511(90)90140-R (sciencedirect.com [abgerufen am 7. März 2017]).
- R. E. Ulrich, N. H. Azrin: Reflexive fighting in response to aversive stimulation. In: Journal of the Experimental Analysis of Behavior. Band 5, Nr. 4, 1. Oktober 1962, ISSN 0022-5002, S. 511–520, doi:10.1901/jeab.1962.5-511, PMID 13995319, PMC 1404196 (freier Volltext).
- Dorothea C Lerman, Christina M Vorndran: On the status of knowledge for using punishment implications for treating behavior disorders. In: Journal of Applied Behavior Analysis. Band 35, Nr. 4, 1. Januar 2002, ISSN 0021-8855, S. 431–464, doi:10.1901/jaba.2002.35-431, PMID 12555918, PMC 1284409 (freier Volltext).
- J. G. Holland, B. F. Skinner: Analyse des Verhaltens. Urban & Schwarzenberg, München 1974, S. 218.
- A. Charles Catania: Learning. Interim (4th) Edition. Sloan Publishing, Cornwall-on-Hudson, NY 2007, ISBN 1-59738-007-5.
- Paul Chance: Learning and Behavior. Brooks / Cole Publishing Company, Pacific Grove 1999, ISBN 0-534-34691-X.
- "People are rewarded, but behavior is reinforced", B. F. Skinner: What is wrong with daily life in the western world? In: American Psychologist. Washington DC 41.1986, H. 5, S. 568–574 ISSN 0003-066X (S. 569).