Theorie des Lernens durch Verstärkung (Burrhus Frederic Skinner)
Aufgaben:
1. Informieren Sie sich über die Grundlagen des Lernens durch Verstärkung nach Burrhus F. Skinner.
2. Fassen Sie die zentralen Erkenntnisse schriftlich zusammen. Gehen Sie dabei auch auf den Versuchsaufbau der klassischen „Skinnerbox“ ein.
3. Zeigen Sie an selbstgewählten Beispielen aus Ihrem (beruflichen) Alltag Prozesse des Lernens durch Verstärkung . Bestimmen Sie dabei die relevanten Fachbegriffe.
Informationstext zum Lernen durch Verstärkung
Ausgehend von Thorndikes Erkenntnissen zum Lernen durch Versuch und Irrtum entwickelte B.F. Skinner einen eigenen Problemkäfig – die sogenannte Skinnerbox. Anhand von Experimenten mit Ratten und Tauben entwickelte Skinner die von Thorndike vorgelegte Theorie weiter, indem er die Konsequenzen für ein gezeigtes Verhalten in den Mittelpunkt seiner Forschungen rückte.
a) Versuchsanordnung
Skinner setzte verschiedene Ratten in seine Käfige, die mit einem Hebel, einem Licht und einem elektrischen Boden ausgestattet waren (Quelle: http://www.lern-psychologie.de/behavior/skinner.htm (25.08.18)):
Drückte Ratte 1 zufällig den Hebel, so kam für das hungrige Tier Futter aus dem Futtermagazin gefallen.
Drückte Ratte 2 den Hebel, so wurde der Strom abgeschaltet, der durch den Käfigboden lief, und die Ratte wurde somit von ihren Schmerzen befreit.
Drückte Ratte 3 den Hebel, so wurde der Gitterboden unter Strom gesetzt und der Ratte wurden so Schmerzen zugefügt.

SkinnerBox, V1nzorg, CC BY-SA 3.0, https://commons.wikimedia.org/wiki/File:Skinner_box_de.png (25.08.18)
Skinner wiederholte den Versuch solange, bis die jeweilige Ratte den Zusammenhang zwischen „Hebel drücken“ und „Futter bekommen“ bzw. „Stromfluss im Käfig“ lernte. Sie lernte also, wie die Konsequenzen ihres Verhaltens mit ihrem Verhalten zusammenhingen.
Beobachtbare Folgen:
Die Ratten 1 und 2 drückten den Hebel häufiger, denn sie hatten gelernt, durch das Drücken eine angenehme Konsequenz herbeizuführen (= Futtergabe) bzw. eine unangenehme Konsequenz (= Strom) abzuwenden.
Bei Ratte 3 blieb das Drücken des Hebels nach einiger Zeit aus. Sie hatte gelernt, dass auf dieses Verhalten eine unangenehme Konsequenz folgt, was durch den nach dem Hebeldruck folgenden Stromfluss verdeutlicht wird.
(Hinweis: weitere Ausführungen zur Bedeutung bzw. den Folgen und verschiedenen Formen der Bestrafung finden sich im Abschnitt „Kontingenzschema“)
b) Begründung des Verstärkungslernens
Skinner fasste die Beobachtungen aus seinen Versuchsaufbauten unter „Lernen durch Verstärkung“ bzw. „Lernen durch Erfolg“ zusammen. Durch operantes Konditionieren wird die Auftretenswahrscheinlichkeit eines Verhaltens aufgrund der darauffolgenden Konsequenz erhöht bzw. gesenkt.
Man kann die Konsequenzen eines Verhaltens in zwei Klassen einteilen: die angenehmen (appetitiven) Konsequenzen und die unangenehmen (aversiven) Konsequenzen. Ein Verhalten, auf das eine angenehme Konsequenz folgt wird in der Zukunft häufiger gezeigt (Verstärkung). Eine appetitive Konsequenz kann die Darbietung eines angenehmen Reizes (z.B. Futter, Aufmerksamkeit) oder die Entfernung eines unangenehmen Reizes (z.B. Stromschlag, Isolation) sein. Entscheidend bei der Verstärkung ist letztlich auch hier die zeitliche Beziehung zwischen einem Stimulus und einer Reaktion.
Schermer, Drinkmann: Grundlagen der Psychologie (Psychologie in der Sozialen Arbeit, Band 1), Kohlhammer Verlag, 4. Auflage 2017, S. 56
Skinner begründete dabei zwei Arten von Verstärkung:
> Folgt auf ein Verhalten eine angenehme Konsequenz, so spricht man von positiver Verstärkung. Die Wahrscheinlichkeit, dass das Verhalten in der Folge wieder und damit vermehrt gezeigt wird, ist sehr hoch, da die angenehme Folge wieder herbeigeführt werden möchte.
Exemplifikation: Marie zeigt löbliches Verhalten im Alltag und bekommt dafür eine Belohnung, z.B. ein Eis. Auf das Verhalten (z.B. Aufräumen des Zimmers) folgt eine positive Konsequenz, welche in diesem Falle durch das Eis dargestellt wird. Es ist in der Folge sehr wahrscheinlich, dass das Mädchen die verstärkte Verhaltensweise, also das Aufräumen des Zimmers, vermehrt zeigt, da eine positive Konsequenz zu erwarten ist.
> Von der negativen Verstärkung ist laut Skinner dann zu sprechen, wenn auf bestimmte Verhaltensweise die Beseitigung eines unangenehmen Reizes als Konsequenz folgt.
Exemplifikation: Das Kind zeigt ein löbliches Verhalten im Alltag. Aus diesem Grund heben die Eltern das zweitägige Fernsehverbot (=unangenehme Konsequenz) auf. Das heißt, dass der unangenehme Zustand des Fernsehverbots beseitigt wird. Dies führt dazu, dass die hiervor gezeigte Verhaltensweise in Zukunft vermehrt gezeigt wird.
Interesse geweckt?
Einen konkreten Einblick in den Versuchsaufbau von Skinner sowie ein kurzes Interview mit Skinner zur Bedeutung seiner Erkenntnisse bietet folgendes Video: