Post on 08-Sep-2018
4. Operante Konditionierung
Operante Konditionierung (OK)
• Die OK befasst sich mit Modellen, die Lernen anhand von Zusammenhängen des Verhaltens mit positiven oder negativen Konsequenzen zu erklären versuchen
– Erfolgslernen, Misserfolgslernen
• OK vermag insbesondere, den Erwerb von absichtsvollem, komplexem, zielgerichtetem Verhalten zu erklären
4. Operante Konditionierung
OK
4. Operante Konditionierung
Edward Thorndike: The Law of Effect (1911)
• beschäftigte sich als Student mit Intelligenz bei Tieren
• experimentierte, um Tiere beim Problemlösen zu beobachten
• bastelte aus alten Obstkisten Käfig mit Hebel zur Öffnung der Türe – setzte die Katze rein und den Fisch vor den Käfig
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
• Beobachtete 3 Lern-Phasen
– Katze versuchte «alles», tritt zufällig auf Hebel
– 2. Katze probierte Verhaltensabfolge aus, bis sie wieder auf Hebel tritt.
– 3. nach vielen Versuchen tritt Katze direkt auf Hebel
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
• The Law of Effect:
– Verhaltensweisen, auf die eine erfreuliche Konsequenz folgt, werden wiederholt, während dem Verhaltensweisen, auf die keine erfreuliche Konsequenz folgt, nicht mehr gezeigt werden
4. Operante Konditionierung 4.1 Frühe Experimente
Edward Thorndike: The Law of Effect (1911)
• Thorndike zeigte also erstmals den Zusammenhang zwischen Verhalten und seinen Konsequenzen (R-K).
• Versuch und Irrtum („trial and error“) sind entsprechend seiner Sicht die Grundlagen des Lernens
• Er lieferte eine mechanistische Erklärung des Lernens: Lernen erfolge auf der Grundlage des Erlebens von Assoziationen.
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: The Law of Effect (1911)
Revidiertes Law of Effect :
• Asymmetrie der Wirkung von Belohnung und Bestrafung: Belohnung ist gegenüber Bestrafung verhaltenswirksamer!
Edward Thorndike: The Law of Exercise
• Geübte Reaktionen treten mit grösserer Wahrscheinlichkeit wieder auf, wenn eine entsprechende Situation wieder auftritt.
• Das Gesetz der Übung beinhaltet zwei Aussagen: – die Annahme, dass der Gebrauch einer Verknüpfung durch Übung
deren Stärke steigert.
– dass der Nicht-Gebrauch (Unterlassen der Übung) zu einer Schwächung oder einem Vergessen dieser Verbindung führt
• Revision: …
– dass die Verstärkung nur stattfindet, wenn der Organismus Informationen über die Richtigkeit der Reaktion erhält
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Edward Thorndike: Relevanz
• Der Ansatz von Thorndike kann als Ursprung der behavioristischen Lerntheorie gelten. Die Theorie findet heute aufgrund ihrer mechanistischen Ausprägung nur begrenzt Anerkennung.
• Nicht alle Erkenntnisse von Thorndike sind in den Humanbereich übertragbar, da verdeckte kognitive Prozesse vernachlässigt wurden.
4. Operante Konditionierung 4.1 Frühe Experimente und Theorie
Burrhus F. Skinner
• Skinner wollte Lernen systematisch untersuchen. Dazu suchte er nach einem Weg, die Reaktions-Konsequenz- Zusammenhänge seiner Probanden (Mäuse, Tauben) vollständig zu kontrollieren
• Als Graduate-Student baute er 1930 aus einer alten Eiskiste eine Apparatur mit – einem Stimulus-Licht – Tasten – einem Futterspender – und einem Gitterrost-Boden (mittels dem Elektroschocks
verabreicht werden konnten).
• Dazu baute er einen Automaten, der automatisch
das Verhalten aufzeichnete
1904 - 1990
4. Operante Konditionierung 4.2 Skinner: Frühe Experimente und Theorie
die SKINNER-BOX!
Kassin, 2004, p.181 4. Operante Konditionierung 4.2 Skinner: Frühe Experimente und Theorie
Zusammenfassung
• Operante Konditionierung: Lernen am Erfolg/Misserfolg
• Wichtige Arbeiten von E. Thorndike: Law of Effect
• Wichtiges Prinzip: Zusammenhang zwischen Verhalten und Konsequenz
• Law of Exercise: – der Gebrauch einer Verknüpfung durch Übung steigert deren
Stärke
– der Nicht-Gebrauch (Unterlassen der Übung) führt zu einer Schwächung oder einem Vergessen dieser Verbindung
• B. F. Skinner: Entwickelte Theorie der Operanten Konditionierung
Skinner: Neue Begriffe
• Skinner führte neue Begriffe ein, um das aktive Lernen vom passiven Lernen, wie es Pavlov konzeptualisierte, zu unterscheiden
• Er nannte die aktive Form zu Lernen: Operante Konditionierung, da das Verhalten auf die Umwelt einwirkt und dadurch eine (erwünschte) Konsequenz auslöst (“the behavior operates on the environment to produce a desirable outcome”)
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Skinner: Neue Begriffe
• Skinner unterscheidet Stimuli zudem in verschiedene Arten von “Verstärkern” (Reinforcement) – Als guter Behaviorist wollte Skinner Spekulationen über die
inneren Vorgänge vermeiden, und war deshalb bemüht, Begriffe wie zufriedenstellend oder Belohnung zu vermeiden
• Ein Verstärker ist ein Stimulus, der kontingent auf ein bestimmtes Verhalten erfolgt, und der die Auftretenswahrscheinlichkeit dieses konkreten Verhaltens entweder erhöht oder vermindert
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Skinner: Verstärker
• Positive Verstärker
– sind angenehme Stimuli, die die zukünftige Verhaltenswahrscheinlichkeit erhöhen. Diese können ungelernt (primäre V. ) oder gelernt (sekundäre V.) sein.
• Negative Verstärker
– sind aversive, also unangenehme Stimuli, die die zukünftige Verhaltenswahrscheinlichkeit senken. Auch diese können ungelernt (primäre V. ) oder gelernt (sekundäre V.) sein.
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Skinner: Verstärkung
• Verstärkung bezeichnet den Prozess der Darbietung oder Entfernen eines Reizes nach einem bestimmten Verhalten
• Positive Verstärkung – Verhaltenskontingente Darbietung eines positiven Stimulus.
Dies führt zu einer Erhöhung der Verhaltenswahrscheinlichkeit
• Negative Verstärkung – Entfernung eines aversiven Stimulus. Führt ebenfalls zu einer
Erhöhung der Verhaltenswahrscheinlichkeit
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Verstärkungsmatrix (s. Holland & Skinner, 1971)
Darbietung Entfernung
Positiver Stimulus
Positive Verstärkung V+
Negative (indirekte) Bestrafung
V-
Aversiver Stimulus
Positive (direkte) Bestrafung
V-
Negative Verstärkung V+
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Primäre Verstärker
• wirken ohne vorangegangene Lernprozesse
– ihre Wirkung wird meist mit Triebreduktion erklärt
• es kann unterschieden werden zwischen:
– positiven primären Verstärkern (Nahrung, Bewegung, usw.)
– negativen primären Verstärkern (akustische Reize, elektrische Schläge, usw.)
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Sekundäre und Generalisierte Verstärker
• Sekundärer V.: Ein ursprünglich neutraler Reiz der zum Verstärker wird, wenn er mit dem primären Verstärker gepaart wird (konditionierte Verstärker).
• Generalisierter V.: Ein Verstärker, der gegen mehrere primäre Verstärker eingelöst werden kann (z.B. Geld, Tokens)
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Arten der Verstärkung
• Intrinsische Verstärkung – spirituelle, ideologische Verstärkung
• religiöse oder ideologische Werte und Ziele, theoretische oder symbolische Verstärkung
– Handlungsverstärker • Sport, Tanzen, Spazieren, Entspannung
• Extrinsische Verstärkung – materielle Verstärkung
• Geld, materielle Belohnungen
– soziale Verstärkung • Lächeln, Lob, Anerkennung, Zuwendung
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe
Arten der Verstärkung
Oft erfolgen Verstärkungsprozesse nicht durch externe Verstärkung (Fremdverstärkung), sondern in Form der Selbstverstärkung
• hierzu gibt es zwei Varianten
1. jemand belohnt sich selbst bewusst
2. die Verstärkung geht aus einer Handlung selbst hervor
4. Operante Konditionierung 4.3 Skinner: Konzepte / Begriffe