TEMA 4 APRENDIZAJE.pdf

7
 PSICOLOGIA APRENDIZAJE ADELINE  TEMA 4 2014  1  TEMA 4: PRINCIPIOS BASICOS DEL CONDICIONAMIENTO OPERANTE Palabras claves: CASTIGO, ENTRENAMIENTO DE OMISION, CLASE DE ESTIMULO, CLASE DE RESPUESTA, CONDUCTA SUPERSTICIOSA, CONTRASTE CONDUCTUAL, CONTROL POR EL ESTIMULO, DERIVA INSTINTIVA, DEVALUACION DEL REFORZADOR, INDEFENSION APRENDIDA, ESCAPE, EVITACION, EXTINCION, MARCADO, REFORZAMIENTO POSITIVO I  ANTECEDENTES HISTORICOS  Teoría evo : variación y selección tb se aplican al comportamiento. Darwin  Lo plantea en Skinner  The Behavior of Organisms  Reforzador como elemento seleccionador  A  THORNDIKE Y LA LEY DEL EFECTO  Primer en estudiar CO, lo llamò “ aprendizaje por ensayo-error   Conexión E-R se fortaleza si satisfacción del animal => CONEXIONISMO  Paradigma / Concepción hedonista E-R  Cajas problemas: medida de latencia de escape  Ley del Efecto: las respuestas que van acompañadas o inmediatamente seguidas de s atisfacción  se conectaran más firmemente con la situación, de manera que cuando ésta vuelva a presentarse, volverán las R con más probabilidad. ENSAYO DISCRETO B  ANALISIS EXPERIMENTAL DEL COMPORTAMIENTO DE SKINNER  Reflejos se pueden estudiar como conductas: conducta se regula tanto por C respondiente (reflejos) que CO  Relaciones funcionales entre conducta / consecuencias.  OPERANTE: cap del indiv para operar sobre su ambiente  INSTRUMENTAL : conducta como instrumento para obtener  el reforzador  Introdujo innovación: respuesta que sujeto pueda ejecutar repetidamente sin intervención  experimentador  Caja de Skinner: medida de tasa de respuesta   OPERANTE LIBRE II  DEFINICION DE CONDICIONAMIENTO OPERANTE  Conductas operantes resultados de las consecuencias que han tenido en el pasado  (# estímulos que las provoquen) => son (# Elicitadas) EMITIDAS  = proceso que da lugar a que la proba de u na respuesta se vea mod ificada por sus co nsecuenci as  CO  Organismos aprenden a obtener consecuencias favorables / eliminar desfavorables.  Puede dar lugar a aparición de respuestas nuevas  A  LA CONTINGENCIA DE TRES TERMINOS  Contingencia respuesta/reforzador/estimulo (consecuencia depende presentación respuesta).  En presencia de un especifico, el se presentará si y solo si la ESTIMULO REFORZADOR RESPUESTA operante sucede.

description

TEMA 4 APRENDIZAJE

Transcript of TEMA 4 APRENDIZAJE.pdf

  • PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014

    1

    TEMA 4: PRINCIPIOS BASICOS DEL CONDICIONAMIENTO OPERANTE

    Palabras claves: CASTIGO, ENTRENAMIENTO DE OMISION, CLASE DE ESTIMULO, CLASE DE RESPUESTA, CONDUCTA SUPERSTICIOSA, CONTRASTE CONDUCTUAL, CONTROL POR EL ESTIMULO, DERIVA INSTINTIVA, DEVALUACION DEL REFORZADOR, INDEFENSION APRENDIDA, ESCAPE, EVITACION, EXTINCION, MARCADO, REFORZAMIENTO

    POSITIVO

    I ANTECEDENTES HISTORICOS Teora evo : variacin y seleccin tb se aplican al comportamiento. Darwin

    Lo plantea en Skinner The Behavior of Organisms

    Reforzador como elemento seleccionador

    A THORNDIKE Y LA LEY DEL EFECTO Primer en estudiar CO, lo llam aprendizaje por ensayo-error

    Conexin E-R se fortaleza si satisfaccin del animal => CONEXIONISMO

    Paradigma / Concepcin hedonista E-R

    Cajas problemas: medida de latencia de escape

    Ley del Efecto: las respuestas que van acompaadas o inmediatamente seguidas de satisfaccin se

    conectaran ms firmemente con la situacin, de manera que cuando sta vuelva a presentarse, volvern

    las R con ms probabilidad.

    ENSAYO DISCRETO

    B ANALISIS EXPERIMENTAL DEL COMPORTAMIENTO DE SKINNER Reflejos se pueden estudiar como conductas: conducta se regula tanto por C respondiente (reflejos) que CO

    Relaciones funcionales entre conducta / consecuencias.

    OPERANTE: cap del indiv para operar sobre su ambiente

    INSTRUMENTAL: conducta como instrumento para obtener el reforzador

    Introdujo innovacin: respuesta que sujeto pueda ejecutar repetidamente sin intervencin experimentador

    Caja de Skinner: medida de tasa de respuesta

    OPERANTE LIBRE

    II DEFINICION DE CONDICIONAMIENTO OPERANTE Conductas operantes resultados de las consecuencias que han tenido en el pasado (# estmulos que las

    provoquen) => son (# Elicitadas) EMITIDAS

    = proceso que da lugar a que la proba de una respuesta se vea modificada por sus consecuencias CO

    Organismos aprenden a obtener consecuencias favorables / eliminar desfavorables. Puede dar lugar a aparicin de respuestas nuevas

    A LA CONTINGENCIA DE TRES TERMINOS Contingencia respuesta/reforzador/estimulo (consecuencia depende presentacin respuesta).

    En presencia de un especifico, el se presentar si y solo si la ESTIMULO REFORZADOR RESPUESTA

    operante sucede.

  • PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014

    2

    1 ESTIMULO DISCRIMINATIVO

    NO provocan aparicin respuesta sino que de un reforzador potencial si se ejecute la sealan la presencia

    conducta (informa al sujeto de cuando ha de responder).

    : reforzar una operante en una situacin pero no en otra. Reforzamiento DIFERENCIAL

    Las consecuencias de las RO establecen el control que ejercen los ED.

    Si consecuencia => reforzada, proba operante apetitiva aumenta

    Si consecuencia reforzante => (E), proba no hay Estimulo Delta disminuye

    CONTROL POR EL ESTIMULO: E precedentes de una conducta pueden controlar su ocurrencia.

    2 RESPUESTA

    Se define por los efectos que provoca en el ambiente (FUNCION y no forma)

    Si una respuesta produce mismo efecto que otra, hablamos de la misma operante.

    La conducta puede tener # topografas que tienen la misma funcin.

    CLASE DE RESPUESTA: cualquier forma de ejecutar conducta con funcin similar.

    3 REFORZADOR

    Se define en funcin de los efectos que tiene sobre la conducta.

    Cualquier suceso o evento que, al hacerse contingente con una respuesta, cambia su proba de aparicin

    en un futuro.

    a REFORZAMIENTO CONDICIONADO

    Conducta humana controlada por eventos cuyos efectos . dependen de la historia de reforzamiento

    REFORZAMIENTO CONDICIONADO o SECUNDARIO: un estmulo originalmente no reforzante adquiere cap

    de reforzar mediante asociacin repetida con otro previamente reforzante.

    Resultados expe contradictorios: con procesos de extincin, los reforzadores condicionados pueden perder

    rpidamente su efectividad. Pero resultados no concluyentes acerca de la duracin del RefC.

    B ACLARACIONES

    1 REFORZADOR REFORZAMIENTO

    Evento = (si consecuencia apetitiva), (si consecuencia aversiva) reforzador castigador

    Proceso = (si aumenta proba) / (si disminuye proba) reforzamiento castigo

    2 RESPUESTA DISCRETA OPERANTE LIBRE

    : una respuesta por ensayo, VD = Ensayo discreto requieren mucho trabajo y tiempo. latencia,

    : emisin respuesta ilimitada, VD = Operante libre , sin manip expe. tasa resp

    3 TOPOGRAFIA FUNCION

    : propiedades o caractersticas fsicas (secuencia de movimientos) Topografa o forma de respuesta

    Est relacionada con las contingencias de reforzamiento (consecuencias R pueden modif su forma)

    Control del reforzador puede estar limitado por topografa.

    : relacin respuesta con estmulos antecedentes y las consecuencias de las misma. Funcin

    4 INSTANCIA DE RESPUESTA Y CLASE DE RESPUESTA

    : todas las formas en las que la ejecucin de una conducta puede llevar a funcin similar. Clase de respuesta

    : unidad mnima de conducta, ocurrencia particular y especfica de resp. Instancia de respuesta

    5 INTERACCIONES CLASICAS Y OPERANTES EN CONTROL CONDUCTA

    CC = pasivo CO = activo

    Para reforzar o castigar conducta es necesario su ocurrencia.

  • PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014

    3

    Para hacer aumentar una conducta de baja ocurrencia, podemos usar el (CC AUTOMOLDEAMIENTO

    apetitivo excitatorio: una vez que EC (luz por ej.) provoca resp, se somete a control operante

    haciendo que el EI solo se presente si se ejerce accin con la ocurrencia del EC, que se convierte en

    ED).

    Ciertas respuestas inicialmente CC pueden posteriormente caer bajo control operante.

    Por qu esta relacin?

    Acontecimientos ambientales actan sobre sistemas neurofisio de forma global y no uno concreto.

    Pero neurobio, ambos tipos de aprendizaje podran estar mediados por # meca al nivel celular.

    III PROCEDIMIENTOS BASICOS DEL CO : los que tienen un patrn temporal identificables, bajo condiciones Procesos conductuales reproducibles

    objetivamente especificadas, y reproducibles en diferentes individuos.

    CONTINGENCIA POSITIVA: cuando respuesta es seguida de consecuencia

    CONTINGENCIA NEGATIVA: cuando respuesta elimina o previene consecuencia

    A AUMENTAR CONDUCTAS: REFORZAMIENTO POSITIVO, ESCAPE Y EVITACION REFORZAMIENTO POSITIVO o ENTRENAMIENTO DE RECOMPENSA

    Cuando consecuencia apetitiva contingente con respuesta => aumento fuerza respuesta

    Se puede emplear el moldeamiento o mtodo de aproximaciones sucesivas para conseguir

    establecer la respuesta.

    ESCAPE Y EVITACION = eliminacin o detencin de un evento aversivo => aumento fuerza de respuesta Escape = impide el suceso de un evento aversivo Evitacion Procedimientos de REFORZAMIENTO NEGATIVO

    B DISMINUIR CONDUCTAS: CASTIGO Y ENTRENAMIENTO DE OMISION CASTIGO O CASTIGO POSITIVO

    Cuando consecuencia aversiva contingente con respuesta => disminucin fuerza respuesta

    Para poder castigar una respuesta antes ha tenido que ser reforzada

    ENTRENAMIENTO DE OMISION O CASTIGO NEGATIVO

    Cuando se elimina o previene consecuencia apetitiva => disminucin fuerza respuesta

    EFECTOS COLATERALES DE LOS PROCEDIMIENTOS AVERSIVOS

    El control aversivo de hacer que disminuyan las conductas no es una forma fiable

    Tiene que no impiden que en un futuro la conducta vuelva a ocurrir efectos emocionales

    Se puede y dar lugar a que se inhiban las conductas deseables asociar con otros E

    Asociacin con castigo quien ejecuta

  • PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014

    4

    C LA EXTINCION EN EL REFORZAMIENTO POSITIVO Procedimiento: cuando respuesta previamente reforzada se deja de reforzar.

    Da lugar a disminucin frecuencia o intensidad de la respuesta y disminucin gradual de su ejecucin.

    Existe RECUPERACION ESPONTANEA

    Fenmeno del : aumento de la tasa de resp al dejar de presentar reforzador. ESTADILLO DE EXTINCION

    de la respuesta: aumenta oportunidades para reinstaurar reforzamiento. AUMENTO DE LA VARIABILIDAD

    Tras la extincin => frustracin que da lugar a (agresin) RESPUESTAS EMOCIONALES INCONDICIONADAS

    La tasa de respuesta durante sesiones de extincin = ndice de la RESISTENCIA A LA EXTINCION.

    Las que hayan sido reforzadas en pocas ocasiones (parcial/intermitente) se extinguen de forma lenta

    Las que hayan sido reforzadas muchas veces (continuo) resisten menos a la extincin

    EFECTO DEL SOBREENTRENAMIENTO EN LA EXTINCION

    EFECTO DE REFORZAMIENTO PARCIAL explicado por procesos de . generalizacin y discriminacin

    Discriminacin entre reforzamiento y extincin ms fcil y rpida si reforzamiento continuo

    Generalizacin de situacin de reforzamiento intermitente a la de extincin

    Contacto con las contingencias (ms inmediato en caso de reforzamiento continuo)

    : reforzamiento parcial da lugar a que resultado aprendizaje sea esperar Teora de la frustracin

    ausencia de reforzamiento / continuo: no hay nada que motive sujetos a seguir emitiendo

    respuestas

    Otras variables que influyen en la persistencia de la respuesta:

    MAGNITUD DEL REFORZADOR: si alta y continua, disminuye la resistencia (# intermitente)

    INMEDIATEZ DE LA RECOMPENSA: si demora baja, aumenta la resistencia

    OLVIDO: con el tiempo la conducta disminuye.

    Extincin: posibilidad de emitir respuesta sigue disponible # olvido

    Es un aprendizaje nuevo

    : disminucin del control que las claves contextuales tienen sobre la Recuperacin espontanea

    conducta con el paso del tiempo.

    : recup respuesta extinguida en Renovacin contexto diferente al de extincin

    : cuando vuelves a situar sujetos Restauracin en contexto original de la extincin

    : Restablecimiento de la fase de adquisicin => exposicin no contingente con el reforzador

    reaparece la conducta extinguida sin que sta d lugar al reforzador.

    IV FENOMENOS DEL CO

    A CONDUCTA SUPERSTICIOSA Experimento de la supersticin de : Skinner reforzamiento accidental.

    Palomas tenan pautas de comportamiento que parecan indicar que su conducta controlaba un

    reforzador entregado sin contingencias.

    REFORZAMIENTO ACCIDENTAL / ADVENTICIO: la alta proba de ocurrencia de esta conducta le

    confiere una alta proba de ser reforzada en el futuro.

    : otra interpretacin con registro ms minucioso. Staddon y Simmelhag

    : las que tienen lugar en Conductas de INTERIN medio del intervalo

    : las que ocurren Conductas TERMINALES y prximas en el tiempo a la aparicin al final del intervalo

    del reforzador

    No vara entre los animales: son simplemente respuestas emitidas de forma innata cuando proba de

    reforzamiento es baja.

    La entrega de comida parece influir solo en las respuestas terminales, no relacionado con

    reforzamiento accidental.

  • PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014

    5

    Algunas conductas supersticiosas estaran explicadas por el y otras por reforzamiento accidental de Skinner mecanismos que tendran que ver con . conductas innatas

    Es ms probable que desarrollen conductas supersticiosas las personas que tienen gran necesidad de control Herrstein

    Supersticiones (expe propia anterior) idiosincrticas Supersticiones sociales tpicas

    B DERIVA INSTINTIVA Y RELEVENCIA EN CI Permite el CI condicionar de la misma manera cualquier tipo de respuesta? NO

    entre respuestas y reforzadores: hay R que son ms difciles de condicionar RELEVENCIA o PERTINENCIA cuando se utilizan ciertos tipos de reforzadores.

    : a veces surgen conductas tpicas de las especies que interfieran con las RO. Marion y Keller Breland DERIVA INSTINTIVA

    C CAMBIOS EN CANTIDAD Y CALIDAD RECOMPENSA: CONTRASTE CONDUCTUAL CONTRASTE CONDUCTUAL: la efectividad de un reforzador puede verse modificada por la expe previa con el

    mismo reforzador cuando ste es de magnitud o calidad diferente. (Todo es relativo!) Efecto Crespi

    Estudio de : Mellgren

    Contraste conductual POSITIVO o NEGATIVO

    Puede tb depender del (+ o -) estado afectivo previo

    D CONTROLABILIDAD CONSECUENCIAS AVERSIVAS E INDEFENSION APRENDIDA Cuando sumisin a situaciones en las que se tiene poco o ningn control.

    : Seligman y Maier

    Escape: emitiendo la respuesta requerida poda impedir la presentacin de descarga.

    Acoplado (expe): conducta no tena consecuencias sobre descargas.

    Confinado: misma situacin pero no reciba tratamiento.

    Generacin de en grupo acoplado de que la en las expectativa conducta no tiene ningn efecto

    : consecuencias negativas HIPOTESIS DE LA INDEFENSION APRENDIDA

    El mejor tratamiento es ubicar sujeto en una situacin en la que es imposible fallar.

    Se puede prevenir: una primera exposicin a descargas controlables es una inmunizacin que bloquea el

    desarrollo de la indefensin aprendida cuando se presentan descargas inescapables.

  • PSICOLOGIA APRENDIZAJE ADELINE TEMA 4 2014

    6

    E EFECTOS DEMORA DEL REFORZADOR: EL MARCADO Demora del reforzamiento cuando existe un periodo de tiempo entre la respuesta y la entrega del reforzador

    Puede disminuir, aumentar o no modificar la conducta en funcin de las circunstancias y de otros

    parmetros.

    Importante tener una lnea base estable antes de imponer una demora.

    Considerarlo como . proceso dinmico

    PROCEDIMIENTO DE MARCADO: presentar un E contingente a la respuesta convierte esa respuesta en un

    evento significativo. Marcar la respuesta hace que esta se pueda diferenciar de otros eventos durante la

    demora.

    Si pasan por el brazo negro reciben una bolita de comida en la caja meta.

    Para marcar los animales, se le trasladaban cogindolos del brazo a la caja de demora.

    Para los animales del grupo control, solo se abra la puerta hacia la caja de demora, sin manip.

    Los animales del grupo marcado mostraron mayor nmero de elecciones correctas (90%).

    El marcado facilita el recuerdo en memoria

    F DEVALUACION DEL REFORZADOR Se (sin contingencia con conducta). asocia el reforzador a un estmulo de naturaleza contraria

    1 fase 2 fase 3 fase

    Palanca A Sabor naranja Sin cambio Sin cambio

    Palanca B Sabor fresa Emparejamiento con sustancia aversiva

    Disminucin respuesta operante

    Colwill y Rescorla

    1 fase 2 fase 2 fase

    Grupo expe Palanca = comida Cadena = agua

    Inyeccin cloruro de litio Disminucin respuesta operante

    Grupo control Palanca = comida Cadena = agua

    Sin cambio Sin cambio

    A veces se puede automatizar la conducta si practica masiva

    : modificada por el valor de sus consecuencias Accin instrumental

    no dependen del valor actual del reforzador Hbitos:

    1 fase 2 fase Fase prueba

    Grupo 1 100 RO reforzadas Inyeccin cloruro litio Disminucin RO

    Sin inyeccin Sin cambio

    Grupo 2 500 RO reforzadas Inyeccin cloruro litio Sin cambio

    Sin inyeccin Sin cambio

    Conductas compulsivas como bsqueda de droga (mas rigidas, menos deliberadas) dependeran de

    mecanismos de aprendizaje diferentes.