07. Condicionamiento instrumental: mecanismos

Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en explicar la estructura asociativa del condicionamiento instrumental. La otra  se origino con el trabajo de Skinner y se centra en como la conducta está regulada en vista de las limitaciones o restricciones creadas por los procedimientos de condicionamiento instrumental.

Las teorías de la regulación conductual describen los efectos del reforzamiento dentro del amplio contexto del repertorio conductual de un organismo utilizando conceptos de varias áreas de investigación, incluyendo la economía conductual y la ecología conductual.

La aproximación asociacionista se centra en los mecanismos moleculares y no se preocupa de la meta a largo plazo o la función de la conducta instrumental. Por el contrario, la aproximación de la regulación conductual se centra n los aspectos molares de la conducta y considera los efectos del condicionamiento instrumental como manifestaciones de procesos de maximización u optimización.

La motivación de la respuesta instrumental ha sido considerada desde dos perspectivas radicalmente distintas. La primera se origino con Thorndike e incluye el análisis de la estructura asociativa del condicionamiento instrumental, radica en el concepto de asociaciones y es compatible con la tradición teórica del condicionamiento pavloviano. Toma una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la aproximación asociativa examina el aprendizaje instrumental en preparaciones conductuales aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nervioso, la aproximación asociativa proporciona un marco conveniente para estudiar los mecanismos neurales del condicionamiento instrumental.

La aproximación alternativa a los procesos motivacionales en el aprendizaje instrumental es la regulación conductual. Se desarrolla dentro de la tradición skinneriana e incluye la consideración del condicionamiento instrumental en el contexto más amplio de las múltiples cosas que el organismo está haciendo. Está interesada en como un procedimiento de condicionamiento instrumental establece los límites al flujo de actividades de un organismo y las consecuencias conductuales de estas restricciones: considera la motivación de la conducta instrumental desde un punto de vista más molar, considera las metas y como los organismos sacan provecho de la complejidad de su ambiente y de sus múltiples opciones conductuales para alcanzar sus metas.

La aproximación asociativa y de regulación conductual casi se han desarrollado independientemente la una de la otra. Cada una ha identificado problemas importantes pero ninguna puede sostenerse sola

La estructura asociativa del condicionamiento instrumental

Thorndike fue el primer en reconocer que el condicionamiento instrumental incluye algo más que una respuesta y un reforzador. La respuesta instrumental ocurre en presencia de estímulos particulares. Deben considerarse tres sucesos en el análisis del condicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y la consecuencia de la respuesta instrumental o reforzador (C). Skinner también suscribió la noción de tres sucesos y describió el condicionamiento instrumental es términos de una contingencia de tres términos que incluía E R y C.

La asociación E_R ya la ley del efecto

La asociación E-R fue postulada por Thorndike como la clave del aprendizaje instrumental en su ley del efecto; el papel del reforzador o de la consecuencia de la respuesta es establecer o estampar una asociación entre las claves contextuales E y la respuesta instrumental, pensó que una vez establecida esta asociación E-R seria, de forma única, responsable de la ocurrencia de la respuesta instrumental. Por tanto, el ímpetu básico o motivación para la respuesta instrumental era la activación de la asociación E-R mediante la exposición del sujeto a los estímulos en presencia de los cuales la respuesta instrumental fue previamente reforzada.

L ley del efecto asume que el único papel del reforzador es crear una asociación E-R, que el reforzador en sí mismo no es una parte o no participa en esta asociación. Esta presunción es bastante contraintuitiva.

Expectativa de recompensa y la asociación E-C

Cualesquiera que sean los estímulos, el reforzamiento de la respuesta instrumental producirá inevitablemente un emparejamiento entre E y el reforzador o consecuencia de la respuesta (C). Estos emparejamientos proporcionan el potencial para el condicionamiento clásico y el establecimiento de una asociación entre E y C.

Una de las explicaciones más tempranas e influyentes del papel del condicionamiento clásico en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y más tarde elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental, la respuesta instrumental llega a ser instigada o motivada por dos factores. En primer lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociación con E-R. En segundo lugar, la actividad instrumental también llega a realizarse en respuesta a la expectativa de recompensa debido al establecimiento de una asociación R-C: la forma concreta en que la asociación R-C llega a motivar la conducta instrumental ha sido tema de considerable debate e investigación experimental. Una formulación especialmente influyente fue  la teoría moderna de los dos procesos /Rescorla y Salomon, 1967)

La teoría moderna de los dos procesos: Asume que hay dos tipos de distintos de aprendizaje, el condicionamiento pavloviano y el instrumental, además asume que estos dos procesos están relacionados de una forma especial, durante el curso de un condicionamiento instrumental, los estímulos (E)_ en presencia de los cuales se refuerza la respuesta instrumental- se presume que llegan a asociarse con la consecuencia de la  respuesta (C) a través de condicionamiento pavloviano para establecer una asociación E-C. A través de la asociación E-C, el estimulo E llega a motivar la conducta instrumental mediante  la activación de un estado emocional central. La naturaleza de ese estado emocional o motivación dependerá de la naturaleza del reforzador, Si se refuerza con comida esta asociación activa la expectativa de comida Mowrer (1960)= esperanza.

Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conducta instrumental, entonces la presentación de un estimulo condicionado pavloviano debería alterar el curso de la respuesta instrumentalmente reforzada. La implicación básica de la teoría moderna de los dos procesos es que la tasa de una respuesta instrumental será modificada por la presentación de un estimulo clásicamente condicionado.  La presentación de un EC+ clásicamente condicionado con comida durante la ejecución de una respuesta reforzada con comida debería aumentar la esperanza que fue creada por la contingencia instrumental e incrementar la respuesta.

 Resultados consecuentes con la teoría moderna de los dos procesos. Utiliza normalmente un diseño experimental llamado experimento de transferencia de control, consta de tres fases; la fase uno incluye un condicionamiento instrumental de una respuesta operante utilizando algún programa de reforzamiento positivo o negativo. En la fase dos se entrena  a los participantes con un condicionamiento clásico, en el cual se asocia un EC explicito con la presencia o ausencia de un estimulo incondicionado. Es necesario que el procedimiento de condicionamiento instrumental no esté en funcionamiento durante la fase de condicionamiento pavloviano. La fase tres es la fase de transferencia crítica. Aquí se permite e los participantes que realicen la respuesta instrumental, y se presenta periódicamente el EC de la fase dos para observar su efecto en la tasa de conducta instrumental. Ver ej. pág. libro 195.

Interacciones de respuesta en los experimentos de transferencia de control. Los estímulos condicionados clásicamente elicitan no solamente estados emocionales, sino también respuestas abiertas, en consecuencia, un estimulo clásicamente condicionado puede influir sobre la conducta instrumental a través de respuestas abiertas que elicita. No es necesaria la apelación a estados emocionales centrales para explicar este resultado. La apelación a estados centrales emocionales también es innecesaria si un estimulo condicionado clásicamente elicitase respuestas abiertas que fuesen similares a la conducta instrumental. En este caso, la presentación del EC incrementaría la respuesta porque las respuestas elicitada por el EC se añadirían a las respuestas que se están realizando porque el animal recibe reforzamiento instrumental.

Los investigadores han estado muy interesados en la posibilidad de que los resultados de los experimentos de transferencia de control sean debidos a que los ECs pavlovianos elicitan respuestas que interfieren en o facilitan la conducta requerida por el reforzamiento instrumental. Se han diseñado barias estrategias experimentales para eliminar estas interacciones, en general han logrado mostrar que muchos efectos de transferencia de control no están producidos por interacciones entre respuestas abiertas

¿Estados emocionales centrales condicionados o expectativas especificas de recompensa?

La teoría moderna de los dos procesos asume que el condicionamiento clásico media la conducta instrumental a través del condicionamiento de estados emocionales centrales como la esperanza (en el caso de reforzamiento positivo) o el medo (en el caso del reforzamiento negativo). Este estudio pág. 196, indican claramente que en ciertas circunstancias los animales adquieren expectativas especificas del reforzador en lugar de un estado emocional mas general de esperanza durante el condicionamiento instrumental y clásico. El aprendizaje de expectativa específica de recompensa es una alternativa importante a la teoría de los dos procesos para explicar ciertos tipos de resultados, está basada en la asunción de que el condicionamiento instrumental incluye aprendizaje de una asociación E-C.

Las asociaciones E-C parecen ser fundamentales para la motivación de la conducta instrumental, Berridge (2001) apunto que la asociación E-C,E llega a ser un estimulo de incentivo; E en si mismo llega a ser atractivo. Esta motivación adquirida de incentivo contribuye significativamente a la motivación de la respuesta instrumental.

Relaciones R-C y E(R-C) en el condicionamiento instrumental

La intuición sugiere que la conducta instrumental involucra asociaciones R-C, estas no existen en el modelo de los dos procesos.

Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumida por las teorías de los dos procesos es que E supone que llega a estar asociado directamente con C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia de condicionamiento clásico. Los emparejamientos EC-EI no son suficientes para el desarrollo de asociaciones pelvianas. El EC debe también proporcionar información acerca del EI, o estar de alguna manera relacionado con el EI. Esta condicionalidad en la relación de E con C es desestimada en la teoría de los dos procesos.

Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que el condicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia, se han obtenido evidencias varias en apoyo de esta posibilidad. La devaluación del reforzador ha sido utilizada para determinar si la repuesta instrumental esta mediada por una asociación entre la respuesta y la consecuencia reforzante, ver ej. pág. 197.

La supresión selectiva de respuesta que se obtuvo es difícil de explicar a partir de las asociaciones E-C o E-R que se supone que son aprendidas de acuerdo con la teoría de los dos procesos, la devaluación de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociada separadamente con su propio reforzador.

Evidencia del aprendizaje de una relación jerárquica E-(R-C); La evidencia citada anteriormente muestra de forma clara que los organismos aprenden  a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C no pueden actuar aisladamente para producir la repuesta instrumental. Mackintosh y Dickinson (1979) el hecho de que la respuesta instrumental activa una expectativa del reforzador no es suficiente para clarificar lo que produzca la respuesta. Se necesita un factor adicional para activar la asociación R-C. Una posibilidad es que la asociación R-C sea activada por los estímulos E que están presentes cuando la respuesta es reforzada, E no activa R directamente, sino que activa la asociación R-C. El sujeto llega a pensar en la asociación R-C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.

Skinner (1938) sugirió que E, R y C en el condicionamiento instrumental están conectados a través de una relación condicional E-(R-C). Se ha acumulado evidencias que indican el aprendizaje de relaciones E-(R-C)

Regulación conductual

Los análisis de regulación conductual están basados en una visión del mundo completamente distinta. En lugar de considerar el condicionamiento instrumental en términos del reforzamiento de una respuesta, los análisis de la regulación conductual se centran en como las contingencias instrumentales ponen limitaciones a las actividades de un organismo.

Antecedentes de la regulación conductual

Los teóricos estaban de acuerdo en que los reforzadores eran estímulos especiales que fortalecías la conducta instrumental durante medio siglo después de la ley del efecto de Thorndike

La teoría de la respuesta consumatoria: E primer reto a esta idea vino de Fred Sheffield que formularon la teoría de respuesta consumatoria, esta atribuye el reforzamiento a estas conductas típicas de la especie. Se establece que las respuestas consumatorias típicas de la especie son en sí mismas el rasgo crítico de los reforzadores. Fue una innovación radical debido a que traslado  la investigación de los reforzadores desde tipos especiales de estímulos a tipos especiales de respuestas. Se considero que las respuestas reforzadoras eran especiales porque involucraban la consumación o el completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con su teoría y sugirió que las respuestas reforzadoras son especiales solo debido a que es más probable que ocurran que las respuestas instrumentales a las que siguen.

El principio de Premack: Apunto que las respuestas incluidas en los reforzadores comúnmente utilizados eran actividades que es altamente probable que realicen los animales. Las respuestas instrumentales son actividades que normalmente ocurren a una baja probabilidad. Propuso que esta diferencia en las probabilidades de respuesta es crítica para el reforzamiento. Puede establecerse como sigue:  “dadas dos respuestas de diferente probabilidad A y B, la oportunidad  para realizar la respuesta de alta probabilidad A después de la respuesta de baja probabilidad B tendrá como resultado el reforzamiento de la respuesta B. (B   A refuerza B). La oportunidad para realizar la respuesta B de baja probabilidad después de  la respuesta A de alta probabilidad no dará como resultado el reforzamiento de la respuesta A. (A   B no refuerza A).

Se centra en la diferencia de en la probabilidad de las respuestas instrumental y reforzadora: en consecuencia también es denominado el principio de la probabilidad diferencial.

Estimulo la consideración de los reforzadores como respuestas más que como estímulos.

La hipótesis de la privación de respuesta: En la mayoría de los procedimientos de condicionamiento instrumental, la probabilidad momentánea de una respuesta reforzada se mantiene a un nivel alto mediante la restricción al acceso a la respuesta reforzante.

Premack (1965) reconoció la importancia de restringir el acceso a respuesta reforzadora para el condicionamiento instrumental. Caracterizo la privación de respuesta no solo como una condición necesaria para el reforzamiento sino como algo adjunto al principio de probabilidad diferencial. La respuesta reforzadora todavía tiene que ser una conducta más probable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974) abandonaron totalmente el principio de probabilidad diferencial y argumentaron que la restricción de la respuesta reforzadora era el factor crítico para el reforzamiento instrumental, esta propuesta es denominada Hipótesis de privación de respuesta, hace explicita la idea radicalmente diferente de que un reforzador es producido por la contingencia instrumental en si misma. Posteriores desarrollos de las teorías de regulación conductual han establecido como las contingencias instrumentales crean los reforzadores y los efectos del reforzamiento

Regulación conductual y el punto de deleite conductual

Las teorías de la regulación conductual asumen que existen mecanismos homeostáticos análogos respecto a la conducta: Se propone que los organismos tienen una distribución de actividades preferida u óptima que luchan por mantener frente a  los cambios o interrupciones. Se centran en el grado en que la contingencia instrumental respuesta- reforzador rompe la estabilidad conductual y empuja  al individuo fuera de su distribución de actividades preferida u optima.

El punto de deleite conductual: La teoría de la regulación conductual asume que si los organismos son libres para distribuir sus respuestas entre las alternativas disponibles, lo harán de  la forma en que sea mas cómodo o en algún sentido optimo para ellos: Esta distribución de respuestas define el punto de deleite conductual.

El punto de deleite conductual puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo  en una situación sin restricciones.

Imposición de una contingencia instrumental. La teoría de regulación conductual establece que los organismos defenderán el punto de deleite conductual contra los cambios. Lo interesante es que la línea de base libre del punto de deleite conductual no siempre puede ser restablecida después de que se haya introducido una contingencia instrumental. Este es a menudo el dilema que impone una contingencia instrumental. No permite volver al punto de deleite.

El punto de deleite proporciona la motivación para la conducta instrumental. La teoría de regulación conductual asume que para volver al punto conductual establecido continua siendo una meta en la distribución de respuestas. Cuando esta meta no puede alcanzarse, la redistribución de las respuestas entre las conductas instrumental y contingente llega a ser una cuestión de ajuste. La tasa de una respuesta se mantiene lo más cerca posible del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido.

Staddon propuso un  modelo de desviación mínima de regulación conductual para resolver el dilema de las restricciones del programa, la introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviación total de las dos respuestas  con respecto al punto óptimo o de deleite.

Explicación los efectos de reforzamiento de: La regulación conductual incluye la defensa de un punto de deleite conductual frente a restricciones de respuesta impuestas por una contingencia respuesta-reforzador. El aumento en la respuesta instrumental / un efecto de reforzamiento) es el resultado de mecanismos reguladores de la conducta que funcionan para minimizar las desviaciones del puto de deleite conductual.

Una visión sobre las contingencias de reforzamiento en un contexto conductual mas amplio: Las contingencias instrumentales no suceden en un vacio conductual ocurren en el contexto de una variedad de respuestas y reforzadores que puede obtener el sujeto. Centrarse solo en la respuesta instrumental  y sus estímulos antecedentes y consecuentes (esto es, la estructura asociativa de la conducta instrumental) desatiende el contexto conductual más amplio ya que puede influir de forma significativa en el resultado de los procedimientos particulares de condicionamiento instrumental.

Conceptos económicos y distribución de respuesta

En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas por el numero de respuestas  que un organismo es capaz de realizar y el numero de respuestas requerido para obtener cada reforzador

Demanda del consumidor: La relación entre el precio de una comodidad y cuanto se obtiene se denomina curva de la demanda.

El grado en el cual el precio influye en el consumo se denomina elasticidad de la demanda.

El concepto de demanda del consumidor puede utilizarse para analizar el reforzamiento instrumental considerando el número de respuestas realizadas como análogo al dinero. EL precio de un reforzador es el tiempo o numero de respuestas requeridas para obtener un reforzador. Por tanto, el precio del reforzador está determinado por el programa de reforzamiento.

Madeen y Biekel (1999) ver ej., pág. 210 libro.

Determinantes en la elasticidad de la demanda: Los conceptos económicos han ayudado a identificar tres factores principales que influyen en como las restricciones de un programa moldean la redistribución de la conducta.

  1. Disponibilidad de sustitutos: Es el factor que más influye en la elasticidad de la demanda. La disponibilidad de sustitutos aumenta la sensibilidad del artículo a los precios altos.

    • Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de la sesión experimental. La parte de comida que no comen durante la sesión experimental se les da luego en la jaula hogar, esta situación se denomina una economía abierta, Esto se contrapone con una economía cerrada, en la cual los sujetos no reciben alimentación suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economía abierta  que en economías cerradas.

  2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos.

  3. Nivel de ingresos: En estudios de condicionamiento instrumental, el número de respuestas o la cantidad de tiempo disponible para responder corresponde a los ingresos. Cuantas más respuestas o tiempo tengan disponibles los animales, menos estará su conducta influida por los aumentos en el coste del reforzador.

Problemas con las aproximaciones de regulación conductual

El punto de deleite es una característica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo del bloque temporal amplio. Un punto de deleite molar dado puede alcanzarse de varias formas, de acuerdo con esta aproximación, las diferencias en las pautas de respuesta no deberían tener importancia. Pero la evidencia experimental indica que es importante como se alcanza el punto de deleite molar. En consecuencia una adecuada caracterización del deleite conductual requiere información sobre las pautas de elección moleculares.

Otra dificultad, tal vez más seria es que las respuestas durante un periodo de línea base libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos externamente  (correr por placer ) parece ser diferente a hacer lo mismo cuando se requiere por una contingencia instrumental impuesta.

Finalmente, debido a que las aproximaciones no comprenden procesos conductuales moleculares, no dicen nada de cómo los organismos defienden una combinación favorita de bienes o actividades.

Contribuciones de la regulación conductual

  1. Nos alejo de  la consideración de los reforzadores como tipos especiales de respuestas.  Los efectos del reforzamiento se ven como producidos por las restricciones del programa en el devenir de las actividades de un organismo.

  2. Los procedimientos de condicionamiento instrumental ya no se considera que estampan o fortalecen la conducta instrumental: en su lugar el condicionamiento instrumental es visto como la creación de una nueva distribución, o asignación de respuestas, la reasignación de  la conducta incluye un aumento en la respuesta instrumental y una disminución de la respuesta reforzadora.

  3. No existe una distinción fundamental entre las respuestas instrumentales y las reforzadoras, se distinguen solo por los papeles asignados a ellas mediante u n procedimiento de condicionamiento instrumental.

  4. Aceptan la idea de que los organismos responden para maximizar sus beneficios.

  5. Han proporcionado caminos nuevos y precisos para describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no puede ser estudiada en un vacio o en un tubo de ensayo conductual. Todas las opciones de respuesta del organismo que se dan en un momento dado deben ser consideradas como un sistema.

Comentarios finales

Las dos aproximación parecen centrarse en asuntos completamente distintos, pero ambas han contribuido de forma significativa a la comprensión de la motivación de la conducta instrumental.

Incluyen diferentes niveles de análisis. La aproximación asociacionista involucra un nivel molecular donde el objetivo son los estímulos  específicos, las respuestas, y sus conexiones. La regulación conductual opera a un nivel molar de agregados de conducta y el contexto conductual más amplia en el que operan las contingencias instrumentales.

Una se relaciona con procesos y la otra está más relacionada con funciones o metas a largo plazo. La aproximación asociacionista describe procesos específicos (asociaciones E-R, E-C, R-C y E-(R-C)) que sirven para generar y dirigir la conducta instrumental. Este es el punto de vista de la regulación conductual y la economía conductual, que asumen que los organismos trabajan para defender una distribución óptima de actividades. La defensa del punto de deleite conductual se alcanza mediante los procesos moleculares de las asociaciones.