03. Técnicas operantes

Introducción

El condicionamiento operante es uno de los pilares básicos de la Terapia de Conducta desde la primera generación de la Terapia de Conducta. Estas técnicas son altamente eficaces.

Fundamentos teóricos

Las conductas son cepnceptualizadas como operantes en la medida en que operan (influyen) sobre el ambiente, y se fortalecen o debilitan en función de las consecuencias que les siguen. Se consideran antecedentes aquellas situaciones en las que ocurre una conducta particular. Las consecuencias son el impacto que tiene la conducta sobre las relaciones sociales. Contingencia es el término que se utiliza para describir las relaciones probabilísticas entre la conducta, sus antecedentes y sus consecuencias. Se dice que se está produciendo un control de estímulos cuando las consecuencias que siguen a la conducta sólo se dan en presencia de unos estímulos antecedentes y no de otros.

Principios básicos del condicionamiento operante:

  • Reforzamiento: Presentación de un estímulo positivo o retirada de un estímulo negativo, después de una respuesta, que a consecuencias de ello incrementa su frecuencia o probabilidad.

  • Castigo: Presentación de un estímulo negativo o retirada de uno positivo después de haber sido emitida una respuesta que a consecuencias de ello reduce su frecuencia o probabilidad.

  • Extinción: Dejar de reforzar una conducta previamente reforzada, a consecuencia de lo cual disminuye su frecuencia o probabilidad.

  • Control de estímulos: Reforzamiento de una conducta en presencia de un estímulo pero no en presencia de otros. En el primer caso se incrementa la respuesta, en el segundo decrece.

Técnicas operantes para el incremento y mantenimiento de conductas

Es necesario diferencias entre refuerzo, reforzamiento y reforzador:

El refuerzo es el proceso de aprendizaje (aumento de probabilidad de conductas). Se considera un proceso único porque en todos los casos aumenta la probabilidad de la conducta.

El reforzamiento es el procedimiento mediante el cual las consecuencias producen el aprendizaje (positivo o negativo)

El reforzador es el estímulo concreto (para el ref. positivo o el negativo)

Reforzamiento positivo

Los reforzadores positivos no son sinónimo de recompensa o premio. La diferencia es que en el reforzamiento la conducta que lo precede se incrementa, mientas que en el premio no se hace más probable que se repita nuevamente la conducta. Sólo se puede hablar de reforzador si se incrementa la conducta (sólo se puede comprobar de modo empírico). En ocasiones, un estímulo agradable puede ser un reforzador o un castigo en función de la persona que lo suministre.

Tipos de reforzadores positivos

Se agrupan en distintas categorías en función de su origen, naturaleza, tangibles e intangibles, contexto de aplicación, valencia apetitiva o aversiva, etc..

Reforzadores primarios o incondicionados.  Su valor reforzante suele estar asociado a necesidades básicas del ser humano (comida, bebida). El valor reforzante varía según las necesidades del individuo.

Reforzadores secundarios o condicionados. No están asociados a necesidades básicas primarias y sufren un proceso de condicionamiento (inicialmente neutros). A los reforzadores condicionados que están asociados con varios reforzadores se les denomina reforzadores condicionados generalizados (dinero y elogio como ejemplo, están asociados a comida, sonrisa, etc..).

Reforzadores tangibles. Objetos materiales que pueden ser tanto reforzadores primarios como secundarios (comida, juguetes, ropa,…).

Reforzadores sociales. Son las muestras de atención, valoración, aprobación, reconocimiento, etc… que recibe una persona por parte de otras como consecuencias de la realización de una conducta (de los más poderosos). Cuatro ventajas de la aplicación del refuerzo social: 1) son fáciles de administrar, 2) no tienen coste económico, 3) administración inmediata, 4) son refuerzos naturales.

Actividades reforzantes. Cualquiera de las actividades placenteras que realiza una persona puede utilizarse como reforzador para incrementar la ocurrencia de una conducta (ir al cine). Se da el caso en el que actividades no especialmente gratificantes, pero que se llevan a cabo habitualmente o con frecuencia, pueden utilizarse como reforzadores de conductas que tienen una probabilidad menor y se desea incrementar (Principio de Premack).

Reforzamiento negativo

El reforzamiento negativo hace referencia al aumento de la probabilidad de que se repita una conducta al retirar un estímulo aversivo después de que se ha realizado la conducta. El reforzador negativo se define también por su capacidad de incrementar la conducta a la que es contingente.

Programas de reforzamiento

Dos tipos:

Reforzamiento continuo implica presentar un reforzador siempre que se realice la conducta objetivo. Útil para respuestas débiles o para instaurar una nueva conducta. 

Reforzamiento intermitente supone administrar el reforzador de manera contingente a la conducta, pero no en todas las ocasiones. Dos tipos; programas de razón, y programas de intervalo.

Programas de razón. En los programas de razón fija el reforzador se obtiene de forma contingente a la realización de la conducta el número de veces previamente estipulado (RF3, RF5, RF30,…). En los programas de razón variable el número cambia de un reforzador a otro (RV5 promedio de 5 veces).

Programas de intervalo. Reforzamiento cada ciertos intervalos temporales (fijos y variables).

Los programas de reforzamiento intermitente pueden combinarse entre si. Los programas de reforzamiento de tasas altas se utilizan cuando se desea obtener un número alto de respuestas en un intervalo corto de tiempo. Los programas de reforzamiento de tasas bajas se utilizan cuando el objetivo es que se emita un número pequeño de respuestas en un intervalo largo de tiempo. Combinar distintos programas de reforzamiento es adecuado cuando incrementar determinadas conductas puede implicar reducir otras.

Cuando el objetivo es desarrollar inicialmente una respuesta, es preferible utilizar reforzamiento continuo. Una vez ha llegado a los niveles deseados y se quieren mantener, son más apropiados los reforzamientos intermitentes. En la fase de retirada de reforzadores, los programas de reforzamiento intermitente son más resistentes a la extinción que los continuos.

Técnicas operantes para la adquisición de conductas

Para instaurar nuevas conductas se utilizan tres técnicas: moldeamiento, encadenamiento e instigación/atenuación. En todas se parte de algún componente de la conducta final, y que se encuentra en el repertorio habitual de la persona.

Moldeamiento

El moldeamiento se refiere al reforzamiento de los pequeños pasos o aproximaciones que conducen hacia una conducta meta. Gradualmente se va alcanzando la conducta meta. Se dejan de reforzar las conductas que no se parecen a la meta.

El moldeamieno se puede llevar a cabo reforzando diferentes aspectos de la conducta final: a) Topografía como puede ser la configuración espacial, forma, etc.. (coger una cuchara), b) Cantidad (frecuencia y duración de la conducta), c) Latencia entre estímulos y respuesta, d) Intensidad, fuerza física para llevar a cabo una conducta.

Para que la técnica de moldeamiento sea efectiva es necesario: 1) definir de forma objetiva la conducta meta, 2) evaluar el nivel de ejecución real, 3) seleccionar conducta inicial como punto de partida, 4) seleccionar los reforzadores, 5) reforzar diferencialmente las aproximaciones sucesivas.

Encadenamiento

La mayoría de las conductas están compuestas por una secuencia de varias respuestas que siguen un orden y forman una cadena. Tres tipos de encadenamiento:

Presentación de la cadena total. Se entrena a la persona en cada uno de los pasos que ha de realizar desde el primero hasta el último. En cada ensayo se entrena todos los pasos de la secuencia.

Encadenamiento hacia delante. Se enseña el paso inicial de la cadena; cuando se realiza correctamente se enlaza con el paso 2, el paso 2 con el 3,… cada nuevo paso se realizan todos los anteriores.

Encadenamiento hacia atrás. El entrenamiento se realiza comenzando por la conducta meta y se van añadiendo las conductas que la preceden.

El proceso de encadenamiento cada una de las respuestas intermedias que componen la cadena se mantiene porque actúa como estímulo discriminativo (ED) del siguiente eslabón al que preceden. Un ED no sólo señala el reforzamiento, sino que se transforma también en reforzamiento. Las conductas intermedias adquieren valor de reforzamiento condicionado.

Diferencias entre moldeamiento y encadenamiento

   Moldeamiento  Encadenamiento
 Conducta final  Nueva conducta en alguna dimensión física (duración, frecuencia,…)
Las conductas intermedias que permitieron la conducta final no son consideradas
 Nueva secuencia de respuesta con un estímulos claro que señala el final de cada respuesta
La conducta final consiste en todos los pasos del encadenamiento (varios eslabones necesarios)
 Procedimientos generales de entrenamiento  No se requiere de un ambiente estructurado para emitir una gama de comportamientos.
Se lleva a cabo hacia delante desde el punto de vista del orden natural de la conducta.
 El enlace de la cadena de conductas suele requerir un ambiente estructurado o semiestructurado
Se puede llevar a cabo hacia delante o hacia atrás
 Otras consideraciones de procedimiento  Puede implicas algunos instigadores verbales y/o físicos en los pasos sucesivos, pero son mínimos
Implica la aplicación sucesiva del reforzamiento y la extinción.
 Con frecuencia se utilizan instigadores verbales, físicos y quizá moldeamiento.
Implica menos ensayos de extinción que el moldeamiento.

En el entrenamiento en encadenamiento se puede incluir como parte del mismo el moldeamiento. El aprendizaje de conductas que forman parte de una secuencia de conductas se puede adquirir mediante moldeamiento, mientras que el enlace de todas las conductas que forma la secuencia se realizaría por encadenamiento.

Instigación/Atenuación

La instigación como guía se utiliza cuando es difícil adquirir conductas por aproximaciones sucesivas o encadenamiento. Se emplean señales, instrucciones, gestos o direcciones para iniciar la respuesta. Al procedimiento sistemático de introducción de ayudas o instigadores para aprender una conducta y su retirada gradual una vez consolidada se conoce como técnica de desvanecimiento o atenuación.

Técnicas operantes para la reducción o eliminación de conductas

Tres técnicas para eliminar conductas: el RDO, la extinción y el castigo.

Reforzamiento diferencias de otras conductas (RDO)

Un procedimiento habitual para eliminar conductas o reducirlas es evitar su reforzamiento y a cambio reforzar conductas alternativas. Existen varios tipos:

  • Reforzamiento diferencias de conductas incompatible (RDI). Consiste en reforzar una conducta que es incompatible con la conducta a eliminar. Al incrementar la frecuencia de emisión de la conducta incompatible, se reduce la de la conducta problema.

  • Reforzamiento diferencial de conductas alternativas (RDA). Si no se puede encontrar conductas incompatibles, se pueden buscar el reforzamiento diferencial de conductas alternativas que compitan.

  • Reforzamiento diferencial de conductas funcionalmente equivalentes. Hace referencia al reforzamiento de conductas alternativas a la conducta problema que permitan alcanzar las mismas metas pero de forma más adecuada o adaptativa (pedir la comida bien, en lugar de chillando).

  • Reforzamiento diferencial de tasas bajas de respuesta. Cuando la frecuencia de la conducta problema es muy alta, o hay pocas alternativas en el repertorio conductual, es mejor el reforzamiento diferencial de tasas bajas. Una reducción de la frecuencia de la conducta problema sería reforzada.

El RDO ha demostrado su eficacia. La desventaja es la lentitud en la reducción de la conducta problema debida a: 1) dificultad en encontrar conductas meta alternativas, 2) incrementar las conductas alternativas puede reducir sólo parcialmente la conducta a eliminar, 3) el refuerzo diferencial reduce gradualmente la conducta a eliminar. En conductas agresivas o autolesivas el RDO no es la técnica de elección.

Extinción

Si una conducta deja de tener consecuencias, dejará de realizarse. La extinción consiste en dejar de reforzar una conducta previamente reforzada. No suele resultar fácil identificar los reforzadores (diferentes fuentes). El programa de reforzamiento influye en la eficacia de la extinción (si es continuo es más fácil la extinción que si es intermitente). Cuanto mayor es el intervalo de tiempo en el que se suministra el refuerzo intermitente, mayor será también la resistencia de la conducta reforzada a la extinción.  Cuanto mayor sea la cantidad de reforzador y el tiempo durante el cual se ha suministrado, mayor será la resistencia a la extinción.

El proceso de extinción es gradual en relación a la reducción de la conducta (no es adecuados para conductas agresivas o autolesivas). El estallido de la extinción hace referencia al incremento significativo de intensidad o frecuencia de la conducta debido a la ausencia de reforzamiento al comienzo de la extinción.  Después de haberse reducido una conducta puede aparecer nuevamente o incrementarse (recuperación espontánea), pero si se mantiene sin reforzamiento la conducta vuelve a decrecer.

Algunas razones por las que se considera más eficaz el uso conjunto de la extinción con el reforzamiento positivo son:

La identificación estricta de los reforzadores que mantienen la conducta a extinguir puede llevarse a cabo de forma menos estricta ya que el incremento de la conducta alternativa por efecto de reforzamiento facilita la extinción de la conducta problema.

Los efectos negativos que pueden acompañar a la extinción tienen menor probabilidad de ocurrencia si la conducta alternativa reforzada reemplaza o sustituye a la conducta problema en extinción. 

La extinción reduce la emisión e la conducta problema pero no permite reemplazarla puesto que no interviene en la instauración o incremento de conductas alternativas.

Castigo

La mera introducción de un estímulo aversivo o la simple retirada del estímulo positivo no se considera castigo a no ser que lleve aparejado la reducción efectiva de la conducta.  Definir castigo en lugar de simple penalización (al igual que premio vs. reforzamiento) es una cuestión empírica. Es castigo sólo si se reduce la conducta.

Castigo positivo

El castigo positivo es la reducción de la frecuencia futura de una conducta cuando tras su emisión se presenta un estímulo aversivo. Dos tipos de estímulos negativos: a) estímulos aversivos primarios o incondicionales (carácter universal, como el dolor), y b) estímulos aversivos secundarios o condicionados (gestos, insultos).

El efecto que tiene de un estímulo aversivo en la reducción de la conducta es más importante que el grado de aversión que pueda atribuirse.

Castigo negativo

Dos tipos de castigo basado en la retirada de estímulos: tiempo-fuera de reforzamiento y coste de respuestas.

Tiempo fuera de reforzamiento positivo

Consiste en negar el acceso temporal a los reforzadores inmediatamente después de que se realice la conducta inadecuada que se desea reducir o eliminar (se usa con niños). Para que sea efectivo tiene que cumplir las siguientes condiciones: 1) la persona ha de ser consciente de las razones y duración del castigo, 2) la duración del tiempo-fuera ha de ser breve (5 minutos en niños pequeños, >5 años con 1 minuto por año añadido), 3)  no debe estar presente ni introducirse ningún reforzador durante el tiempo-fuera de reforzamiento positivo, 4) no debe terminar antes de tiempo, 5) sólo debe terminar si el niño se comporta adecuadamente, de lo contrario se estaría reforzando negativamente, 5) el tiempo fuera no debe servir al niño para escapar de una situación desagradable o incómoda (reforzamiento negativo). Inconveniente: aleja a la persona del medio o contexto impidiendo el refuerzo positivo de conductas alternativas. 

Coste de respuesta

El coste de respuesta se refiere a la pérdida de un reforzador positivo del que dispone el individuo (retirada de puntos del carnet). Resulta más efectivo si se entregan reforzadores positivos al incrementarse la conducta adecuada. 

Factores que influyen en la efectividad del castigo

El castigo, cuando se combina con procedimientos de reforzamiento y de extinción, tiene efectos inmediatos sobre la conducta que se desea eliminar y sustancialmente superiores a los efectos producidos por el uso exclusivo de programas de reforzamiento. Pocos estudios han encontrado efectos negativos debido a los procedimiento de castigo.

El castigo positivo es útil cuando otras técnicas fallan, o es difícil identificar los reforzadores. Es útil para conductas agresivas hacia si mismo, o hacia los otros.  Algunas guías para aplicar el castigo: 1) debe ocurrir inmediatamente después de la conducta inadecuada, 2) debe ser administrado cada vez que ocurra la conducta inadecuada, 3) la persona a la que se le aplica debe ser consciente de la contingencia, 4) el reforzamiento no debe administrarse muy a continuación del castigo, 5) el castigo ha de ir precedido por un aviso de advertencia.

Algunos de los factores que contribuyen a la eficacia del castigo son:

  • No demora del castigo.

  • Programa de aplicación. Aplicado de forma continúa.

  • Regulación temporal del castigo en la secuencia de respuesta. Más eficiente si se castigan conductas preliminar a la conducta final (en el caso de eslabones de conductas).

  • Fuente de reforzamiento. El efecto del castigo puede verse contrarrestado por el potencial reforzamiento que pueda estar recibiendo la conducta que se desea eliminar.

  • Variaciones del castigo. Variar el tipo de castigo (tiempo-fuera, coste de respuesta, reprimenda) utilizado favorece la reducción de la conducta a eliminar.

  • Reforzamiento de respuestas alternativas. La utilización de reforzamiento positivo mejora la efectividad y reduce efectos colaterales.

Efectos colaterales del castigo

A pesar de la efectividad demostrada por el castigo, no se suele utilizar por razones éticas y por los efectos colaterales. Algunos de los efectos negativos son:

  • Reacciones emocionales adversas. Llanto, rabia, miedo, cuyos efectos pueden dificultas el aprendizaje de conductas alternativas. Efectos perjudiciales incluso para el que las administra (afectivos).

  • Evitación y escape. Puede conducir a conductas de escape y evitación de la situación o persona que administra el castigo.

  • Agresión. Reacción con agresividad como defensa ante el castigo.

  • Castigo modelado (efecto más importante). Puede aprenderse el castigo (por modelado) como procedimiento eficaz para modificar conductas de otros.

  • Perpetuación del castigo. Puede convertirse en herramienta habitual por el reforzamiento negativo que supone para la persona que lo dispensa.

Sobrecorrección

Kazdin propone como procedimiento adicional para reducir conductas la realización de actividades. La realización de tareas no se considera castigo ya que no se introduce un estímulo aversivo, y no se pierde un reforzador positivo.

La sobrecorrección es una penalización por llevar a cabo una conducta o acción inadecuada que tiene dos componentes: 1) restitución (corregir efectos negativos por una conducta inapropiada) y 2) práctica positiva (llevar a cabo una conducta apropiada, incluso de forma exagerada). Se puede utilizar uno o los dos componentes.  La sobrecorrección cumple una función educativa.

La sobrecorrección sigue siendo efectiva si se demora su aplicación (se suele aplicar de forma inmediata). El incremento de la duración de la práctica positiva no va acompañado de una mayor reducción de la conducta desadaptativa. El rango de aplicación de la sobrecorrección es menor que el de otros procedimientos, como el castigo.

Programa de economía de fichas

Es un programa de contingencias que combina reforzamiento y castigo. Se entrega un reforzador generalizado (ficha) tras la emisión de una conducta deseable y se retira si la conducta es inadecuada. El valor de la ficha es poder canjearlo por otros reforzadores previamente seleccionados.  Se deben indicar: lista de conductas a modificar, indicación explícita del numero de fichas que se pueden ganar por cada comportamiento, reforzadores por los que se puede intercambiar las fichas (debe existir variedad), indicación clara de las reglas. Las fichas se pueden entregar poco a poco (refuerzo positivo), o todas de una vez e irlas retirando con la conducta problema (coste de respuesta). El coste de respuesta se utiliza cuando el número de conductas perturbadoras y la probabilidad de emisión es alto (al inicio se entregan todas y eso transmite confianza).

El éxito depende que al principio se entreguen muy frecuentemente fichas y se puedan cambiar rápidamente por reforzadores, y a medida que se avanza se acumulen por el valor simbólico. El programa debe ir retirándose paulatinamente (por refuerzo social). Si no se siguen estas recomendaciones es probable que la conducta se mantenga lo que dure el programa.

Las ventajas son: entrega inmediata del reforzador, permite cuantificar la entrega de reforzadores, evita el fenómeno de saciación (la ficha se puede intercambiar por diversos reforzadores), y la ficha queda asociada a reforzadores secundarios (atención, alabanza y refuerzo simbólico) que cuando el programa se retire serán los que mantendrán los logros alcanzados.

La mayor utilización se da en grupos e instituciones.

Contratos de contingencias

Un contrato de contingencias es un acuerdo, por lo general escrito, en el que se especifican las conductas que se desea instaurar o eliminar y las consecuencias que le acompañan (función= conseguir la implicación de la persona). Se debe especificar el límite de tiempo de duración del contrato, se debe incluir una consecuencia ligeramente aversiva si no se cumple lo pactado, se debe incluir una bonificación adicional si se superan objetivos, las conductas deben ser observables y registrables. Tan pronto como se verifique su cumplimiento debe administrarse la recompensa.

La obediencia como base del contrato contradice los principios en que éste se apoya. Debe estar formulado en términos positivos. Se debe empezar por recompensa pequeña, y dejar las grandes para el final. El contrato debe ser revisable.