Conducta de evitación

La conducta de evitación ha recibido mayor atención que la de escape por parte de los investigadores principalmente por dos razones: primero por el reto teórico de explicar la aparición y mantenimiento de una conducta que tiene como consecuencia la ausencia de un estímulo aversivo; segundo porque ambos comportamientos pueden simplemente representar extremos de un continuo que sería el reforzamiento negativo.

Bechterev llevó a cabo un estudio con humanos en el que pretendían asociar un estímulo neutro (futuro EC) a una descarga (EI). Los sujetos inicialmente levantaban de forma refleja el dedo (RI) de la placa metálica al recibir la descarga, pero después de pocos ensayos empezaron a hacerlo (RC) tras la aparición del estímulo designado como EC, no recibiendo la descarga programada. Este experimento se consideró de aprendizaje asociativo hasta que algunos autores lo repitieron con animales no humanos y, lo más importante, añadiendo un grupo de control en el que el EI se presentaba en todos los ensayos independientemente de la respuesta del sujeto. Los resultados mostraron que en el grupo experimental, el que podía evitar la descarga, tanto la velocidad de adquisición como la ejecución de la supuesta RC eran mucho mayores. Esto demostró que eran dos conductas diferentes.

Procedimientos de evitación

Evitación discriminada

La evitación discriminada (o señalada) recibe este nombre debido a la existencia de claves que señalan el acontecimiento aversivo (frecuentemente una descarga). Esta técnica utiliza ensayos discretos, con el consiguiente tiempo experimental e intervalo entre ensayos. Cada ensayo se inicia con la presentación de un evento neutro (como una luz o tono) al que se denomina “señal”, que si seguimos la terminología operante va a funcionar como Ed+. Después, dependiendo de lo que haga el sujeto, hay dos posibilidades:

Si el sujeto no emite la respuesta requerida para la evitación durante el intervalo entre la señal y el EI aversivo, se presenta el EI programado y se mantiene hasta que la emite, después de lo cual tanto la señal como el EI cesan. En este caso, la respuesta instrumental se consideraría una forma de escape, ya que suprime la descarga eléctrica en curso. Y, por tanto, este tipo de ensayo se denomina ensayo de escape.
Si el sujeto emite la respuesta requerida, antes de que se presente el EI aversivo, la señal cesa y se omite el EI en ese ensayo. Este sí se consideraría un ensayo de evitación con éxito.

Durante los primeros momentos del entrenamiento, la mayoría de los ensayos son de escape, según se va desarrollando el entrenamiento empiezan a predominar los ensayos de evitación, y por tanto, las respuestas de evitación.

En un ensayo de este tipo se barajan tres elementos: la señal de aviso, la respuesta operante y la consecuencia aversiva, con sus contingencias entre ellos:

Contingencia Respuesta-Señal de aviso. La emisión de la respuesta operante conlleva la desaparición de la señal de aviso, lo que convierte su relación en una contingencia de escape.
Contingencia Respuesta-Consecuencia. Aunque inicialmente se produce una contingencia de escape (dar la respuesta implica hacer desaparecer la descarga que está produciéndose), cuando el entrenamiento está más avanzado la contingencia será de evitación (realizar a tiempo la conducta apropiada impide la llegada de la consecuencia aversiva).
Contingencia Señal de aviso-Consecuencia. La contingencia entre estos dos eventos ambientales también varía dependiendo (como hemos visto anteriormente) de la respuesta del sujeto. En los primeros momentos del procedimiento, antes de que el sujeto adquiera la respuesta de evitación, la señal de aviso y la consecuencia aversiva ocurren conjuntamente. Sin embargo, cuando el sujeto consigue evitar con su respuesta la descarga programada, hace que se rompa esta contingencia, de manera que ahora aparece únicamente la señal de aviso, pero no la consecuencia. Esto implica que durante los ensayos de escape se produce un condicionamiento excitatorio aversivo entre la señal y la descarga, condicionamiento que se somete a extinción en los ensayos de evitación, en los que la señal adquiere la función de Ed+ para la conducta de evitación.

Un efecto muy robusto que se ha encontrado en la adquisición de la conducta de evitación discriminada es la elevada cantidad de ensayos que requiere. Una misma conducta, como presionar una palanca, se adquiere en muy pocos ensayos cuando es un procedimiento de reforzamiento positivo, y sensiblemente más lento cuando hay que adquirir esa misma respuesta como evitación de una descarga. Algunos autores explican esta diferencia como resultado de la interferencia de la conducta elicitada por la señal (la parálisis) en la emisión de la operante requerida. Otros apuntan a que puede deberse a la especificidad de la conducta de evitación/escape en función de la especie. Para evitar una descarga corriendo por un corredor, las palomas necesitaban unos 120 ensayos mientras que las ratas dos o tres para saltar de una plataforma, lo que indica que la elección de la operante que se pretende reforzar determina el tiempo necesario para adquirirla: cuanto más se asemeje a la respuesta elicitada específica de la especie mayor es la velocidad de aprendizaje.

Se han propuesto diferentes teorías para explicar el efecto que el entrenamiento de evitación discriminada tiene sobre los individuos. La primera y más influyente es la Teoría Bifactorial de Mowrer, y está motivada por la paradoja de que una conducta pueda ser reforzada por la ausencia de un evento. Sostiene que en el aprendizaje de evitación están implicados dos procesos interdependientes: el condicionamiento clásico de miedo al EC y el reforzamiento operante de la respuesta de evitación a través de la reducción del miedo.Este reforzamiento no es posible hasta que el miedo se condiciona al EC. En definitiva, desde esta posición se explica la conducta de evitación en términos de escape del miedo condicionado, más que en términos de prevención de la descarga. Es decir, la operante se refuerza por la reducción del «miedo» (o «ansiedad») generada por el EC (señal), y no por impedir la aparición del EI (descarga). Es como una interacción constante entre CC y CO con cambios cíclicos en las repuestas de evitación:

La señal se condiciona de forma excitatoria aversiva mientras el sujeto no emite la respuesta de evitación (ya que aparece el EI)
El sujeto emite la respuesta para escapar del miedo generado por el EC, impidiendo la aparición del EI y provocando que la función del EC se extinga (al no aparecer el EI)
Una vez se extingue el EC deja de emitir la respuesta, volviendo a presentarse el EI (lo que nos lleva de nuevo al punto 1).

Sin embargo, el uso del miedo como una variable intermediaria en el aprendizaje de la evitación ha sido criticado por innecesario. Schoenfeld formuló otra teoría sobre la evitación discriminada en la que no aparecía este concepto. Este autor propuso que la señal adquiere, por condicionamiento clásico, funciones de consecuencia aversiva secundaria o condicionada. Los animales en la situación de evitación no pueden huir de la descarga porque no está presente; lo que emiten es una respuesta de escape reforzada por la retirada de la señal de aviso. Así, en realidad la evitación sería una situación de reforzamiento negativo secundario o condicionado. Aunque ambas teorías se basan en la interpretación de la conducta de evitación discriminada como una forma de escape ante la señal, Schoenfeld no considera necesario aludir al efecto emocional en proceso.

Evitación no discriminada de operante libre de Sidman

En estos procedimientos la descarga se programa para que ocurra periódicamente, sin aviso, (cada 10 seg por ejemplo). Se establece como respuesta de evitación una determinada conducta, y la aparición de esta respuesta impide la administración durante un periodo fijo (30 seg, por ejemplo) de la descarga programada. Los individuos aprenden a evitar las descargas aun cuando no existe un estímulo de aviso.

Aquí se permite que las respuestas de evitación se den en cualquier momento, ya que, ocurran cuando ocurran, reinician el intervalo R-EI. Por esta razón se denomina a este tipo de evitación «de operante libre». Este procedimiento se construye a partir de dos intervalos de tiempo:

Intervalo E-E, Er-Er, o Reloj choque-choque: es el intervalo entre las descargas en ausencia de una respuesta.
Intervalo R-E, R-Er, o Reloj respuesta- choque: que es el intervalo entre la respuesta y la descarga programada, es decir, el período de seguridad.

Los resultados que se obtienen presentan ciertas diferencias respecto a la evitación discriminada:

Implican generalmente períodos mucho más largos de entrenamiento que los experimentos de evitación discriminada.
Con frecuencia, aun después de un entrenamiento extenso, los animales no aprenden nunca a evitar todas las descargas.
Distintos sujetos a menudo se diferencian enormemente en la forma de responder ante el mismo procedimiento de evitación de operante libre.

Entre las hipótesis explicativas destacan dos. La primera de ellas es la Hipótesis Propioceptiva de Sidman. Esta hipótesis sugiere que el papel de la señal de aviso (no existente explícitamente en este tipo de procedimiento) lo ocupa la propia conducta del individuo. Todas las conductas que realiza el sujeto en la situación experimental (excepto la respuesta instrumental) quedan asociadas a la aplicación de la descarga, con lo que en el futuro, cuando el sujeto las esté realizando, sufrirá una ansiedad comparable a la del sujeto al que, en un procedimiento de evitación discriminada, se le presentara la señal de aviso. La manera de escapar de esa ansiedad es emitiendo la operante reforzada.

Una segunda opción es la Hipótesis Interoceptivo-temporal de Anger, según la cual es el paso del tiempo (a través de la “interiorización” de los dos intervalos) el que produciría la ansiedad que conduce al sujeto a responder.

Estas dos hipótesis se centran en el escape del EC excitatorio aversivo como explicación, pero existe otra teoría que señala al reforzamiento positivo como causa de la respuesta observada: la hipótesis de la Señal de Seguridad. Según esta teoría los estímulos asociados a los periodos de seguridad provocados por la respuesta de evitación (fundamentalmente los que son resultado de la retroalimentación de desplazarse hacia una zona de la caja, saltar a una plataforma o pulsar una palanca) se convierten en estímulos condicionados inhibitorios aversivos por su contingencia negativa con la descarga, y acaban funcionando como un reforzador de la respuesta de evitación. Ha recibido bastante apoyo empírico. Por un lado se ha comprobado que aquellos estímulos que se han condicionado de forma inhibitoria aversiva a lo largo de un procedimiento de evitación funcionan de forma eficaz como consecuencias apetitivas para otras conductas. Por otro lado, se ha demostrado que la inclusión de estímulos explícitos (como una luz o un tono) que sigan a la emisión de la respuesta de evitación acelera su adquisición.

Evitación de descarga aleatoria de Herrnstein-Hineline

Los autores de este procedimiento introdujeron a ratas en una caja de Skinner que contaba con una palanca y dos máquinas dispensadoras de descargas (A y B) conectadas al suelo de rejilla metálica de la caja (aunque sólo una a la vez). Las descargas de cada máquina eran intensas, breves y programadas en períodos de tiempo irregulares. La única diferencia entre ambas es que la máquina A las dispensaba según un orden más rápido (mayor frecuencia) que la B. Al principio se conectaba la maquina A, una presión de la palanca la desconectaba y conectaba la B, que se mantenía activa hasta dispensar una descarga, entonces se volvía a conectar A. Es decir ejecutar la operante tenía como consecuencia la suspensión del programa de descargas frecuentes, y activaba el de descargas poco frecuentes, que operaba hasta la siguiente administración.

En estas condiciones era posible que inmediatamente después de accionar la palanca, la máquina B produjese la descarga. Así, el apretar la palanca no prevenía necesariamente del estímulo aversivo. Todo lo que se podía hacer era cambiar las condiciones para decrecer la tasa total de descargas (mantener una frecuencia baja de administración de descargas).

Los resultados obtenidos por estos autores mostraron un aumento de la probabilidad de emisión de la presión de la palanca (conducta de evitación). Herrnstein explicó el reforzamiento de la conducta de evitación no tanto como el resultado de omitir o retardar la presentación de la estimulación aversiva, sino como el debido a la reducción de su frecuencia total o densidad, entendida ésta como una contingencia molar negativa entre las tasas de respuesta y de consecuencias aversivas.

Variables que afectan al reforzamiento negativo

En general, cuanto mayor es la intensidad de la estimulación aversiva, mayor es la velocidad de adquisición de la conducta reforzada negativamente. En el caso de la conducta de escape, la intensidad también determina de la misma forma la rapidez con la que se emite. Pero hay que tener en cuenta que la habituación (en los EI) y la extinción (en los EC) pueden también reducir la efectividad de las consecuencias aversivas, tanto para la adquisición de conductas (evitación/escape) como para su supresión (castigo).

Además de la intensidad de los estímulos aversivos, existen otros parámetros que determinan el reforzamiento negativo, principalmente en los procedimientos de evitación libre y de descargas aleatorias.

En el procedimiento de evitación libre de Sidman la tasa de respuestas está determinada por los intervalos E-E y R-E. Cuanto mayor es la frecuencia de las descargas en ausencia de respuestas (menor intervalo E-E) y mayores sean los períodos de seguridad (mayor intervalo R-E), mayor será la probabilidad de que el animal aprenda la respuesta de evitación. Esta relación también se cumple teniendo en cuenta los valores relativos, es decir, además de su valor absoluto, el hecho de que el intervalo R-E sea mayor que el E-E también mejora la adquisición de la respuesta de evitación.

En la evitación de descarga aleatoria esta relación también se da, no obstante, hay que tener en cuenta que, dada la naturaleza del procedimiento, la evitación no será nunca absoluta. Es más, algunas respuestas pueden ir inmediatamente seguidas de descargas.

Conducta de evitación

Procedimientos de evitación

Evitación discriminada

Evitación no discriminada de operante libre de Sidman

Evitación de descarga aleatoria de Herrnstein-Hineline

Variables que afectan al reforzamiento negativo

Compartir

Contenido relacionado

Categorías del Blog

Compartir

Los más populares

Últimas novedades

Enlaces web

Te puede interesar