5.0. Percepción del habla

Abordar el estudio del lenguaje oral desde el punto de vista material, de su realización física o acústica, es referirse al habla. Así, la percepción del habla o lenguaje oral puede definirse como un proceso complejo por el cual una señal acústica continua y altamente variable activa representaciones mentales discretas y estables de los fonemas de una lengua.

El sonido se produce cuando un cuerpo vibra y comunica la vibración a las moléculas del entorno (aire, agua) y esta energía es recibida por el oído, por lo que en el vacío no puede oírse.

En los seres humanos, las voces masculinas son más graves porque las cuerdas vocales de los varones son más largas que las de las mujeres siendo la frecuencia fundamental de la voz o Fo más baja.

Desde el punto de vista perceptivo, su unidad es el decibelio (dB) , que es una medida relativa y no lineal que abarca desde 0 dB, o umbral de la audición, hasta más de 140 dB, que es el umbral del dolor al sonido. Así, una conversación normal se sitúa entre 40 y 60 dB.

En ciertas alteraciones neurológicas, como en la enfermedad de Parkinson, en algunas disartrias o en la muy rara del síndrome del acento extranjero, la prosodia se ve afectada y repercute negativamente en la inteligibilidad o en la naturalidad del lenguaje.

La frecuencia fundamental, característica de cada individuo, interviene en el anclaje del sistema perceptivo del oyente sobre una voz particular, en situaciones de conversaciones cruzadas y simultáneas (Efecto “cocktail-party).

La suma de varias ondas simples da lugar a una onda compleja. En la naturaleza solo existen ondas complejas, consiguiendo las ondas simples por medios electrónicos o con dispositivos especiales como el diapasón para afinar instrumentos musicales.

Existen dos clases de ondas complejas:

  • Periódicas: ciclos o patrones complejos de vibración que se repiten de forma periódica (notas musicales, silbidos, sirenas). Corresponden a vocales, y consonantes sonoras como /b/, /d/, /g/, /m/, /n/, /r/, /l/ (Tono o tonalidad).
  • Aperiódicas: ondas sin ciclos repetitivos que se perciben como ruidos, sin tono (soplo, golpe, fricción). Corresponden a consonantes no sonoras como /s/, /f/, /Ɵ/, /p/, /t/, /k/, etc.

Los espectrogramas registran mediante un espectrógrafo la distribución de esta energía a través de las frecuencias. El espectrograma presenta tres dimensiones básicas: el eje horizontal (tiempo), el eje vertical (frecuencia) y los distintos grados de grises (intensidad).

Formantes

Los formantes son franjas oscuras horizontales de gran concentración de energía que se observan en la mitad inferior del espectrograma. Están numerados desde abajo como F1, F2, F3, F4 y F5, y corresponden a las resonancias de la garganta, o frecuencias que resultan potenciadas debido a la forma del conducto o tracto vocal.

La investigación con estímulos artificiales demuestra que la mayor parte de las vocales pueden ser identificadas sólo con los dos primeros formantes, F1 y F2. Los formantes F3, F4 y F5 añaden naturalidad.

Los espectrogramas de las cinco vocales castellanas, ordenadas desde la más anterior, /i/, -la estrechez causada por la lengua ocurre en la parte delantera de la boca-, a la más posterior, /u/. Se constatan dos principios:

  • F2 es más alto cuanto más anterior es la vocal
  • F1 es más alto cuanto más abierta es una vocal

Por otra parte, el abocinamiento (redondeamiento y prolongación de los labios) que se produce en la /u/ tiene el efecto de alargar todo el tubo vocal y, por lo tanto, el de bajar ambos formantes.

Dado que los formantes dependen del tamaño y la forma del tracto vocal, existen importantes diferencias individuales a través de los hablantes de distintas edades y sexo, siendo las frecuencias de los formantes inversamente proporcionales a la longitud del tubo.

Un estudio sobre las vocales inglesas es el de Peterson y Barney demuestra:

  • Alta variabilidad de los formantes. Los puntos que representan a la misma vocal se extienden por una amplia región del plano F1 x F2.
  • Solapamientos entre las áreas vocálicas. Vocales diferentes, dichas por hablantes distintos, coinciden a veces en el plano y tienen los mismos, o muy parecidos, valores para F1 y F2, aunque los oyentes no las confunden entre sí. Esto no sucede en el castellano que cuenta con 5 vocales frente a las 10-12 del inglés. Los oyentes no tienen dificultad para entender el lenguaje y perciben correctamente cada vocal, como si contaran con un mecanismo perceptivo. Los oyentes no tienen dificultad en entender el lenguaje y perciben correctamente cada vocal. Parece que cuentan con un mecanismo perceptivo.

Contenido relacionado