3.4. La aproximación computacional

El esbozo primario

El propósito de la primera fase, llamada esbozo primario, es hacer explícitos tanto los cambios de intensidad de la imagen que proporcionan las vías visuales, como la distribución de esos cambios en la escena y su organización geométrica. La descripción explícita de esos cambios se hace especificando las características primitivas simbólicas de la imagen que, según Marr, son cuatro: bordes, barras, terminaciones y manchas y los parámetros fundamentales de cada una de esas características primitivas que son: posición, tamaño, orientación y contraste. El punto de partida de esa fase es la imagen bidimensional proporcionada por los receptores visuales que representa la distribución de luminancia de la escena y que es una representación analógica de la misma. El resultado final es una representación simbólica formada por los cuatro tipos de características mencionadas que describen los cambios de intensidad y que, organizadas en conjuntos resultantes de la aplicación de principios de agrupamiento, servirán como descripción básica a los restantes niveles de procesamiento. Para Marr, el sistema visual se hace simbólico muy pronto, en la primera fase de procesamiento, dando lugar a una descripción de la imagen considerablemente reducida en comparación con la imagen original pero que sigue conservando los aspectos importantes necesarios para el análisis de la imagen. Marr asume que las superficies constitutivas de las imágenes visuales son estables, tienen un alto grado de homogeneidad y las transiciones de luminancia dentro de ellas tienden a ser suaves y no bruscas. Estos supuestos generales permiten orientar el funcionamiento del sistema en esta primera fase.

El esbozo primario incluye dos subfases. En la primera, llamada esbozo primario bruto, Marr estudió los procesos que permiten pasar de la descripción analógica proporcionada por la distribución de luminancia que describe la escena, a la descripción simbólica basada en las características primitivas. La segunda, llamada esbozo primario completo, está dedicada a la exposición de los principios de organización que permiten agrupar las características primitivas en conjuntos y zonas que estructuran la escena.

El esbozo primario bruto

El punto de partida del procesamiento visual es la imagen más simple que pueden producir el conjunto de nuestros receptores: una representación bidimensional de los distintos niveles de intensidad luminosa que tienen los puntos que la componen. Es una representación monocromática, monocular y estática.

El esbozo primario bruto tiene como objetivo proporcionar una descripción de los cambios de luminancia existentes en la imagen en diferentes escalas y clasificar los que sean relevantes en las cuatro categorías de características primitivas que hemos mencionado antes. Tanto Marr como la mayor parte de los investigadores en inteligencia artificial han prestado especial atención a la clasificación de los bordes.

Bases fisiológicas del esbozo primario bruto

Marr también prestó atención a los aspectos relacionados con la realización física de procesos en el cerebro humano. Especialmente se interesó por los mecanismos capaces de realizar el cómputo de los puntos de cruce de cero. Marr pensó que el campo receptivo de las células ganglionares y de las células del núcleo geniculado lateral del tálamo muestra características similares a las del operador utilizado por ellos. Marr asumió que las células del núcleo geniculado que forman que, un conjunto de células con centro off y entorno on estén alineadas y adyacentes a un conjunto alineado de células con centro on y entorno off , forman la base para lograr el cómputo de los puntos de cruce de cero.

Siempre que ambas filas de células estén activas simultáneamente se producirá la presencia de puntos de cruce de cero entre ellas. Si otro conjunto de células en un nivel de procesamiento superior recibe información de ambas células y solamente dispara cuando ambas están activas, estas células Y actuarán como verdaderos detectores de puntos de cruce de cero. Si a su vez estas células están sintonizadas a orientaciones diferentes y se organizan entre sí en alineamientos de una determinada orientación, tendremos la base para la detección de segmentos de puntos de cruce de cero que forman en la teoría de Marr la base sobre la cual se lleva a cabo el cómputo de las características primitivas.

Valoración de la teoría de Marr

La teoría de Marr fue la primera teoría computacional de la visión que se propuso con carácter general y que trató de organizar las principales contribuciones que las investigaciones en inteligencia artificial habían aportado al campo de la percepción visual. Más problemática para la teoría de Marr y Hildreth nunca ofrecieron un algoritmo preciso y otras aportaciones posteriores parecen preferibles. Sin embargo es conveniente recalcar que la principal aportación de Marr fue la nueva forma de pensar que introdujo al teorizar sobre la percepción visual apuntando a los problemas centrales que toda teoría debe resolver en cada nivel de procesamiento.

Contenido relacionado