08. Reconocimiento visual

Conceptos más importantes del capítulo 8

  1. Uttal (1988) define el reconocimiento como la acción de clasificar, categorizar o conceptuar un determinado estímulo como miembro de una clase de estímulos.

  2. El reconocimiento requiere el recuerdo de una o varias clases de estímulos, además de la asignación de significado al objeto. (Ojo. En detección y discriminación son prioritarias las características físicas del estímulo. En reconocimiento es añadido el recuerdo de uno o más estímulos y la asignación de significado)

  3. Es necesaria una exposición entre 100 y 200 mseg., para reconocer, 100 mseg., para ser conscientes.

  4. El primer modelo de reconocimiento basado en las características, denominado “pandemonium” fue desarrollado por Selfridge (1939) El sistema consta de una serie de mecanismos o “demonios” que realizan funciones específicas.

  5. Los demonios de la imagen cumplen la función de formar la representación interna del patrón estimular.

  6. Los demonios de las características analizan la imagen y responden únicamente cuando están presentes las características a la que son sensibles (líneas verticales, ángulos, etc.)

  7. Los demonios cognitivos son responsables del reconocimiento de patrones específicos (letra, número...)
  8. El demonio de la decisión tiene como función la respuesta final sobre el reconocimiento.

  9. Las descripciones estructurales incluyen la descripción de las características de un patrón, relaciones entre las mismas y su disposición espacial.

  10. Cuando la relación entre el objeto y el marco de referencia permanece constante, el reconocimiento del mismo es posible a pesar de los cambios en la imagen cuando se produce un cambio en la orientación o determinadas transformaciones.

  11. Teoría de Marr y Nishihara (1978) Basada en ejes de coordenadas, en el contexto de la inteligencia artificial, intenta ofrecer una explicación de cómo se transforman los patrones estimulares en una representación simbólica en la que se explicitan la forma, orientación, posición, movimiento, etc., de los objetos. También establece una distinción entre la contribución del proceso visual inicial, en el que se generaría el esbozo primario y el esbozo 2 1⁄2 D, y la contribución de procesos posteriores o más tardíos (que llevarían al modelo 3D) Proponen una organización modular y una representación del objeto basada en primitivos volumétricos (conos generalizados)

  12. El modelo extensivo de la anterior teoría es el Modelo de reconocimiento por componentes (Hummel y Biederman, 1992). Los objetos pueden identificarse correctamente a partir de una serie limitada de geones básicos. Parte de una idea similar a la de los de reconocimiento de palabras mediante fonemas. La propuesta básica es un modelo de reconocimiento basado en un conjunto finito de primitivos y sus posibles combinaciones (36 formas volumétricas –esferas, cilindros, bloques y cuñas-, aproximadamente, llamadas geones) que permiten especificar primitivos tridimensionales a partir de imágenes de entrada bidimensionales. El primer paso sería la extracción de borde a partir de cambios en luminancia. Desde ahí las propiedades no accidentales de la imagen para identificar los geones, división del objeto en regiones cóncavas par identificar a los geones que componen el objeto, tipo de geones, posición en la escena, relaciones espaciales entre los mismos (Proceso Top-Down) Una vez activada la descripción de los geones del objeto, se activaría la descripción de los geones almacenados en la memoria y se llevaría a cabo el proceso de comparación en paralelo que conduce a la identificación del objeto.

  13. Las propiedades no accidentales (simetría, paralelismo, rectitud/curvatura, conexión y coterminación) serían las responsables de mantener la constancia del objeto. Empeora el reconocimiento si se degradan.

  14. El principio básico de organización es que el sistema visual considera que determinadas propiedades de los bordes de la imagen bidimensional constituyen una evidencia de la presencia de esas mismas propiedades en los objetos tridimensionales.

  15. El modelo JIM es una red neuronal conexionista de siete capas: 1. Bordes, 2. Vértices, ejes y manchas, 3. atributos de los geones, 4. y 5. relaciones, 6. colección de atributos de los geones, y 7. objetos.

  16. El tiempo empleado en emitir un juicio sobre las diferencias de caras era más corto cuanto más características se presentaban en las caras.

  17. Las características se procesan de forma independiente y secuencial: pelo, ojos, nariz, etc., hasta que se encuentran diferencias.
  18. Las características componentes de las caras no se perciben independientemente sino que se produce una interacción entre las mismas (como una configuración), es decir, una influencia mutua. Determinaría un nuevo percepto junto con sus relaciones espaciales que serviría como base para el reconocimiento. Es peor el reconocimiento cuando estas se presentaban aisladamente que cuando se presentaban en el contexto de caras. Con mayor interferencia en la comparación de características cuando las caras se presentaban en posición recta que cuando se presentaban invertidas.

  19. Los cambios en la configuración influyen en el reconocimiento de las características componentes.

  20. Las caras se procesan como un todo, mientras que los objetos y caras invertidas se procesan en base a sus componentes.

  21. Las relaciones espaciales entre las características componentes de las caras se distorsionan cuando se presentan invertidas o con un cambio de orientación mayor de 90º. Resultados más concluyentes dicen que la configuración se distorsiona más que las características componentes cuando se presentan caras invertidas (por déficit en la codificación de la información configuracional)

  22. El giro fusiforme y el sulcus temporal superior son las áreas que se activan en el reconocimiento visual.

  23. Estudios posteriores permitieron determinar que una pequeña región del giro fusiforme derecho se activa selectivamente durante la percepción de caras y no durante la de objetos.