• UABDivulga
10/2007

Nova teoria per explicar com reconeixem els objectes

Tassa de cafè
Reconèixer els objectes sembla fàcil, però no ho és. Hem de separar la informació rellevant d'altres aspectes com la il·luminació, la perspectiva o l'angle des del qual s'observa l'objecte, i que fan que sembli diferent a la nostra vista. Aquest treball presenta una nova teoria sobre la manera com el nostre cervell tracta tota aquesta informació per aconseguir distingir allò que observem.

Si obres els ulls al matí, et lleves i prepares una tassa de cafè, normalment no ets conscient de la quantitat de càlculs que el teu cervell ha de dur a terme perquè tu puguis reconèixer una cosa tan simple com una tassa de cafè. Quan la veus saps que és una tassa, tant amb una il·luminació artificial com amb la llum del sol. De tots els objectes que coneixes (per exemple, la tassa), tens una mena de petita imatge memoritzada en una part del cervell.

Donat que, en realitat, es tracta d'imatges abstractes, que són “pintades” per les connexions entre les cèl·lules nervioses (neurones), o a vegades representades en l'activitat de les neurones, les anomenem representacions. Es diu que les neurones són actives quan es comuniquen amb altres neurones. En observar alguna cosa, el teu cervell ha de comparar allò que veus amb els objectes que tens memoritzats. A primera vista això no sembla tan difícil, però sí que ho és.

Imagina't la tassa amb ombra i sense ombra. De prop i de lluny. Girada o dreta.  Si el cervell fos només una memòria gegant, aleshores tindria una representació de cada objecte en cada situació. Malgrat això, hi ha un nombre infinit de situacions en les que pots trobar un objecte, així que necessitaries una memòria amb capacitat infinita, la qual cosa és impossible. El cervell ha trobat una solució més intel·ligent. Imagina que en el cervell treballen diferents especialistes per a cada característica d'un objecte. Per exemple, un especialista s'encarregaria de la il·luminació, et diria quin aspecte de l'objecte fa referència a la il·luminació, si té ombres, realços o variacions quan canvia d'estar molt lluminós a estar més fosc. Amb l'ajut de l'especialista d'il·luminació podem extreure de la tassa tots els efectes que són causats per la il·luminació, perquè en altre cas hauries de memoritzar per a cada il·luminació l'aspecte de la tassa. La representació neuronal de la tassa seria igual tant a la llum de la lluna com sota la llum del sol. Si aleshores afegim especialistes similars que descompten efectes de perspectiva o de rotació (entre d'altres), aleshores només caldria tenir una representació de la tassa, seria vàlida per a totes les situacions i podríem aprofitar la nostra memòria visual per a molts més objectes.

El treball científic dels darrers anys ha generat molta evidència en favor d'aquesta teoria. Per exemple, s'han proposat teories que expliquen que els efectes de la il·luminació ja són descomptats en les primeres etapes del sistema visual, és a dir, molt al principi de la jerarquia l'objectiu de la qual és reconèixer els objectes que veiem, o interpretar les coses que veiem amb l'ull, en un instant.

Malgrat això, tots i els avantatges d'extreure la informació sobre il·luminació, nosaltres podem percebre les ombres, realços o gradients d'il·luminació sobreimposats als objectes. És a dir, podem descomptar els efectes d'il·luminació que estan en contradicció amb allò que veiem. A més, hi ha situacions en les quals aquests efectes són, fins i tot, avantatjosos. Per exemple, un realç ens pot facilitar tant la informació sobre les propietats de la superfície com sobre la seva curvatura. Les ombres poden transmetre informació sobre com estan col·locats objectes en relació a d'altres. És a dir, per a interpretar el contingut d'una escena visual, aquesta informació és imprescindible.

Jo he desenvolupat una teoria sobre com és representada aquesta informació en l'activitat neuronal al principi del procés visual. La meva teoria complementa teories existents que clarifiquen com es poden descomptar efectes de la il·luminació, i s'ha acumulat prou evidència al seu favor. En conseqüència, les teories es complementen, i així expliquen com podem tenir representacions d'objectes que no varien amb diferents il·luminacions, i d'altra banda com és possible que veiem els efectes de la il·luminació.

Malgrat tot, com es pot saber si la teoria és correcta? En el meu cas, un model computacional de la teoria prediu algunes il·lusions òptiques: les bandes de Mach, la il·lusió de Chevreul, i una variant del disc d'Ehrenstein. Però no només prediu aquestes il·lusions, sinó que també prediu correctament variacions conegudes. Associar aquestes il·lusions amb un especialista per a la il·luminació és completament nou, i ara els neurofisiòlegs han de trobar evidències a favor o en contra per a acceptar o rebutjar la meva teoria.

Matthias S. Keil
Universitat Autònoma de Barcelona
 
View low-bandwidth version