Contenuto
Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricerca»Unità di ricercaINIZIO_TESTO_DA_INDICIZZARE
UNITA' DI RICERCA
italiano - english
Bibliografia
1. Wolfe, J., Visual Search, in Attention, H. Pashler, Editor. 1996, University college London Press: London.2. Schall, J.D., (2001), Neural basis of deciding, choosing and acting. Nat Rev Neurosci. 2(1): p. 33-42.
3. Wolfe, J.M. and T.S. Horowitz, (2004), What attributes guide the deployment of visual attention and how do they do it? Nat Rev Neurosci. 5(6): p. 495-501.
4. Treisman, A.M. and G. Gelade, (1980), A feature-integration theory of attention. Cognit Psychol. 12(1): p. 97-136.
5. Wolfe, J.M., K.R. Cave, and S.L. Franzel, (1989), Guided search: an alternative to the feature integration model for visual search. J Exp Psychol Hum Percept Perform. 15(3): p. 419-33.
6. Green, D.M. and J.A. Swets, (1966), Signal detection theory and psychophysics., New York: John Wiley & sons.
7. Palmer, J., (1994), Set-size effects in visual search: the effect of attention is independent of the stimulus for simple tasks. Vision Res. 34(13): p. 1703-21.
8. Palmer, J., (1995), Attention in Visual Search: Distinguishing four causes of a set-size effect. Current directions in psychological science. 4(4): p. 118-123.
9. Baldassi, S. and P. Verghese, (2002), Comparing integration rules in visual search. Journal of Vision. 2(8): p. 559-570.
10. Eckstein, M., (1998), The lower visual search efficiency for conjunctions is due to noise and not serial attentional processing. Psychological Science. 9: p. 111-118.
11. Palmer, J., Attentional effects in visual search: relating search accuracy and search time, in Visual Attention, R.D. Wright, Editor. 1998, Oxford University Press: New York, Oxford. p. 348-387.
12. Palmer, J., P. Verghese, and M. Pavel, (2000), The psychophysics of visual search. Vision Res. 40(10-12): p. 1227-68.
13. Shaw, M.L., (1982), Attending to multiple sources of information: I. The integration of information in decision making. Cognitive Psychology. 14: p. 353-409.
14. Baldassi, S. and D.C. Burr, (1999), Different attention-based mechanisms for locating and discriminating oriented targets. Investigative Ophthalmology & Visual Science. S1905.
15. Baldassi, S. and D.C. Burr, (1998), Effect of noise and attention on orientation discrimination. Perception. 27: p. 35.
16. Baldassi, S. and D.C. Burr, (2000), Feature-based integration of orientation signals in visual search. Vision Res. 40(10-12): p. 1293-300.
17. Baldassi, S., Burr, D.C., (1999), The effect of attention on orientation thresholds for location and discrimination of oriented targets amongst vertical and tilted distractors. Perception. 28.
18. Morgan, M.J., Ward, R.M., Castet E.,, (1998), Visual search for a tilted target:tests of spatial uncertainty models. Quarterly Journal of Experimental Psychology. 51A: p. 347-370.
19. Parkes, L., et al., (2001), Compulsory averaging of crowded orientation signals in human vision. Nat Neurosci. 4(7): p. 739-44.
20. Verghese, P., (2001), Visual search and attention. A signal detection theory approach. Neuron. 31(4): p. 523-35.
21. Baldassi, S., P. Verghese, and D.C. Burr, (2001), Effect of orientation noise on a two-tailed orientation discrimination during visual search. Investigative Ophthalmology and Visual Science. 42(4): p. S926-4970.
22. Baldassi, S., D.C. Burr, and N. Megna, (2004), Confidence grows with uncertainty in visual search. Journal of Vision. in press.
23. Baldassi, S., D.C. Burr, and C. Bracali, (2004), What is compulsory in crowded orientation signals? Perception. 33, 41b.
24. Baldassi, S., Burr, D.C., Megna, N., (2005), Visual clutter causes high magnitude errors. Nature Neuroscience. under review.
25. Ress, D., B.T. Backus, and D.J. Heeger, (2000), Activity in primary visual cortex predicts performance in a visual detection task. Nat Neurosci. 3(9): p. 940-5.
26. Baldassi, S. and D.C. Burr, (2004), "Pop-out" of targets modulated in luminance or colour: the effect of intrinsic and extrinsic uncertainty. Vision Res. 44(12): p. 1227-33.
27. Ahumada, A.J., Jr. and J. Lovell, (1971), Stimulus features in signal detection. Journal of the Acoustical Society of America. 49: p. 1751-1756.
28. Eckstein, M.P. and A.J. Ahumada, Jr., (2002), Classification images: a tool to analyze visual strategies. J Vis. 2(1): p. 1x.
29. Heeger, D.J., (1993), Modeling simple-cell direction selectivity with normalized, half-squared, linear operators. J Neurophysiol. 70(5): p. 1885-98.
30. Ress, D. and D.J. Heeger, (2003), Neuronal correlates of perception in early visual cortex. Nat Neurosci. 6(4): p. 414-20.
31. Burr, D.C., Verghese, P., Morrone, M.C., Baldassi, S., (2003), Search for motion direction: pop-out and set-size dependencies explained by stimulus and intrinsic uncertainty. Journal of Vision. in press.
32. Gold, J.A., Shadlen, M.N., (2001), Neural computations that underlie decisions about sensory stimuli. Trends Cogn Sci. 5(1): p. 10-16.
33. Smith, P.L. and R. Ratcliff, (2004), Psychology and neurobiology of simple decisions. Trends Neurosci. 27(3): p. 161-8.
Programma di ricerca
Integrazione delle informazioni nel sistema visivo: modelli computazionali dei processi sensoriali e decisionaliUniversità di riferimento
Università degli Studi di FIRENZE - PSICOLOGIA - FIRENZE(FI)Responsabile dell'Unità di ricerca
Stefano BALDASSIDescrizione
La nostra Unità si propone di studiare i meccanismi con cui l'informazione da diversi oggetti della scena è integrata allo scopo di giungere ad una decisione percettiva. Cercheremo di ottenere dati empirici per caratterizzare le fasi computazionali e per identificare i correlati neuronali di questi processi. A tal fine ci proponiamo di usare in modo combinato tecniche psicofisiche, elettrofisiologiche e di tempi di reazione (TR) in diversi compiti di ricerca visiva di un bersaglio diverso dai distrattori per caratteristiche visive elementari.I nostri studi recenti hanno proposto una nuova tecnica comportamentale di Stima della Grandezza (Magnitude Estimation) per misurare le distribuzioni interne di risposta che guidano i soggetti nelle decisioni percettive in un ambienti visivi complessi [23, 24, 26]. Questa tecnica è adatta a studiare processi basati su meccanismi non-lineari [9] poichè, a differenza di altre tecniche psicofisiche ad alta risoluzione come la correlazione inversa [27, 28], non richiede alcuna assunzione di linearità.
Abbiamo dunque in programma una serie di esperimenti per
a) testare le predizioni dei modelli seriali di ricerca visiva basati sui tempi di risposta, confrontandoli con i modelli paralleli, a loro volta basati su misure di accuratezza e di soglia, con un unico esperimento che utilizzi la tecnica di Magnitude Estimation in congiunzione con la rilevazione dei TR,
b) distinguere tra plausibili modelli non-lineari alternativi di ricerca visiva,
c) caratterizzare i correlati neurali delle decisioni percettive in scene complesse mettendo in relazione l'attività neurale legata a diversi tipi di risposta in esperimenti di ricerca visiva,
d) correlare i risultati in d) al generatore di attività utilizzando EEG ad alta intensità.
Parte a): Modello seriale o parallelo
Il confronto quantitativo diretto tra modelli della ricerca visiva seriali e paralleli è ostacolato dal fatto che i dati a cui fanno riferimento sono basati principalmente su misure di accuratezza o su TR, rispettivamente. Una serie di resoconti teorici [12, 20] hanno criticato i modelli seriali basati sui TR in quanto in questi ultimi non veniva controllata la discriminabilità (o d') del bersaglio rispetto ai distrattori, che è invece una variabile di disturbo fondamentale. L'ipotesi è che controllando il d', la pendenza della funzione che lega i tempi di risposta al numero di elementi presenti nel display (set size) dovrebbe appiattirsi, mostrando che non c'è bisogno di postulare un'elaborazione seriale. I precedenti tentativi di verificare questa ipotesi [11] sono indeboliti dal fatto che ai soggetti veniva richiesto di mantenere un certo livello di prestazione, basandosi sull'assunzione della SDT per cui il livello della prestazione stabilisce la rilevabilità dello stimolo. Una tale richiesta esplicita potrebbe influire sulla strategia naturale del soggetto, introducendo ulteriori artefatti. In un esperimento preliminare abbiamo misurato contemporaneamente Magnitude Estimation e TR. Nell'esperimento pilota di base il bersaglio era un ‘Gabor patch' (un profilo di luminanza sinusoidale racchiuso in una finestra Gaussiana) inclinato in senso orario o antiorario rispetto al verticale, e i distrattori erano elementi simili orientati in senso verticale di numero variabile. La direzione di inclinazione del bersaglio è stabilita casualmente ad ogni trial e gli stimoli sono mostrati per 100 ms, per evitare movimenti oculari di esplorazione. Dopo la presentazione dello stimolo è richiesto ai soggetti di segnalare il più velocemente ed accuratamente possibile l'orientamento del bersaglio digitando uno di due tasti. Subito dopo aver premuto il tasto, è presentato al soggetto un display di risposta che contiene 12 elementi (probes) che riportano una ampia gamma di angoli in entrambe le direzioni di inclinazione. Il soggetto deve classificare l'inclinazione percepita del bersaglio selezionando con un mouse il probe che si avvicina di più all'inclinazione percepita in ogni dato trial. Questa doppia risposta permette di registrare dati più completi: il TR per decidere l'inclinazione del bersaglio, la risposta binaria di identificazione (orario-antiorario) che permette di tracciare la funzione psicometrica, e la "classificazione" dell'angolo percepito che verrà usata per tracciare la distribuzione delle risposte. Confrontando i dati ottenuti da ognuna di queste misure separatamente abbiamo stabilito che la doppia risposta non influenza la prestazione. La novità di questo studio consiste nella possibilità di isolare i punti individuali della distribuzione delle risposte, ognuno dei quali rappresenta l'effettiva discriminabilità del bersaglio ad ogni trial. In particolare, dovremmo essere in grado di effettuare tre tipi di analisi per ottenere i risultati ipotizzati. La prima è il confronto tra i tempi di reazione dei vari set size a vari livelli di discriminabilità del bersaglio, ottenuta calcolando la media dei TR tra le inclinazioni fisiche che hanno prodotto simili livelli di accuratezza (per esempio, tra un'inclinazione del bersaglio di 1.5° dal verticale a set size 1 e un'inclinazione di 6° a set size 16). Questa analisi può essere effettuata indipendentemente dalle misure di Magnitude Estimation ed satà influenzata dal rumore dello stimolo. La seconda è il confronto tra i TR di inclinazioni percepite simili ai vari set size, prendendo, ad esempio, tutte le classificazioni a 4° separatamente per risposte corrette ed errori. Ciò è legittimo se si assume che la classificazione dell'inclinazione del bersaglio massimigli l'eguaglianza tra l'inclinazione percepita e i probe di risposta. Sebbene tale misura sia indipendente dal rumore, essa non segue la regola del d' fisso, dato che ad ogni angolo corrisponderà un d' sempre più basso con l'aumentare del set size. Nell'ultima analisi si considerano inclinazioni fisiche a livelli prefissati di d' in vari set size ma vengono ulteriormente selezionati solamente le classificazioni (cioè le inclinazioni percepite) corrispondenti al d' teorico di ogni dato angolo fisico. Quest'ultima analisi rivela l'esatta variazione dei TR, libera dal rumore e dipendente solamente dall'aumento del set size a d' costante. In effetti i nostri dati pilota mostrano che mentre il primo tipo di analisi mostra un' aumento molto marcato dei TR al crescere del set size, le altre due analisi annullano tale variazione, in linea con un modello parallelo di elaborazione dell'informazione. L'ultimo tipo di analisi sembra comunque quella statisticamente più affidabile.
Ci proponiamo dunque di eseguire questo esperimento estensivamente su un campione rappresentativo di soggetti (>10), ognuno dei quali dovrebbe raccogliere almeno 5000 trials per ogni set size per fornire la massima affidabilità statistica sui dati di TR.
Crediamo che i risultati di questo esperimento potrebbero rappresentare un contributo originale alla letteratura sulla ricerca visiva e permetteranno di confrontare le due classi di modelli nello stesso contesto sperimentale.
Parte b): Analisi di modelli non-lineari alternativi
Misurando le distribuzioni di risposta con la nostra nuova tecnica di Magnitude Estimation, abbiamo ottentuto distribuzioni bimodali a set size alti sia in display con elementi distanti e di medie dimensioni che molto vicini tra loro e di dimensioni piccole. Abbiamo interpretato questi risultati come l'effetto dell'incertezza decisionale: a causa del rumore intrinseco a ogni elemento, all'aumentare del set size aumenta anche la probabilità che uno degli elementi possa produrre una risposta particolarmente grande in una direzione o nell'altra; questo modello è basato sulla SDT ed è stato chiamato ‘Signed-Max Model' [9,26]. Anche se questa interpretazione è altamente plausibile per il display normale, in cui la grandezza degli elementi e la loro distanza è tale da escludere qualsiasi effetto di configurazione, possono sorgere dubbi per l'esperimento effettuato con elementi ravvicinati (crowding). In effetti in quest'ultime condizioni, a causa delle piccole dimensioni degli elementi (<0.2° di angolo visivo) e della loro relativa distanza (0.4° dal centro di essi) un modello che sommi percettivamente l'informazione è plausibile poiché la gamma di grandezza dei detettori ottimali per mantenere indipendenti gli stimoli di questo compito (che giustifichi un modello di decisione) risiede nell'estremo inferiore per il sistema visivo umano. In realtà esiste per lo meno un altro modello non-lineare che prevede distribuzioni bimodali in simili compiti. E' un modello di sommazione di secondo ordine nel quale l'informazione rumorosa proveniente da ogni elemento è amplificata da una funzione-potenza e poi sommata a livello percettivo, prima della decisione. In questo modello maggiore è l'esponente, più netta la bimodalità. Dato che è stato provato che l'elevazione al quadrato dell'input è un'operazione che ha luogo nel cervello visivo [29], ci proponiamo di testare questa ipotesi mediante un esperimento chiave. In particolare, se l'informazione dai vari elementi passa attraverso uno stadio di sommazione non-lineare e il risultato (unico) di questa operazione è utilizzato nella decisione, ci aspettiamo che i soggetti non riescano a localizzare l'elemento bersaglio.
In questa parte del progetto eseguiremo due esperimenti: 1) ricerca visiva di elementi ben distanziati e 2) discriminazione di orientamento di un elemento noto in presenza di distrattori ravvicinati.
1) Ricerca visiva. In questo esperimento si useranno gli stessi stimoli descritti dell'esperimento descritto in a). Dopo la presentazione dello stimolo, la locazione di ogni elemento verrà marcata da cerchi vuoti privi informazione e il soggetto dovrà indicare il cerchio corrispondente allo spazio nel quale ha visto il bersaglio. Dopo aver dato la risposta di locazione, il soggetto dovrà classificare l'inclinazione del bersaglio. In questo caso abbiamo bisogno di tracciare distribuzioni di risposta in modo da rilevare sottili differenze che dipendono dall'esponente che può amplificare il segnale prima della sommazione, quindi la pagina di risposta usuale con 6 probes per ogni direzione di inclinazione non è particolarmente indicata. Pertanto, piuttosto di utilizzare un numero maggiore di probes, che come abbiamo visto in esperimenti pilota introduce artefatti nella strategia di risposta dei soggetti, mostreremo al soggetto un unico probe di risposta utilizzabile come un cursore per aggiustarne in modo continuo l'angolo ad indicare quello percepito nel bersaglio. Se la risposta di locazione non fosse correlata a quella del bersaglio, ciò suggerirebbe una sommazione percettiva non-lineare. Se al contrario lo fosse, ciò fornirebbe ulteriore supporto al modello decisionale. Inoltre l'analisi degli errori di locazione rispetto all'effettiva locazione del bersaglio potrebbe essere utile nel rilevare proprietà delle decisioni percettive in scene complesse che possono costituire le basi di progetti successivi.
2) Crowding. In questo esperimento useremo la stessa struttura per registrare la risposta di 1), che richiede al soggetto di selezionare un probe per la locazione e di aggiustare l'inclinazione del probe per avvicinarlo a quella percepita, mentre la configurazione dello stimolo sarà equivalente a quella usata in [19].
Per evitare gli artefatti dovuti agli effetti della memoria dovuti alla doppia risposta assegneremo casualmente i soggetti ad una delle seguenti condizioni: I) risposta di locazione prima, aggiustamento dell'inclinazione dopo, II) aggiustamento dell'inclinazione prima, risposta di locazione dopo, III) e IV) ciascun compito separatamente.
Parte c) Correlati neurali delle decisioni percettive
Una recente scoperta [25,30] ha descritto direttamente la classificazione di risposta in compiti di detezione (hits, false alarms, correct rejections, misses) in relazione all'attività neurale, mostrando con tecniche di fMRI che hits e false alarms sono associati ad un'attività corticale significativamente maggiore di quella associata a correct rejection e misses. Questi dati suggeriscono che l'attività della corteccia visiva primaria corrisponda al percetto del soggetto, piuttosto che allo stimolo presentato fisicamente. A loro volta i falsi allarmi dipendono dal rumore che il sistema introduce a vari livelli. In uno studio non pubblicato svolto dallo stesso gruppo (Norcia A.M., comunicazione personale) gli stessi risultati sono stati replicati usando i Potenziali Evocati Visivi (PEV). Nella ricerca visiva abbiamo dimostrato come, in presenza di molti elementi, gli errori siano associati ad una maggiore quantità percepita di segnale e ad una maggiore fiducia nella risposta. Su queste basi pensiamo che mettendo a punto l'esperimento appropriato possiamo verificare la predizione per cui, quando il soggetto sbaglia, l'ampiezza del segnale evocato in presenza di molti elementi sia maggiore a quello registrato con uno o pochi elementi.
Ci proponiamo di usare la nostra apparecchiatura per registrare PEVs utilizzando come stimoli campi di punti che si muovono in modo coerente in mezzo a punti che si muovono a caso. In un tale display, il bersaglio conterrà una proporzione variabile di punti che si spostano coerentemente in una di due possibili direzioni più un numero di punti di rumore in movimento di browniano casuale, mentre gli elementi distraenti presenteranno lo stesso numero di punti del bersaglio ma tutti in moto casuale. L'accuratezza e la soglia per questo compito sono correlate alla proporzione di punti in moto coerente rispetto a quelli casuali, misura che segue lo stesso andamento in ricerca visiva di quello ampiamente mostrato dall'orientamento [31]. Inoltre i campi di punti in movimento sono stimoli standard usati con gli animali per indagare le proprietà neurali delle decisioni percettive [32]. Per ottenere un segnale di base, mostreremo continuamente il massimo numero di elementi (16), definendo il set size indicando un istante prima gli elementi rilevanti tramite cerchi, procedura adeguata a definire il set size [26]. L'esatta calibrazione del pre-cue sarà effettuata in test pilota. I soggetti dovranno identificare la direzione del moto premendo uno di due tasti e il potenziale evocato in corrispondenza del trial verrà registrato separatamente per risposte corrette ed errori. Verranno inoltre registrati i TR. Ipotizziamo che la componente che segnalerà la forza del segnale cresca con il set size sia per le risposte corrette che per gli errori, e questo indipendentemente dall'intensità dello stimolo (cioè la proporzione di punti-segnale).
Parte d) Localizzazione della fonte delle decisioni basate sulla percezione
L'esperimento messo a punto per la parte c) della proposta della nostra unità registra i PEV con un numero di elettrodi variabile da 5 a 8. Tale numero è sufficiente per caratterizzare l'attività corticale correlata al compito di ricerca visiva, ma non rende possibile una mappatura accurata delle sorgenti di attività relative alle varie componenti. Per mappare con precisione le aree nervose legate a questi compiti ci proponiamo, in collaborazione con il laboratorio PEVs dello Smith-Kettlewell Eye Research Institute di San Francisco di ripetere l'esperimento in c) utilizzando il sistema Geodesic EEG del loro laboratorio che registra l'attività nervosa da 128 elettrodi simultaneamente. Data l'alta risoluzione spaziale e temporale di questo sistema, possiamo ottenere fondamentali chiarimenti sui circuiti neurali implicati in questi compiti complessi, che sembrano coinvolgere centri neurali distribuiti in diversi lobi del cervello, dalla corteccia visiva alle cortecce parietale e frontale [33].



