Vai al contenuto| Home page|

   Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricerca
INIZIO_TESTO_DA_INDICIZZARE

PROGRAMMA DI RICERCA

italiano - english
Programmi di ricerca simili:
Classificazione scientifico-disciplinare
Classificazione geografica
Bibliografia
UNITA' I


Alais, D., & Burr, D. (2004). The ventriloquist effect results from near-optimal bimodal integration. Current Biology, 14, 257-262.

Backus, B.T., Banks, M.S., van Ee, R., & Crowell, J.A. (1999). Horizontal and vertical disparity, eye position, and stereoscopic slant perception. Vision Research, 39, 1143-1170.

Blaser, E., & Domini, F. (2002). The conjunction of feature and depth information. Vision Research, 42, 273-279.

Brenner, E., & Landy, M.S. (1999). Interaction between the perceived shape of two objects. Vision Research, 39, 3834-3848.

Clark, J.J. & Yuille, A.L. (1990). Data fusion for sensory information processing systems. Kluwer Academic Publishers, Boston.

Domini, F., Blaser, E., & Cicerone, C.M. (2000). Color-specific depth mechanisms revealed by a color-contingent depth aftereffect. Vision Research, 40, 359-364.

Ernst, M. O., & Banks, M. S. (2002). Humans integrate visual and haptic information in a statistically optimal fashion. Nature, 415, 429-433.

Gepshtein, S. & Banks, M.S. (2003). Viewing Geometry Determines How Vision and Haptics Combine in Size Perception. Current Biology, 13, 483-488.

Hillis, J.M., Watt, S.J., Landy, M.S. & Banks, M.S. (2004) Slant from texture and disparity cues: optimal cue combination. Journal of Vision, 4, 967-992

Jacobs, R.A. (2002). What determines visual cue reliability? Trends in Cognitive Sciences, 6, 345-350.

Jacobs, R.A. (1999). Optimal integration of texture and motion cues to depth. Vision Research, 39, 3621-3629.

Kersten, D., & Yuille, A. (2003). Bayesian models of object perception. Current Opinion in Neurobiology, 13,150-158.

Knill, D. C., & Saunders, J. A. (2003). Do humans opti-mally integrate stereo and texture information for judgments of surface slant? Vision Research, 43, 2539-2558.

Landy, M.S., Maloney, L.T., Johnston, E.B., & Young, M. (1995). Measurement and modeling of depth cue combination: in defense of weak fusion. Vision Research, 35, 389-412.

Landy, M. S., & Kojima, H. (2001). Ideal cue combination for localizing texture-defined edges. Journal of the Optical Society of America A, 18, 2307-2320.

Nawrot, M, & Blake, R. (1989). Neural integration of information specifying structure from stereopsis and motion. Science, 244, 716-718.

Poom, L., & Borjesson, E. (1999). Perceptual depth synthesis in the visual system as revealed by selective adaptation. Journal of Experimental Psychology: Human Perception and Performance, 25, 504-517.

Shimozaki, S.S., Eckstein, M.P., & Abbey, C.K. (2003). Comparison of two weighted integration models for the cueing task: linear and likelihood. Journal of Vision, 3, 209-229.

Young, M.J., Landy, M.S., & Maloney, L.T. (1993). A perturbation analysis of depth perception from combinations of texture and motion cues. Vision Research, 33, 2685-2696.


UNITA' II


Baldassi, S., & Burr, D.C. (2000). Feature-based integration of orientation signals in visual search. Vision Res, 40 (10-12), 1293-1300.

Baldassi, S., & Verghese, P. (2002). Comparing integration rules in visual search. Journal of Vision, 2 (8), 559-570.

Baldassi, S., & Burr, D.C. (2004). "Pop-out" of targets modulated in luminance or colour: the effect of intrinsic and extrinsic uncertainty. Vision Res, 44 (12), 1227-1233.

Baldassi, S., Burr, D.C., & Bracali, C. (2004a). What is compulsory in crowded orientation signals? Perception, 33, 41b

Baldassi, S., Burr, D.C., & Megna, N. (2004b). Confidence grows with uncertainty in visual search. Journal of Vision, 4(8), 166a, http://journalofvision.org/4/8/166/, doi:10.1167/4.8.166.

Baldassi, S., Burr, D.C., Megna, N. (2005). Visual clutter causes high magnitude errors. Nature Neuroscience, under review

Green, D.M., & Swets, J.A. (1966). Signal detection theory and psychophysics. New York: John Wiley & sons.

Heeger, D.J. (1993). Modeling simple-cell direction selectivity with normalized, half-squared, linear operators. J Neurophysiol, 70 (5), 1885-1898.

Morgan, M.J., Ward, R.M., Castet E., (1998). Visual search for a tilted target:tests of spatial uncertainty models. Quarterly Journal of Experimental Psychology, 51A, 347-370.

Palmer, J. (1995). Attention in Visual Search: Distinguishing four causes of a set-size effect. Current directions in psychological science, 4 (4), 118-123.

Parkes, L., Lund, J., Angelucci, A., Solomon, J.A., & Morgan, M. (2001). Compulsory averaging of crowded orientation signals in human vision. Nat Neurosci, 4 (7), 739-744.

Ress, D., & Heeger, D.J. (2003). Neuronal correlates of perception in early visual cortex. Nat Neurosci, 6 (4), 414-420.

Schall, J.D. (2001). Neural basis of deciding, choosing and acting. Nat Rev Neurosci, 2 (1), 33-42.

Shaw, M.L. (1982). Attending to multiple sources of information: I. The integration of information in decision making. Cognitive Psychology, 14, 353-409.

Treisman, A.M., & Gelade, G. (1980). A feature-integration theory of attention. Cognit Psychol, 12 (1), 97-136.

Watson, A.B., & Pelli, D.G. (1983). QUEST: a Bayesian adaptive psychometric method. Perception and Psychophysics, 33 (2), 113-120.
Wolfe, J. (1996). Visual Search. In: H. Pashler (Ed.) Attention (London: University college London Press.


UNITA' III


Dosher, B. A., & Lu, Z. L. (2000). Noise exclusion in spatial attention. Psychological Science, 11 (2), 139-146.

Freeman, E., Sagi, D., & Driver, J. (2001). Lateral interactions between targets and flankers in low-level vision depend on attention to the flankers. Nature Neuroscience, 4 (10), 1032-1036.

Gilbert, C., Ito, M., Kapadia, M., & Westheimer, G. (2000). Interactions between attention, context and learning in primary visual cortex. Vision Research, 40 (10-12), 1217-1226.

Ito, M., & Gilbert, C. D. (1999). Attention modulates contextual influences in the primary visual cortex of alert monkeys. Neuron, 22 (3), 593-604.

Ito, M., Westheimer, G., & Gilbert, C. D. (1998). Attention and perceptual learning modulate contextual influences on visual perception. Neuron, 20 (6), 1191-1197.

Polat, U., & Sagi, D. (1993). Lateral interactions between spatial channels: suppression and facilitation revealed by lateral masking experiments. Vision Research, 33 (7), 993-999.

Yeshurun, Y., & Carrasco, M. (1998). Attention improves or impairs visual performance by enhancing spatial resolution. Nature, 396 (6706), 72-75


UNITA' IV


Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle. B. N. Petrov and F. Csaki (eds.), 2nd International Symposium on Information Theory: 267-81. Budapest: Akademiai Kiado.

Cutting, J. E. (2000). Accuracy, scope, and flexibility of models, Journal of Mathematical Psychology, 44, 3-19.

Cutting, J.E., Bruno, N., Brady, N.P., & Moore, C. (1992). Selectivity, scope, and simplicity of models: a lesson from fitting judgments of perceived depth. Journal of Experimental Psychology: General, 121, 364-381.

Bruno, N., & Cutting, J.E. (1988). Minimodularity and the perception of layout. Journal of
Experimental Psychology: General, 117, 161-170.

Domini, F., & Caudek, C. A new approach to the study of cue-integration. Vision Sciences Society (VSS), Sarasota, Florida, May, 2004.

Domini, F., & Caudek, C. (2003). 3-D structure perceived from dynamic information: a new theory. Trends in Cognitive Sciences, 7, 444-449.

Forster, M. R. (2000). Key concepts in model selection: performance and generalizability. Journal of Mathematical Psychology, 44, 205-231

Forster, M. R. and E. Sober (1994). How to tell when simpler, more unified, or less ad hoc theories will provide more accurate predictions. The British Journal for the Philosophy of Science, 45, 1-35.

Kullback, S. and R. A. Leibler (1951). On information and sufficiency. Annals of Mathematical Statistics 22, 79-86.

Massaro, D. W. (1988). Ambiguity and perception in experimentation, Journal of Experimental Psychology: General, 117, 417-421.
Parole Chiave
PERCEZIONE; INTEGRAZIONE DELLE INFORMAZIONI; MODELLI COMPUTAZIONALI; ATTENZIONE; PERCEZIONE DELLA FORMA 3D; SEGMENTAZIONE FIGURA SFONDO; POTENZIALI VISIVI EVOCATI; RICERCA VISIVA; PSICOFISICA

Integrazione delle informazioni nel sistema visivo: modelli computazionali dei processi sensoriali e decisionali

Università degli Studi di Trieste
Abstract
Il presente progetto di ricerca si propone di indagare l'integrazione di informazioni ai diversi livelli di elaborazione cognitiva. L'integrazione delle informazioni per la percezione della forma 3D verrà indagata utilizzando metodi psicofisici e assumendo, come punto di partenza della modellizzazione, un'architettura computazionale interamente di tipo 'bottom-up'. Mediante tale indagine si intendono esplorare i limiti di una spiegazione dell'integrazione delle informazioni dal basso all'alto. Il fenomeno dell'integrazione delle informazioni verrà anche indagato considerando i fenomeni percettivi 'di basso livello', quali la discriminazione di tessiture e la percezione dei contorni. Nel caso di tali studi, infatti, le metodologie presenti consentono di considerate in maniera esplicita le richieste definite dal compito in maniera dipendente dal contesto e i conseguenti processi di decisione. A questo proposito, la modellizzazione proposta non sarà dunque puramente 'bottom-up'. Ciascuno di questi due approcci trarrà beneficio dalla possibilità di confrontarsi con l'altro.

I compiti saranno ripartiti tra 4 unità nel modo seguente.

Unità I. Le ricerche psicofisiche eseguite da tale unità saranno motivate da un nuovo modello per il recupero della forma 3D da cue multipli e conseguiranno due obiettivi. (A) In una prima serie di esperimenti, il modello sarà verificato mediante esperimenti riguardanti la segmentazione di superfici 3D, e la discriminazione tra strutture rigide e non rigide. (B) In una seconda serie di esperimenti, verrà studiata la plasticità del sistema visivo, ovvero la capacità del sistema di ricalibrarsi in funzione delle caratteristiche dei segnali input, come ipotizzato dal modello.

Unità 2. I ricercatori della Unità II metteranno a punto una serie di esperimenti basati su paradigmi di ricerca visiva guidati da modelli biologicamente plausibili ed eseguiti utilizzando tecniche psicofisiche ed elettrofisiologiche. Lo scopo di tali ricerche è quello di studiare i meccanismi che permettono l'integrazione di informazioni provenienti da oggetti visivi multipli al fine di guidare le decisioni percettive. Studi elettrofisiologici saranno effettuati per ottenere informazioni sulle proprietà dei processi neurali che sono alla base delle decisioni percettive relative a display complessi.

Unità 3. Verranno indagati mediante la misurazione di indici comportamentali (accuratezza) ed elettrofisiologici (VEP) i processi di integrazione degli elementi microstrutturali e di come le caratteristiche di questi elementi influiscono sui fenomeni di segmentazione tissurale e segmentazione figura-sfondo. Vengono predette differenze nella prestazione a seguito della manipolazione dei livelli di attenzione. Tali differenze, inoltre, potrebbero rivelarsi anche nei correlati elettrofisiologici (VEP) registrati in posizione occipitale.

Unità 4. Mediante simulazioni Monte Carlo, due obiettivi verranno raggiunti. Da un lato verranno confrontati i modelli proposti per la ricostituzione dell'immagine tridimensionale degli oggetti dall'immagine retinica (modelli di fusione, modelli di vincoli intrinseci, modelli fuzzy-logic); dall'altro, per la verifica e scelta dei modelli verranno utilizzati sei metodi (NHST, ML, resampling, metodi bayesiani, AIC, MLD), e questo consentirà di confrontarne pregi e limitazioni. <<<

Coordinatore Scientifico del Programma di Ricerca
Corrado CAUDEK Università degli Studi di TRIESTE
Obiettivo del Programma di Ricerca
Lo scopo del presente progetto di ricerca è lo sviluppo di un paradigma di ricerca interdisciplinare in grado di tenere in considerazione, al necessario livello di approssimazione, tutti gli elementi costituenti del processo di integrazione di informazioni nel sistema visivo. Tre elementi costitutivi possono essere individuati all'interno del processo visivo: (1) le caratteristiche rilevanti dell'input (stimolo), (2) le proprietà computazionali dell'elaborazione eseguita dal sistema visivo, e (3) le richieste definite dal compito, ecologico o sperimentale che sia, in maniera dipendente dal contesto e i conseguenti processi di decisione.

In una descrizione dei processi visivi 'all'ordine zero' solo gli elementi di tipo 1 e 2 sono presi in considerazione. I vincoli fisici sugli stimoli verranno indagati con metodi psicofisici (Unità I, II e III), mentre, come punto di partenza della modellizzazione, assumiamo che l'architettura computazionale sia interamente di tipo 'bottom-up' (Unità I). Lo scopo sostanziale di produrre una descrizione dei processi visivi all'ordine zero non è semplicemente quello di descrivere la potenza computazionale dell'approccio, ma, specificatamente per il nostro obiettivo, quello di esplorare i suoi limiti computazionali (Unità I e IV). Una descrizione all'ordine zero dei processi visivi, infatti, è utile e valida se produce indicazioni rilevanti (Unità III) e suggerimenti teorici e computazionali espliciti (Unità I e II) sulla maniera in cui il terzo elemento cruciale può influenzare ed eventualmente ridisegnare l'intero processo visivo (Unità II e III).

Le unità I e IV considereranno l'integrazione di informazioni nel fenomeno di percezione della forma 3D a partire da cue multipli. L'aspetto innovativo di tale ricerca risiede nello sviluppo e test di un nuovo modello per la percezione della forma 3D. Tale modello è in grado di riconciliare una serie di risultati (apparentemente) contraddittori presenti in letteratura. Alcune ricerche, infatti, sono state interpretate a favore dell'ipotesi secondo la quale il sistema visivo può essere descritto nei termini di uno stimatore bayesiano ottimale che combina l'output di moduli indipendenti, ciascuno dedicato all'analisi di un particolare segnale sensoriale (disparità, movimento, ...). Altre ricerche, invece, suggeriscono che l'architettura del sistema visivo non può essere modulare. Nel presente progetto di ricerca, tutti questi risultati empirici contrastanti possono essere 'accomodati' nel modello proposto.

Le unità II e III indagheranno l'integrazione delle informazioni considerando i fenomeni della percezione dei contorni e della discriminazione di tessiture. Tali ricerche forniranno risultati rilevanti per la comprensione del rapporto tra processi 'dal basso' e 'dall'alto' (descrizione dell'elaborazione cognitiva 'all'ordine uno'). Le risorse attentive verranno manipolate per lo studio sia di processi di base (es., discriminazione di tessiture; unità III) sia di processi decisionali in scene complesse (Unità II).


Il programma di ricerca sarà articolato come segue.

UNITA' I. L'unità I svilupperà e verificherà un modello di integrazione delle informazioni per la percezione della forma 3D. In base a tale proposta, il sistema visivo utilizza la covariazione tra i segnali retinici per (i) ridurre la dimensionalità dello spazio di soluzione per la ricostruzione 3D, e (ii) fornire un'interpretazione 3D euclidea a tale ridescrizione di dimensionalità ridotta dei segnali di input. Verrà esplicitato e verificato un modello matematicamente trattabile di integrazione 'strong fusion' (Clark & Yuille, 1990) tra i 'cue' di profondità. Si dimostrerà come un manifold soggiacente definito dalla covariazione tra i segnali retinici sia sufficiente per specificare la profondità, l'inclinazione locale e la curvatura della struttura locale degli oggetti distali.

UNITA' II. L'obiettivo principale della ricerca della seconda unità è quello di comprendere i meccanismi che guidano decisioni percettive in scene visive complesse. A tal fine verranno utilizzati modelli che derivano dalla Teoria di Detezione del Segnale ed applicati alla ricerca visiva e verranno sviluppati paradigmi sperimentali che uniscono misure classiche di tempi di reazione e di accuratezza con una tecnica originale in grado di misurare con molta affidabilità le distribuzioni di risposta alla base delle decisioni percettive dei soggetti (Baldassi et al., 2004a, Baldassi et al., 2005). Tale approccio combinato di modelli e tecniche sperimentali ci permetterà di esplorare i vari aspetti del processo di ricerca visiva, dall'input sensoriale all'output decisionale, all'interno di un unica struttura sperimentale. L'informazione discriminante tra i vari modelli sarà fornita dall'analisi degli errori partendo da un approccio di tipo ‘low threshold'. Questo approccio consentirà inoltre di sviluppare il secondo obiettivo, ovvero, la ricerca dei correlati neurali delle decisioni percettive, siano esse corrette o erronee, in scene visive complesse. A tal fine, ci proponiamo di esplorare, con tecniche elettrofisiologiche, le caratteristiche del segnale neurale relativo all'elaborazione di fonti di informazione multiple, che ci aspettiamo rispecchi le stesse caratteristiche non lineari suggerite dai dati comportamentali.

UNITA' III. Usando come stimoli delle tessiture, si vuole indagare il ruolo dell'attenzione nella modulazione dell'integrazione delle informazioni nella percezione delle tessiture (discriminazione di aree diverse di una superficie di tessitura i cui elementi modulari differiscono per una qualche caratteristica). Le tessiture sono stimoli ideali per lo studio di come il sistema visivo integri le caratteristiche elementari di un'immagine, perche' da una parte permettono il controllo e la manipolazione di tali caratteristiche semplici, e dall'altra permettono di studiare come la combinazionee di tali caratteristiche semplici influenzi la salienza di un'immagine. In particolare si vogliono indagare le interazioni tra gli effetti dell'attenzione, dell'eccentricita' e gli aspetti configurazionali della tessitura in un compito di discriminazione di orientamento di una barra tissurale. Intendiamo verificare se l'attenzione possa modulare la risposta di quei canali (selettivi per orientamento e frequenza spaziale) che sono rilevanti per il compito richiesto, e se tale modulazione sia dipendente dall'eccentricita'. Lo studio include sia la registrazione di indici comportamentali (accuratezza) sia la registrazione di indici elettrofisiologici (VEPs: potenziali evocati visivi) in risposta alla presentazione di una barra di tessitura che puo' essere presentata in fovea o in periferia, i cui elementi possono essere collineari o non collineari all'orientamento della barra (configurazione) e con l'attenzione portata sulla barra attraverso un compito di discriminazione di orientamento, oppure distolta dalla barra di tessitura attraverso l'uso di un compito distraente.

UNITA' IV. I dati empirici raccolti dalle altre unità verranno valutati alla luce di modelli diversi di integrazione delle informazioni e di elaborazione cognitiva. Mediante simulazioni di Monte Carlo, verrano valutate sia l'adeguatezza dei modelli, sia l'efficacia dei metodi statistici per la valutazione dei modelli computazionali dei processi cognitivi. In particolare, le procedure disponibili atte alla selezione di modelli verranno confrontate sulla base delle loro proprietà di "robustezza" e consistenza.


Le implicazioni di tale progetto di ricerca sono notevoli. Il problema dell'integrazione di informazioni stà infatti alla base della nostra comprensione della percezione della forma e dello spazio. Inoltre, la comprensione di come il sistema visivo umano integri le informazioni fornite da segnali diversi è certamente importante per lo studio dei deficit visivi e per lo sviluppo di algoritmi robusti di visione artificiale. <<<
Durata
24 mesi
Base di partenza scientifica nazionale o internazionale
UNITA' I


La teoria più recente sull'integrazione delle informazioni visive è chiamata Modified Weak Fusion Model (MWF) (Bruno & Cutting;
Cutting, Bruno, Brady & Moore, 1992). Il modello MWF è stato usato per spiegare una vasta gamma di fenomeni che rigurardano la combinazione delle informazioni di disparità, movimento, tessitura ecc. (Backus, Banks, van Ee & Crowell, 1999; Curran & Johnston, 1994; Jacobs, 1999; Mather & Smith, 2000; Shimozaki, Eckstein, & Abbey, 2003), l'apprendimento percettivo (Jacobs & Fine, 1999; Triesch, Ballard, & Jacobs, 2002) e la percezione cross-modale (Atkins, Fiser, & Jacobs, 2001; Ernst & Banks, 2002; Gepshtein & Banks, 2003).

Il modello MWF ipotizza un processo a 3 stadi per la combinazione delle informazioni (Clark & Yuille, 1990; Kersten & Yuille, 2003; Landy, Maloney, Johnston, & Young, 1995; Young, Landy, & Maloney, 1993).
- 1. Interazione tra moduli diversi allo scopo di rendere commensurabili gli output dei vari moduli ('promotion');
- 2. Una mappa 3D viene derivata da ciascun cue.
- 3. Le stime 3D vengono combinate attraverso una media pesata, dove i pesi sono determinati dall'affidabilità ('reliability') di
ciascun cue (Jacobs, 2002).

In base al modello MWF, ciascun modulo produce una stima di profondità della profondità distale D uguale a . Se il fine è produrre una stima avente varianza minima, e se i cue sono incorrelati, allora la stima ottimale di D è la media ponderata , dove i pesi sono inversamente proporzionali alla varianza dell'errore di misurazione di ciascun cue. Un'importante caratteristica di questa regola di integrazione è che la varianza di è minore della varianza delle stime derivate dai cue isolati:

Limiti del modello MWF.

Anche se varie ricerche empiriche hanno fornito risultati coerenti con la seconda delle due predizioni del modello MWF, il supporto
per la prima predizione è scarso (Alais & Burr, 2004; Ernst & Banks, 2002; Gepshtein & Banks, 2003; Hillis, Watt, Landy, &
Banks, 2004; Knill & Saunders, 2003; Landy & Kojima, 2001). Inoltre, l'ipotesi di modularità proposta dal modello MWF è stata
messa in dubbio da numerose ricerche psicofisiche e neuropsicologiche, che suggeriscono l'esistenza di interazioni tra cue a diversi
livelli dell'elaborazione visiva. L'evidenza più forte contro il modello MWF viene dagli studi sull'adattamento visivo(Poom and Borjesson, 1999; Nawrot & Blake, 1989; Domini, Blaser & Cicerone, 2000; Blaser & Domini, 2002).

I proponenti del modello MWF hanno cercato di spiegare tali risultati in due modi: (1) sostenendo che l'adattamento visivo avviene
al livello dell'elaborazione della forma 3D; (2) invocando i processi di 'cue promotion' e 'cue re-weighting' (Bulthoff & Mallot,
1988; Bulthoff & Mallot, 1990; Johnston, Cumming & Parker, 1993).
Entrambe queste spiegazioni alternative, però, risultano insufficienti dato che, all'interno della teoria, non è mai stato specificao in maniera formale come i processi di 'cue promotion' e 'cue re-weighting' potrebbero avere luogo (Brenner & Landy, 1999).

Il presente progetto di ricerca intende sviluppare un approccio innovativo per rendere conto del recupero percettivo della forma 3D
da cue multipli che sia capace di superare i limiti del modello MWF e di spiegare le interazioni tra cue ai diversi livelli
dell'elaborazione visiva.


UNITA' II


Le decisioni percettive sono raramente effettuate in presenza di stimoli isolati. Nella realtà i bersagli visivi sono confusi con oggetti o caratteristiche che interagiscono a vari livelli. In laboratorio le decisioni percettive in contesti complessi sono tipicamente studiate con il paradigma della Ricerca Visiva (Schall, 2001, Wolfe, 1996), dove la prestazione percettiva è misurata in presenza di distrattori. E' noto che i distrattori danneggino spesso la prestazione, ma si è ancora ben lontani dal capire quali sono i processi sottostanti.
La classica Teoria dell'Integrazione dell'Informazione (Treisman & Gelade, 1980) assume che la ricerca visiva avvenga in due stadi sequenziali, il primo parallelo e pre-attentivo adatto alla ricerca di caratteristiche, e il secondo seriale e attentivo, che compie la ricerca di bersagli definiti da congiunzioni di caratteristiche. La Teoria di Detezione del Segnale (Green & Swets, 1966) fornisce una diversa interpretazione assumendo un'elaborazione parallela di elementi indipendenti codificati rumorosamente. In questo caso i limiti della ricerca dipendono dalla discriminabilità del bersaglio. All'interno di quest'ultima classe di modelli, il dibattito si concentra sulla natura ‘percettiva' o ‘decisionale' della regola di integrazione (Shaw, 1982). Il modello ‘percettivo' (Baldassi & Burr, 2000, Morgan, 1998, Parkes et al., 2001) postula che il segnale ed il rumore di ogni elemento vengano messi insieme in un unico canale in cui il segnale disponibile per la decisione viene diluito dalla presenza dei distrattori. Questo modello predice che l'effetto del set size sarebbe dovuto all'aumento della deviazione standard della distribuzione di risposta alla base delle funzioni psicometriche. Secondo il modello ‘decisionale' (Palmer, 1995) l'effetto del set size dipenderebbe dall'incertezza introdotta allo stadio decisionale dai distrattori addizionali. All'aumentare del set size aumenta la probabilità che l'output più alto provenga dalla risposta rumorosa di uno dei distrattori. In una serie di studi recenti (Baldassi & Burr, 2004, Baldassi et al., 2004a, Baldassi, 2005) abbiamo misurato direttamente le distribuzioni di risposta interna che sottostanno alle funzioni psicometriche e alle soglie in un compito psicofisico che richiedeva di discriminare la direzione di inclinazione del bersaglio rispetto al verticale usando una nuova tecnica. Abbiamo utilizzato per la risposta stimoli-campione (probes) a vari angoli e i soggetti dovevano classificare l'angolo percepito del bersaglio selezionando il probe più simile ad esso. Il modello percettivo predice che un'unica distribuzione di risposta di forma Gaussiana si allarghi al crescere del set size, mentre il modello decisionale predice che con l'aumentare del set size la distribuzione di risposta divenga asimmetrica e bimodale, con due picchi distinti per risposte corrette ed errori. I risultati mostrano distribuzioni chiaramente bimodali a set size alti con due lobi che rappresentano rispettivamente risposte corrette ed errori. Questi risultati implicano anche una paradossale illusione ‘decisionale' per cui i soggetti sono più fiduciosi della propria risposta a set size alti, ovvero commettono più ‘errori ad alta confidenza' quando sono presenti più elementi, fornendo così nuove indicazioni sulla natura dei meccanismi che guidano le decisioni percettive in scene complesse. Partendo da queste basi, il primo obiettivo è di studiare a fondo le predizioni dei principali modelli alternativi che possono spiegare questi effetti e di effettuare gli esperimenti appropriati per testare empiricamente ogni predizione. In più, sulla base del fatto che le decisioni percettive per stimoli singoli sono in relazione all'attività delle aree visive primarie responsabili della codifica di tali stimoli, e che i ‘false alarm' nel rilevare stimoli appena visibili sono legati a un aumento dell'attivazione delle stesse aree corticali elicitate dagli stimoli fisicamente presenti (Ress & Heeger, 2003), vogliamo estendere simili risultati al caso di elementi multipli, quando le decisioni percettive dipendono dall'integrazione di molti elementi in display visivi complessi.


UNITA' III


La segmentazione figura-sfondo e' alla base della percezione cosciente del mondo che ci circonda e stimoli costituiti da tessiture sono ideali per lo studio di come le caratteristiche semplici (degli elementi costituenti la tessitura) vengano integrati e diano origine al percetto di una figura che si segmenta dallo sfondo.
Si ritiene che la segmentazione tissurale avvenga attraverso due meccanismi, uno di segregazione ed uno piu' tardivo di aggregazione. Alcuni autori ritengono che questi due meccanismi siano strettamente interconnessi e indipendenti dall'attenzione (Beck, 1972; Nothdurft, 1991), mentre altri autori (Braun and Sagi, 1991) pensano che questi due processi siano indipendenti e che il secondo, quello di aggregazione, richieda l'attivazione di stadi piu' avanzati di elaborazione dello stimolo e l'intervento dell'attenzione. In quest'ultimo caso il raggruppamento puo' essere considerato come una proprieta' che facilita la segmentazione tissurale basata sul contrasto di orientamento (segregazione) aumentandone la salienza (Field et al., 1993; Nothdurft, 1992). Qual'e' il ruolo della collinearita' nella segmentazione tissurale? La collinearita' degli elementi locali aumenta la salienza di regioni di tessitura che si segmentano da altre sulla base del contrasto di orientamento in quanto facilita il raggruppamento (Field, Hayes & Hess, 1993; Kapadia, Ito, Gilbert & Westeimer, 1995; Nothdurft, 1992; Olson & Attneave, 1970). Oltre a facilitare il raggruppamento, la collinearita' sembra pure facilitare la detezione di singoli elementi (Polat & Sagi, 1993), diminuendone la soglia espressa come il valore di contrasto necessario per rilevare un target, anche in questo caso attraverso la mediazione di connessioni orizzontali a breve o a lungo-raggio tra detettori (Ito & Gilbert, 1999). L'effetto della collinearita' sembra dunque essere duplice, influenzando sia l'informazione globale che quella locale dei singoli elementi di tessitura. Come interviene l'attenzione nel processo di segmentazione? Se l'attenzione dunque influenza l'integrazione delle informazioni percettive, questo puo' avvenire a diversi livelli. Ci focalizzeremo su quegli studi che hanno dimostrato un coinvolgimento dell'attenzione a livello del raggruppamento attraverso la modulazione delle interazioni laterali. Alcuni di questi studi (Ito & Gilbert, 1999; Gilbert et al., 2000; Freeman et al., 2001) si sono concentrati sulla discriminabilita' di un singolo elemento e su come tale discriminabilita' potesse essere influenzata dalla collinearita' di flankers che potevano essere attesi o meno, ed hanno dimostrato che l'attenzione sembra essere un elemento indispensabile per l'integrazione attraverso le interazioni laterali. Altri studi invece hanno preso in considerazione l'integrazione nella discriminazione tissurale trovando tuttavia risultati controversi: se da un lato Carrasco e collaboratori (Yeshurun & Carrasco, 1998, 2000) trovano che, in un compito di detezione di tessiture basato sul contrasto di orientamento, l'attenzione ha un effetto inibitorio in fovea (e facilitatorio in periferia), altri autori (Casco et al., in press) trovano che l'attenzione sembra facilitare la discriminazione di orientamento globale di tessiture presentate in visione centrale, in cui l'orientamento dei singoli elementi e' parallelo all'orientamento globale.


UNITA' IV


Le procedure di analisi dei dati in psicologia sperimentale ha subito dei profondi cambiamenti in questi ultimi anni. Se il paradigma prevalente è stato finora quello della verifica dell'ipotesi nulla, negli ultimi decenni ha acquistato un peso preponderante la costruzione dei modelli e la loro verifica. E' chiaro che ogni modello che si può formulare è comunque sottodeterminato rispetto alle prove empiriche che si possono raccogliere. E' allora necessario ricorrere a criteri in certa misura "esterni" rispetto all'ambito specifico delle ricerche che si stanno conducendo. Di questi, il più comune è quello della parsimonia. Un modello è preferibile quanto più è semplice, anche perché un modello semplice è più facilmente generalizzabile a situazioni diverse da quelle in cui sono stati raccolti i dati che hanno0 condotto alla sua formulazione. Il problema della semplicità viene spesso tradotto in termini di parametrizzazione dei modelli: un modello sovraparametrizzato si adatterà con maggiore facilità ai dati raccolti, ma sarà generalizzabile con difficoltà; un modello sottoparametrizzato sarà più facilmente generalizzabile, ma perde in potere esplicativo
Questo modo di vedere le cose, fondato sul senso comune, pur non avendo perso una sua sensatezza è stato integrato da due altri approcci potenza esplicativa superiore. Il primo è quello degli approcci bayesiani alla verifica dei modelli, il secondo è quello dell'approccio basato sulla teoria dell'informazione (nella versione di Kullbak e Leibler, 1959), di cui l'iniziatore è stato Akaike (1973), con il suo "criterio" (AIC). Oggi, di fatto, i criteri della parsimonia, dell'informazione intesa come "distanza" dai modelli e della probabilità a posteriori vengono utilizzati in modo integrato, per giungere a una maggiore "accuratezza predittiva" (cfr Forster e Sober, 1994).
Peraltro, i problemi che si incontrano nell'applicazione pratica di questi principi alla sperimentazione psicologica sono in larga misura anche "tecnici", e si collegano direttamente alla problematica della "robustezza" delle statistiche utlizzate, e della loro "consistenza". L'interesse scientifico internazionale per questa problematica è ad esempio dimostrata dal fatto che nel 1997 l'Indiana University organizzò con J. Shiffrin un Simposio internazionale sulla tematica della selezione dei modelli, e che nel 2000 il Journal of Mathematical Psychology ha dedicato un intero numero al problema.
I modelli di percezione visiva sono stati tra i problemi più dibattuti: è il caso dei modelli di Bruno e Cutting (1988; cfr Cutting, Bruno, Brady e Moore, 1992; Cutting, 2000) sulla percezione del layout, o di Massaro (1988) sulla segregazione e occlusione (cfr Forster, 2000). Le due linee che oggi appaiono prevalenti per affrontare questi problemi son quindi quelle informazionale di Akaike e quella Bayesiana. In realtà, questi nuovi approcci aprono anche nuovi problemi. Tra questi vi è la possibilità di assumere la normalità nella distribuzione sottostante ai dati osservati; di utilizzare modelli lineari generali; il problema dell'utilizzo di apriori non informativi impropri. Un ruolo importante può averlo la simulazione Montecarlo, ampiamente usata nello studio degli stimatori, meno nel settore dei modelli di percezione visiva.
In particolare vanno esaminati tre tipi di modelli: (1) il punto di partenza sarà il Modified Weak Fusion Model (MWFM), derivato dal modello di Bruno e Cutting succitato, che rende ragione dell'integrazione di diversi indici di profondità (stereoptici, di movimento, gradiente, texture, etc). (2) Verrà analizzato il modello fuzzy-logic di Massaro (1988). (3) A questi modelli si è affiancato di recenti il modello di Intrinsic Constraint (IC), che vede il sistema visivo come una sorta di estrattore di componenti principali, e che può ridurre aspetti complessi dell'analisi visiva in termini unidimesionali (cfr Domini e Caudek, 2003). <<<