Vai al contenuto| Home page|

   Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricerca»Unità di ricerca
INIZIO_TESTO_DA_INDICIZZARE

UNITA' DI RICERCA

italiano - english
Bibliografia
1.Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle. B. N. Petrov and F. Csaki (eds.), 2nd International Symposium on Information Theory: 267-81. Budapest: Akademiai Kiado.
2.Bachmann, Ch., Luccio, R: e Salvadori, E. (2005). La verifica della significatività dell’ipotesi nulla in psicologia. Firenze: Firenze University Press.
3.Bansal, Na. K. E Miescke, K. J (2005). Simultaneous selection and estimation of the best treatment with respect to a control in a general linear model. Journal of Statistical Planning and Inference, 129, 387 – 404
4.Bozdogan, H. (1987). Model selection and akaikeís information criterion (AIC): The general theory and its analytical extensions. Psychometrika, 52, 345-370.
5.Bozdogan, H. (2000). Akaikeís information criterion and recent developments in informational complexity. Journal of Mathematical Psychology, 44, 345-370.
6.Busemeyer, J. R. e Wang, Y.-M. (2000). Model comparisons and model selections based on generalization test methodology, Journal of Mathematical Psychology, 44: 171-189. 7.Bruno, N., & Cutting, J.E. (1988). Minimodularity and the perception of layout. Journal of Experimental Psychology: General, 117, 161-170.
8.Cutting, J. E. (2000). Accuracy, scope, and flexibility of models, Journal of Mathematical Psychology, 44, 3-19.
9.Cutting, J.E., Bruno, N., Brady, N.P., & Moore, C. (1992). Selectivity, scope, and simplicity of models: a lesson from fitting judgments of perceived depth. Journal of Experimental Psychology: General, 121, 364-381.
10.Domini, F., & Caudek, C. (2003). 3-D structure perceived from dynamic information: a new theory. Trends in Cognitive Sciences, 7, 444-449.
11.Forster, M. R. (2000). Key concepts in model selection: performance and generalizability. Journal of Mathematical Psychology, 44, 205-231
12.Forster, M. R. and E. Sober (1994). How to tell when simpler, more unified, or less ad hoc theories will provide more accurate predictions. The British Journal for the Philosophy of Science, 45, 1 - 35.
13.Grünwald, P. (2000). Model selection based on minimum description length. Journal of Mathematical Psychology, 44, 133-152.
14.Kullback, S. and R. A. Leibler (1951). On information and sufficiency. Annals of Mathematical Statistics 22, 79-86.
15.Linhart, H. e Zucchini, W. (1986). Model selection. New York: Wiley.
16.Massaro, D. W. (1988). Ambiguity and perception in experimentation, Journal of Experimental Psychology: General, 117, 417-421.
17.Mosier, C. I. (1951). Problems and designs of cross-validation. Educational and Psychological Measurement, 11, 5-11.
18.Myung, I. J., e Pitt, M. A. (1997). Applying Occam's razor in modeling cognition: A Bayesian approach. Psychonomic Bulletin and Review, 4, 79-95.
19.Schwarz, G. (1978). Estimating the dimension of a model. Annals of Statistics 6, 461-465.
20.Wasserman, L. (2000). Bayesian model selection and model averaging. Journal of Mathematical Psychology, 44, 92-107.

Programma di ricerca

Integrazione delle informazioni nel sistema visivo: modelli computazionali dei processi sensoriali e decisionali
Università di riferimento
Università degli Studi di FIRENZE - PSICOLOGIA - FIRENZE(FI)
Responsabile dell'Unità di ricerca
Riccardo LUCCIO
Descrizione
Introduzione
Da quanto abbiamo detto, lo scopo fondamentale del lavoro di questa unità consisterà nel determinare su base statistico matematica dei criteri di scelta tra i possibili modelli che sono stati sinora proposti per spiegare come mai il sistema visivo umano è capace di ricostruire la struttura tridimensionale degli oggetti che stimolano la sua retina a partire dai segnali bidimensionali di cui dispone sull'immagine retinica. Abbiamo visto sopra che sostanzialmente i modelli che si contendono il campo possono essere ricondotti a modelli di fusione debole (MWF) o a modelli di vincoli intrinseci (IC). Siamo ora più specifici.
Una forte linea di pensiero tende a ricondurre tutti i modelli di integrazione a un meccanismo che si comporta come uno stimatore di parametri su base probabilistica (in questi ultimi anni, si ipotizza uno stimatore bayesiano, ma il punto non è qui rilevante). Peraltro, è stato fatto notare che vi sono dei vincoli intrinseci che fanno sì che vi siano relazioni stabili (anche lineari) tra caratteristiche proprie degli indici di profondità diversi che devono essere integrati tra loro. E' possibile che entrambi questi approcci siano parziali; che cioè i vincoli intrinseci spieghino una parte sola della storia, anche preliminare, e che forniscano degli ancoraggi per stabilire dei valori di probabilità su cui il sistema procede a stime parametriche probabilistiche.
Un aspetto di straordinario rilievo dei modelli IC sarebbe rappresentato dal fatto che la stabilità di relazioni, specie se lineari, consentirebbe un'enorme economia di calcolo al sistema, attraverso una riduzione di dimensioni. Di fatto, le relazioni lineari stabili non sono altro che strutture di covarianza. Se (come lo studio delle reti neurali ha in più contesti dimostrato, e come in questa situazione è stato specificamente ipotizzato) il sistema fosse in grado di comportarsi come un estrattore di componenti principali, questo meccanismo sarebbe in gradi di compiere la riduzione di dimensioni voluta. Secondo Domini e Caudek, tale riduzione potrebbe portare a ipotizzare tre livelli: i) profondità (ordine 0); ii) inclinazione (ordine 1) e iii) curvatura (ordine 2).
I diversi modelli
I modelli di fusione, nelle diverse versioni proposte, propongono un processo per fasi operate da diversi moduli. Per esempio, in una prima fase dei moduli danno come output delle singole rappresentazioni di profondità, che in una seconda fase portano alla creazione di una mappa di profondità per ogni indice. Su questa base, nella terza fase queste stime di profondità sono trasformate in una media ponderata, che conduce alla stima, dove i pesi sono inversamente proporzionali alla varianza di errore (e quindi la varianza della stima complessiva è inferiore alla varianza dei singoli indici). Questa condizione è detta statisticamente ottimale. I pesi, si badi, non sono dati una volta per tutte, ma vengono riaggiustati ad ogni prova (riponderazione dinamica).
Un altro modello (o famiglia di modelli) è quello detto di fuzzy-logic (FLM), il primo dei quali è stato proposto in questo ambito da Massaro (1988), modello moltiplicativo dove i modelli di fusione sono addittivi. Anche qui peraltro i dati non consentono al momento di preferirlo agli altri.
Il modello IC segue una via con un diverso punto di partenza. Si ritiene infatti che, seppur anche in questo caso in tre fasi, queste non partano da un processo modulare che inizia separatamente per i diversi indici, ma piuttosto affronti direttamente l'elevata multidimensionalità della situazione di stimolazione i) riducendola innanzitutto a una struttura unidimensionale; ii) mappando questa sulla struttura affine dell'oggetto distale; e iii) operando una stima di massima verosimiglianza che consente di trovare una soluzione euclidea nello spazio affine.
Queste tre fasi si svolgerebbero nel seguente modo. La riduzione di dimensionalità si opererebbe a partire dalla struttura di covarianza determinata dal fatto che, per ogni oggetto distale che stimola la retina, per ogni punto di tale oggetto, e per ogni proprietà distale, vi sarà una serie di segnali (correlati tra loro) che saranno una funzione della proprietà distale controllata da parametri non noti, e affetta da errore. Evidentemente ci troviamo qui in uno spazio che ha tante dimensioni quanti sono i segnali provenienti da ogni punto dall'oggetto. Ma ogni punto dell'oggetto corrisponderà allora a un punto in questo spazio multidimensionale. Per ogni proprietà distale questi punti si disporranno lungo una linea (linea IC) Se il sistema può funzionarie come estrattore di componenti principali, il primo autovettore estratto indicherà sostanzialmente la direzione di questa struttura lineare unidimensionale, e le proiezioni su questa struttura (scalate per la deviazione standard del rumore) costituiranno i valori dei segnali. Su questa base, attraverso una stima di massima verosimiglianza, potranno essere ricostruite le proprietà euclidee dell'oggetto distale. Si osservi che si dimostra che il modello IC è compatibile con entrambe le condizioni di ottimalità statistica e di riponderazione dinamica. In altri termini, ed è questo un aspetto di straordinaria importanza, anche nel modello IC la varianza è minore se vi sono più indici di profondità, rispetto ai casi di un unico indice. Ma soprattutto l'attendibilità di ogni indice è indicata direttamente dall'orientamento della linea IC. Osserviamo che pare opportuno confrontare un modello di questo tipo con altro modello, in cui la matrice di correlazione abbia sulla diagonale principale in luogo di uno il coefficiente di attendibilità (che può essere stimato come quadrato del coefficiente di correlazione multipla), poiché l'estrazione delle componenti principali come tale confonde la varianza d'errore con la varianza comune.
Questi cenni possono essere sufficienti per capire l'ambito in cui ci si muove. Il lavoro fatto, sia nella raccolta di dati sperimentali che nella costruzione dei modelli, non consente a nostro avviso al momento di prendere partito per un modello (o famiglia di modelli) rispetto all'altro. E' certo che i modelli di fusione appaiono sovraparametrizzati, ma questa critica può valere anche per il modello IC. Lo ICM appare probabilmente il più semplice, nel senso che richiede meno assunzioni: peraltro appare il più "esplorativo" di tutti, nel senso che (vuoi per il meccanismo di estrazioni di componenti principali, sia per la stima in termini di massima verosimiglianza), non richiede nessuna ipotesi sulla struttura che verrà trovata.
Linee della nostra ricerca
La nostra ricerca si baserà sostanzialmente su simulazioni Montecarlo. A questo scopo si passerà attraverso le seguenti fasi.
1. In primo luogo, verranno precisate matematicamente le funzioni che rappresentano i tre tipi di modelli individuati (con le loro possibili varianti): i) modelli di fusione (S/WFM); ii) modelli fuzzy-logic (FLM); iii) modelli di vincoli intrinseci (ICM).
2. Verranno quindi simulati i risultati sperimentali, sulla base da un lato dei modelli, dall'altro delle diverse assunzioni sulle possibili distribuzioni sottostanti. Si verificherà l'influenza di campioni rispettivamente molto grandi e molto piccoli, con diverse funzioni di densità di probabilità.
3. Si passerà quindi alla verifica dei modelli, ponendo a confronto le sei modalità che vengono sotto esposte. In particolare, verrà studiata l'adeguatezza dei modelli in funzione della parametrizzazione, della grandezza dei campioni, e delle assunzioni sulle distribuzioni.
La verifica dei modelli
La scelta tra diversi modelli passa necessariamente attraverso la verifica dei modelli. Noi abbiamo accennato al fatto che tale verifica segue oggi soprattutto attraverso le vie maestre dei modelli bayesiani e dei modelli informazionali. In realtà la situazione è più complessa, e sono almeno sei le strade che vanno prese in considerazione. Vediamole rapidamente (cfr Forster, 2000; Forster e Sober, 1994; Bozdogan, 2000; Bachmann, Luccio e Salvadori, 2005; Linhart e Zucchini, 1986), tutte con i loro pregi e difetti:
1. Verifica della significatività dell'ipotesi nulla (NHST). E' il classico metodo, tradizionalmente utilizzato nella ricerca psicologica. Contrappone un'ipotesi nulla H0, secondo cui il/i parametro/i ? stimato/i non differisce da quello della funzione di densità di probabilità che regola l'universo della variabile casuale ? considerata, a un'ipotesi sostantiva H1, secondo cui vi è differenza. Questo approccio viene usualmente letto (in modo anche fuorviante) nella versione di Fisher (p-value approach), e non in quella di Neyman e Pearson (fixed alpha approach). Il primo approccio, peraltro, se dimostra una sua efficacia quando lo scopo è falsificare l'ipotesi nulla, si dimostra poverissimo quando al contrario si tratta di verificarla. Il secondo, fondato sul rapporto tra i coefficienti di massima verosimiglianza per il parametro stimato a condizione che sia vera l'ipotesi nulla risp. sostantiva (lemma di Neyman-Pearson) rischia di far scambiare la semplicità del modello con la bontà dell'adattamento (Forster, 2000, p. 211).
2. Metodo della massima verosimiglianza (ML). La scelta è quella del modello per cui è massima la verosimiglianza della stima dei parametri, e successivamente la verosimiglianza del modello complessivo. Da questo punto di vista può quindi essere considerato di fatto poco "economico", non tanto nella stima dei parametri, quanto nella verifica del modello complessivo. Può soffrire dell'eccessiva grandezza del campione utilizzato.
3. Resampling. Con i metodi di resampling (test di randomizzazione, cross-validation, bootstrapping) dal campione originale si creano nuovi campioni simulati, e si vede come si distribuiscono le statistiche, che diventano a questo punto le nuove variabili casuali. Si tratta di metodi potenti, che hanno però indicazioni diverse a seconda della situazione studiata. Il metodo della generalizzazione (GTM - Busemeyer e Wang, 2000) può essere considerato un miglioramento delle tecniche di cross-validation, come originariamente proposte da Mosier (1951).
4. Metodi bayesiani. I metodi bayesiani possono essere sintetizzati in questi termini: posti dei possibili modelli in alternativa M1, M2, …, Mn, la soluzione bayesiana consiste nel calcolare la probabilità a posteriori Pr(Mj|Dati) for ogni modello. Per la selezione tra modelli, si sceglie quello per cui Pr(Mj| Dati), che costituisce quello che si può definire un "sommario numerico" (Wasserman, 2000) della forza dei dati a favore di Mj, è massima. Molto interessante appare la proposta di Myung e Pitt (1997), che si configura come un metodo di resampling bayesiano.
5. AIC e metodi derivati. Hanno costituito un vero e proprio punto di svolta nella tematica della selezione tra modelli. Con l'AIC Akaike (1973) ha proposto un'efficiente misura della distanza tra la densità di probabilità del modello e densità di probabilità "vere", distanza definita in termini di informazione secondo Kullback e Leibler (1952). E' inoltre uno straordinario indice incrementale, per cui è particolarmente efficace nella scelta tra modelli "nested". L'AIC soffre per l'eccessiva grandezza dei campioni, problema solo parzialmente risolto dal CAIC (Consistent AIC; Bozdogan, 1987).
6. Minima lunghezza descrittiva (MDL) o minima lunghezza del messaggio (MML). Questo metodo si basa sul principio della complessità stocastica, a sua volta fondato sul principio dell'informazione come definita da Fisher nel 1925. Il modello scelto è quello che consente la minima complessità di codificazione. Da questo punto di vista, lo MDL sembra essere un anello di congiunzione tra metodi bayesiani (come il BIC di Schwarz, 1978) e metodi derivati dall'AIC (CAIC e ICOMP di Bozdogan, rispettivamente 1987 e 2000). Degli ultimi metodi sviluppati, lo MDL si è dimostrato uno dei più interessanti sia per la semplicità concettuale che per la potenza esplicativa.
Conclusioni
In conclusione, il compito che si assume questa unità di ricerca è duplice. Da un lato, verranno confrontati i modelli proposti per la ricostituzione dell'immagine tridimensionale degli oggetti dall'immagine retinica (modelli di fusione, modelli fuzzy-logic, modelli di vincoli intrinseci). Dall'altro, per la verifica e scelta dei modelli verranno utilizzati sei metodi (NHST, ML, resampling, metodi bayesiani, AIC, MLD), e questo consentirà di confrontarne pregi e limitazioni. Tutto ciò avverrà mediante simulazione Montecarlo.
Si ritiene che nel primo anno di ricerca potranno essere messe a punto in prima approssimazione le metodologie di indagine e si potrà procedere alle prime simulazioni. Il secondo anno verrà impiegato nella definizione delle simulazioni e nella discussione dei risultati definitivi.