Vai al contenuto| Home page|

   Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricerca
INIZIO_TESTO_DA_INDICIZZARE

PROGRAMMA DI RICERCA 2006

italiano - english
Programmi di ricerca simili:
Classificazione scientifico-disciplinare
Classificazione geografica
Bibliografia
[Aa] Aalen, O.O. (1989). A linear regression model for the analysis of lifetimes. Statistics in Medicine 9, 907-925.
[ABGK] Andersen, P.K., Borgan, Ø., Gill, R.D. and Keiding, N. (1993). Statistical Models Based on Counting Processes. Springer, New York.
[AK] Andersen, P.K. and Keiding, N. (2002). Multi-state models for event history analysis. Statistical Methods in Medical Research 11, 91-115.
[BH] Barry, D. and Hartigan, J. A. (1993). A Bayesian analysis for change point problems. J. Amer. Statist. Assoc. 88, 309-319.
[BBC] Boneh, S., Boneh, A. and Caron, R.J. (1998). Estimating the prediction function of the number of unseen species in sampling with replacement. J. Amer. Stat. Assoc. 93, 372-379.
[Br] Brix, A. (1999). Generalized gamma measures and shot-noise Cox processes. Adv. in Appl. Probab. 31, 929-953.
[CS] Chao, A. and Shen, T.-J. (2004). Nonparametric prediction in species sampling. Journal of Agricultural, Biological, and Environmental Statistics 9, 253-269.
[Cl] Clayton, D.G. (1991). A Monte Carlo method for Bayesian inference in frailty models. Biometrics 47, 467-485.
[CF] Clayton, M.K. and Frees, E.W. (1987). Nonparametric estimation of the probability of discovering a new species. J. Amer. Stat. Assoc. 82, 305-311.
[Co] Cox, D.R. (1972). Regression models with life tables (with discussion). J. Roy. Statist. Soc., Series B 34, 187-220.
[DS] Demiris, N. and Sharples, L.D. (2006). Bayesian evidence synthesis to extrapolate survival estimates in cost-effectiveness studies. Statistics in Medicine, to appear.
[Do] Doksum, K. (1974). Tailfree and neutral random probabilities and their posterior distributions. Ann. Probab. 2, 183-201.
[DL] Dykstra, R.L. and Laud, P.W. (1981). A Bayesian nonparametric approach to reliability. Ann. Statist. 9, 356-367.
[ELP] Epifani, I., Lijoi, A. and Pruenster, I. (2003). Exponential functionals and means of neutral-to-the-right priors. Biometrika 90, 791-808.
[EW] Escobar, M.D. and West, M. (1995). Bayesian density estimation and inference using mixtures. J. Amer. Statist. Assoc. 90, 577-588.
[Fe] Ferguson, T.S. (1973). A Bayesian analysis of some nonparametric problems. Ann. Statist. 2, 615-629.
[GT] Good I. J. and Toulmin G.H. (1956). The number of new species, and the increase in population coverage, when a sample is increased. Biometrika 43, 45-63.
[Ha] Hartigan, J. A. (1990). Partition models. Comm. Statist. Theory Methods 19, 2745-2756.
[Hj1] Hjort, N. L. (1990). Nonparametric Bayes estimators based on beta processes in models for life history data. Ann. Statist. 18, 1259-1294.
[Hj2] Hjort, N.L. (2000). Bayesian analysis for a generalized Dirichlet process prior. Statist. Research Report N.7, University of Oslo.
[IJ] Ishwaran, H. and James, L. F. (2001). Gibbs sampling methods for stick-breaking priors. J. Amer. Stat. Assoc.,96, 161--173.
[Ja1] James, L.F. (2002). Poisson Process Partition Calculus with applications to Exchangeable models and Bayesian Nonparametrics. Mathematics ArXiv math.PR/0205093.
[Ja2] James, L.F. (2005). Poisson process partition calculus with applications to Bayesian Lévy moving averages and shot-noise processes. Ann. Statist. 33, 1771-1799.
[Ja3] James, L.F. (2006). Poisson calculus for spatial neutral to the right processes. Ann. Statist., to appear.
[Ka] Kalbfleisch, J.D. (1978). Non-parametric analysis of survival time data. J. Roy. Statist. Soc., Series B 40, 214-221.
[KL1] Kim, Y. and Lee, J. (2003). Bayesian analysis of proportional hazard models. Ann. Statist. 31, 493-511.
[KL2] Kim, Y. and Lee, J. (2004). A Berstein-von Mises theorem in the nonparametric right-censoring model. Ann. Statist. 32, 1492-1512.
[Ki] Kingman, J.F.C. (1975). Random discrete distributions. J. Roy. Statist. Soc., Series B 37, 1--22.
[La] Lavine, M. (1992). Some aspects of Polya tree distributions for statistical modelling. Ann. Statist. 20, 1222-1235.
[LMP1] Lijoi, A., Mena, R.H. and Pruenster, I. (2005). Hierarchical mixture modelling with normalized inverse Gaussian priors. J. Amer. Stat. Assoc. 100, 1278-1291.
[LMP2] Lijoi, A., Mena, R., Pruenster, I. (2005b). Bayesian nonparametric analysis for a generalized Dirichlet process prior. Statistical Inference for Stochastic Processes, 8, 283-309.
[LPW] Lijoi, A., Pruenster, I, and Walker, S.G. (2005). On consistency of nonparametric normal mixtures for Bayesian density estimation. J. Amer. Stat. Assoc, 100, 1292-1296.
[LY] Lin, D.Y. and Ying, Z. (1994). Semiparametric analysis of the additive risk model. Biometrika 81, 61-71.
[Li] Liu, J.S. (1996). Nonparametric hierarchical Bayes via sequential imputations. Ann. Statist. 24, 911-930.
[Lo] Lo, A.Y. (1984). On a class of Bayesian nonparametric estimates: I. Density estimates. Ann. Statist. 12, 351-357.
[MM] MacEachern, S.N. and Mueller, P. (1998). Estimating Mixture of Dirichlet Process Models. J. Comput. Graph. Statist., 7, 223-239.
[Ma] Mao, C. X. (2004). Prediction the conditional probability of discovering a new class. J. Amer. Stat. Assoc. 99, 1108--1118.
[ML] Mao, C. X. and Lindsay, B. G. (2002). A Poisson model for the coverage problem with a genomic application. Biometrika 89, 669--682.
[MQ] Mueller, P., and Quintana, F. (2004). Nonparametric Bayesian Data Analysis. Statist. Science 19, 95-110.
[MSW] Mauldin, R.D., Sudderth, W.D. and Williams, S.C. (1992). Polya trees and random distributions. Ann. Statist. 20, 1203-1221.
[NPW] Nieto-Barajas, L., Pruenster, I. and Walker, S. (2004). Normalized random measures driven by increasing additive processes. Ann. Statist., 32, 2343-2360.
[PR] Papaspiliopoulos, O. and Roberts, G.O. (2005) Retrospective MCMC for Dirichlet process hierarchical models. Tech. Report, University of Lancsater.
[Pe] Petrone, S. (1999). Random Bernstein polynomials. Scand. J. Statist. 26, 373-393.
[Pi1] Pitman, J. (1996). Some developments of the Blackwell-MacQueen urn scheme. In Statistics, Probability and Game Theory, Lecture Notes, Monograph Series, vol. 30, 245-267, IMS, Hayward.
[Pi2] Pitman, J. (2003). Poisson-Kingman partitions. In Goldstein, D.R., ed., Science and Statistics: A Festschrift for Terry Speed. Lecture Notes, Monograph Series, vol. 40, 1-35. IMS, Hayward.
[Pi3] Pitman, J. (2005). Combinatorial stochastic processes. Lecture notes for St. Flour Summer School.
[Pr] Pruenster, I. (2002). Random probability measures derived from increasing additive processes and their application to Bayesian statistics. Ph.D. dissertation, University of Pavia.
[QI] Quintana, F.A., Iglesias, P.L. (2003). Bayesian clustering and product partition models. J. R. Stat. Soc. Ser. B Stat. Methodol. 65, 557-574.
[RLP] Regazzini, E., Lijoi, A. and Pruenster, I. (2003). Distributional results for means of random measures with independent increments. Ann. Statist. 31, 560--585.
[Ro] Robbins H.E. (1968). Estimating the total probability of the unobserved outcomes of an experiment. Ann. Math. Statist. 39, 256-257.
[TT] Tiwari, R.C. and Tripathi, R.C. (1989). Nonparametric Bayes estimation of the probability of discovering a new species. Comm. Statist. Theory Methods 18, 877-895.
[W1] Walker, A.M. (1969). On the asymptotic behaviour of posterior distributions. JRSS B 31, 80-88.
[WD] Walker, S. and Damien, P. (1998). A full Bayesian non-parametric analysis involving a neutral to the right process. Scand. J. Statist., 25, 669-680.
[WDLS] Walker, S., Damien, P., Laud, P.W. and Smith, A.F.M. (1999).Bayesian nonparametric inference for random distributions and related functions (with discussion). J. R. Stat. Soc. Ser. B 61, 485-527.
[WM] Walker, S. and Muliere, P. (1997). Beta-Stacy processes and a generalization of the Polya-urn scheme. Ann. Statist., 25, 1762-1780.
Parole Chiave
STATISTICA BAYESIANA NON PARAMETRICA, STATISTICA BAYESIANA, DISTRIBUZIONI INIZIALI, PROCESSO DI DIRICHLET, MODELLI MISTURA, MODELLI GERARCHICI, CLUSTERING BAYESIANO, DISTRIBUZIONI FINALI

Metodi bayesiani non parametrici per il clustering, l'analisi della sopravvivenza e la previsione del numero di specie

Università degli Studi di Torino
Abstract
Questo progetto di ricerca tratta differenti aspetti della statistica bayesiana non parametrica. Si propone di sviluppare nuove metodologie e la loro applicazione in vari campi: in particolare, l'attenzione verrà focalizzata sul clustering, sull'analisi della sopravvivenza e sulla previsione nell'ambito di problemi di campionamento di specie.
La parte metodologica concerne l'analisi di distribuzioni iniziali discrete che differiscono sostanzialmente dal celebre processo di Dirichlet: ci si propone di studiarne le proprietà a posteriori e di individuare casi specifici che godono di sufficiente trattabilità ai fini di un loro in contesto reale. La parte applicativa riguarda innanzitutto modelli semiparametrici: nell'ambito di tali modelli, si intendono sfruttare varie distribuzioni iniziali non parametriche e confrontarne le capacità inferenziali su problemi reali sviluppando appropriati algoritmi di simulazione. Le linee di ricerca perseguite riguardano il clustering bayesiano mediante modelli mistura e l'analisi della sopravvivenza o, più in generale, l’event history analysis. Un' altra importante area di interesse riguarda la previsione del numero di specie in una data popolazione ai fini dell'analisi di dati genetici quali sequenze di frammenti di cDNA. L'approccio bayesiano non parametrico si adatta in maniera naturale a queste problematiche e ci si propone di derivare una serie di strumenti da testare su dati genetici.

Coordinatore Scientifico del Programma di Ricerca
Igor Pruenster Università degli Studi di TORINO
Obiettivo del Programma di Ricerca
Questo progetto di ricerca tratta differenti aspetti metodologici e applicativi della statistica bayesiana non parametrica. La statistica bayesiana non parametrica sta vivendo un periodo di vigoroso sviluppo: metodologie innovative, nuovi algoritmi di simulazione e applicazioni originali sono apparse nella letteratura recente. Questo progetto ha le sue radici in questi recenti contributi e si propone di sviluppare ulteriormente questa disciplina lungo le linee qui riassunte (maggiori dettagli sono forniti nella Sezione 2.3).
Gli argomenti oggetto di studio possono essere riassunti in tre punti:
(I) Analisi di distribuzioni iniziali nonparametriche discrete
(II) Modelli semiparametrici per clustering bayesiano e per l’analisi della sopravvivenza
(III) Previsione del numero di specie per l'analisi di dati genetici

(I) Recentemente numerose nuove classi di distribuzioni iniziali non parametriche discrete sono state proposte nella letteratura. Menzioniamo, tra le altre, i modelli species sampling (e l’interessante sottoclasse costituita dalle prior di tipo Gibbs) ([Pi1], [Pi3]), le misure normalizzate ad incrementi indipendenti [RLP], le distribuzioni iniziali stick breaking [IJ]. Tutte queste classi di prior contengono il processo di Dirichlet come caso particolare; tuttavia, includono anche altre distribuzioni iniziali che si caratterizzano per un comportamento molto diverso dal processo di Dirichlet (si veda, e.g., [LMP1]) >>>

Durata
24 mesi
Base di partenza scientifica nazionale o internazionale
La statistica bayesiana nonparametrica è un'area di ricerca relativamente giovane protagonista recentemente di un forte sviluppo. Le fondamenta del paradigma bayesiano non parametrico sono già state poste negli anni ’30 con il concetto di scambiabilità e il celebre teorema di rappresentazione di de Finetti. Tuttavia, le difficoltà di natura tecnica nel fornire esempi concreti di distribuzioni iniziali ne hanno a lungo impedito lo sviluppo. La scoperta cruciale è dovuta a Ferguson [Fe] con l’introduzione della misura di probabilità aleatoria (m.p.a.) di Dirichlet. Nei due decenni successivi particolare attenzione è stata riservata ai problemi posti da questa nuova disciplina. Varie generalizzazioni del processo di Dirichlet sono state proposte in letteratura, tra cui le prior neutrali a destra [Do], il processo extended gamma [DL], il processo mistura di Dirichlet [Lo], il processo beta [Hj], le distribuzioni inziali Polya-tree [La], [MSW], i polinomi di Bernstein aleatori [Pe]. In questa prima fase i risultati sono stati principalmente di natura teorica, in quanto la complessità matematica delle espressioni coinvolte ha impedito una concreta applicazione dei risultati. Tuttavia, con l’introduzione nei primi anni '90 di nuove tecniche computazionali, quali il Markov Chain Monte Carlo, i metodi bayesiani non parametrici hanno suscitato un vasto interesse nella comunità scientifica grazie alla possibilità di essere applicati a problemi reali di grande complessità. Ci >>>