Contenuto
Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricercaINIZIO_TESTO_DA_INDICIZZARE
PROGRAMMA DI RICERCA
italiano - english
Unità di Ricerca
- Universita' degli Studi di ROMA
STATISTICA,PROBABILITA' E STATISTICHE APPLICATE
ROMA(RM) - Università della CALABRIA
ECONOMIA E STATISTICA
ARCAVACATA DI RENDE(CS) - Università degli Studi di PARMA
ECONOMIA
PARMA(PR) - Università degli Studi di BOLOGNA
SCIENZE STATISTICHE
BOLOGNA(BO) - Università degli Studi di NAPOLI "Federico II"
MATEMATICO STATISTICO
NAPOLI(NA)
Programmi di ricerca simili:
- 1 - Metodi statistici multivariati per la valutazione integrata della qualità dei servizi di pubblica utilità: efficacia-efficienza, rischio del fornitore, soddisfazione degli utenti
- 2 - Metodologie statistiche per l'analisi di impatto e la valutazione della regolamentazione
- 3 - METODI E MODELLI STATISTICI PER LA VALUTAZIONE DEI PROCESSI FORMATIVI
- 4 - Sintesi automatica di modelli astratti a partire da dati temporali o spaziali
- 5 - Metodologie di data mining per le applicazioni di e-business
- 6 - METODI DI FINANZIAMENTO, VALUTAZIONE E BENCHMARCHING DEI SISTEMI SANITARI
- 7 - Basi di dati crittografate
- 8 - Nuove tecniche e strumenti per l'interrogazione di servizi di ricerca su Web
- 9 - Metodi inferenziali classici e bayesiani in classi di modelli econometrici per la finanza
- 10 - Trattamento statistico della complessità e dell'incertezza negli studi ambientali
Classificazione scientifico-disciplinare
- Area scientifico disciplinare: Scienze economiche e statistiche
Classificazione geografica
- Regione: Lazio
Bibliografia
Ansari, A. et al. (1997). Representing Heterogeneity in Consumer Response Models, in DeSarbo, W.S. (chair) 1996 Choice Conference, Marketing Letters¸ 8, 335-348.Atkinson, A. C., Riani, M. and Cerioli, A. (2004). Exploring Multivariate Data with the Forward Search. New York: Springer-Verlag.
Atkinson A.C.; Cerioli A.; Riani M. (2003). Robust classification through the forward search. In M. SCHADER; W. GAUL; M. VICHI Between Data Science and Applied Data Analysis. pp. 3-12 BERLIN: SPRINGER-VERLAG (GERMANY)
Attias, H. (1999), Independent factor analysis, Neural Computation, 11.
Bartholomew, D. J., Knott, M. (1999), Latent variable models and factor analysis, Kendall’s Library of Statistics 7, London.
Bastien, P., Esposito Vinzi, V. and Tenenhaus, M. (2004): PLS Generalized linear regression, Computational Statistics and Data Analysis, in stampa.
Boari, G. (2001). A dynamic version of structural equation models applied to national customer satisfaction indices, Proceedings of the 6th TQM World Congress, 2001, St. Petersburg, 291-298.
Bollen K.A., (1989). Structural equations with latent variables. Wiley, New York.
Brannas, K., Rosenqvist, G. (1994). Semiparametric estimation of heterogeneous count data models, European journal of Operational Research, 76, 247-258.
Cerioli A. (2002). Testing mutual independence between two discrete-valued spatial processes: a correction to Pearson chi-squared BIOMETRICS. (vol. 58 pp. 888-897) .
Cerioli A., Ingrassia S. & Corbellini A. (2004) Classificazione simbolica di dati funzionali: un'applicazione al monitoraggio ambientale, in: "Lauro C., Davino C. (a cura di), Data Mining e Analisi Simbolica, Franco Angeli Editore, 2004, in corso di stampa.
Cerioli A.; Riani M. (1999). The Ordering of Spatial Data and the Detection of Multiple Outliers JOURNAL OF COMPUTATIONAL AND GRAPHICAL STATISTICS. (vol. 8pp. 239-258)
Cerioli A.; Riani M. (2002). Robust methods for the analysis of spatially autocorrelated data STATISTICAL METHODS & APPLICATIONS – JOURNAL OF THE ITALIAN STATISTICAL SOCIETY. (vol. 11 pp. 335-358)
CNVSU (2004a), Proposte per la costruzione di un nuovo modello per la ripartizione teorica del FFO alle università statali, Documenti del “Comitato nazionale per la valutazione del sistema universitario, gennaio 2004, http://www.cnvsu.it/
CNVSU (2004b), Modello informativo per l’accreditamento dei Corsi di Studio, Documenti del “Comitato nazionale per la valutazione del sistema universitario, febbraio 2004, http://www.cnvsu.it/
De Soete G. e Carroll, J. (1994) D., K-means Clustering in a Low-dimensional Euclidean Space, in: E. Diday et al. (Eds), New Approaches in Classification and Data Analysis. Springer, Heidelberg, 212-219.
Ehrenberg, A.S.C. (1972). Repeat-Buying, heory and Applications, North-Holland, Amsterdam.
Givon, M., Horsky, D. (1985). Homogeneity and heterogeneity in sthocastic models of brand choice, International journal of Research in Marketing, 2, 263-272.
Grigoroudis, E., Siskos, Y., 2002. Preference disaggregation for measuring and analysing customer satisfaction: The MUSA method. European Journal of Operational Research 143 (1), 148–170.
Ingrassia S. (2004), A Likelihood-Based Constrained Algorithm for Multivariate Normal Mixture Models, Statistical Methods & Applications, to appear.
Ingrassia, S., Cerioli, A. & Corbellini, A. (2003), in Some issues on clustering of functional data, in: "Schader M., Gaul W., Vichi M. (Eds.), Between Data Science and Applied Data Analysis", Springer-Verlag, Berlin, 2003, 49-56.
Johnson, M.D. and Fornell, C. (1991), A Framework for Comparing Customer Satisfaction across Individuals and Product Categories, Journal of EconomicPsychology 12, 267-286.
Jöreskog, K.G. (1978), Structure analysis of covariance and correlation matrices, Psychometrika, 43, 443-477.
Jöreskog, K.G. & Wold, H. (Eds) : Systems under indirect observation : Causality – Structure – Prediction. North-Holland, 1982.
Lauro N. C., Balbi, S. e Scepi, G. (1997). L’analisi multidimensionale dei dati per la misurazione della customer statisfaction nei servizi. Atti del convegno intermedio della Società Italiana di Statistica: La Statistica per le Imprese, vol. 1, 567-581.
Lord, F. M., Novick, M. R. (1968), Statistical theories of mental test scores, Addison-Wesley, Reading, Ma.
McLachlan, G.J., Basford, K.E. (1987). Mixture Models: Inference and Applications to Clustering. Marcel Dekker.
Mclachlan G.J., Been R.W., Peel D. (2002). A mixture model-base approach to the clustering of microarray expression data, Bioinformatics, 18, 413-422.
Montanari A., Viroli C., (2004), The independent factor analysis approach to latent variable modeling, submitted.
Muthén B.O. (1978), Contributions to factor analysis of dichotomous variables, Psychometrika, 43.
Muthén B.O. (1989). Latent variable modeling in heterogeneous populations, Psychometrika, 54, 557-585.
Parasuraman A., Berry L.L., Zeithmal V.A. (1988), “SERVQUAL: a Multiple-Item Scale for Measuring Customer Perceptions of Service Quality”, Journal of Retailing, 1, 11-40.
Pillati, M. (2001), Le reti neurali in problemi di classificazione: una soluzione basata sui metodi di segmentazione binaria, STATISTICA, LXI, n. 3, pp. 407-421.
Pillati , M., Calò, D. G. (2002), A Clustering Based Procedure for Learning the Hidden Unit Parameters in Elliptical Basis Function Networks", in "Classification, Clustering and Data Analysis: Recent Advances and Applications" (a cura di: K. Jajuga, A. Sokolowski, H.-H. Bock), pp. 419-426, Springer Verlag Berlin, Heidelberg.
Pillati , M., Calò, D. G. (2004), Robust centre location in Radial Basis Function, in “Studies in Classification, Data Analysis and Knowledge Organization”, SpringerVerlag, Heidelberg
QAA (2003), Benchmarking academic standards: proposed recognition scheme for further subject benchmark statements, Quality Assurance Agency for Higher Education, http://www.qaa.ac.uk/crntwork/benchmark/index.htm
Ramsay, J.O. & Silverman, B.W. (1997), Functional Data Analysis, Springer-Verlag, New York.
Ramsay, J.O. & Silverman, B.W. (2002), Applied Functional Data Analysis: Methods and Case Studies, Springer-Verlag, New York.
Rocci R., Vichi M. (2001b). Mixture models for simultaneous reduction and classification. In Provasi C. (eds.) Modelli complessi e metodi computazionali intensivi per la stima e la previsione. Cleup, Padova, 379-384.
Vavra, T.G., 1997. Improving Your Measurement of Customer Satisfaction. ASQC Quality Press, Milwaukee.
Vedaldi, R. (1997). Modelli interpretativi per la valutazione della customer satisfaction: l’impiego degli strumenti statistici. Atti del convegno intermedio della Società Italiana di Statistica: La Statistica per le Imprese, vol. 1, 583-596.
Vermunt, J. K., Magidson, J. (2003), Latent class models for classification, Computational Statistics and Data Analysis, 41, 531-537.
Vichi, M., & Kiers, H.A.L. (2001). Factorial k-means analysis for two-way data. Computational Statistics and Data Analysis, 37, 49-64.
Wedel M., Kamakura W. (2002). Editorial: Introduction to the Special Issue on Market Segmentation, Intern. J. of Research in Marketing, 19, 181 – 183
Wold, H. (1982): Soft Modelling, The basic designe and some exentions. In J.K. Joreskog and H. Wold (Eds) Systems Under Indirect Observation- Part 1, p 1-53 North Holland, Amsterdam
Wold, H. (1966): Non linear Estimation by Iterative Least Squares procedure. In F. David (Eds). Research paper in Statistics: Festschift for J. Neyman. p. 411-444.
Zanella, A. (2001). Measures and models of customer satisfaction: the underlying conceptual construct and a comparison of different approaches, Proceedings of the 6th TQM World Congress, 2001, St. Petersburg, 291-298.
Zani, S. (1996). Misure della Qualità della Vita. Milano: Franco Angeli.
Parole Chiave
RIDUZIONE DIMENSIONALE; ANALISI DEI GRUPPI; SEGMENTAZIONE; PLS; MIXTURE MODELS; ROBUSTEZZA; MODELLI DI CLASSE LATENTE E MODELLI A VARIABILI LATENTI; CUSTOMER SATISFACTION; VALUTAZIONE DELLA QUALITÀNuovi metodi statistici multivariati di classificazione e riduzione dimensionale per la valutazione e la customer satisfaction nei servizi
Università degli Studi di Roma "La Sapienza"Abstract
Il gruppo di ricerca si propone l'obiettivo di definire ed implementare un insieme di metodologie innovative per l'analisi di dati riguardanti la soddisfazione del cliente (customer satisfaction) e la valutazione dei servizi di pubblica utilità, in termini di efficacia e efficienza. In particolare saranno affrontate diverse problematiche:- definizione di indicatori sintetici;
- misurazione di variabili latenti che influenzano la soddisfazione del cliente;
- segmentazione del mercato per tipologia di clienti;
- valutazione "oggettiva" della performance dei servizi di pubblica utilità.
Le unità di ricerca si occuperanno di questioni metodologiche e relative all'applicazione delle metodologie proposte a situazioni reali. A tal proposito si terrà conto anche dell'esigenza di sviluppare metodologie statistiche in grado di fornire risultati di semplice ed immediata lettura per l'utilizzatore finale non esperto.
La ricerca esplorerà i limiti degli approcci tradizionali ai problemi di valutazione al fine di descrivere evoluzioni e/o di definire innovativi paradigmi di analisi per valutare la Customer Satisfaction. Efficienza, efficacia e soddisfazione possono essere intese come variabili latenti il cui grado, espresso in categorie, determina le risposte effettivamente osservate. In questo contesto, l'obiettivo dell'unità di ricerca di Bologna è di sviluppare un sistema di indicatori statistici di efficienza e di efficacia dei servizi sanitari, spostandosi dal tradizionale contesto dell'analisi univariata alla più innovativa e completa impostazione offerta dai metodi statistici multivariati. Il gruppo di ricerca di Bologna intende adottare e in taluni casi sviluppare ex novo due classi di metodologie statistiche: modelli di classe latente (Vermut & Magidson 2003), che trovano nelle misture di distribuzioni il loro elemento portante, e modelli a fattori indipendenti (Attias 1999, Montanari & Viroli 2004). L'obiettivo principale dell'unità di Napoli è quello di ricercare, sviluppare ed implementare un sistema per la misurazione della Customer Satisfaction, oltre che un appropriato Customer Satisfaction Index (CSI). Il sistema sarà basato su modelli ad equazioni strutturali stimati mediante l'approccio PLS, esteso al caso di risposte categoriali (Bastien et al., 2004), di dati mancanti e/o multicollinearità. Inoltre, si discuteranno i modelli per sottopopolazioni, le procedure di validazione ed, infine, la stima dei fattori influenti il CSI attraverso modelli di Conjoint Analysis.
L'unità di ricerca di Roma si propone di estendere gli approcci di De Soete & Carroll (1994) e Vichi & Kiers (2001) secondo alcune direzioni fondamentali. In primo luogo, si propone di trattare il caso di dati osservati in condizioni differenti (dati multiway); inoltre, sarà esplorata la possibilità di estendere i modelli semiparametrici ad effetti misti ed i modelli a mistura finita per trattare simultaneamente classificazione e riduzione dimensionale, partendo da alcune proposte già presenti in letteratura (si veda: McLachlan, Bean & Peel, 2002; Rocci & Vichi, 2001b). L'unità di ricerca di Cosenza, secondo l'approccio proprio dell'analisi di dati funzionali, considererà il processo formativo come un processo continuo che viene valutato in corrispondenza di determinati istanti di tempo con cadenza usualmente non regolare, cosicché la carriera d uno studente può essere considerata come una traiettoria che descrive il numero di crediti formativi acquisiti nel tempo. L'obiettivo dell'unità di Ricerca di Parma è fortemente collegato a quelli delle altre unità di ricerca, visto che riguarda la predisposizione di nuove tecniche robuste ed efficienti, che consentano sia di individuare l'eventuale esistenza di unità con caratteristiche peculiari, sia - più in generale - di porre in luce le relazioni complesse presenti nei dataset a disposizione (Cerioli and Riani, 1999, 2002; Atkinson, Cerioli and Riani, 2003; Atkinson, Riani and Cerioli, 2004). <<<
Coordinatore Scientifico del Programma di Ricerca
Maurizio VICHI Universita' degli Studi di ROMAObiettivo del Programma di Ricerca
Il gruppo di ricerca si propone l'obiettivo di definire ed implementare un insieme di metodologie innovative per l'analisi di dati riguardanti la soddisfazione del cliente (customer satisfaction) e la valutazione dei servizi di pubblica utilità, in termini di efficacia ed efficienza. In particolare saranno affrontate diverse problematiche:- definizione di indicatori sintetici;
- misurazione di variabili latenti che influenzano la soddisfazione del cliente (e quindi la qualità percepita);
- segmentazione del mercato per tipologia di clienti;
- valutazione "oggettiva" della performance dei servizi di pubblica utilità.
Le unità di ricerca si occuperanno sia di questioni metodologiche sia di questioni relative all'applicazione delle metodologie proposte a situazioni reali. A tal proposito si terrà conto anche dell'esigenza di sviluppare metodologie statistiche in grado di fornire risultati di semplice ed immediata lettura per l'utilizzatore finale non necessariamente esperto di metodologie statistiche.
La ricerca esplorerà innanzitutto i limiti degli approcci tradizionali ai problemi di valutazione al fine di descriverne potenziali evoluzioni e/o di definire innovativi paradigmi di analisi. Il primo obiettivo è quello di formulare una rassegna critica dei metodi statistici per la valutazione della customer satisfaction, dell'efficacia ex-post e dell'efficienza nel settore dei servizi di pubblica utilità, con particolare riferimento alle tematiche sanitarie, ambientali, formative e dell'e-government. In tale contesto, vanno considerate in modo appropriato le difficoltà relative alla valutazione dei servizi di pubblica utilità in riferimento alla:
1. quantificazione della soddisfazione, derivante principalmente da comportamenti, sensazioni e benefici difficilmente esprimibili;
2. definizione degli standard, trattandosi di servizi intangibili;
3. comparazione tra differenti servizi;
4. costruzione ed analisi del campione essendo gli utenti serviti da differenti Aziende.
Il secondo obiettivo è quello di sviluppare un sistema di indicatori statistici di qualità, efficacia ed efficienza dei servizi, spostandosi dal tradizionale contesto dell'analisi univariata alla più innovativa, completa, e metodologicamente corretta impostazione offerta dai metodi statistici multivariati. La valutazione dell'efficacia di un servizio realizzata nell'ottica di chi ne usufruisce è strettamente legata al livello di soddisfazione del cliente stesso. In quest'ottica si ritiene che un servizio sia di qualità se, in una data situazione, soddisfa il cliente. In tale contesto, forte è l'interesse a ricercare, sviluppare ed implementare un sistema per la misurazione della Customer Satisfaction, insieme ad un appropriato Customer Satisfaction Index (CSI). Il sistema sarà basato su modelli a variabili latenti. In questo modo, le variabili di input manifeste, ossia direttamente misurabili, vengono "ridotte" ad un certo numero di variabili latenti, ossia non direttamente osservabili, quali ad esempio il CSI.
Nell'ambito dell'analisi di dati sulla valutazione di uno o più servizi, particolare importanza assume il problema della segmentazione del mercato e/o classificazione dei clienti. In altri termini, gli utenti di un determinato servizio spesso provengono da più popolazioni tra loro non omogenee. A volte l'identificativo della popolazione di provenienza è noto. Ad esempio, potremmo trovarci nella situazione di dover valutare il grado di soddisfazione di un utente nei confronti di un determinato servizio che viene erogato da più enti. Altre volte, questo identificativo non è noto a priori e deve quindi essere determinato, o meglio, stimato. Tale esigenza può essere sia uno degli obiettivi dell'analisi, ad esempio, una segmentazione del mercato, sia di natura puramente strumentale. Infatti, è naturale pensare che l'applicazione di una stessa metodologia ad una popolazione eterogenea, cioè formata da più popolazioni, generalmente fornisce risultati distorti a meno che non tenga esplicitamente conto della possibile eterogeneità della popolazione oggetto di studio.
Uno degli obiettivi della ricerca sarà quello di indagare un approccio simultaneo di "classificazione e riduzione". Questo equivale ad identificare dei fattori latenti in grado di spiegare la variabilità between, ossia la variabilità tra i centroidi dei gruppi. In questo modo si può operare sia una classificazione delle variabili distinguendole tra variabili con o senza potere discriminante, sia una riduzione del numero di queste, riduzione in generale molto efficacie grazie all'alta collinearità spesso presente tra le variabili. In molti contesti applicativi, tra cui quello dell'analisi di dati per la customer satisfaction, spesso accade che alcune delle variabili abbiano un potere discriminante limitato solo ad alcuni gruppi piuttosto che altri. In questo caso si può procedere ad una partizione, diciamo di secondo livello, dei gruppi di unità, a seconda che questi siano discriminati o no dallo stesso insieme di variabili. Nel caso dell'analisi di dati sulla customer satisfaction, una tecnica di classificazione simultanea di variabili e unità risulta molto utile in quanto permette di analizzare, ad esempio, le eventuali interazioni tra segmenti di consumatori/utenti e diversi aspetti della misura della soddisfazione. In letteratura sono già presenti alcune proposte per la classificazione simultanea di variabili e unità, un obiettivo sarà quello di evolvere tali tecniche tenendo in particolare conto delle particolari esigenze che vengono poste dall'analisi di dati sulla customer satisfaction.
Le tecniche sopra esposte saranno affrontate sia con un approccio "soft modelling", sia mediante il ricorso a modelli mistura. Mediante l'uso di questi sarà inoltre affrontato il problema della stima di modelli di valutazione in presenza di eterogeneità.
Le tecniche di classificazione saranno inoltre studiate anche con riferimento a dati funzionali, ossia, dati dove la generica osservazione è costituita da una funzione continua.
Le tematiche della riduzione dimensionale e della classificazione pongono anche un problema legato alla predisposizione di tecniche robuste ed efficienti, che consentano sia di individuare l'eventuale esistenza di unità con caratteristiche peculiari, sia - più in generale - di porre in luce le relazioni complesse presenti nei datasets a disposizione senza essere influenzate da tali outliers. Questo ulteriore obiettivo sarà conseguito attraverso l'approccio robusto alla statistica multivariata denominato "forward search", in cui alcuni partecipanti al progetto hanno maturato negli ultimi anni una significativa esperienza. Un ulteriore ambito di impegno sarà costituito dalla predisposizione di nuovi metodi per la classificazione di sequenze di dati.
La realizzazione di tali obiettivi richiede sia sviluppi metodologici sia la realizzazione di un software ad hoc, in grado di rendere facilmente fruibili le tecniche proposte.
Le unità di ricerca coopereranno tra di loro su varie basi scientifiche. In particolare ci si attende di stabilire i collegamenti seguenti:
le unità di Roma, Bologna e Napoli, collaboreranno per i modelli riguardanti variabili categoriche e di preferenza, nonché per i modelli a variabili latenti;·le unità di ricerca di Cosenza e Parma collaboreranno per quanto riguarda la classificazione robusta di dati funzionali. Le unità di Roma e di Bologna, per i modelli mistura e a classi latenti;·le unità di Roma, Parma, per l'approccio simultaneo alla classificazione e riduzione dimensionale; le unità di Roma, di Cosenza, di Parma e di Napoli per la definizione di distanze e la classificazione di dati longitudinali. Le unità di Napoli, Bologna e Parma collaboreranno per il trattamento dei differenti tipi di variabili utilizzate per misurare la Customer Satisfaction. <<<
Risultati parziali attesi
1) Rassegna critica delle metodologie presenti nella letteratura nazionale ed internazionaleQuesto risultato sarà ottenuto mediante una stretta collaborazione tra le unità partecipanti al progetto e sarà riferito in particolare ai servizi di pubblica utilità. In questo contesto, l'obiettivo è di analizzare gli approcci metodologici e le soluzioni proposti in letteratura, allo scopo di produrre una rilettura critica dei metodi statistici per l'analisi dell'impatto nei servizi sanitari pubblici (unità di ricerca di Bologna), degli indicatori funzionali per l'analisi e la valutazione delle carriere accademiche (unità di ricerca di Cosenza), dei metodi robusti di classificazione (unità di ricerca di Parma), delle tecniche esplorative o basate su modello per la riduzione dimensionale e la segmentazione dei consumatori (unità di ricerca di Napoli e Roma);
2)Sviluppo di nuove metodologie e procedure
L'unità di ricerca di Roma si propone di estendere gli approcci di De Soete & Carroll (1994) e Vichi & Kiers (2001) secondo alcune direzioni fondamentali. In primo luogo, si propone di trattare il caso di dati osservati in condizioni differenti (dati multiway), con l'obiettivo di esplorare la possibilità di estendere i modelli semiparametrici ad effetti misti ed i modelli di classe latente, in presenza di dipendenza tra più scelte dello stesso consumatore, in senso multivariato e longitudinale, allo scopo di considerare una osservazione longitudinale come generata da un insieme di effetti fissi, da fonti di eterogeneità non osservabile e di dipendenza seriale dalle scelte effettuate nel passato. E' importante notare che l'approccio semiparametrico permette di interpretare le fonti di eterogeneità in termini di classificazione e di segmentazione dei clienti. In queso contesto, una scelta razionale riguarda la specificazione di un modello statistico-probabilistico di generazione dei dati; in tale contesto uno strumento standard è rappresentato da misture finite di distribuzioni multivariate di probabilità, dove ogni componente della mistura rappresenta un diverso gruppo presente nella popolazione. Questo approccio alla classificazione è molto studiato in letteratura (si veda McLachlan & Basford, 1987) ed ha dimostrato la sua efficacia in diversi campi applicativi di analisi di mercato (Wedel & Kamakura, 2002). L' obiettivo è quello di estendere questo approccio alla classificazione e riduzione simultanea, partendo da alcune proposte già presenti in letteratura (si veda: McLachlan, Bean & Peel, 2002; Rocci & Vichi, 2001b) ed evolvendole ponendo una particolare attenzione agli aspetti di definizione dei criteri per la scelta del modello, agli aspetti più propriamente computazionali, alle possibilità di modificare le ipotesi distribuzionali standard.
L'obiettivo dell'unità di ricerca di Bologna è quello di sviluppare un sistema omogeneo di indicatori statistici di efficienza e di efficacia dei servizi sanitari, spostandosi dal tradizionale contesto dell'analisi univariata alla più innovativa, completa, e metodologicamente corretta impostazione offerta dai metodi statistici multivariati. Efficienza, efficacia e soddisfazione possono essere intese come variabili latenti il cui livello espresso in categorie, determina le risposte effettivamente osservate. In questo quadro fenomenico di riferimento la metodologia statistica che il gruppo di ricerca intende adottare e in taluni casi sviluppare ex novo fa riferimento ai modelli a classi latenti, che trovano nelle misture di distribuzioni il loro elemento portante, e ai modelli a componenti indipendenti. L'impostazione dei modelli a classi latenti si rivela particolarmente interessante e promettente nel contesto applicativo, poiché essi non si fondano sulle classiche ipotesi distributive riguardo ai dati (linearità, normalità, omoschedasticità) e quindi sono, in questo senso, più robusti, al pari di alcune tipologie di reti neurali rispetto alle quali, a fronte di una stretta somiglianza formale (Pillati 2001; Pillati e Calò 2002; Pillati e Calò 2004), presentano il vantaggio di produrre risultati più facilmente interpretabili. In particolare l'unità si soffermerà sui modelli di clustering a classe latente (McLachlan e Basford, 1988), sui modelli fattoriali a classi latenti (Vermunt e Magidson 2003) e sui modelli di regressione e di classificazione a classi latenti (Wedel e DeSarbo 1994) per identificare le determinanti di soddisfazione, efficacia ed efficienza nei diversi segmenti di unità statistiche.
L'unità di ricerca di Cosenza, in accordo all'approccio proprio dell'analisi di dati funzionali, considererà il processo formativo come un processo continuo che viene valutato in corrispondenza di determinati istanti di tempo con cadenza usualmente non regolare. Un primo elemento di indagine riguarda lo studio di opportune distanze e/o dissimilarità fra le carriere di due studenti o anche la distanza e/o dissimilarità fra la carriera di un generico studente ed una carriera considerata quale riferimento "ideale" di customer satisfaction, individuata e costruita in base sia a opportune considerazioni di efficacia di un corso di studio universitario, vedi CNVSU (2004b), sia con riferimento a benchmark internazionali, vedi QAA (2003).
L'obiettivo principale dell'unità di Napoli è quello di ricercare, sviluppare ed implementare (mediante un software specifico) un sistema per la misurazione della Customer Satisfaction, oltre che un appropriato Customer Satisfaction Index (CSI). Il sistema sarà basato su modelli ad equazioni strutturali stimati mediante l'approccio PLS. La realizzazione di tali obiettivi richiede sviluppi metodologici nell'ambito sia della modellizzazione statistica che della stima di indici di soddisfazione; è necessario inoltre lo sviluppo di software ad hoc. In questo progetto l'unità di Napoli intende generalizzare l'approccio PLS, così come è stato fatto per la regressione PLS generalizzata (Bastien et al., 2004), in modo da estendere l'applicabilità dell'algoritmo PLS a diverse funzioni di link per adattarlo in maniera appropriata alla natura dei dati.
Inoltre, un ulteriore campo di studio sarà il trattamento di dati mancanti; è infatti noto che il PLS agisce come se si fosse eseguito il primo passo dell'algoritmo EM (Expectation Maximisation) nel quale si effettua la stima delle medie e delle covarianze con dati mancanti. Il progetto intende inserire, invece, l'intero algoritmo EM nel PLS per ottenere delle stime complessivamente più efficienti. Ulteriori percorsi di ricerca dell'unità di Napoli riguarderanno la stima PLS in presenza di multicollinearità, la definizione di procedure di validazione, di strategie per la definizione ed il confronto tra modelli alternativi.
L'obiettivo dell'unità di Ricerca di Parma è fortemente collegato a quelli delle altre unità di ricerca, visto che riguarda la predisposizione di nuove tecniche robuste ed efficienti, che consentano sia di individuare l'eventuale esistenza di unità con caratteristiche peculiari, sia - più in generale - di porre in luce le relazioni complesse presenti nei dataset a disposizione, con particolare enfasi all'analisi dei dati provenienti dall'implementazione di servizi pubblici telematici. In tale contesto, l'Unità si impegnerà a produrre contributi di rilievo sia metodologico che applicativo, fornendo strumenti di conoscenza innovativi utili ad orientare la governance della Pubblica Amministrazione. Questo obiettivo sarà conseguito attraverso l'approccio robusto alla statistica multivariata denominato "forward search", in cui il responsabile dell'Unità ha maturato negli ultimi anni una significativa esperienza (Cerioli and Riani, 1999, 2002; Atkinson, Cerioli and Riani, 2003; Atkinson, Riani and Cerioli, 2004). Un ulteriore ambito di impegno sarà costituito dalla predisposizione di nuovi metodi per la classificazione delle sequenze di dati provenienti dagli accessi ai portali della pubblica amministrazione. Sul tema della classificazione di sequenze l'Unità di Ricerca intrattiene da tempo proficui rapporti con quella dell'Università della Calabria (Ingrassia et al., 2003; Cerioli et al., 2004).
3) Implementazione degli algoritmi
Il progetto continua con la progettazione e l'implementazione delle nuove metodologie con un software.
Il gruppo di ricerca, al fine di rendere disponibili gli algoritmi prodotti, ha programmato di utilizzare MATLAB o alternativamente S-PLUS, che sono tra i pacchetti software più diffusi in ambiente statistico.
Ovviamente, parte delle routine utilizzate all'interno dei software sopra menzionati potrà essere sviluppata utilizzando linguaggi di programmazione quali fortran, C, C++ etc.L'unità di ricerca di Bologna analizzerà, in collaborazione con alcune aziende ospedaliere emiliane, la soddisfazione degli utenti dei servizi sanitari secondo un percorso che si articola nello studio dei seguenti aspetti:
i) rilevazione del grado di soddisfazione dell'utente per il trattamento ricevuto;
ii) valutazione, da parte dell'utente, degli aspetti relativi all'accoglienza in ospedale, all'organizzazione della giornata, alla qualità alberghiera e di ristorazione nonché alle relazioni con gli operatori sanitari;
iii) miglioramento della qualità dell'assistenza attraverso i giudizi espressi dai degenti;
iv) coinvolgimento dei degenti e degli operatori in un processo graduale, ma continuo, mirato a creare una nuova cultura assistenziale centrata sul concetto di qualità. Tale approccio prevede un'ulteriore valutazione dell'efficienza e dell'efficacia sulla base delle informazioni contenute nelle schede di dimissione ospedaliera (SDO), su una banca dati relativa alle prescrizioni farmacologiche e su informazioni sulle caratteristiche delle diverse strutture sanitarie (ospedali, reparti, medici) oggetto di valutazione.
L'obiettivo dell'Unità di Ricerca di Cosenza concerne la costruzione di indicatori e lo sviluppo di metodi di analisi di dati funzionali e multidimensionali, con particolare riferimento ad applicazioni concernenti la valutazione di processi formativi e amministrativi in ambito universitario. Indicatori basati su metodi dell'analisi di dati funzionali (che nel seguito verranno chiamati "indicatori funzionali") possono trovare uno specifico interesse nel contesto del nuovo sistema italiano di istruzione universitaria che è basato sul sistema dei Crediti Formativi Universitari (CFU). In tale ambito, a ciascuno studente può essere associata una traiettoria che descrive il numero di crediti acquisiti in funzione del tempo; tali traiettorie possono anche tener conto del tipo di attività formative previste (di base, caratterizzanti, etc.) sia della votazione riportata.
Le metodologie sviluppate nell'ambito dell'unità di ricerca di Napoli saranno applicate e testate per costruire un sistema per la misura della Customer Satisfaction nei servizi di pubblica utilità e della pubblica amministrazione. In questa fase saranno condottele applicazioni sui dati reali. Due interessanti collaborazioni sono state definite: la prima con A.S.I.A. (Azienda Speciale Igiene Ambientale) con riferimento alla gestione dei rifiuti solidi urbani della città di Napoli e la seconda con GE.S.A.C SpA (Gestione Servizi Aeroportuali) con riferimento ai servizi aeroportuali dell'aeroporto di Napoli Capodichino. In entrambi i casi, si testeranno le metodologie sviluppate con lo scopo finale di definire un sistema di Customer Satisfaction. La fase di progettazione del questionario e della raccolta dei dati sarà eseguita in collaborazione con le altre unità del progetto.
L'Unità di Ricerca di Parma procederà alla sperimentazione delle metodologie proposte sui temi della valutazione dei servizi pubblici telematici e del grado di soddisfazione degli utenti di tali servizi. In particolare, gli obiettivi perseguiti in questa fase saranno i seguenti. 1. Applicazione delle metodologie multivariate robuste ai fini della creazione di indicatori di benchmarking della società dell'informazione e di rating dei corrispondenti agenti.
2. Applicazione delle metodologie di classificazione robusta ai fini della determinazione di gruppi di progetti di e-government con caratteristiche omogenee.
3. Applicazione delle metodologie multivariate robuste ai fini dell'individuazione di criticità in alcuni siti della Pubblica Amministrazione.
Gli obiettivi indicati saranno raggiunti analizzando i dati dell'Osservatorio sull'e-government e la società dell'informazione in Emilia-Romagna, nonché i dati raccolti mediante indagini apposite aventi come riferimento la situazione nella regione Emilia-Romagna
L'attività dell'unità di ricerca di Roma riguarderà l'applicazione e la sperimentazione delle metodologie proposte nella fase precedente a dati di benchmark e a dati originali forniti dalle aziende descritte nel seguito. Inoltre, l'unità di ricerca si interesserà di confrontare le metodologie standard per la classificazione e la riduzione dimensionale di variabili categoriali con quelle proposte nella fase precedente. Le metodologie proposte saranno applicate all'analisi di dati di soddisfazione del cliente provenienti da due fonti principali:
1) dati riguardanti il settore automobilistico forniti dalla Urban Science Italia;
2) dati provenienti dal questionario sottoposto ai clienti (interni) di servizi informativi e di rete forniti dalla direzione dell'IT di un primario gestore di servizi postali.
Alla fine del progetto sarà organizzata una riunione scientifica ed i principali risultati saranno pubblicati in un volume. Inoltre, i risultati scientifici più rilevanti verranno sottoposti a pubblicazione su riviste, oppure presentati a convegni nazionali ed internazionali(come ad esempio COMPSTAT 2006, 17th Symposium of IASC, ROMA; KEM'06, Summer School on Knowledge Extraction by Modeling, ANACAPRI, 2006). Ci si propone infine di produrre alcuni rapporti tecnici per la diffusione dei risultati nella pubblica amministrazione. <<<
Durata
24 mesiBase di partenza scientifica nazionale o internazionale
La Customer Satisfaction rappresenta il grado di soddisfazione dei consumatori di un prodotto o degli utenti di un servizio. Un prodotto o un servizio è considerato soddisfacente se soddisfa le necessità e le aspettative del cliente o dell'utente. Quando i clienti non sono soddisfatti di un prodotto (o di un servizio), questo non è né efficace né efficiente. Il livello di soddisfazione dei prodotti e dei servizi è un fattore importante nello sviluppo di un sistema di requisiti che sia un'adeguata risposta alle necessità dei clienti nei termini di una minimizzazione dei costi e dei tempi da una lato e di una massimizzazione dell'impatto dei prodotti o dei servizi dall'altro. Prima dell'avvento della distribuzione di massa, i produttori sapevano molto più facilmente intuire quanto i propri clienti fossero soddisfatti, poiché i rapporti erano diretti. Il produttore/artigiano accettava e recepiva prontamente le necessità del cliente e adottava i cambiamenti desiderati per migliorare i prodotti e mantenere i clienti. In questo modo la soddisfazione del cliente seguiva un percorso di adattamento giornaliero.L'epoca della distribuzione di massa di prodotti e servizi ha distrutto questo meccanismo distanziando quelli che producono beni e servizi da quelli che li consumano o ne usufruiscono. In questo modo l'interazione diretta con i consumatori/utenti è stata eliminata e questi diventano un importante componente mancante nel processo decisionale del produttore.
La rapida evoluzione dell'economia globale, accompagnata da modifiche radicali nei risultati e nella competitività fra realtà locali, nazioni e singoli operatori economici, pone l'esigenza di approfondire lo studio delle relazioni economiche con i consumatori dei diversi prodotti/servizi offerti. Fondare le decisioni unicamente su indicatori di performances sta diventando sempre meno opportuno, sia in ambito strettamente economico che politico. Lo sviluppo di nuovi indicatori che mirino ad individuare le potenzialità del mercato e le esigenze dei consumatori è pertanto sempre più importante; soprattutto in Europa dove la liberalizzazione dell'economia in un unico mercato richiederà ancora molto tempo. Conoscere le reali valutazioni degli utilizzatori dei beni forniti diventa fondamentale nella new economy dove i consumatori cambiano opinioni e gusti molto rapidamente e sono consapevoli delle alternative disponibili. In molti settori l'informazione sulla percezione della qualità da parte dei consumatori è ancora lacunosa. Gli indici di impresa tradizionali quali turn-over, market-share, redditività, ROI ecc. sono inoltre strumenti inadeguati a comprendere le dinamiche della domanda prima evidenziata.
In questo contesto, la Customer Satisfaction deve essere intesa come un concetto multidimensionale non osservabile direttamente (associabile perciò a una o più variabili latenti) che può però essere misurato attraverso un insieme di indicatori reali (variabili manifeste). Questa è l'idea sottostante l'approccio che misura la Customer Satisfaction mediante variabili latenti stimate con i modelli ad equazioni strutturali. In quest'ottica per costruire un indice che misuri la soddisfazione, si studiano le relazioni causali tra variabili latenti e variabili manifeste. Variabili latenti possono essere considerati i diversi aspetti, o componenti, della soddisfazione del cliente. Variabili manifeste sono, invece, misure ottenute dalle risposte dei clienti sul proprio grado di soddisfazione. La letteratura statistica fa riferimento a due approcci dominanti per risolvere il problema della stima della soddisfazione mediante i modelli ad equazioni strutturali: il PLS ed il LISREL. La soluzione PLS —introdotta da H. Wold (1966)- ottiene la stima delle variabili latenti mediante un sistema interdipendente di elaborazioni alternate (Partial Least Squares) basate su regressioni semplici e multiple. L'approccio LISREL, —sviluppato da K.G. Jöreskog (Jöreskog, 1978)— utilizza un classico procedimento statistico di stima basato sulla massima verosimiglianza. Questi due approcci hanno seguito evoluzioni diverse.
Allo stesso modo, le tematiche della valutazione ex-post dei servizi di pubblica utilità (sanità, formazione, etc.) sono già da tempo trattate in letteratura sia da un punto di vista teorico sia da un punto di vista empirico secondo l'impostazione offerta dai modelli a variabili latenti, dai modelli multilevel e dall'integrazione dei due approcci. Il sempre più diffuso utilizzo di strumenti di raccolta dati da questionari a scale categoriche, in ambito socio-comportamentale e psico-attitudinale, ha notevolmente accresciuto l'interesse rivolto ai modelli a variabili latenti per dati categorici. A tale riguardo i modelli basati sull'item response theory approach (Lord e Novick 1968) possono essere visti come caso particolare dei cosiddetti modelli lineari generalizzati per variabili latenti che rappresentano un apparato concettuale generale entro il quale si colloca una molteplicità di soluzioni caratterizzate dalla diversa natura delle variabili osservate (Bartholomew e Knott 1999). Quando l'obiettivo sia invece quello di indagare la presenza di legami tra variabili latenti lo strumento di analisi di riferimento è costituito dai cosiddetti modelli a equazioni strutturali, che trattano le variabili categoriche secondo le assunzioni dell'underlying variable approach (Muthen 1978). D'altro canto i modelli multilevel si riferiscono ad una varietà di metodi statistici che possono essere impiegati per l'analisi dei dati a struttura gerarchica che sovente si presentano nella ricerca sociale e sanitaria. Recentemente è stata proposta l'integrazione dei modelli di regressione multilevel classici con i modelli a equazioni strutturali.
Le teorie summenzionate, sono tutte basate sui seguenti principi:
- i dati del problema derivano da giudizi dei consumatori e dovrebbero essere direttamente raccolti;
- si tratta di un problema di valutazione multivariata dato che la soddisfazione globale del consumatore dipende da un insieme di variabili che rappresentano le dimensioni caratteristiche di un prodotto o di un servizio. In questo contesto, le tecniche proposte si concentrano principalmente sulla valutazione di una misura di soddisfazione totale (Parasuraman et al., 1988, Bollen, 1989, Johnson e Fornell, 1991, Grigoroudis & Siskos, 2002), sull'analisi della ridondanza delle variabili rilevate sul consumatore e valutazione del loro impatto sulla sua soddisfazione totale (Givon e Horsky, 1985; Brannas e Rosenqvist, 1994; Ehrenberg, 1972; Zanella, 2001), ed infine sulla classificazione dei clienti in segmenti distintivi diversi, con obiettivi di marketing (decisioni, allocazioni di risorse, strategie promozionali). In quest'ultimo contesto, l'analisi è condotta usando: tecniche di classificazione, di analisi discriminante, modelli mistura (Wedel e Kamakura, 2002).
Molti problemi sorgono quando si applicano tecniche statistiche standard per raggiungere i suddetti obiettivi; infatti spesso il ricercatore è interessato ai tre obiettivi insieme, e l'uso di diverse tecniche indipendenti può portare a risultati contrastanti e fuorvianti. Inoltre, i dati possono avere tre o più dimensioni (tempo, spazio, etc., si veda Vavra, 1997; Boari, 2001). Le tecniche standard spesso non sono in grado di sfruttare questa ricchezza di informazioni. Per concludere, spesso le osservazioni sono considerate omogenee; questa ipotesi si dimostra in alcuni casi irrealistica (Muthén, 1989)e le tecniche di analisi statistica devono essere definite in modo da considerare in modo adeguato questo aspetto (Ansari et al., 1997).
In molti dei casi menzionati, tuttavia, le metodologie classiche dell'analisi multivariata si dimostrano insoddisfacenti in quanto:
1. non sono robuste, per cui i risultati sono sostanzialmente inficiati in presenza di uno o più outliers multivariati. La presenza di unità fortemente atipiche appare la norma e non l'eccezione negli studi che coinvolgono unità territoriali, quali Comuni o altri Enti Locali (si veda, ad esempio, Zani, 1996);
2. si fondano largamente sull'ipotesi, non verificata nel presente contesto, di normalità multivariata degli indicatori disponibili (Lauro et al., 1997);
3. non tengono adeguatamente conto della complessità strutturale del dataset, che fa riferimento ad unità territoriali interdipendenti tra loro, che richiede il trattamento simultaneo di caratteri quantitativi e qualitativi (Vedaldi, 1997; Zanella, 2001) e che presenta in certi casi aspetti di dinamicità difficilmente riconducibili agli schemi abituali dell'analisi dei dati (Ramsay and Silverman, 1997, 2002). <<<



