Contenuto
Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricercaINIZIO_TESTO_DA_INDICIZZARE
PROGRAMMA DI RICERCA
italiano - english
Unità di Ricerca
Programmi di ricerca simili:
- 1 - Nuove tecniche e strumenti per l'interrogazione di servizi di ricerca su Web
- 2 - Basi di dati crittografate
- 3 - WISDOM: Ricerca Intelligente su Web basata su Ontologie di Dominio
- 4 - Future applicazioni del paradigma peer-to-peer
- 5 - Tecniche per la diagnosi, valutazione e adattività per la qualità del servizio nei sistemi informativi (QuaDRAnTIS)
- 6 - La Geomatica a supporto delle azioni di Governo del Territorio
- 7 - Analisi intelligente dei dati di monitoraggio di emodialisi per il miglioramento dei processi di cura.
- 8 - ANONIMO: metodi informatici e legali per la protezione della privacy e l'anonimato.
- 9 - Studio e sviluppo di un sistema per il controllo e il monitoraggio in tempo reale del territorio per la prevenzione degli incendi
- 10 - Sintesi automatica di modelli astratti a partire da dati temporali o spaziali
Classificazione scientifico-disciplinare
- Area scientifico disciplinare: Ingegneria industriale e dell'informazione
Classificazione brevettuale
- PHYSICS
- COMPUTING; CALCULATING; COUNTING (score computers for games A63; combinations of writing applicances with computing devices B43K29/08)
- ELECTRICAL DIGITAL DATA PROCESSING (computers in which a part of the computation is effected hydraulically or pneumatically G06D; optically G06E; self-contained input or output peripheral equipment G06K; impedance networks using digital techniques H03H) [C9603]
- COMPUTING; CALCULATING; COUNTING (score computers for games A63; combinations of writing applicances with computing devices B43K29/08)
Classificazione geografica
- Regione: Lazio
Bibliografia
[Aberer et al., 2003] K. Aberer, P. Cudré-Mauroux, and M. Hauswirth. The Chatty Web: Emergent Semantics Through Gossiping. WWW 2003.[Aberer et al., 2004] K. Aberer et al., Emergent Semantics Principles and Issues, DASFAA, Jeju Island, Korea, 2004.
[Aberer and Despotovic, 2001] K. Aberer and Z. Despotovic, Managing Trust in a Peer-2-Peer Information System, CIKM, Atlanta, Georgia, USA, 2001.
[Baldoni et al., 2004] R. Baldoni, R. Beraldi, L. Querzoni and A. Virgillito. Subscription-DrivenSelf-Organization in Content-Based Publish/Subscribe. ICAC 2004.
[Baldoni et al., 2005] R. Baldoni, C. Marchetti, R. Vitenberg and A. Virgillito. Content-basedPublish/Subscribe over Structured Overlay Networks. ICDCS 2005. To appear.
[Bernstein and Klein, 2004] A. Bernstein and M. Klein. Towards high-precision service retrieval. IEEE Internet Computing 8(1), 2004.
[Bertino et al., 2001] E. Bertino, S. Castano, E. Ferrari, and M. Mesiti, Specifying and Enforcing Access Control Policies for XML Document Sources, WWW J., 3(3), 2001.
[Bolchini et. al, 2004] C. Bolchini, F. A. Schreiber, and L. Tanca. A context-aware methodology for very small data base design. SIGMOD Rec., 33(1), 2004.
[Bolchini et. al, 2004b] C. Bolchini, C. Curino, M. Giorgetta, A. Giusti, A. Miele, F. A. Schreiber, L. Tanca. PoLiDBMS: Design and Prototype Implementation of a DBMS for Portable Devices. SEBD, S. Margherita di Pula, Italy, 2004.
[Bonifacio et al., 2003] M. Bonifacio, P. Bouquet, G. Mameli and M. Nori, Peer - Mediated Distributed Knowledge Management, AMKM, Stanford, CA, USA, 2003.
[Bravo and Bertossi, 2003] L. Bravo, L. Bertossi. Logic programming for consistently querying data integration systems. IJCAI 2003.
[Broekstra et al., 2003] J. Broekstra et al., A Metadata Model for Semantics-based Peer-to-Peer Systems, SemPGRID, Budapest, Hungary, 2003.
[Brogi et al., 2004] A. Brogi, S. Corfini, R. Popescu. Flexible Matchmaking of Web Services Using DAML-S Ontologies. ICSOC 2004.
[Cali' et al., 2003] A. Cali', D. Lembo, R. Rosati. On the decidability and complexity of query answering over inconsistent and incomplete databases. PODS 2003.
[Cali' et al., 2004] A. Cali', D. Calvanese, G. De Giacomo, M. Lenzerini. Data Integration under Integrity Constraints. In Information Systems, 29, 2004.
[Calvanese et al., 2001] D. Calvanese, G. De Giacomo, M. Lenzerini, D. Nardi, and R. Rosati. Data integration in data warehousing. Int. J. of Cooperative Information Systems, 10(3), 2001.
[Calvanese et al., 2004] D. Calvanese, G. De Giacomo, M. Lenzerini, and R. Rosati. Logical Foundations of Peer-To-Peer Data Integration. PODS 2004.
[Calvanese et al., 2004b] D. Calvanese, G. De Giacomo, M. Lenzerini, R. Rosati, G. Vetere: Hyper: A Framework for Peer-to-Peer Data Integration on Grids. ICSNW 2004
[Castano and Ferrari, 2003] S. Castano, E. Ferrari, Protecting Data sources over the Web: Policies, Models, and Mechanisms, in Web-Powered Databases, Idea Group, 2003.
[Castano et al., 2003] S. Castano, A. Ferrara, S. Montanelli, and D. Zucchelli, HELIOS: a General Framework for Ontology-based Knowledge Sharing and Evolution in P2P Systems, DEXA WEBS, Prague, Czech Rep., 2003.
[Castano et al., 2003b] S. Castano, A. Ferrara, and S. Montanelli, H-MATCH: an Algorithm for Dynamically Matching Ontologies in Peer-based Systems, SWDB, Berlin, Germany, 2003.
[Castano et al., 2004] S. Castano, A. Ferrara, S. Montanelli, and G. Racca, Matching Techniques for Resource Discovery in Distributed Systems Using Heterogeneous Ontology Descriptions, ITCC, Las Vegas, Nevada, USA, 2004.
[Castano et al., 2005] S. Castano, A. Ferrara, and S. Montanelli, Ontology-based Interoperability Services for Semantic Collaboration in Open Networked Systems, INTEROP-ESA 2005, Geneva, Switzerland 2005.
[Catarci and Lenzerini, 1993] T. Catarci and M. Lenzerini. Representing and using interschema knowledge in cooperative information systems. J. of Intelligent and Cooperative Information Systems, 2(4), 1993.
[Celentano et al. 2004] A. Celentano, F. A. Schreiber, and L. Tanca. Requirements for context-dependent mobile access to information services. Int.Workshop on Multimedia Information Systems, College Park, MA, USA, 2004.
[Crespo and Garcia-Molina, 2003] A. Crespo and H. Garcia-Molina, Semantic Overlay Networks for P2P Systems, Stanford University, Tech. Rep., 2003.
[De Roure et al., 2005] D. De Roure, N.R. Jennings, N.R. Shadbolt. The Semantic Grid:Past, Present and Future. IEEE 2005.
[De Santis et al., 2003] L. De Santis, M. Scannapieco, T. Catarci: Trusting Data Qualty in Cooperative Information Systems. CoopIS, Catania , Italy , 2003.
[Doan et al., 2003] A. Doan, J. Madhavan, R. Dhamankar, P. Domingos A. Halevy. Learning to match ontologies on the Semantic Web. VLDB J. 12(4), 2003.
[Doan et al., 2004] A. Doan, N. Noy, A. Halevy (editors): Special Issue on Semantic Integration, SIGMOD Record, 33(4), 2004.
[Ehrig et al., 2003] M. Ehrig, P. Haase, F. van Harmelen, R. Siebes, S. Staab, H. Stuckenschmidt, R. Studer, and C. Tempich. The swap data and metadata model for semantics based peer-to-peer systems. MATES 2003.
[Fagin et al., 2003] R. Fagin, P. G. Kolaitis, R. J. Miller, and Lucian Popa. Data exchange: Semantics and query answering. ICDT 2003.
[Giunchiglia and Shvaiko, 2004] F. Giunchiglia, P. Shvaiko, Semantic Matching, The Knowledge Engineering Review Journal, 3, 2004.
[Gkantsidis et al., 2004] C. Gkantsidis, M. Mihail, and A. Saberi. Random walks in peer-to-peer networks. INFOCOM 2004.
[Haase et al., 2004] P. Haase, R. Siebes, and F. van Harmelen, Peer Selection in Peer-to-Peer Networks with SemanticTopologies, ICSNW 2004, Paris, France, 2004.
[Halevy et al., 2003] A. Halevy, Z. Ives, D. Suciu, and I. Tatarinov. Schema mediation in peer data management systems. ICDE 2003.
[Harter et al., 2002] A. Harter, A. Hopper, P. Steggles, A. Ward, and P. Webster. The anatomy of a context-aware application. Wireless Networks, 8(2/3), 2002.
[Horrocks and Li, 2003] I. Horrocks and L. Li. A Software Framework for Matchmaking Based on Semantic Web Technology. WWW 2003.
[Jarke et al., 2000] M. Jarke, M. Lenzerini, Y. Vassiliou, P. Vassiliadis. Fundamentals of Data Warehouses. Springer-Verlag , 2000.
[Keller et al., 2004] U. Keller, H. Lausen, D. Roman. Web Service Modeling Ontology (WSMO). WSMO Working Draft, 2004.
[Lenzerini, 2002] M. Lenzerini. Data integration: A theoretical perspective. PODS 2002.
[Marti and Garcia-Molina,2004] S. Marti and H. Garcia-Molina, Limited Reputation Sharing in P2P Systems, ACM-EC 2004, New York, NY, USA, 2004.
[McCool and Guha, 2003] R. McCool and R.V. Guha. Tap, building the semantic web.
[Patil et al., 2004] A. Patil, S. Oundhakar, A. Sheth, K. Verma. METEOR-S Web Service Annotation Framework. WWW 2004.
[Sattler et al., 2003] K.Sattler, S.Conrad, and G.Saake, Interactive Example-Driven Integration and Reconciliation for Accessing Database Integration, Information Systems, 28, 2003.
[Scannapieco et al., 2004] M. Scannapieco, A.Virgillito, M. Marchetti, M. Mecella, R. Baldoni: The DaQuinCIS Architecture: a Platform for Exchanging and Improving Data Quality in Cooperative Information Systems. Information Systems, 29(7) 2004.
[Schmidt et al., 1999] A. Schmidt, M. Beigl, and H.-W. Gellersen. There is more to context than location. Computers & Graphics, 23(6), 1999.
[Shvaiko, 2004] P. Shvaiko, A Classification of Schema-based Matching Approaches, ISWC MCN, 2004.
[Staab et al., 2004] S. Staab, C. Tempich, and A. Wranik, REMINDIN': Semantic Query Routing in Peer-to-Peer Networks based on Social Metaphors, WWW 2004, New York, NY, USA, 2004.
[Sundaram and Chapman, 2002] B. Sundaram and B.M. Chapman, XML-basedPolicy Engine Framework for Usage Policy Management in Grids, Workshop on GRID 2002.
Parole Chiave
SEMANTICA EMERGENTE; PEER-TO-PEER; ELABORAZIONE DI INTERROGAZIONI; COMUNITA' SEMANTICHE; MATCHING DINAMICO DI ONTOLOGIE; RICERCA SEMANTICA DI SERVIZI; RETI AD-HOC; DISSEMINAZIONE MULTICANALE DELL'INFORMAZIONE; GESTIONE DEI DATI IN SISTEMI MOBILIESTEEM: Emergent Semantics and cooperaTion in multi-knowledgE EnvironMents - Metodi e strumenti avanzati per la collaborazione semantica in comunita' virtuali su web
Università degli Studi di Roma "La Sapienza"Abstract
Al giorno d'oggi, tutto è globale (e dinamico). Economia globale, ambiente globale, alimentazione globale, mercato globale. E quindi, informazione globale. Sono finiti i tempi in cui i dati risiedevano nel sistema informativo centrale delle aziende. Oggi, tutte le organizzazioni più grandi hanno strutture decentralizzate e i loro sistemi informativi devono gestire una varietà enorme di risorse. In effetti, i sistemi informativi sono in uso da molto tempo. Il problema di come fornire un accesso trasparente a risorse informative eterogenee mantenendone al contempo l'autonomia esiste da alcuni decenni, ed ha trovato una soluzione, anche se parziale, nelle tecniche di integrazione dati, in cui l'interazione fra i client e le sorgenti avviene attraverso un punto d'accesso centralizzato e interfacce uniformi danno agli utenti l'illusione di interrogare un sistema omogeneo. Tuttavia, queste tecniche funzionano sotto certe ipotesi, ivi compresa uno scenario poco dinamico, un'interpretazione comune del dominio di interesse, sotto forma di uno schema o ontologia globale, un insieme di sorgenti chiuso o per lo meno ad accesso ristretto. Tutte queste ipotesi non valgono più nelle odierne reti, in cui milioni di nodi informativi autonomi (peer) cooperano condividendo risorse (come dati o servizi).L'informazione deve essere quindi integrabile in ambienti dinamici, in cui i peer che interagiscono fra loro non condividono necessariamente una visione unica del mondo e non hanno un quadro completo del contesto in cui le interazioni avvengono. Al contrario, essi costruiscono in modo dinamico informazione e conoscenza, danno vita a nuove comunità semantiche e stabiliscono una nuova forma di interoperabilità semantica che si fonda su accordi dinamici e basati sulla credibilità. Ad essa facciamo riferimento con il nome di "emergent semantics".
Al momento, esistono poche risposte alle nuove esigenze della semantica emergente. Le difficoltà nascono principalmente a causa della natura dinamica dell'interoperabilità fra peer, della mancanza di una ontologia globale condivisa, nonchè dalla necessità di distribuire il carico computazionale ai singoli nodi durante il query processing in ambiente P2P. Ciò richiede soluzioni nuove a diversi problemi, come la costruzione del consenso, la gestione dei requisiti di credibilità e di qualità, la definizione delle architetture fisiche, il query processing, l'individuazione dinamica dei servizi.
Il progetto ESTEEM intende affrontare tali problemi attraverso il progetto e l'implementazione di una piattaforma per l'emergent semantics in ambienti multi-knowledge, in cui le comunità semantiche interagiscano secondo il paradigma P2P. Nella piattaforma ESTEEM, la natura autonoma di tali comunità verrà preservata consentendo ad una semantica condivisa di ‘emergere' in modo spontaneo dalle interazioni fra peer.
I contributi chiave del progetto ESTEEM saranno i seguenti:
1. Soluzioni avanzate per la creazione guidata dal consenso di comunità semantiche di peer in ambienti P2P multi-knowledge;
2. Specifica formale di sistemi di integrazione dati P2P trust-aware, e caratterizzazione della loro semantica;
3. Algoritmi di query answering corretti e completi rispetto alla semantica del sistema;
4. Una infrastruttura P2P sotto forma di rete overlay che fornisca primitive per l'interoperabilità fra peer;
5. Metodi e tecniche basati su ontologie per l'individuazione di servizi in presenza di requisiti altamente dinamici e dipendenti dal contesto;
6. uno strato di accesso in grado di fornire strumenti per la gestione delle informazioni multicanale e su sistemi mobili.
La piattaforma ESTEEM verrà testata in un importante scenario applicativo, comprendente personale medico che deve poter condividere informazioni allo scopo di migliorare le diagnosi diminuendo gli errori. Ciò richiede l'identificazione e l'integrazione su scala mondiale di diversi peer in grado di fornire risorse informative di interesse e non note in anticipo. <<<
Coordinatore Scientifico del Programma di Ricerca
Tiziana CATARCI Università degli Studi di ROMA "La Sapienza"Obiettivo del Programma di Ricerca
L'integrazione ed il coordinamento di risorse informative eterogenee in sistemi informativi distribuiti sul web è una delle sfide cruciali allo stato attuale dell'evoluzione dell'IT. Al giorno d'oggi, qualsiasi comunità che svolga il suo lavoro tramite internet richiede un accesso coordinato e virtuale a risorse informative distribuite. Le tecniche tradizionali di integrazione dell'informazione, in cui l'interazione fra i client e le sorgenti avviene in maniera centralizzata, forniscono una soluzione parziale ai problemi che emergono in presenza di una rete di nodi informativi autonomi (peer) che devono cooperare condividendo le proprie risorse (dati, documenti, servizi). In questo scenario, l'interazione fra i peer non può essere controllata in modo centralizzato, ed il problema dell'integrazione e cooperazione fra diversi nodi deve essere affrontato con un approccio peer-to-peer (P2P).In questo contesto, la condivisione dell'informazione su base semantica, piuttosto che l'elaborazione dell'informazione o lo scambio sintattico à la XML, diviene un obiettivo primario. La semantica assume un ruolo rilevante perchè i peer che interagiscono in ambienti aperti non condividono necessariamente la stessa visione del mondo. L'assenza di una conoscenza comune porta alla necessità di definire procedure esplicite per la comprensione del significato dei dati. Da qui nasce la crescente importanza delle ontologie. Inoltre, lo scambio dati fra peer può avvenire in maniera significativa solo sulla base di accordi stabiliti dinamicamente che siano credibili nell'ambito di un determinato contesto. Questa particolare forma di interoperabilità semantica viene indicata con il nome di "emergent semantics".
Ad oggi, pochi sforzi sono stati fatti per fronteggiare i nuovi requisiti dell'emergent semantics. Le difficoltà sono principalmente dovute alla natura altamente dinamica del contesto, alla eterogeneità semantica dei peer, alla mancanza di un'ontologia globale stabilita sulla base di un accordo comune, alla necessità di ripartire la computazione fra i singoli peer nel corso dell'elaborazione delle interrogazioni e della composizione di servizi. Di conseguenza, si richiedono nuove soluzioni per diversi problemi, come la costruzione del consenso, la gestione di credibilità e qualità di dati, la definizione di infrastrutture fisiche P2P, l'elaborazione delle interrogazioni, la composizione dinamica di servizi.
L'obiettivo del progetto ESTEEM è quello di affrontare i problemi indicati attraverso una piattaforma per emergent semantics in ambienti multi-knowledge in cui comunità semantiche possano interoperare secondo il paradigma P2P. Nella piattaforma ESTEEM, la natura autonoma di tali comunità sarà preservata facendo emergere la semantica condivisa in modo spontaneo dalle interazioni fra i peer, senza richiedere l'esistenza di una base di conoscenza comune. In tale contesto, ovviamente, il raggiungimento di un consenso globale fra i diversi peer del sistema è estremamente difficile. E' dunque richiesto che i peer siano in grado di negoziare accordi locali e che sia possibile costruire accordi globali (e dunque comunità) dalla loro aggregazione.
La piattaforma ESTEEM fornirà soluzioni avanzate per la costituzione basata sul consenso di comunità semantiche di peer in sistemi P2P multi-knowledge. In particolare, saranno sviluppate tecniche di negoziazione/aggregazione che sfruttano descrizioni ontologiche della risorse, e tecniche per il matching dinamico delle ontologie. Verranno inoltre definite politiche per la condivisione e per la specifica di disponibilità di un peer a rispondere a richieste entranti, e per la condivisione di risorse messe a disposizione nell'ambito di una comunità semantica, nonchè politiche di reputazione/propagazione per la distribuzione delle richieste di risorse e per la condivisione coordinata di risorse distribuite.
Nell'ambito della piattaforma ESTEEM verranno definite misure per la valuazione del grado di consenso. Tali misure possono riferirsi alla valutazione della credibilità nei confronti di un agente che fornisce informazione e alla valutazione della qualità percepita dell'informazione ricevuta. La credibilità è tipicamente basata sul consenso fra opinioni reciproche che le persone detengono. La qualità dell'informazione dipende dalle opinioni della gente o dalle applicazioni che utilizzano l'informazione. Nel primo caso, valutare il consenso sarà una componente cruciale nel determinare la qualità dell'informazione.
Le misure di credibilità e qualità saranno prese in considerazione nel processo di elaborazione di interrogazioni. A tal fine, verranno individuate soluzioni ai seguenti problemi: i) come fornire la specifica formale di un peer in un sistema di integrazione dati con requisiti di credibilità e come stabilire le semantica di tale specifica; ii) come definire la semantica dei mapping fra peer; iii) come rispondere ad interrogazioni poste ad un peer in base alla semantica del sistema. Inoltre, verrà progettata una infrastruttura P2P sotto forma di una overlay network strutturata, allo scopo di fornire le primitive di base atte a garantire l'interoperabilità fra i peer, come l'individuazione delle risorse, la gestione dei gruppi, la comunicazione uno-a-uno e uno-a-molti.
La piattaforma ESTEEM supporterà anche ambienti distribuiti orientati ai servizi: tecniche efficaci di individuazione dei servizi in presenza di requisiti dinamici e dipendenti dal contesto sono un bisogno primario in ambienti multi-knowledge. Una infrastruttura a servizi unificata supporterà in modo flessibile l'individuazione dei servizi su base semantica, sfruttando tecniche per la descrizione semantica dei servizi, il matching basato su ontologie e tecniche flessibili di composizione.
I servizi offerti dalla piattaforma ESTEEM saranno resi disponibili in modalità multicanale. I peer appartenenti ad una comunità semantica possono dover accedere a dati e servizi in contesti diversi. E' dunque ncessario assicurare l'accesso anche attraverso dispositivi eterogenei, in differenti contesti operazionali. La piattaforma ESTEEM fornirà caratteristiche per i) la gestione dell'informazione in sistemi mobili; ii) la progettazione di basi di dati sensibili al contesto per piccoli dispositivi; iii) la sincronizzazione basata sulla semantica fra le diverse sorgenti informative ed i dispositivi.
La piattaforma ESTEEM verrà testata in un importante scenario applicativo, riguardante personale medico che deve poter condividere informazioni allo scopo di migliorare le diagnosi diminuendo gli errori. Un medico potrebbe voler ottenere tutte le informazioni rilevanti per una determinata malattia. Ciò richiede l'identificazione e l'integrazione su scala mondiale di diversi peer in grado di fornire risorse informative di interesse e non note in anticipo. E' da notare che sono attualmente in corso i primi tentativi di creare reti ospedaliere per la condivisione di dati medici, e che tali proposte presentano molte limitazioni, per lo più dovute alla natura eterogenea dei dati dal punto di vista terminologico e di formato.
La piattaforma ESTEEM mira a fornire soluzioni avanzate, che seguano il paradigma dll'emergent semantics, per l'interoperabilità e la cooperazione a livello di dati e di servizi in ambienti P2P multi-knowledge, in cui l'accesso alle risorse informative e la loro gestione possono avvenire con mezzi convenzionali e non, ad esempio dispositivi mobili. Di conseguenza la definizione e lo sviluppo della piattaforma richiede l'integrazione di competenze provenienti da diversi settori della ricerca, come integrazione di dati e schemi, definizione e matching di ontologie, P2P computing, individuazione e composizione dei servizi, accesso all'infomazione da dispositivi mobili. I partner del progetto ESTEEM hanno lavorato negli ultimi anni in questi settori, e garantiscono il know-how e le competenze necessarie per raggiungere gli obiettivi del progetto. <<<
Durata
24 mesiBase di partenza scientifica nazionale o internazionale
L'interoperabilità semantica su reti aperte è attualmente un obiettivo primario della ricerca. La semantica riveste particolare importanza, perché le informazioni ed i servizi devono essere condivisibili in ambienti aperti in cui nodi interagenti (sorgenti, siti, agenti) non fanno riferimento necessariamente ad un' unica rappresentazione del mondo. In uno scenario recentemente proposto in [Aberer et al., 2004], gli attori interagiscono in un ambiente P2P, accordandosi in modo dinamico su una interpretazione comune da adottare nel contesto di un determinato compito. Dall'unione di accordi locali nascono comunità virtuali di peer con una visione comune del mondo. Questa particolare forma di interoperabilità semantica viene detta "semantica emergente".Per realizzare tale scenario, è necessario integrare ed estendere i risultati di numerose aree di ricerca.
I sistemi P2P stanno attualmente evolvendo verso lo scambio di contenuti informativi ricchi. In questi ambienti aperti, la mancanza di un background comune implica la necessità che l'individuazione di risorse e conoscenza sia guidata in modo esplicito. Le ontologie forniscono una substrato comune a diverse aree di ricerca in cui è rilevante la semantica. In particolare, se ne è studiato l'utilizzo per la descrizione di risorse da condividere, sia in relazione al problema di individuare contenuti in sistemi P2P, sia per l'individuazione di servizi sul web. La semantica ha ultimamante richiamato l'attenzione anche nella ricerca su GRID.
Oltre all'individuazione delle risorse, fondamentale è l'integrazione dei dati provenienti da peer autonomi. La ricerca sull'integrazione dati P2P è appena agli inizi. In particolare, fornire una soluzione al problema del processamento delle query in ambiente P2P aperti appare come un compito estremamente arduo. Le ontologie hanno anche in questo contesto un ruolo rilevante, offrendo un formalismo di specifica semanticamente ricco per gli schemi delle sorgenti dati. Perchè sia possibile utilizzare le ontologie per l'individuazione e la condivisione basate sulla semantica, un passo necessario consiste nello studiare come confrontare ed integrare le ontologie stesse. La condivisione di conoscenza e servizi su reti P2P conduce alla formazione di comunità virtuali. Proposte recenti hanno analizzato tale fenomeno, che costituisce un'idea centrale nella visione della semantica emergente. Altra letteratura rilevante concerne la problematica fondamentale di gestire sicurezza e credibilità nei sistemi P2P, in relazione soprattutto al mantenimento della consistenza e della qualità dei dati. Pure rilevante è la letteratura riguardante l'accesso a reti P2P attraverso dispositivi multipli, con particolare riguardo ai limiti e alle peculiarità di dispositivi mobili come PDA e cellulari.
Infine, è essenziale considerare lo stato dell'arte sulle architetture fisiche delle reti P2P. Nel seguito, tratteggiamo uno stato dell'arte per gli argomenti menzionati.
Individuazione di risorse basata sulla semantica
La ricerca più recente su sistemi P2P punta ad un'evoluzione da reti P2P che supportano solo lo scambio di file, utilizzando come metadati i nomi dei file, a sistemi basati su metadati ricchi quali le ontologie, in grado di supportare lo scambio di contenuti strutturati, e.g. [Broekstra et al., 2003]. E' necessario sviluppare algoritmi basati su proprietà semantiche, allo scopo di migliorare i processi di individuazione delle risorse. Alcuni risultati iniziali appaiono in [Staab et al., 2004], in cui la selezione dei peer avviene sfruttando informazioni basate sulle interrogazioni a cui altri peer hanno risposto in precedenza.
In [Crespo and Garcia-Molina, 2003], insiemi di nodi semanticamente correlati costituiscono delle Semantic Overlay Networks (SON) e le richieste vengono indirizzate verso le SONs opportune. In [Haase et al., 2004], i peer pubblicizzano le loro competenze sulla rete. Un peer può selezionare i peer appropriati a cui inviare una richiesta valutando tramite un'ontologia comune la correlazione semantica tra la richiesta e l'expertise degli atri peer. Gli algoritmi di propagazione delle interrogazioni al momento si basano essenzialmente su osservazioni statistiche e sfruttano, in alcuni casi, un'ontologia condivisa, spesso niente più che una tassonomia. E' necessario sviluppare tecniche per contesti aperti, in cui sono presenti varie ontologie.
Meccanismi basati su ontologie sono anche alla base di molte proposte relative alla individuazione di servizi web. La maggior parte degli approcci correnti adottano tecniche tradizionali basate su parole chiave supportate dal meccanismo UDDI. Gli approcci basati su ontologie costituiscono un passo in avanti verso l'individuazione di servizi su base semantica, offrendo il vantaggio di una specifica formale e di capacità inferenziali. In [Patil et al., 2004] viene proposto un framework per l'annotazione semi-automatica di file WSDL con ontologie di dominio. In [Brogi et al., 2004] viene proposta una tecnica che permette di effettuare il matchmaking in modo flessibile sfruttando ontologie DAML-S. In [Keller et al., 2004] una Web Service Modeling Ontology (WSMO), espressa tramite il linguaggio formale F-Logic, descrive vari aspetti relativi a Semantic Web Services. Horrocks et al. [Horrocks and Li, 2003] usano OWL-S e le capacità inferenziali di un ragionatore DL per stabilire il grado di corrispondenza fra annunci e richieste. [Bernstein and Klein, 2004] propongono ontologie di processi per descrivere il comportamento di servizi e effettuano le interrogazioni tramite un Process Query Language (PQL).
Grid
Attualmente, la Grid è una tecnologia promettente per la condivisione di risorse e il problem solving in organizzazioni virtuali dinamiche e multi-istituzionali. E' stata messa in luce la necessità di tenere in considerazione la semantica anche in contesti di tipo Grid e proposte per integrare Grid computing e Semantic Web in vista di un Semantic Grid (e.g. [De Roure et al., 2005], [Calvanese et al., 2004b]) sono attualmente in corso di sviluppo.
La Open Grid Services Architecture (OGSA) rappresenta lo strato fondamentale per sviluppare ambienti operativi integrati e virtualizzati (i.e. "On Demand") di IBM.
Comunità virtuali di peers
L'idea di supportare comunità di peers attraverso un approccio basato sulla semantica è in uno stadio iniziale della ricerca, e poche proposte sono finora apparse nella letteratura. Ad esempio, in [Bonifacio et al., 2003] gli autori presentano un' architettura P2P per supportare federazioni di peer in cui la condivisione della conoscenza è basata su di un modello sociale di collaborazione. I singoli peer e le federazioni organizzano la conoscenza da una prospettiva individuale o di comunità, gestendo differenti interpretazioni attraverso un algoritmo di match semantico.
Matching di ontologie
L'obiettivo generale delle tecniche di matching di ontologie consiste nel confrontare diverse descrizioni ontologiche per trovare concetti che abbiano una affinità semantica. Una panoramica su tali tecniche è proposta in [Shvaiko, 2004], in cui esse vengono classificate in approcci formali ed approcci basati su euristiche.
I primi sono fondati su modelli semantici teorici e tecniche di corrispondenza automatica, come in [Giunchiglia and Shvaiko, 2004], mentre i secondi si basano sulla ricerca di corrispondenze fra grafi attraverso tecniche di analisi, matching e apprendimento [Doan et al., 2003]. Tecniche dinamiche di matching di ontologie e di instradamento delle interrogazioni sono state sviluppate nel sistema HELIOS P2P [Castano et al., 2003, Castano et al. 2003b, Castano et al., 2004]. In [Castano et al., 2003b], vengono proposte tecniche euristiche per il matching dinamico di ontologie. L'algoritmo proposto viene configurato dinamicamente con il modello di matching più appropriato per il caso specifico, prendendo in considerazione ai fini della valutazione del grado di matching la ricchezza della descrizione ontologica della conoscenza. Un'architettura collaborativa basata su servizi per tecniche dinamiche di individuazione della conoscenza e interoperabilità semantica in reti P2P aperte è poi descritta in [Castano et al., 2005].
Integrazione Dati
L'integrazione dati ha come obiettivo quello di fornire accesso unificato ad un insieme di sorgenti dati eterogenee. La ricerca in tale campo si è concentrata soprattutto su approcci dichiarativi [Lenzerini, 2002], in cui il sistema di integrazione esporta una vista globale riconciliata dei dati (chiamata schema globale), sulla quale le vengono formulate le interrogazioni, e mantiene un mapping fra lo schema globale ed i dati delle sorgenti [Lenzerini, 2002]. Tra i vari problemi relativi all'integrazione dati, quello che ha ricevuto maggiore attenzione è il problema di rispondere ad interrogazioni sullo schema globale[Cali' et al., 2004, Calvanese et al., 2001].
L'uso delle ontologie ha assunto negli ultimi anni un'importanza crescente nell'ambito dell'integrazione dati, ma la ricerca è ancora in una fase preliminare. La maggior parte delle proposte riguarda la costruzione di una ontologia globale integrata sulla base delle ontologie locali delle sorgenti [Doan et al., 2004], mentre la gestione delle interrogazioni su una ontologia integrata richiede ulteriori ricerche.
La problematica dell'integrazione dati in sistemi P2P è stata affrontata solo di recente [Halevy et al., 2003]. In un sistema P2P, sorgenti dati autonome vengono messe in relazione attraverso dei mapping. Non esiste alcuna ontologia globale attraverso cui assegnare una semantica ai dati.
Approcci iniziali sfruttano corpus di termini predefiniti che forniscono un contesto iniziale per la definizione di nuovi concetti [Mc Cool and Guha, 2003], oppure partono da mapping locali e ne estendono incrementalmente la validità facendo uso di gossiping [Aberer et al., 2003].
Nonostante una formalizzazione iniziale (vedi [Catarci and Lenzerini, 1993; Halevy et al., 2003] per una caratterizzazione in logica del primo ordine e [Calvanese et al., 2004] per una semantica alternativa), non è stata ancora raggiunta una piena comprensione delle problematiche di base dell'integrazione dati in sistemi P2P. Alcune proposte [Halevy et al., 2003; Fagin et al., 2003] introducono restrizioni non realistiche sulla topologia complessiva dei mapping P2P. Il problema attende ancora un'appropriata caratterizzazione per sistemi P2P "reali", in cui i mapping possono avere una struttura arbitraria, che potenzialmente comprende dei cicli.
Sicurezza, Credibilità e Qualità dei Dati
Un requisito fondamentale nella condivisione di risorse P2P riguarda la sicurezza e credibilità, per garantire che un peer conservi il controllo sui propri contenuti e le proprie risorse di calcolo, pur consentendo ad altri peers di accedervi secondo opportuni termini e condizioni. Oltre ai meccanismi convenzionali per la sicurezza delle reti, che forniscono autenticazione e crittografia, devono essere considerate politiche di condivisione appropriate. I sistemi P2P attuali raramente affrontano tali problemi.
Sono stati sviluppati formalismi di specifica di politiche basati su XML e tecniche per il controllo dell'accesso a documenti Web (e.g.[Castano and Ferrari, 2003; Bertino et al., 2001]). Modelli di supporto allo scambio di informazioni su credibilità/reputazione in sistemi basati su peer sono trattati in [Aberer and Despotovic, 2001]. Alcune proposte relative ad ambienti GRID sono in corso di sviluppo, ma ancora ad uno stadio iniziale [Sundaram and Chapman, 2002].
E' necessario sviluppare linguaggi basati su ontologie per la specifica dichiarativa di politiche di condivisione applicabili a risorse multiple.
La consistenza e la qualità dell'informazione rivestono un ruolo importante nel contesto dell'integrazione dati. L'integrazione dati in presenza di dati inconsistenti è stata affrontata attraverso metodi formali, ad esempio in [Calvanese et al., 2001]. La metodologia proposta all'interno del progetto Europeo DWQ (Foundations of Datawarehouse Quality) [Jarke et al., 2000; Calvanese et al., 2001] si basa sulla specifica dichiarativa di corrispondenze di riconciliazione tra dati in sorgenti diverse. Recentemente, sono stati proposti sistemi di integrazione dati che trattano conflitti a livello delle instanze [Scannapieco et al., 2004; Sattler et al., 2003]. Semantiche per la correzione di dati inconsistenti sono state proposte in [Bravo and Bertossi, 2003; Cali' et al., 2003].
Recentemente, sono stati proposti meccanismi per garantire la credibilità basati sulla qualità delle sorgenti così come percepita dai clienti. Vari lavori hanno analizzato meccanismi per raggiungere il consenso sulla credibilità, prendendo in considerazione la reputazione delle parti [Marti and Garcia-Molina, 2004]. La qualità dell'informazione è spesso legata al giudizio di chi la utilizza. Il calcolo del consenso è una componente cruciale nel determinare la qualità dei dati [De Santis et al., 2003]. L'informazione sulla provenienza [Ehrig et al., 2003] consente di correlare i dati alla sorgente che li ha originati, e dunque di valutarne la credibilità.
Accesso Multicanale
In uno scenario di integrazione dati P2P come quello sopra descritto, le caratteristiche tecnologiche dei peers in termini di risorse (spesso limitate quando si considerano capacità di memorizzazione, durata delle batterie, capacità computazionale, ecc.) e modalità di accesso influiscono significativamente sulle politiche sia di selezione dei dati da memorizzare localmente che di accesso ai dati. Sistemi costituiti sia da sorgenti informative eterogenee fisse che dispositivi mobili permettono oggi l'accesso a informazioni complesse. Dispositivi mobili e accesso multicanale ricevono crescente attenzione, dovuta anche all'incremento di prestazioni di dispositivi come i telefoni cellulari, i PDA e notebooks. In tale ambito è fondamentale il concetto di "contesto", principalmente associato al concetto di locazione, ma in realtà molto più articolato [Schmidt et al., 1999]. Alcuni lavori hanno identificato diverse categorie di contesto, come contesto computazionale, utente, fisico e temporale (e.g. [Harter et al., 2002]). Nell'area dei sistemi informativi e basi di dati, tuttavia, il ruolo del contesto è rimasto prevalentemente inesplorato sino ad oggi [Bolchini et. al, 2004; Celentano et al. 2004]. In [Bolchini et. al, 2004b] viene proposto un prototipo "light" di dbms relazionale per dispositivi mobili, che sfrutta politiche innovative di accesso e memorizzazione dati per ottimizzare le prestazioni e minimizzare il consumo energetico.
Implementazione Fisica
Per quanto riguarda gli aspetti legati all'implementazione fisica di reti P2P, la recente crescita di applicazioni P2P su Internet ha motivato l'interesse verso general purpose P2P overlay networks. Una delle sfide per la ricerca futura riguarda come supportare applicazioni complesse [Baldoni et al., 2004; 2005] senza sovraccaricare le risorse di rete e mantenendo una buona scalabilità. Sono state identificate due architetture che offrono tali funzionalità.
I sistemi strutturati sfruttano topologia e dislocazione delle risorse specifiche, fornendo primitive efficienti per l'individuazione delle risorse. Attualmente, l'interesse si è focalizzato su sistemi fortemente strutturati, in cui sia la topologia che le risorse sono estremamente organizzate, ed in modo specifico su sistemi che implementano distributed hash tables (DHTs) (e.g. [Stoica et al., 2001]).
Nei sistemi non strutturati la topologia di rete è casuale o costruita seguendo regole non rigide. La dislocazione delle risorse non è controllata. Tali sistemi gestiscono bene l'entrata e l'uscita di nodi dal sistema, ma rendono più costosa l'individuazione delle risorse, conseguita spesso tramite algoritmi basati su flooding o tecniche di random walk (e.g.[Gkantsidis et al., 2004]). <<<



