Vai al contenuto| Home page|

   Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricerca»Unità di ricerca
INIZIO_TESTO_DA_INDICIZZARE

UNITA' DI RICERCA

italiano - english
Bibliografia
[1] R. Alur, C. Belta, F. Ivancic, V. Kumar, M. Mintz, G. H. Pappas, H. Rubin, and J. Shug. Hybrid Modeling of
Biomolecular Networks. In Proceedings of the 4th International Workshop on Hybrid Systems: Computation and Control,
number 2034 in Lecture Notes in Computer Science, 2001.

[2] R. Alur, C. Courcoubetis, N. Halbwachs, T. A. Henzinger, P. H. Ho, X. Nicollin, A. Olivero, J. Sifakis, and S.
Yovine. The Algorithmic Analysis of Hybrid Systems. Theoretical Computer Science, 138:3–34, 1995.

[3] R. Alur, R. Grosu, Y. Hur, V. Kumar, and I. Lee. Modular Specification of Hybrid Systems in charon. In Proceedings
of the 3rd International Workshop on Hybrid Systems: Computation and Control, 2000.

[4] M. Antoniotti, A. Ferrari, A. Sangiovanni-Vincentelli, and E. Sentovich. Embedded System Design Specification:
Merging Reactive Control and Data Computations. In Proceedings of the 40th IEEE Conference on Decision and Control.
IEEE, December 2001.

[5] M. Antoniotti and A. Gollu. SHIFT and SMART-AHS: A Language for Hybrid Systems Engineering, Modeling, and
Simulation. In Conference on Domain Specific Languages, Santa Barbara, CA, U.S.A., October 1997. USENIX.

[6] M. Antoniotti, B. Mishra, C. Piazza, A. Policriti, and M. Simeoni. Modeling Cellular Behavior with Hybrid Automata:
Collapsing and Bisimulation. In Proceedings of the International Workshop on Computational Methods in System Biology
(CMSB 2003), February 2003.

[7] BioSpice site. http://www.biospice.org, 2001.

[8] A. Cimatti, E. Clarke, F. Giunchiglia, and M. Roveri. Nusmv: a New Symbolic Model Checker. STTT International
Journal on Software Tools for Technology Transfer, 2:410–425, 2000.

[9] E. M. Clarke, O. Grunberg, and D. A. Peled. Model Checking. MIT Press, 1999.

[10] E. M. Clarke, D. E. Long, and K. L. McMillan. Compositional Model Checking. Technical Report CMUCS- 89-145, School
of Computer Science, Carnegie Mellon University, April 1989.

[11] C. Daws, A. Olivero, S. Tripakis, and S. Yovine. The Tool kronos. In Hybrid Systems III, Verification and Control,
volume 1066 of Lecture Notes in Computer Science, pages 208–219. Springer-Verlag, 1996.

[12] D.L. Dill. Trace Theory for Automatic Hierarchical Verification of Speed-independent Circuits. MIT Press, 1989.

[13] E. A. Emerson. Temporal and Modal Logic. In J. van Leeuwen, editor, Handbook of Theoretical Computer Science,
volume B, chapter 16, pages 995–1072. MIT Press, 1990.

[14] F. Eska., D. Khorramabadi, and P. Varaiya. An Automated Highway System Simulator. Transportation Research Journal,
part C, 3(1), 1995.

[15] D. T. Gillespie. A General Method for Numerically Simulating the Stochastic Time Evolution of Coupled Chemical
Reactions. Journal of Computational Physics, 22:403–434, 1976.

[16] D. T. Gillespie. Exact Stochastic Simulation of Coupled Chemical Reactions. Journal of Physical Chemistry, pages
2340–2361, 1977.

[17] D. T. Gillespie. A rigorous derivation of the chemical master equation. Physica A, 188:404–425, 1992.

[18] T. Henzinger, P. W. Kopke, A. Puri, and P. Varaiya. What’s Decidable about Hybrid Automata. In Symposium on the
Theory of Computing (STOC), pages 373–382, 1995.

[19] T. A. Henzinger, P.-H. Ho, and H. Wong-Toi. Hytech: A Model Checker for Hybrid Systems. In Software Tools for
Technology Transfer, volume 1, pages 110–122. Springer-Verlag, 1997.

[20] P. Karp. BioCyc site. http://www.biocyc.org, 2003.

[21] P. D. Karp, M. Riley, S. Paley, and A. Pellegrini-Toole. The MetaCyc Database. Nucleic Acid Research, 30(1):59,
2002.

[22] P. D. Karp, M. Riley, M. Saier, and S. Paley A. Pellegrini-Toole. The EcoCyc Database. Nucleic Acids Research,
30(1):56, 2002.

[23] Kegg database. http://www.genome.ad.jp/kegg/.

[24] R. Kurshan. Computer-Aided Veri.cation of Coordinating Processes. Princeton University Press, 1994.

[25] G. Laferiere, G. J. Pappas, and S. Yovine. A New Class of Decidable Hybrid Systems. In Proceedings of the 2nd
International Workshop on Hybrid Systems: Computation and Control, volume 1569 of Lecture Notes in Computer Science,
pages 137–151. Springer-Verlag, 1999.

[26] K. L. McMillan. Symbolic Model Checking. Kluwer Academic Publishers, 1993.

[27] P. Mendes. GEPASI: A Software Package for Modelling the Dynamics, Steady States and Control of Biochemical and
Other Systems. Comput. Applic. Biosci., 9:563–571, 1993.

[28] P. Mendes. GEPASI site. http://gepasi.dbs.aber.ac.uk/softw/gepasi.html, 2002.

[29] B. Mishra and E. M. Clarke. Hierarchical Veri.cation of Asynchronous Circuits Using Temporal Logic. Theoretical
Computer Science, 38:269–291, 1985.

[30] National Center for Genome Resources. Pathdb database. http://www.ncgr.org/pathdb/.

[31] S. Owre, J. Rushby, N. Shankar, and F. von Henke. Formal Veri.cation of Fault-Tolerant Architectures: Prolegomena
to the Design of PVS. IEEE Transaction on Software Engineering, 21(2):107–125, 1995.

[32] G. J. Pappas, G. Laferiere, and S. Shastry. Hierarchically Consistent Control Systems. IEEE Transactions on
Automatic Control, 45(6):1144–1160, June 2000.

[33] M. A. Savageau. Biochemical System Analysis: A Study of Function and Design in Molecular Biology. Addison-Wesley,
1976.

[34] System Biology Markup Language. http://www.smb-sbml.org/sbml/docs/index.html, 2002.

[35] System Biology Workbench. http://www.sbw-sbml.org, 2002.

[36] J. Schaff, C. C. Fink, B. Slepchenkop, J. H. Carson, and L. M. Loew. A General Computational Framework for
Modeling Cellular Structure and Function. Biophysical Journal, 73:1135–1146, 1997.

[37] SyMP site. http://www.cs.cmu.edu/~modelcheck/symp/.

[38] M. Tomita. Whole-cell Simulation: a Grand Challenge for the 21st Century. Trends in Biotechnology, 19(6):205–210,
2001.

[39] M. Tomita, K. Hashimoto, K. Takahashi, T. Shimizu, Y. Matsuzaki, F. Miyoshi, K. Saito, K. Yugi, J. C. Venter, and
C. Hutchison. E-CELL: Software Environment for Whole-cell Simulation. Bioinformatics, 15(1):72–84, 1999.

[40] J. J. Tyson, K. Chen, and B. Novak. Network dynamics and cell physiology. Nature Reviews, 2:908–916, 2001.

[41] J. J. Tyson and B. Novak. Regulation of the Eukaryotic Cell Cycle: Molecular Antagonism, Hysteresis, and
Irreversible Transitions. Journal of Theoretical Biology, 210:249–263, 2001.

[42] P. Varaiya. Smart Cars on Smart Roads: Problems of Control. IEEE Transactions on Automatic Control, 38(2):195–207,
February 1993.

[43] E. O. Voit. Canonical Nonlinear Modeling, S-system Approach to Understanding Complexity. Van Nostrand Reinhold,
New York, 1991.

[44] E. O. Voit. Computational Analysis of Biochemical Systems A Practical Guide for Biochemists and Molecular
Biologists. Cambridge University Press, 2000.

[45] WIT database. Web site at http://wit.mcs.anl.gov/WIT2/.

[46] M. Antoniotti, A. Policriti, N. Ugel, and B. Mishra. Model building and model checking for biochemical processes.
Cell Biochemistry and Biophysics, 38(3):271–286, 2003.

[47] M. Antoniotti, B. Mishra, F. Park, A. Policriti, and N. Ugel. Foundations of a query and simulation system for the
modeling of biochemical and biological processes. In R.B. Altman, A.K. Dunker, L. Hunter, T.A. Jung, and T.E. Klein,
editors, The Pacific Symposium on Biocomputing (PSB 2003), pages 116–127. World Scientific, January 2003.

Programma di ricerca

Systems Biology: modellazione, linguaggi e analisi (Sybilla)
Università di riferimento
Università degli Studi di UDINE - MATEMATICA E INFORMATICA - UDINE(UD)
Responsabile dell'Unità di ricerca
Alberto POLICRITI
Descrizione
La teoria dei processi biochimici cerca di creare un contesto unificante in cui ragionare sui percorsi biochimici e sui processi evolutivi che li hanno plasmati. Ci sono molte componenti interrelate. Queste includono modelli derivati dalla cinetica massa-azione che si focalizza sulle concentrazioni di sostanze chimiche; modelli derivati da eventi discreti come la specializzazione, la differenziazione e l'auto-rinnovamento; modelli derivati dai segnali cellulari; modelli derivati da grandi popolazioni cellulari; e modelli che considerano la compartimentazione cellulare ed il trasporto attraverso membrane e tra compartimenti. Le richieste che questi modelli impongono sulla tecnologia dell'informazione vanno ben al di la' dell'area biologica; questa unita' indirizzera' varie questioni correlate con aspetti numerici, probabilistici, logici e simbolici della computazione e, in particolare, come essi possono essere implementati sulle moderne architetture computazionali. Intendiamo principalmente considerare le seguenti aree di ricerca che sono tra loro strettamente correlate. (a) Modelli: Automi, Logiche Temporali e Tecniche di Riduzione. Sebbene i processi biochimici possano essere rappresentati in forma compatta come sistemi di ODE (Ordinary Differential Equations) o SDE (Stochastic Differential Equations), tali rappresentazioni sono piuttosto inadatte ed inefficienti per ragionare. Approcci tradizionali basati sull'integrazione numerica e la simulazione, falliscono rapidamente l'obiettivo di fornire le intuizioni rilevanti anche per sistemi ragionevolmente complessi. Pensiamo che gli automi (sia discreti che ibridi) possano modellare praticamente ed elegantemente tutti i meccanismi di controllo biologico, ci permettano di ragionare su tali meccanismi in sistemi di Logica Temporale, e possano diventare il contesto fondazionale per il campo emergente della system biology. Tali modelli, grazie all'applicazione di gia' note tecniche di riduzione, consentono un'analisi piu' rigorosa di grosse quantita' di dati biologici, prodotti come tracce (numeriche) di esperimenti in vivo, in vitro e in silico -- attualmente attivita' centrale di molti biologi e biochimici. (b) Ragionamento ed Estrapolazione: Tecniche di Computazione Simbolica. La rappresentazione ed il processo di riduzione di automi forniscono rappresentazioni efficienti, ma gli algoritmi di ragionamento su questi modelli possono essere inefficienti e male adattabili al crescere delle dimensioni. Algoritmi basati sulla manipolazione simbolica di formule possono garantire significativi miglioramenti nella complessita' computazionale. Inoltre, le tecniche di manipolazione simbolica, sotto opportuni vincoli, permettono di costruire una rappresentazione contenente piu' informazioni di una simulazione puramente numerica del sistema, e suggeriscono intervalli di variazione per i parametri del modello e punti critici per lo spazio degli stati. MODELLI: AUTOMI, LOGICHE TEMPORALI E TECNICHE DI RIDUZIONE Intendiamo disegnare uno strumento capace di usare sia dati utili per una modellazione matematica "classica" che, quando disponibili, informazioni sui meccanismi di controllo soggiacenti al sistema. In altre parole, intendiamo combinare le due, in qualche modo, separate tradizioni in una singola cornice, deducendo la struttura dell'automa da (1) dati sperimentali e (2) traiettorie derivate da modelli matematici. Per questo obiettivo, abbiamo bisogno di descrivere la semantica di un sistema usando un automa che catturi le caratteristiche qualitative del sistema biologico. Una via possibile, parzialmente analizzata in [37,46,47], per costruire l'automa e' la seguente: istantanee delle variabili di sistema costituiscono l'insieme dei possibili stati dell'automa. Le transizioni sono dedotte dalla evoluzione delle tracce delle variabili di sistema. Gli stati finali sono quegli stati in cui la simulazione raggiunge una fine riconoscibile e si suppone siano punti di equilibrio per il percorso metabolico oggetto di studio. Gli automi possono essere arricchiti con etichette su nodi e/o archi che permettono di mantenere informazioni relative alle proprieta' dei nodi e di imporre condizioni sulle azioni rappresentate dagli archi. Intendiamo analizzare quali automi meglio si prestino a rappresentare diversi sistemi biologici (automi standard, con etichette su nodi/archi, automi ibridi). Testare se il sistema biologico modellato attraverso un automa soddisfi o meno una data proprieta' P e' equivalente a testare se l'automa soddisfa la formula della logica temporale che codifica P. Un esempio semplice e naturale di proprieta' logica di molti sistemi biologici e' la nozione di "steady state", il sistema resta "fisso" al passare del tempo. Un'altra proprieta' naturale riguarda la limitatezza delle concentrazioni di reagenti coinvolti in processi biologici e puo' essere necessario accertarla come precondizione ad altre proprieta' quali l'esistenza di un ciclo limite, soluzioni a stabilita' multipla, meta-stabilita', o isteresi. Usando una logica temporale proposizionale e basandosi sulle nozioni di model-checking si puo' analizzare una o piu' tracce dell'automa, dove la singola traccia e' creata da un singolo "set-up" (e.g. condizioni iniziali, un insieme di valori per i parametri, un insieme di segnali di eventi, ecc.) del sistema oggetto di analisi. Basilare e' il fatto che la logica temporale permetta di specificare chiaramente il significato di termini tempo-dipendenti del linguaggio naturale, quali "prima o poi" e "sempre", in relazione al comportamento astratto del sistema in discorso. Come esempio, si consideri la seguente frase: "La concentrazione di guanosine triphosphate (GTP) e' uguale ad X". Dato un sistema biologico in equilibrio, la frase precedente puo' essere vera in alcuni o nessuno degli istanti temporali. In particolare, possiamo facilmente costruire enunciati (in un opportuno linguaggio naturale) che esprimono il fatto che, dato un certo insieme di condizioni iniziali, l'enunciato di cui sopra sara' vero "eventually". La logica temporale formalizza precisamente il significato del termine "eventually" (e quello di altri "modi": "always", "infinitely often" e "almost always"), e la semantica risultante conduce ad un algoritmo di model-checking per determinare la validita' di enunciati di logica temporale nel contesto dei nostri automi (si veda [37,46,47]). Logiche temporali opportunamente arricchite permettono anche di analizzare proprieta' dinamiche dei processi biologici e di "riunire" componenti diverse del sistema che possono essere co-regolate o anti-regolate. Intendiamo analizzare quali logiche temporali meglio si adattino a studiare proprieta' biologiche interessanti e sviluppare relativamente a tali logiche ed agli automi utilizzati per la modellazione algoritmi efficienti di model checking. Un punto focale nella nostra ricerca e' la questione di tenere sotto controllo la complessita' degli automi mediante "collassi" simbolici, e rappresentazione modulare dei modelli. Cio' permette lo studio parallelo di molte evoluzioni ed esperimenti che differiscono per costanti di proporzionalita' dei cambiamenti e di ordini cinetici (in una singola struttura). Nei casi pratici, gli automi costruiti a partire dalle tracce hanno un numero di stati enorme. Abbiamo esplorato due tecniche per ridurre il numero degli stati di automa, cioe' la proiezione ed il collasso (si veda [37,46,47]). Per evitare approssimazioni dei risultati dovuti all'uso di collasso e proiezione, e per ottenere un metodo piu' potente e flessibile, e' stato introdotto in [6] l'uso di automi ibridi insieme con una riformulazione della proiezione e del collasso. Intendiamo analizzare l'utilizzo di altre tecniche di riduzione dei modelli derivanti dal model checking (per esempio bisimulazioni) che devono essere opportunamente adattate dipendentemente dalla logica temporale di interrogazione. La simulazione, numerica o simbolica, gioca un ruolo chiave in ogni aspetto di questo progetto. Tradizionalmente, la simulazione numerica con la successione di passi di un integratore, o la simulazione stocastica con una sequenza di eventi reagenti, hanno costituito il motore computazionale di base per rispondere a molte questioni scientifiche relative a come predire un risultato osservando un modello di sistema in evoluzione. Ci sono molte trappole inerenti a questi approcci: la violazione delle leggi di conservazione causata dagli errori numerici, l'instabilita' numerica introdotta da riduzioni di modello inappropriate, la perdita di fedelta' o di efficienza nel simulare un modello che prevede molte scale temporali diverse, ecc.. Possiamo alleviare questi problemi essenzialmente facendo uso di una "aritmetica esatta" disponibile tramite la simulazione simbolica e introducendo vincoli ed invarianti. Tuttavia, c'e' un punto in cui la simulazione riemerge come una componente critica del nostro contesto: cioe', nel tentativo di spiegare una ipotesi falsificata mediante la simulazione di controesempi. Data la natura ed il potenziale del nostro sistema, ogni specifico enunciato logico temporale viene verificato a livelli di astrazione multipli in automi ibridi molto distanti dal modello fisico di base (e.g. quello piu' prossimo al livello delle interazioni molecolari o cellulari). Quindi, se un enunciato specifico e' determinato essere falso in uno dei nostri modelli, deve essere spiegato mediante un controesempio nel nostro caso una traccia di eventi rappresentanti le interazioni. Una simulazione di tal guisa deve essere consistente con i livelli piu' alti di astrazione e le scelte dei parametri ad ogni livello di astrazione, e puo' coinvolgere molti orologi ognuno dei quali avanza ad un ritmo diverso. Quindi, avremo bisogno di sviluppare strumenti di simulazione di base che usino tecniche numeriche, multi-scala, event-driven, "tau-leaping" e astraibili mentre, allo stesso tempo, saranno vincolati da invarianti e astrazioni multiple. Riassumendo le questioni che intendiamo esplorare sono: - Sistemi di interrogazione: se un biologo vuol ragionare su un sistema mediante interrogazioni logiche formulate in un opportuno query language (e.g. la logica temporale), quali sono i migliori query languages? Quali sono i migliori algoritmi che siano in grado di avvantaggiarsi delle strutture simboliche? Quali sono le strade corrette per risolvere i problemi associati con (a) equivalenza di modello, (b) analisi sperimentale e (c) analisi di raggiungibilita'? - Sistemi ibridi: certe interazioni sono puramente discrete e dopo una tale interazione la dinamica del sistema puo' cambiare. Per un modello ibrido di questo tipo l'automa soggiacente deve essere modificato per un tale "mode". Questi rafforzamenti espressivi come modificano il modello di base? - Spazio degli stati (Spazio prodotto): l'interazione di un gruppo di cellule puo' essere modellata mediante il prodotto di automi. Oltre al classico problema dell'esplosione esponenziale degli stati, dobbiamo anche stare attenti alla struttura delle variabili correlata con (a) divisione cellulare, (b) apoptosi e (c) differenziazione. RAGIONAMENTO ED ESTRAPOLAZIONE: TECNICHE DI COMPUTAZIONE SIMBOLICA Gli automi ibridi sopra menzionati approssimano complicati sistemi biochimici non lineari in termini di un modello che e' in parte discreto ed in parte continuo. Quando il sistema e' in un particolare stato discreto (spesso definito "control mode"), evolve nel suo stato continuo descritto mediante un sistema dinamico. Le transizioni (spesso chiamate "control switches") dell'automa discreto hanno luogo (magari probabilisticamente) quando lo stato continuo del sistema soddisfa certe condizioni di guardia. Cosi' come si ragiona nel contesto di sistemi ingegnerizzati in modo complesso (sistemi di controllo, sistemi digitali, protocolli di comunicazione, ecc.), nelle applicazioni relative alla biologia abbiamo anche bisogno di risolvere "safety", raggiungibilita', "liveness" e altre interrogazioni complicate coinvolgenti quantificazioni di ordine superiore. Molte forme di enunciati in logica temporale possono essere usate per esprimere interrogazioni di questo tipo ma queste possono non produrre soluzioni algoritmicamente efficienti. Intendiamo investigare approcci "algorithmic algebraic" che si generalizzano anche ad una piu' ampia classe di sistemi (cf. [13, 18, 25]), e che si collegano a molti problemi matematici irrisolti ed interessanti. Inizieremo studiando una metodologia per risolvere il problema del model checking per logiche temporali in automi ibridi in cui gli insiemi e le relazioni rilevanti sono semi-algebrici. L'approccio generalizza ad altre logiche temporali e versioni di logiche dinamiche. Dato un modello ibrido M e una formula p nella logica di nostra scelta, cerchiamo di computare una relazione di derivabilita' che corrisponde a "p e' vera in M a partire da X e all'istante t", dove X e' uno stato continuo che denota lo stato di partenza e t e' la variabile temporale. La maggior parte dei problemi qui sono di natura matematica e tecnica. Crediamo che ci siano una quantita' di tecniche recentemente sviluppate dalla comunita' della computazione simbolica che possono essere utilizzate in questo contesto. L'obiettivo principale della nostra ricerca rimane comunque la creazione di una chiara, generale, unificante, "model-based", sistematica e rigorosa metodologia, che tenga aperta la strada per modelli di grossa scala, complessi e spazio-temporali. Alcuni dei problemi sono: (1) La creazione di una metodologia unificante che sussuma precedenti tecniche simboliche basate su OBDD o piu' recenti tecniche SAT-based. Queste generalizzazioni naturali richiedono la codifica semialgebrica di transizioni ed il successivo collegamento con il Positivestellensatz. (2) La generalizzazione di automi ibridi oltre i lineari e rettangolari sui quali si possa ragionare efficientemente. (3) La costruzione di algoritmi piu' efficienti che possano usare tecniche randomizzate o probabilistiche (permettendo risposte "non so"). Intendiamo inoltre studiare l'applicazione di tecniche simboliche analoghe a quelle sopra menzionate, per il problema di predizione del folding di una proteina. Per tale problema non esistono allo stato attuale algoritmi con approssimazione ed efficienza soddisfacente. Si desidera studiare la modellizzazione del processo di folding di una proteina. Saranno studiati sia modelli discreti (a reticolo) che continui e con diverso livello di granularità (aminoacido/atomico). Saranno descritti simulatori codificati in linguaggi concorrenti e in automi ibridi. Saranno combinati con risultati dello studio del problema basati su minimizzazione di funzioni in programmazione con vincoli. L'obiettivo che ci si pone è riuscire a predire mediante simulazione e analisi di proprietà di linguaggi formali i vari segmenti di struttura secondaria di una proteina. In un secondo tempo, sia mediante simulazione che programmazione con vincoli predire la struttura nativa (ed il processo di folding) per proteine di lunghezza vicina ai 100 aminoacidi.