Contenuto
Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricerca»Unità di ricercaINIZIO_TESTO_DA_INDICIZZARE
UNITA' DI RICERCA
italiano
Bibliografia
Bibliografia generale: strumenti di ricerca informatica per la letteratura- G. Gigliozzi, Il testo e il computer. Manuale di informatica per gli studi letterari, Milano, Bruno Mondadori, 1997;
- I formati della memoria. Beni culturali e nuove tecnologie alle soglie del terzo millennio, a cura di P. Galluzzi e A. Valentino, Firenze, Giunti, 1997;
G.P. Landow, L’ipertesto. Tecnologie digitali e critica letteraria, a cura di P. Ferri, Milano, Bruno Mondadori, 1998;
- Linguistica e informatica. Corpora, Multimedialità e percorsi di apprendimento, a cura di R. Rossini Favretti, Roma, Bulzoni, 2000;
- Il documento immateriale. Ricerca storica e nuovi linguaggi, a cura di G. Abbatista e A. Zorzi, in «L’Indice», 5 (2000), pp. I-XII;
- G. Savoca, Lessicografia letteraria e metodo concordanziale, Firenze, Olschki, 2000;
- M. Biffi, DBT 2000. Manuale d’uso (il manuale, in formato elettronico, è contenuto nel CD-ROM del programma DBT 2000);
- P. Stoppelli, Letteratura e informatica, in Il Novecento: scenari di fine secolo, a cura di Nino Borsellino e Lucio Felici, Milano, Garzanti, 2001, vol. I, pp. 811-835
- S. Spina, Fare i conti con le parole. Introduzione alla linguistica dei corpora, Perugia, Guerra, 2001;
- New Media and the Humanities: Research and Applications, edited by D. Fiormonte and Jonathan Usher, Proceedings of the first seminar Computers, Literature and Philology, Edinburgh, 7-9 September 1998, Oxford, Humanities Computing Unit of University of Oxford, 2001;
- Il controllo terminologico delle risorse elettroniche in rete: tavola rotonda, Firenze 27 gennaio 2000, a cura di P. Capitani, Firenze, FUP, 2001;
- R. H. Baayen, Word Frequency Distributions, Kluwer Academic Publishers, Dordrecht, 2001;
- L.M. Reale, Guida a internet per italianisti, Perugia, Guerra, 2001 (cfr. la versione ondine aggiornata e ampliata http://win.italianisticaonline.it/inRete);
- F. Metitieri - R. Ridi, Biblioteche in Rete. Istruzioni per l’uso, Roma, Laterza, 2002;
- Guidelines for Text Encoding and Interchange, Sperberg-McQueen C. M., Burnard L. (eds), Published for the TEI Consortium by the Humanities Computing Unit, University of Oxford, 2002;
- Informatica per le scienze umanistiche, a cura di T. Numerico e A. Vespignani, Bologna, Il Mulino, 2003;
- D. Fioromonte, Scrittura e filologia nell’era digitale, Torino, Boringhieri, 2003;
- Treebanks. Building an Using Parsed Corpora, A. Abeillé (ed.), Kluwer Academic Publishers, Dordrecht, 2003;
- M. Lana, Il testo nel computer. Dal Web all’analisi dei testi, Torini, Boringhieri, 2004;
- Computers, literature and philology. Clip 2003. La gestione unitaria dell'eredità culturale multilingue europea e la sua diffusione in rete, a cura di C.N. Martinez e M. Moneglia, Firenze, FUP, 2005;
- Letterature biblioteche ipertesti, a cura di F. Pellizzi. Introduzione di E. Raimondi. Roma, Carocci, 2005;
- E. Pierazzo, La codifica dei testi. Un’intorduzione, Roma, Carocci, 2005;
- A. Lenci, S. Montemagni, V. Pirrelli, Testo e computer. Elementi di linguistica computazionale, Roma Carocci, 2005.
Bibliografia specifica sull'Archivio "Aldo Palazzeschi"
- G. Grillo, Il fondo Aldo Palazzeschi, nell’opera collettiva Archivi degli scrittori. Le carte di alcuni autori del Novecento: indagini e proposte, a cura di G. Lavezzi e A. Modena, Treviso, Premio Comisso, 1992, pp. 83-91;
- S. Magherini, L’archivio Palazzeschi della Facoltà di Lettere dell’Università di Firenze, in «La Rassegna della letteratura italiana», 3 (1993), pp. 238-243;
- G. Tellini, L’eredità di Palazzeschi (1988), in L’arte della prosa. Alfieri, Leopardi, Tommaseo e altri, La Nuova Italia, Firenze 1995, pp. 305-18;
- S. Magherini, L’Archivio digitale del Fondo Palazzeschi dell’Università di Firenze, in «Studi italiani», X (1998), 20, pp. 229-232;
- M. Moretti - A. Palazzeschi, Carteggio, Edizioni di Storia e Letteratura-Università degli Studi di Firenze-, Roma 1999 sgg.: I (1904-1925), a cura di S. Magherini, 1999; II (1926-1939), a cura di A. Pancheri, 2001; III (1940-1962), a cura di F. Serra, 2000; IV (1963-1974), a cura di L. Diafani, 2001;
- La «difficile musa» di Aldo Palazzeschi. Indagini, accertamenti testuali, carte inedite, a cura di G. Tellini, in «Studi italiani», XI, 21-22, 1999;
- Scherzi di gioventù e d’altre età. Album Palazzeschi (1885-1974), a cura di S. Magherini e G. Manghetti, Prefazione di G. Tellini, Pagliai Polistampa, Firenze 2001;
- L’opera di Aldo Palazzeschi, Atti del Convegno internazionale, Firenze 22-24 febbraio 2001, Firenze, Olschki, 2002;
- E. Bruschi, «Aldo Balezzeschi - Piazza Beccaria 3 - Firenze», in «Studi italiani», XV 1, gennaio-giugno 2003, pp. 123-140;
- S. Magherini, «Purché ci sia vita»: preliminari di un’amicizia. Prezzolini e Palazzeschi (1912-1913), in Prezzolini e il suo tempo, a cura di C. Ceccuti, Le Lettere, Firenze 2003, pp. 179-200;
- G. Tellini, «La Piramide» di Aldo Palazzeschi: problemi di datazione, in Heitere Mimesis. Festschrift für Willi Hirdt zum 65.geburtstag, hersg. von B. Tappert und W. Jung, Tübingen-Basel, Francke, 2003, pp. 271-285;
- Id., Perelà et la transgression subversive de la «légèretè», trad. par S. Reuberd, in Perelà. Uomo di fumo, Paris, Opéra National, 2003, pp. 75-81;
- Id., Nel laboratorio di Palazzeschi. Sulla genesi delle «Sorelle Materassi», in L’occhio e la memoria. Miscellanea di studi in onore di Natale Tedesco, s.l., Lussografica, 2004, 2 voll. , II, pp. 59-85;
- Id., Il «saltimbanco» in scena, nell’opera collettiva Il Re bello, musica di R. De Simone, libretto di S. Ferrone dall’omonimo racconto di A. Palazzeschi, Firenze, SEF, 2004, pp. 93-103;
- La biblioteca di Aldo Palazzeschi. Catalogo, a cura di S. Magherini, Roma, Edizioni di Storia e Letteratura-Università degli Studi di Firenze, 2004;
- Il codice delle libertà. Aldo Palazzeschi (1885-1974), Catalogo della mostra documentaria, GAMeC (Bergamo, 9-11 dicembre 2004), a cura di Simone Magherini, presentazione di Gino Tellini, Firenze, SEF, 2004;
- A. Palazzeschi, Tutti i romanzi, I, a cura e con introduzione di G. Tellini e un saggio di L. Baldacci, Milano, Mondatori, 2004;
- A. Palazzeschi-D. Valeri, Carteggio (1934-1972), a cura di Gloria Manghetti, Roma, Storia e Letteratura, 2004;
- A. Palazzeschi, Tutti i romanzi, II, a cura e con introduzione di G. Tellini, Milano, Mondatori, 2005;
- A. Palazzeschi-G. Papini, Carteggio (1912-1933), a cura di S.A. Bottini, Roma, Storia e Letteratura, 2006;
- Palazzeschi e i territori del comico, Atti del convegno (Bergamo, 9-11 dicembre 2004) a cura di M. Dillon Wanke e G. Tellini, Firenze, SEF, 2006;
- E. Bruschi, Manoscritti di Aldo Palazzeschi, Roma, Storia e Letteratura (2006);
- Carteggio tra l’editore Mondadori e Aldo Palazzeschi (1938-1974), a cura di L. Diafani, Roma, Storia e Letteratura (in corso di stampa);
- Carteggio tra Aldo Palazzeschi e l’editore Vallecchi (1913-1974), a cura di I. Gambacorti, Roma, Edizioni di Storia e Letteratura, 2 voll. (in corso di stampa);
- Palazzeschi europeo, Atti del convegno internazionale (Bonn, 30-31 maggio 2005), a cura di G. Tellini (in corso di stampa).
Programma di ricerca
Strumenti di ricerca per gli archivi letterari digitali del Novecento italiano (STRALE.DI.AD900.IT)Università di riferimento
Università degli Studi di FIRENZE - ()Responsabile dell'Unità di ricerca
Gino TelliniDescrizione
L’obiettivo generale dell’unità fiorentina è il potenziamento della banca dati “Archivio Digitale Aldo Palazzeschi” realizzata nel biennio 2003-2005. La banca dati è gestita attraverso un innovativo programma informatico di trattamento degli archivi digitali che ha consentito la creazione, insieme ad altri gruppi di ricerca, di “Ad900”. “Ad900” è un sistema di catalogazione e interrogazione integrata di archivi del territorio nazionale che permette di accedere non soltanto alle schede, ma anche agli stessi documenti, sia in forma di riproduzione in facsimile digitale dell’originale, sia in forma di trascrizione elettronica.Il progetto qui proposto mira a un potenziamento degli strumenti informatici di ricerca e insieme a un ampliamento dei dati disponibili in rete; del primo si occuperà unicamente l’unità fiorentina, nel suo ruolo di coordinatrice del progetto generale, mentre ciascuna delle unità di ricerca svilupperà una parte specifica della banca dati di “Ad900”.
I) Potenziamento degli strumenti informatici per la ricerca negli archivi letterari.
L’esperienza fin qui maturata nella realizzazione della banca dati attuale ha permesso di realizzare un accesso tradizionale ai dati archivistici, con un motore di ricerca che individua parole chiave all’interno dei campi di una base di dati. La massiccia presenza di materiali trascritti in formato elettronico induce ora a sviluppare nuovi sistemi integrati che consentano di potenziare la ricerca full text nella direzione delle procedure di information retrieval proprie dei corpora linguistici. Il primo obiettivo è quindi quello di progettare e realizzare un motore di ricerca per forme integrato agli strumenti tradizionali di ricerca nei data base, dotato di tutte le potenzialità proprie dei sofisticati strumenti informatico-linguistici (impiego di caratteri jolly, possibilità di ricerca combinata di due o più forme a distanza stabilita, procedure statistiche di individuazione di cooccorrenze statistiche ecc.). Anche sul fronte della tokenizzazione si intendono sviluppare procedure flessibili che consentano facili adattamenti alle varie lingue e un’alta disponibilità alla gestione di sistemi convenzionali di scrittura filologicamente e paleograficamente curati, in modo da poter rendere conto fedelmente del materiale documentario.
In seconda battuta si svilupperanno procedure automatiche di lemmatizzazione che consentano di interrogare le banche dati degli archivi e le trascrizioni ad esse collegate superando i problemi di indecisione sulle forme omografe tipici dei motori di ricerca per forme. Per quanto esistano varie procedure di lemmatizzazione semiautomatica per corpora dell’italiano contemporaneo, niente è stato mai messo a punto in relazione alle ricerche su basi di dati; qualche approccio è stato tentato recentemente dai più diffusi programmi commerciali (come ad esempio SQL della Microsoft) ma senza che si siano raggiunti risultati soddisfacenti e linguisticamente accettabili.
Come terzo obiettivo l’unità di ricerca si propone di studiare le problematiche legate alla realizzazione di un motore di ricerca semantico su basi di dati archivistiche, un motore di ricerca cioè che sia in grado di discriminare anche semanticamente le stringhe funzionali di ricerca. Per questo ulteriore stadio di sviluppo del motore di ricerca ci si limiterà alla realizzazione di una demo su un campione ristretto di materiale.
Si prevedono le seguenti fasi:
1) Progettazione e realizzazione del motore di ricerca per forma.
a) Individuazione delle regole di tokenizzazione.
b) Progettazione di una piattaforma di indicizzazione personalizzabile.
c) Realizzazione del motore di ricerca corredato degli strumenti di interrogazione (indice di frequenza, ricerca dei contesti immediati e allargati, aggancio alle immagini, possibilità di marcatura per l’individuazione di sub-corpora, possibilità di ricerca di gruppi di forme a distanze stabilite dall’utente, procedure di integrazione della ricerca per forme e di punteggiatura, strumenti di analisi statistica e di leggibilità, individuazione di cooccorrenze).
d) Adattamento delle procedure di ricerca sviluppate all’interrogazione su data base propria del programma di catalogazione di “Ad900”.
e) Integrazione fra il data base dell’archivio e il corpus linguistico delle opere di Palazzeschi.
2) Progettazione e realizzazione del motore di ricerca per lemma.
a) Individuazione delle regole morfologiche informaticamente formalizzate per l’italiano.
b) Creazione e sviluppo delle tavole di declinazione e coniugazione dell’italiano.
c) Sviluppo di procedure di analisi statistica per la realizzazione di una procedura semiautomatica di lemmatizzazione.
d) Realizzazione di un motore di ricerca per lemmi, implementato su quello per forme e quindi con le stesse caratteristiche e potenzialità di ricerca.
e) Adattamento del sistema di ricerca al data base di “Ad900”.
f) Integrazione fra il data base dell’archivio e il corpus linguistico delle opere di Palazzeschi.
3) Progettazione e realizzazione di una demo di motore di ricerca semantico per la letteratura.
a) Individuazione delle aree semantiche e tematiche relative a concetti di base per la letteratura italiana.
b) Creazione di costellazioni semantiche di parole sui concetti individuati.
c) Individuazione di un corpus circoscritto di prova e di prima applicazione delle procedure.
d) Realizzazione di una versione dimostrativa di motore semantico applicato al campione selezionato.
e) Studio delle possibilità di integrazione al motore per forme e al motore per lemma, e dell’applicazione globale ad un sistema strutturato del data base di “Ad900”.
4) Pubblicazione dei risultati raggiunti.
II) Ampliamento dei dati dell’“Archivio Digitale Aldo Palazzeschi”.
Dell’archivio digitale palazzeschiano è già disponibile in rete (con accesso differenziato e controllato) gran parte del materiale, completo di schede di inventariazione e catalogo, delle riproduzioni in facsimile degli originali, delle versioni digitali di materiali audio e video, e di parte delle trascrizioni dei documenti. Il compito specifico dell’unità di ricerca di Firenze sul fronte dell’ampliamento prevede 4 settori:
a) inserimento dei Fondi Valentino Brosio, Plebe Bellocchio, Alberto Perrini e Pier Giorgio Ricci.
Il Fondo Valentino Brosio, donato al Centro Studi “Aldo Palazzeschi” dall’amico e biografo di Palazzeschi, a un’accurata ricognizione mostra di comprendere una Serie Biblioteca, con estratti e ritagli su Aldo Palazzeschi e la sua opera; una Serie Corrispondenza, con lettere, cartoline, telegrammi; una Serie Carte d’autore con opere e redazioni di opere; una Serie Iconografia comprendente disegni e fotografie, e infine una Serie Miscellanea dove compaiono anche documenti personali.
Il Fondo Plebe Bellocchio include le lettere, i manoscritti, i libri e i beni mobili lasciati da Palazzeschi in eredità alla domestica Plebe Bellocchio, ribattezzata Margherita dallo scrittore. Il materiale, messo in vendita dagli eredi della domestica, è stato acquistato dalla Regione Toscana che l’ha concesso in comodato gratuito al Centro Studi “Aldo Palazzeschi”. Si compone di una Serie Biblioteca, con monografie, riviste, ritagli; di una Serie Corrispondenza con lettere, cartoline, telelegrammi; di una Serie Carte d’autore e di una Serie Miscellanea.
Il Fondo Alberto Perrini, donato al Centro di Studi dal commediografo amico di Palazzeschi, comprende una Serie Biblioteca, con riviste estratti, ritagli; una Serie Corrispondenza con lettere, cartoline, telegrammi; una Serie Carte d’autore; una Serie Miscellanea, con materiali vari (ad esempio locandine).
Il Fondo Pier Giorgio Ricci (1912-1976), donato dagli eredi al Centro di Studi “Aldo Palazzeschi”, comprende una Serie Corrispondenza, una cospicua Serie Biblioteca e una Serie Miscellanea: documenti che danno conto della fitta rete di scambi e di interessi dello studioso fiorentino di Dante e Petrarca, professore di Lingua e Letteratura italiana alle Università di Messina, Bologna e Siena.
Si prevede altresì la fattiva collaborazione con la Fondazione Primo Conti di Fiesole (Firenze), sede del Centro di Documentazione e Ricerche sulle Avanguardie Storiche, e con l’Archivio Contemporaneo “Alessandro Bonsanti”, custodito presso il Gabinetto Scientifico G.P. Vieusseux di Firenze (nel quale sono conservati più di 130 fondi, per un totale di oltre 500.000 documenti e 50.000 volumi), rivolta all’integrazione nella banca dati AD900 di gruppi omogenei di carteggi primonovecenteschi.
Dei fondi suddetti si intende portare a compimento la catalogazione e la schedatura, nonché l’acquisizione in formato digitale e la trascrizione;
b) digitalizzazione della biblioteca del Fondo Aldo Palazzeschi e integrazione all’interno del programma di archiviazione per la gestione multimediale e ipertestuale. Si intende con questo passo acquisire in formato digitale le pagine più significative della biblioteca palazzeschiana, sia dal punto di vista storico-artistico che contenutistico: saranno rese visibili la copertina, i risvolti, il colophon e l’indice dei volumi, le numerose dediche, e valorizzato lo status di prima edizione;
c) completamento della trascrizione integrale dei documenti finora archiviati, che renderà disponibili i testi degli oltre mille corrispondenti palazzeschiani;
d) costituzione di una banca dati testuale delle opere di Palazzeschi integrate alle trascrizioni del carteggio, con marcatura specifica funzionale a ricerche di tipo testuale, linguistico e letterario; l’operazione si avvale della collaborazione con la casa editrice Mondadori.
Si prevedono le seguenti fasi:
1) Aggiunta dei fondi.
b) Censimento e inventariazione dei materiali.
c) Catalogazione dei documenti con il programma di “Ad900”.
d) Acquisizione delle immagini digitali dei documenti.
e) Trascrizione dei documenti.
2) Digitalizzazione della biblioteca.
a) Individuazione di una griglia descrittiva essenziale e della tipologia di immagini funzionale alla creazione di una scheda rappresentativa del volume.
b) Acquisizione delle immagini digitali dei documenti.
c) Inserimento dei metadati necessari alla gestione delle immagini.
d) Sviluppo di una procedura informatica di interrogazione integrata al sistema di “Ad900”.
3) Completamento delle trascrizioni.
4) Realizzazione della banca dati testuale delle opere di Palazzeschi.
a) Acquisizione dei testi in formato elettronico delle opere e del carteggio di Palazzeschi.
b) Progettazione di un sistema di marcatura per l’individuazione di dati rilevanti sul piano letterario.
c) Personalizzazione dei motori di ricerca realizzati ai testi marcati e inserimento della banca dati integrata in “Ad900”.
5) Pubblicazione dei risultati raggiunti. Pubblicazione di carteggi, cataloghi, inventari, atti di convegni e manualistica.



