Contenuto
Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »PRIN - Programmi di ricerca di Rilevante Interesse Nazionale»Programma di ricercaINIZIO_TESTO_DA_INDICIZZARE
PROGRAMMA DI RICERCA 2007
italiano - english
Unità di Ricerca
Programmi di ricerca simili:
- 1 - Parlare italiano: teorie e applicazioni linguistiche.
- 2 - L'italiano in Europa e la letteratura italiana "fuori d'Italia": scrittori stranieri in lingua italiana, dal Medioevo a oggi (costituzione di un archivio storico e di un corpus commentato di testi)
- 3 - Parlare italiano: osservatorio degli usi linguistici
- 4 - Italiano di apprendenti: corpora di italiano L1 e L2 online
- 5 - Livelli di analisi nell'evoluzione delle lingue indoeuropee.
- 6 - Musisque deoque II. Un archivio digitale dinamico di poesia latina, dalle origini al Rinascimento italiano.
- 7 - eColingua: e-corpora negli studi linguistici e multimodali, nella traduzione, nell'apprendimento e nelle verifiche on-line delle lingue
- 8 - TEATRO UMANISTICO. SAGGI ED EDIZIONI
- 9 - Le iscrizioni achemenidi di Persepoli: analisi testuale ed edizione critica e sinottica delle versioni antico-persiana, elamica e babilonese
- 10 - Gli esiti della filosofia classica tedesca: sviluppo della già iniziata edizione critica di testi e approntamento di ulteriori studi sull'argomento
Classificazione scientifico-disciplinare
- Area scientifico disciplinare: Scienze dell'antichità, filologico-letterarie e storico-artistiche
Classificazione geografica
- Regione: Veneto
Parole Chiave
ITALIANO ANTICO, LINGUISTICA ITALIANA, FILOLOGIA ITALIANA, MORFOSINTASSI, CORPORA INFORMATICIMorfosintassi e corpora informatici dell'italiano antico
Università degli Studi di PadovaAbstract
Lo scopo del Programma di Ricerca è costituito da applicazioni della linguistica dei corpora (ramo della linguistica informatica) a testi italiani antichi.Diverse precisazioni sono necessarie. Le applicazioni informatiche sono in parte di natura diversa, come si vedrà meglio in seguito; tutte presuppongono l'esistenza di corpora. Le unità di Pisa e di Torino mirano a una etichettatura (tagging) degli elementi del corpus, quella di Padova ne sfrutta, invece, le possibilità di interrogazione allo scopo di stabilirne una grammatica, secondo i parametri che sono stati presentati in B e che saranno ripresi brevemente qui.
Il concetto di italiano antico è assunto qui nell'accezione di lingua fiorentina del Duecento e dei primi anni del Trecento, e cioè della prima fase della lingua italiana, documentata in numerosi testi pratici (documentari) e letterari, e non nel senso di ogni varietà documentata dell'Italia medievale. Oltre che in numerose edizioni cartacee, l'italiano antico è ora depositato sotto forma di corpora informatici (il più importante dei quali è quello dell'OVI del CNR di Pisa, ripetutamente menzionato nei modelli B e in questo modello).
L'esistenza di corpora informatici ha fornito da tempo nuove possibilità di studio di lingue moderne ed antiche, tra cui l'italiano antico. Lo sviluppo di questi studi è stato tuttavia finora limitato dalla novità delle tecnologie, dall'aspetto quantitativamente imponente >>>
Coordinatore Scientifico del Programma di Ricerca
Lorenzo Renzi Università degli Studi di PADOVAObiettivo del Programma di Ricerca
Uno dei rami più interessanti dell'informatica umanistica è quello che riguarda i corpora informatici di testi.Obiettivo comune del programma di ricerca è la realizzazione di studi di italiano antico che sfruttino le potenzialità offerte oggi dai corpora elettronici e incrementino queste possibilità stesse. Rispetto a corpora cartacei, quelli informatici si presentano adatti a operazioni di interrogazione e di etichettatura di elementi di stringhe. In Italia e fuori d'Italia è stato condotto molto lavoro sia nella costituzione di corpora sia nella loro etichettatura, soprattutto sulle lingue moderne. Contributi di particolare importanza nel dominio specifico dell'italiano antico sono stati dati, invece, proprio dai partecipanti a questo Progetto, particolarmente dai coordinatori delle unità di Pisa e di Torino. Il primo, Mirko Tavoni, ha diretto la Biblioteca italiana, attualmente la più grande biblioteca digitale di testi della letteratura italiana, consultabile in rete (http://www.bibliotecaitaliana.it/index.asp) (opera cofinanziata da PRIN 1997 e 1999). Ha inoltre diretto la lemmatizzazione con annotazione grammaticale del corpus delle opere volgari e latine di Dante, consultabile in rete (http://dante.di.unipi.it/), e ha collaborato alla progettazione di un sistema esperto per l’estrazione di conoscenza dal poema dantesco. Il secondo, Manuel Barbera, ha realizzato in collaborazione con Carla Marello, il "Corpus Taurinense", CT, un corpo >>>
Risultati parziali attesi
La grammatica a cui mira il lavoro dell'unità di PADOVA non si presenterà in modo artificiale come un tutto compatto, come in realtà nessuna lingua è, ma mostrerà, almeno in alcuni fenomeni, delle differenziazioni interne. Ci sono d’altra parte anche differenze che non dipendono da influssi esterni, ma rappresentano fatti di dinamica interna della lingua. Uno stadio linguistico può presentare, come si sa, concorrenza di forme o di fenomeni, una concorrenza destinata spesso a decantarsi nel corso del tempo. Non mancheranno nemmeno, quindi, alcune indicazioni diacroniche, suggerite proprio dalla compresenza di forme. Osservando che l’it. ant. aveva sia "diciamo" che "dichiamo", è immancabile notare che la variazione è stata in seguito eliminata (cap. Morfologia verbale di Roberta Maschi e Laura Vanelli). Un altro es.: la presenza di “neuno”/”niuno” (prevalentemente in prosa) e di “nessuno” (prevalentemente in poesia) nel fiorentino del Duecento evolve già nel Trecento nel senso di una prevalenza di “nessuno”, avviato ad eliminare “neuno/niuno” in italiano moderno (il caso è già stato studiato da Luca Serianni in “Studi linguistici italiani” VIII, 1982, pp.27-40; cfr. cap. Negazione di Raffaella Zanuttini). Schemi evolutivi simili si possono ritrovare, spesso in forma più complessa, a livello sintattico, il meno indagato, precedentemente, da questo punto di vista, ma quello sul quale la “Grammatica” dovrebbe incidere forse con più forza.Secondo >>>
Durata
24 mesiBase di partenza scientifica nazionale o internazionale
Bisogna distinguere da un lato gli studi dedicati all'italiano antico, dall'altro quelli che si sono occupati di linguistica dei corpora, ramo dell'informatica umanistica che acquista sempre maggiore importanza, e dei corpora di italiano antico in particolare.Il primo dominio è un campo tradizionale di studio, che ha le sue radici addirittura nel XVI sec., e che si è sviluppato particolarmente dall'Ottocento ad oggi. La sua prospettiva è stata particolarmente storica, anche se non sono mancati, negli ultimi decenni del Novecento, contributi di impostazione sincronica, con precedenti anche qui in qualche caso remoti. Come lavori di sintesi sono indispensabili: Rohlfs 1966-1969; Tekavcic 1980; Ambrosini e altri 1984; Stussi 1995; Maiden 1998. Saggi recenti di diversi autori, molti dei quali collaboratori del presente Progetto: in "Lingua e stile" a cura Renzi e Bisetto 2000, in "Verbum" 2004 e in Dardano e Frenguelli 2004; vedi anche Tavoni 2002, Barbera 2005, Andreose e Penello 2006, e altre voci citate nei modelli B.
La costituzione di corpora dell'italiano letterario, della lingua dell'uso e anche dell'italiano antico (testi documentari e letterari), è proceduta rapidamente negli ultimi decenni. Parallelamente sono stati eleborati vari strumenti di ricerca e di utilizzazione dei corpora. In particolare su quelli che riguradano l'italiano antico, e i problemi specifici che questo pone alla ricerca >>>



