Contenuto
Ti trovi in: HOME »Programmi, progetti e risultati »I progetti »FIRB - Fondo per gli Investimenti della Ricerca di Base »scheda FIRBINIZIO_TESTO_DA_INDICIZZARE
SCHEDA FIRB
italiano - english
Unità di Ricerca
- Universita' degli Studi di BOLOGNA
Dip. STUDI LINGUISTICI E ORIENTALI, BOLOGNA (BO) - Universita' degli Studi di FIRENZE
Dip. ITALIANISTICA, FIRENZE (FI)
FIRB simili:
Classificazione scientifico-disciplinare
- Area scientifico disciplinare: Scienze dell'antichità, filologico-letterarie e storico-artistiche
- Area scientifico disciplinare: Scienze storiche, filosofiche, pedagogiche e psicologiche
Classificazione brevettuale
- PHYSICS
- EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS (devices for psychotechnics or for testing reaction times A61B5/16; games, sports, amusements A63; projectors, projector screens G03B)
- MUSICAL INSTRUMENTS; ACOUSTICS
- SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION (measurement of sound waves in general G01H; frequency spectrum analysis of electric signals in general G01R23/16; sound input/output for computers G06F3/16; computing specially adapted for specific functions G06F17/00, G06G7/00; image data processing G06T; teaching or communicating with the blind, deaf or mute G09B; information storage, e.g. sound storage, G11; electronic circuits for sound generation H03B; electronic filters H03H; coding, decoding or code conversion, in general H03M; transmission of information, e.g. speech, H04B; telephonic communication H04M; microphone arrangements, hearing aids, public address systems H04R) [C9607]
- EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
Classificazione geografica
- Regione: Emilia Romagna
Bibliografia
Aijmer, K., Altenberg, B. (eds.), (1991), English Corpus Linguistics, London-New York, Longman.Baker, M., Francis, G., Tognini-Bonelli, E. (eds.), (1993), Text and Technology: in Honour of John Sinclair, Amsterdam, Benjamins.
Biber, D. (1990), Methodological issues regarding corpus-based analyses of linguistic variation in Literary and Linguistic Computing, 5, 257-269.
Biber, D. (1993), Representativeness in corpus design, in Literary and Linguistic Computing, 8,4, Oxford, Oxford University Press, 243-57.
Biber, D., Conrad, S., Reppen, R., (1998), Corpus Linguistics. Investigating language structure and use, Cambridge, Cambridge University Press.
Biber, D., Johansson S., Leech G., Conrad. S., Finegan E. (1999), Longman Grammar of Spoken and Written English, Longman.
Bortolini, U., Tagliavini, C., Zampolli A. (1972), Lessico di frequenza della lingua italiana contemporanea, Milano, IBM Italia.
Brants T. (2000), "TnT - A Statistical Part-of-Speech Tagger", Proc. Conference on Applied Natural Language
Cresti, E. (2000), Corpus di italiano parlato, Firenze, Accademia della Crusca.
Cutting D. / Kupiec J. / Pedersen J. / Sibun P. (1992), "A Practical Part-of-Speech Tagger", Proc. Third Conf. Applied Natural Language Processing, ACL, pp. 133-140.
De Mauro, T., Mancini, F., Vedovelli, M., Voghera M. (1993), Lessico di frequenza dell'italiano parlato, Milano, Etas Libri.
Delmonte R. (1997), "Rappresentazioni lessicali e linguistica computazionale", Atti SLI, Lessico e Grammatica - Teorie Linguistiche e applicazioni lessicografiche, Roma, Bulzoni, pp. 431-462.
Ferrari, G. (1991), Introduzione al Natural Language Processing, Bologna, Calderini.
Francis, W.N. (1982), Problems of assembling and computerizing large corpora, in Johansson, S. (ed.), Computer Corpora in English Language Research, Bergen, Norwegian Computing Centre forthe Humanities.
Francis, W.N., Kucera, H. (1964/1979), Manual of information to accompany A Standard Corpus of Present-Day Edited American English, for use with Digital Computers, Department of Linguistics, Brown University.
Habert, B., Nazarenko A., Salem A. (1997), Les linguistiques de corpus, Paris, Colin/Masson.
Johansson, S., Leech, G.N., Goodluck, H. (1978), Manual of information to accompany the Lancaster-Oslo/Bergen Corpus of British English, for use with digital computers, Department of English, University of Oslo.
Kucera, H., Francis, N.(1967), Computational analysis of present-day American English, Providence, Brown University Press.
Leech G., (1991), "The state of the art in corpus linguistics" in Aijmer - Altenberg (eds.) 8-29.
McEnery, T., Wilson, A. (1996), Corpus Linguistics, Edinburgh, Edinburgh University Press.
Picchi E. (1994). "Statistical Tools for Corpus Analysis: A Tagger and Lemmatizer for Italian", Proc. EURALEX '94, Amsterdam, pp. 501-510.
Rayson P., Wilson A., McEnery T. et al. (eds.), Proceedings of the Corpus Linguistics 2001 Conference, Lancaster, UCREL, vol. 13, 587-593.
Rossini Favretti, R.(1998a), Using multilingual parallel corpora for the analysis of lega language: the Bononia Legal Corpus in Teubert, W., Tognini Bonelli E. Volz, N. (eds.), Translation Equivalence. Proceedings of the Third European Seminar, The TELRI Association e.V., Institut fur Deutsche Sprache, The Tuscan Word Centre, 57-68.
Rossini Favretti, R.(1998b), Cross-language analysis and large multilingual corpora, in Studi italiani di linguistica teorica e applicata, XVII, 3, 415-434.
Rossini Favretti, R. (1999a), Scientific discourse: intertextual and intercultural practices, in Rossini Favretti, R., Sandri, G. Scazzieri R. (eds.), Incommensurability and Translation, Kuhnian Perspectives on Scientific Communication and Theory Change, Cheltenham, Edward Elgar, 201-216.
Rossini Favretti, R. (1999b), Equivalenze traduttive in corpora giuridici multilingue, in E. Arcaini (cur.), Quaderni di Libri e Riviste d'Italia, Roma, Poligrafico dello Stato, 47-66.
Rossini Favretti, R.(cur.) (2000a), Linguistica e informatica. Corpora, multimedialità e percorsi di apprendimento, Roma, Bulzoni.
Rossini Favretti R. (2000b), Progettazione e costruzione di un corpus di italiano scritto: CORIS/CODIS , in R. Rossini Favretti R. (cur.) (2000a), 39-56.
Rossini Favretti, R. (2000c), Oralità, scrittura e variazioni telematiche, in Studi Orientali e Linguistici, 7, pp. 13-40.
Rossini Favretti R., Tamburini F., De Santis C. (in stampa), "A corpus of written Italian: a defined and a dynamic model", in Wilson A., Rayson P., McEnery T. (eds.), A Rainbow of Corpora: Corpus Linguistics and the Languages of the World, Lincom-Europa, Munich.
Schmid H. (1994a), "Probabilistic Part-of-Speech Tagging Using Decision Trees", Proc. International Conference on New Methods in Language Processing, Manchester, UK.
Schmid H. (1994b), "Part-of-Speech Tagging with Neural Networks", Proc. International Conference on Computational Linguistics, Kyoto, Japan.
Sinclair, J.M. (1987), Looking up, London and Glasgow, Collins.
Sinclair, J.M. (1991), Corpus, Concordance, Collocation,Oxford, Oxford University Press.
Sinclair, J.M. (1999), The computer, the corpus and the theory of language in Azzaro, G., Ulryck, M. (cur.), Transiti linguistici e culturali, Trieste, E.U.T.
Sinclair, J.M. (2000), Current issues in corpus linguistics, in R. Rossini Favretti (cur.) (2000a), 29-38.
Svartvik, J.(ed.) (1992), Directions in Corpus Linguistics, Berlin-New York, Mouton de Gruyter.
Tamburini, F. (2000), Annotazione grammaticale e lemmatizzazione di corpora in italiano in R. Rossini Favretti (cur.) (2000a), 57-73.
Teubert, W. (1996), Comparable or parallel corpora? in International Journal of Lexicography, 9, 3, 238-64.
Thomas, J., Short, M. (eds.), (1996), Using Corpora for Language Research, London-New York, Longman.
Váradi, T. (2001), The linguistic relevance of Corpus Linguistics, in Rayson, P., Wilson A., McEnery T., Hardie P.
Parole Chiave
lingua italiana; corpora elettronici; analisi automatica; analisi sincronica e diacronica; formazione in reteI corpora elettronici come strumenti e metodi per la diffusione e l'analisi dell'italiano in una società globale e multietnica
Università degli Studi di BolognaAbstract
Negli ultimi anni la tecnologia informatica ha portato estesi e profondi mutamenti nell'analisi linguistica e nella didattica. In particolare, la "linguistica dei corpora", metodologia di ricerca basata su raccolte elettroniche di dati linguistici autentici, ha avuto un forte impulso a livello internazionale. Il ricorso sistematico a corpora annotati, di grandi dimensioni e dotati di potenti strumenti di interrogazione permette infatti di osservare con finezza di dettaglio i fenomeni linguistici, aprendo la strada a una molteplicità di applicazioni (dalla descrizione intralinguistica ed interlinguistica, alla traduzione, alla didattica delle lingue).L'obiettivo principale del progetto è quello di operare un coordinamento degli apporti della linguistica dei corpora a livello internazionale e di aprire nuove prospettive di analisi dell'italiano anche attraverso tecnologie computazionali, progettando e realizzando nuovi strumenti per l'analisi automatica della lingua italiana.
A tal fine si prevede un lavoro articolato in 36 mesi, volto:
- alla definizione di una piattaforma metodologica finalizzata all'analisi lessico-semantica, sintattica e testuale dei corpora già accessibili e di quelli in via di costituzione
- allo sviluppo degli strumenti informatici necessari alla gestione e alla interrogazione di corpora, con particolare riguardo alla elaborazione di procedure di annotazione automatica dei corpora ai diversi livelli di analisi
>>>
Coordinatore Scientifico del Programma di Ricerca
REMA ROSSINI, Universita' degli Studi di BOLOGNAObiettivo del Finanziamento
L'obiettivo principale del progetto è quello di operare un coordinamento delle tendenze mostrate dalla linguistica dei corpora in Europa e di far convergere sull'italiano gli apporti delle ricerche linguistiche condotte a livello internazionale sulla base di raccolte elettroniche di dati autentici.Sulla base delle conoscenze acquisite a livello sia di costruzione che di interrogazione dei corpora, e delle competenze presenti in diversi ambiti di indagine, si ritiene di potere operare a diversi livelli di indagine.
A livello di costruzione, si intende progettare e realizzare, in un approccio interdisciplinare che veda coinvolti linguisti e italianisti, un corpus diacronico dell'italiano scritto dall'Unità d'Italia a oggi (Unità di Ricerca 1), unitamente a un corpus diacronico che abbracci gli anni 1750-1850 (Unità di Ricerca 2). I corpora così costituiti consentiranno, nella dialettica dei rapporti tra sincronia e diacronia, una utilizzazione più ampia e significativa, a livello sia di analisi che di formazione, del corpus sincronico di italiano scritto esistente (CORIS: vedi punto 3.3).
A livello di analisi, si intende procedere tanto a livello sincronico quanto a livello diacronico, focalizzando l'attenzione in una prima fase sulle regolarità lessico-sintattiche che emergono dall'osservazione del corpora, per giungere alla definizione di una grammatica - o di almeno alcuni aspetti di questa - basata su dati autentici. L'analisi si allargherà in una>>>



