Programma
Il corso ha l’obiettivo di presentare i principali temi della linguistica computazionale e della linguistica dei corpora e di familiarizzare con gli strumenti di base per l’analisi quantitativa e computazionale dei dati. E’ articolato in tre sezioni (due temi e un case study esemplificativo):
1) Corpora linguistici: tipologie e annotazione:
- annotazione strutturale: lo standard della Text Encoding Initiative
- annotazione linguistica: il pos-tagging
2) Metodi computazionali per l’esplorazione dei dati linguistici:
- frequenza
- concordanze
- collocazioni
- misure lessicali e di associazione
3) Case study sull’analisi computazionale del lessico utilizzato in un corpus
Docenti e Testimoni del corso