Programma
Il corso ha l’obiettivo di presentare i principali temi della linguistica computazionale e della linguistica dei corpora e di familiarizzare con gli strumenti di base per l’analisi quantitativa e computazionale dei dati. E’ articolato in tre sezioni (due temi e un case study esemplificativo):
1) Corpora linguistici: tipologie e annotazione:
• annotazione strutturale: lo standard della Text Encoding Initiative
• annotazione linguistica: il pos-tagging
2) Metodi computazionali per l’esplorazione dei dati linguistici:
• frequenza
• concordanze
• collocazioni
• misure lessicali e di associazione
3) Case study sull’analisi computazionale del lessico utilizzato in un corpus
Docenti e Testimoni del corso