Computer Learner Corpora e sistemi di annotazione dell’errore
Abstract
Il presente lavoro ha lo scopo di introdurre e descrivere brevemente due
progetti e software di annotazione dell’errore, il primo di natura “commerciale”
– Cambridge Learner Corpus – e il secondo di natura “accademica”
– UCLEE, Université Catholique de Louvain Error Editor – per metterne
in rilievo le differenze e sottolineare eventuali problemi di etichettatura
dell’errore. Grande spazio è dato al software di natura accademica
che, applicato a un database di produzioni scritte di apprendenti italiani
di lingua inglese presso atenei nazionali, ha messo in evidenza problemi
di scelta delle etichette che spesso si sovrappongono, sembrano discostarsi
dalla categoria giusta o appartenere a diverse categorie. Questo
evidenzia come, al momento, l’analisi dell’errore e l’esistenza di diverse
“aree problematiche” ad essa connesse generino confusione e approssimazione.