Traduzione automatica (8)

 Categoria: Strumenti di traduzione

Oggi parleremo della traduzione automatica basata sul contesto. Questa tecnologia utilizza un metodo basato su idee abbastanza semplici ma in qualche caso offre risultati molto buoni rispetto ad altri metodi.
Il concetto operativo su cui si basa è la ricerca della migliore traduzione di una parola prendendo in considerazione il resto delle parole che la circondano.
Il sistema suddivide un testo in unità di quattro/otto parole e propone traduzioni di ogni sequenza nella lingua di destinazione eliminando le traduzioni che contengono frasi senza senso. Tale filtraggio utilizza un corpus nella lingua di destinazione, nel quale viene conteggiato il numero di volte in cui compare la frase cercata.
In seguito la sequenza creata viene spostata di una posizione (una parola), la maggior parte dei vocaboli viene ritradotta e il testo viene filtrato di nuovo in modo da lasciare solo le frasi coerenti. Tale procedimento viene ripetuto per tutto il testo. Nella fase finale vengono concatenati i risultati di ciascuna sequenza in modo da ottenere un’unica traduzione del testo.

La traduzione automatica basata sul contesto presenta un grande vantaggio rispetto alle altre tecnologie di traduzione automatica basate su corpora linguistici e cioè la facilità nell’aggiungere nuove lingue. Per inserire una nuova lingua infatti non è necessario tradurre milioni di parole come nei metodi statistici, sono sufficienti due corpora linguistici di dimensioni ridotte:
- un buon dizionario elettronico contenente regole che permettano al sistema di coniugare correttamente  i verbi e di accordare aggettivi e sostantivi in base al genere e al numero.
- un corpus nella lingua di destinazione, che può essere facilmente reperito su internet.