Traduzione automatica (6)

 Categoria: Strumenti di traduzione

Oggi parleremo della traduzione automatica basata su regole. Questa tecnologia utilizza in genere un processo traduttivo suddiviso in tre fasi.
Nella prima fase, nota come fase di analisi, il sistema esegue il parsing delle frasi del testo di partenza e le trasforma in strutture sintattiche ad albero.
Nella seconda fase, detta fase di trasferimento, gli alberi sintattici creati per il testo di partenza vengono trasformati in altrettanti alberi con la struttura sintattica della lingua d’arrivo.
Nella terza fase, chiamata fase di generazione, le parole della lingua di partenza vengono tradotte nella lingua d’arrivo e inserite nell’albero d’arrivo seguendo le regole sintattiche proprie della lingua medesima al fine di creare frasi di senso compiuto.

Una tecnica particolare della traduzione automatica basata su regole è quella che parte da un linguaggio intermedio. La lingua d’origine del testo da tradurre viene trasferita a una lingua intermedia, la cui struttura è indipendente da quella della lingua originale e da quella della lingua finale. Il testo nella lingua di destinazione viene ottenuto a partire dalla rappresentazione del testo nella lingua intermedia.

I più famosi sistemi di traduzione automatica attuali sono tutti basati su regole. Fra questi i più conosciuti sono sicuramente Systran (usato da Google) e Babelfish (usato da Altavista).
La traduzione automatica basata su regole (o basata sul principio del trasferimento), è infatti al giorno d’oggi il paradigma prevalente per la traduzione automatica.
I principali punti deboli di questa tecnologia sono sostanzialmente due.
In primo luogo, la quantità di regole su cui si basa qualsiasi sistema è ovviamente limitata. Per ottenere risultati migliori, gli autori del testo da tradurre dovrebbero adeguare il loro stile di scrittura, la qual cosa è, per ovvi motivi, assolutamente improponibile.
In secondo luogo, nonostante sul mercato siano reperibili pacchetti commerciali di traduzione automatica basata su regole con decine di combinazioni linguistiche, molte lingue ancora non sono state attivate.