Gli standard informatici nella traduzione

 Categoria: Traduzione di siti web

L’avvento di internet e la sua rapidissima diffusione negli anni ’90 originò un flussi di dati impressionante tra i più disparati sistemi informatici a livello mondiale. Emerse quasi subito l’esigenza di elaborare degli standard che consentissero di risolvere le innumerevoli problematiche di compatibilità che questo processo senza precedenti aveva creato.
A tale scopo, nel 1994 venne fondato il World Wide Web Consortium che iniziò a stabilire formati di interscambio dati derivati dal metalinguaggio di marcatura SGML, definito nel 1980.
Tra questi formati basati su testo con marcatori vi sono, fra gli altri, l’HTML, il linguaggio tuttora dominante in Internet, e l’XML, che si sta sempre più diffondendo e promette più flessibilità e potenza rispetto al suo predecessore.

Dopo la definizione degli standard generici per il web si passò all’elaborazione di standard specifici per il settore della traduzione per i quali vennero presi come basi l’SGML e in particolar modo l’XML.
Fra essi, quello più diffuso è il Translation Memory eXchange (TMX) usato per l’interscambio delle memorie di traduzione. Venne sviluppato nel 1998 dal gruppo OSCAR ed è supportato praticamente da tutti gli strumenti CAT/TM.
Per il settore della localizzazione, nel 2003 il gruppo OASIS ha sviluppato l’XML Localisation Interchange File Format (XLIFF).
Il quadro è invece molto più complesso per quanto riguarda la terminologia, settore in cui siamo piuttosto lontani dalla definizione di un unico standard accettato e utilizzato a livello generale. Relativamente al formato dei database lessicali e terminologici coesistono tuttora diversi standard. Fra gli altri menzioniamo:

- Il MAchine-Readable Terminology Interchange Format (MARTIF) è un formato per l’archiviazione di dati terminologici basato sui concetti. È basato sull’SGML ed è stato definito nel 1998. Corrisponde allo standard ISO 12200.
- L’Open Lexicon Interchange Format (OLIF) è un formato sviluppato per l’utilizzo con sistemi di traduzione automatica. È basato sull’XML ed è stato definito nel 1999 dal gruppo SAP.
- L’XML representation of Lexicons and Terminologies (XLT) venne definito da SALT nel 2000 allo scopo di riunire le capacità dei due formati precedentemente citati.
- Il TermBase eXchange (TBX) è in pratica un’implementazione dello standard XLT. È basato sull’XML e venne definito da OSCAR nel 2000.