MODELA, traducción automática en euskera

[Euskarazko bertsioa beheko aldean]

¿Recuerdas alguna mala traducción en euskera? En un anuncio de cazadoras (prenda) a alguien se le ocurrió escribir la palabra “ehiztariak” (persona que caza animales); y alguna otra persona a la rotonda la llamó en una señal de tráfico “borobil” (redondo). Y es que muchas veces nos preguntamos: ¿cuando tendremos una buena herramienta de traducción automática de castellano euskera/euskera-castellano?

Con este propósito hemos creado MODELA, la nueva herramienta de traducción automática para euskera-castellano/castellano-euskera. MODELA es el único sistema de traducción automática basada en redes neuronales para esta combinación de idiomas, algo especialmente útil ante un idioma tan complejo como el euskera. De hecho, los sistemas utilizados anteriormente (basados en reglas y estadística) traducen el texto por segmentos utilizando una memoria previa, y mediante probabilidad deciden cuál es el resultado que deben dar. Con este nuevo sistema, en cambio, la herramienta aprende un nuevo modo de llegar a la traducción correcta mediante funciones matemáticas e inteligencia artificial, lo que produce resultados sorprendentes.

Este tipo de sistemas ofrecen resultados más “naturales” en comparación con los anteriores sistemas de traducción automática y, por tanto, los textos obtenidos son más entendibles.  Ha sido un gran avance en comparación con lo que conocemos como traducción automática en euskera y estamos muy orgullosos de ello. Así pues, las grandes combinaciones de idiomas como el inglés-castellano ya se están pasando al sistema de traducción automática neuronal y en MondragonLingua hemos querido aplicar esta nueva tecnología también para euskera.

El siguiente paso es poner MODELA al alcance del usuario y en ello estamos trabajando. La herramienta estará disponible de manera gratuita pero tendrá ciertos límites. Es importante mencionar que el sistema necesita un servidor especial trabajando continuamente y, por ello, poner ciertos límites será necesario para poder mantenerlo. De todos modos, se ofrecerán unos paquetes de pago para poder utilizar los servicios de MODELA de manera ilimitada.

Como ya hemos mencionado, los resultados han sido sorprendentes y no tienen nada que ver con lo que conseguíamos hasta ahora con otros sistemas; pero, aunque la calidad sea increíble, no deja de ser un sistema de traducción automática y, si los textos van a ser publicados, es importante revisarlos y hacer las correcciones necesarias. Por otro lado, MODELA puede ser una herramienta muy útil para las personas que no entiendan euskera, ya que les ofrecerá versiones en castellano fácilmente entendibles de los textos.

En este proyecto han participado varios organismos: ISEA (Coordinador de los proyectos de innovación de MondragonLingua), el grupo IXA de la UPV, Vicomtech, Ametzaigaina y Elhuyar. En cuanto a la financiación, esta proviene de la subvención de un proyecto Elkartek.

¿Quieres saber más?

Igor Ellakuria (ISEA/MondragonLingua) e Itziar Cortes (Elhuyar) estuvieron hablando sobre este tema en el programa de radio Sarean de Euskadi Irratia. Si quieres conocer mejor esta nueva herramienta de traducción automática, pincha aquí y escucha el programa (en euskera).

——

MODELA, itzulpen automatikoa euskaraz

Gogoratzen al duzu euskarazko itzulpen baldarrik? Iragarki baten jakak (cazadora gaztelaniaz) saltzeko “ehiztariak” idatzi zuen behin norbaitek eta errotonda bat iragartzeko “borobil” hitza erabili zuen beste batek.  Ez al dago gaztelaniatik euskarara eta euskaratik gaztelaniara ganoraz itzultzen duen tresnarik?

Helburu honekin eraiki dugu MODELA, euskara-gaztelania eta gaztelania-euskararako itzulpen automatikorako tresna berria. MODELA hizkuntza bikote honetarako sare neuronaletan oinarritutako (NMT) sistema bakarra da, euskara moduko hizkuntza konplexu batentzako bereziki baliagarria dena. Izan ere, aurretik erabilitako sistemek (erregeletan eta estatistikan oinarritutakoak) testua zatika itzultzen dute, aurretiko memoria batez baliatuz eta probabilitatea erabiliz. Sistema berri honek, berriz, ikasketa-prozesuan hainbat funtzio matematiko dituen ‘bide’ bat ikasten du, eta itzulpen berri bat behar denean, bide hori exekutatzea edo jarraitzea da itzulpena lortzeko modua, emaitza harrigarriak lortuz.

Adimen artifizialean oinarritutako sistema honek emaitza “naturalagoak” eskaintzen ditu, aurretiko itzulpen automatikoko tresnekin konparatuz gero, eta testu ulergarriagoak eskaintzen ditu. Pausu handia izango da orain arte ezagututakoarekiko eta oso harro gaude lortutakoaz. Horrela, ba, hizkuntza bikote handiak (ingelesa-gaztelania adibidez) sistema neuronalera ari dira pasatzen eta guk teknologia berri hau euskaran ere aplikatu nahi izan dugu.

Hurrengo urratsa MODELA erabiltzaileen eskura jartzea da eta horretan lanean gabiltza buru-belarri. Sortutako webgunea edonork erabili ahal izango du dohainik, baina mugak izango ditu. Beharrezkoa da garbi uztea sistemak oso zerbitzari berezi bat behar duela etengabe lanean eta, hortaz, mugak ezartzea beharrezkoa izango da honen beharrak asetzeko. Hala ere, ordainpeko “pack” batzuk eskainiko dira zerbitzua mugarik gabe erabili nahi izanez gero.

Esan bezala, lortutako emaitzak harrigarriak dira eta ez dute zerikusirik orain arte ezagututakoarekin, baina, nahiz eta kalitatea ikaragarria izan, itzulpen automatikoko sistema izaten jarraitzen du, eta testuak nonbait argitaratu behar badira, beharrezkoa da testu horiek errepasatzea, eta egin beharreko zuzenketak egitea. Bestalde, MODELA sistema oso erabilgarria izan daiteke euskaraz ulertzen ez dutenentzat, testuak itzuli eta ulertzeko moduko gaztelaniako bertsioa eskuratzeko.

Proiektu honetan zenbait erakundek hartu dute parte: ISEA (MondragonLinguaren berrikuntza proiektuen koordinatzailea), EHUko IXA taldea, Vicomtech, Ametzaigaina eta Elhuyar; eta Elkartek deialdiko diru-laguntza batetik sortua izan da.

Gehiago jakin nahi?

Honetaz aritu ziren Igor Ellakuria (ISEA/MondragonLingua) eta Itziar Cortes (Elhuyar) Euskadi Irratiko Sarea irratsaioan. Beraz, itzulpen automatikorako tresna berri hau hobeto ezagutu nahi izanez gero, egin klik hemen eta saioa entzun.

LOCALIZACIÓN DE CONTENIDOS DIGITALES

TRADUCCIÓN AUTOMÁTICA

TRADUCCIÓN DE DOCUMENTOS (GENERAL O TÉCNICO)