La industria de la traducción ha experimentado un auténtico cambio de paradigma desde la implantación, cada vez mayor, de la traducción automática en sus servicios lingüísticos. Sin embargo, el uso de ordenadores y programas informáticos para la reproducción interlingüística no siempre ha suscitado la misma confianza a las agencias de traducción y a sus profesionales. Y es que, desde sus inicios allá por mitad del siglo XX de la mano del experimento de Georgetown, su aplicación se ha visto muy cuestionada en distintos ámbitos y por diversos motivos. En general, se aduce que no es una tarea sencilla programar un medio que sea capaz de establecer equivalencias entre un par de idiomas y que estas consigan adecuarse a las necesidades comunicativas. ¿Cómo podría lograrse que un programa informático incorporase la sintaxis, la pragmática, la semántica y las variedades lingüísticas (entre otros muchos parámetros) de uno o más idiomas y pudiera ofrecer opciones de traducción dinámicas entre estos? Finalmente, los especialistas se dieron cuenta de que los ordenadores presentan un desempeño mucho mayor a la hora de buscar y encontrar elementos ya traducidos, en lugar de actuar como un traductor autónomo y tomar decisiones «propias». Así, se iniciaría la historia de la traducción automática, una herramienta con mucho potencial, ampliamente estudiada y de la cual se han ido proponiendo distintos enfoques, los cuales presentamos en el presente artículo.
En primer lugar, surgió la denominada traducción automática basada en reglas (in. rule-based machine translation). Este enfoque se ocupa de educar al programa informático de manera que emule el funcionamiento interno de un idioma. En este, se incluyen las gramáticas de los distintos idiomas, su léxico y se programan reglas de transferencia, de modo que pueda hacer equivalencias exactas entre la sintaxis de una lengua y la de otra. Este aspecto hace que resulte una herramienta muy útil a la hora de traducir entre lenguas cercanas entre sí como entre el español y el catalán, el gallego, el francés o el italiano. Sin embargo, presenta algunos inconvenientes. Fundamentalmente, su desarrollo precisa de una gran inversión de tiempo y recursos y, además, hay que destacar que este tipo de TA no podrá realizar una traducción si la gramática/sintaxis de está no ha sido aprendida por dicho programa informático, por lo que supone crear actualizaciones constantes e incorporar léxico con cierta regularidad. Por eso mismo, tampoco logra traducir con este método expresiones y frases hechas, ya que su traducción se aleja de los procedimientos más literales. Aun así y, pese a ser un tipo de TA minoritario actualmente, se sigue considerando útil para alimentar motores de traducción automática en combinaciones lingüísticas que, debido a su infrecuencia, no pueden proporcionarse con una TA de otro tipo más actual. Un recurso de TA basada en reglas es Apertium, donde os invitamos a comprobar las traducciones que se generan al jugar con la gramática de cada idioma.
Posteriormente, se empezó a desarrollar una nueva línea de TA, que consistía en recopilar corpus de traducciones y ofrecer opciones de traducción en función de las correspondencias lingüísticas previamente registradas.
La que vino antes fue la denominada traducción automática estadística (in. statistical machine translation). Esta necesita un conjunto de textos monolingüe y su equivalente en una lengua de destino. Tiene tres componentes principales. Primero, el modelo de lenguaje, que se encarga de calcular la probabilidad de que una frase en la lengua de destino sea correcta y de la fluidez de la traducción. Después, un modelo de traducción se encarga de establecer correspondencias entre la fuente y el destino, mediante un corpus alineado a nivel oracional. Y, por último, un descodificador se encarga de buscar entre todas las traducciones posibles y seleccionar la más probable. En definitiva, se crean todas las traducciones posibles y se propone la más probable. Evidentemente, esta variabilidad reportaba con bastante frecuencia resultados negativos. De hecho, hace unos años, el traductor de Google, que antes empleaba este motor de traducción automática, se hizo famoso por arrojar resultados poco acertados, literales y descontextualizados. Afortunadamente, este enfoque fue ganando popularidad a medida que se fueron alimentando más corpus entre distintos pares de idiomas y conforme se fueron refinando los procesos de alineación y entrenamiento.
Más tarde, llegó una versión mucho más refinada y vanguardista, la denominada traducción automática neuronal / basada en redes neuronales (in. neural machine translation). Se trata del enfoque de motor de TA por corpus más reciente, y este requiere un volumen de corpus mucho mayor; si la estadística requería millones de palabras, este modelo requiere millones de oraciones. El objetivo es imitar en una máquina la red neuronal de un cerebro humano, de modo que las traducciones propuestas se acerquen a las decisiones que habría tomado un traductor humano. Aunque es un mecanismo muy complejo de explicar, podría decirse que estos motores no solo analizan cómo se traduce una palabra, sino que también analizan cómo se relaciona esta con el resto de palabras de su entorno (con cuáles se combina, con cuáles suele aparecen con mayor frecuencia, etc.). El traductor de Google utiliza este enfoque para su servicio actual. Sin embargo, puede darse el caso de que una palabra no esté dentro del corpus, por lo que estos motores tratan de replicarla según las reglas y las palabras que ha aprendido, lo que plantea el riesgo de generar palabras que no existen, conjugar mal los verbos, emplear términos con significados distintos, ordenar las oraciones de forma incorrecta, etc.
Todo ello apunta a que las herramientas de traducción automática presentan grandes ventajas, pero que no pueden encargarse por sí solas de hacer una traducción. Ya que van asociadas a una serie de errores típicos que deben ser subsanados por un profesional de la traducción y con arreglo a unas normas determinadas orientadas a garantizar la más alta calidad. Dada esta necesidad, nació la posedición de traducciones automáticas, un servicio lingüístico que comporta muchas ventajas y en el que nos detendremos en futuras entregas. La TA se encuentra en constante evolución y abre un mundo de posibilidades para la industria traductora, siempre con el objetivo de facilitar su trabajo.
Para este artículo, nos hemos basado en los siguientes enlaces:
- http://lalinternadeltraductor.org/n16/traduccion-automatica.html
- https://attesor.com/traduccion-automatica/
Ref. de la imagen: https://www.bbc.com/future/article/20150812-how-to-tell-a-good-robot-from-the-bad