Traducción automática de código abierto: una oportunidad para lenguas menores
Taller de traducción automática
-
Upload
ruben-rodriguez-de-la-fuente -
Category
Documents
-
view
511 -
download
1
Transcript of Taller de traducción automática
![Page 1: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/1.jpg)
ASPECTOS BÁSICOS, VENTAJAS, COMPARATIVA DE SISTEMAS Y CRITERIOS DE EVALUACIÓN
Taller de traducción automática
Taller de traducción automática: Conferencia Proz Barcelona 09
![Page 2: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/2.jpg)
Proyecto TAUS
Taller de traducción automática: Conferencia Proz Barcelona 09
Plataforma neutra y segura para el desarrollo de la automatización de procesos de traducción:
Compartir recursos lingüísticos: memorias y glosarios
Desarrollo de plataformas abiertas: estándares de intercambio, código abierto.
Modelo sostenible para satisfacer las necesidades de traducción
Ventajas para traductores:
Taus search
![Page 3: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/3.jpg)
Ventajas
Taller de traducción automática: Conferencia Proz Barcelona 09
MT better than ZT (93%)Tiempo de comercializaciónCostesOptimización de la terminologíaProductividadSatisfacción del cliente (calidad vs.
usabilidad)Expansión a nuevos mercadosBases para mayor innovación
![Page 4: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/4.jpg)
Obstáculos
Taller de traducción automática: Conferencia Proz Barcelona 09
Calidad texto originalPérdida de ventaja competitiva y
personalizaciónConfidencialidadPropiedad de las memorias de traducciónNecesidad de estandarización
![Page 5: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/5.jpg)
Fundamentos
Taller de traducción automática: Conferencia Proz Barcelona 09
Tecnología:Basado en reglasEstadísticosHíbridosTemática:GeneralesEspecializados (p. ej. Meteo: informes
meteorológicos)
![Page 6: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/6.jpg)
Lenguaje controlado (preedición)
Taller de traducción automática: Conferencia Proz Barcelona 09
Vocabulario y gramática restringidos (dominio especializado)
Mejor contenido (claridad y coherencia) y traducibilidad
Caterpillar Technical English: 142 reglas y 70.000 términos. ASD STE, IBM Easy English.
![Page 7: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/7.jpg)
Métricas de calidad
Taller de traducción automática: Conferencia Proz Barcelona 09
BLEU: comparación de traducción automática con traducciones (una o más) de referencia por humanos. Valora el nivel de coincidencia (de 0 a 1). Uso: comprobaciones automáticas durante el desarrollo de TA.
METEOR: Tres comprobaciones: 1) comparación con traducciones de referencia; 2) comparación de lemas; 3) comparación de sinónimos.
TER: mide el número de correcciones necesarias en TA en comparación con traducciones humanas (lematización, sinónimos, paráfrasis, variaciones de order)
NIST: considera el nivel informativo de las coincidencias.ROUGE: evaluación de resúmenes y traducciones.Back translation
![Page 8: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/8.jpg)
Posedición
Taller de traducción automática: Conferencia Proz Barcelona 09
Errores más comunesAutomatización
![Page 9: Taller de traducción automática](https://reader036.fdocument.pub/reader036/viewer/2022082809/556b44c9d8b42adc248b535e/html5/thumbnails/9.jpg)
Integración de tecnologías
Taller de traducción automática: Conferencia Proz Barcelona 09
Círculo virtuoso : Traducción automática, Memorias de traducción, bases de datos terminológicas.