Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução
-
Upload
i-conferencia-internacional-de-traducao-e-tecnologia -
Category
Technology
-
view
404 -
download
0
description
Transcript of Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução
![Page 1: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/1.jpg)
O que querem os tradutores das máquinas de tradução?
Félix do Carmo (TIPS e CLUP) e Luís Trigo (CLUP e INESC)
Faculdade de Letras do Porto Maio 2013
![Page 2: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/2.jpg)
Plano
• A tradução é uma corrida • E as máquinas correm mais do que nós
• Diferentes formas de inteligência • Diferentes papéis e formas de interacção
• O que querem os tradutores • Sugestões e soluções tecnológicas
![Page 3: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/3.jpg)
A tradução é uma corrida
E as máquinas correm mais do que nós
![Page 4: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/4.jpg)
A tradução já não é o que era
Clicar aqui para referência.
![Page 5: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/5.jpg)
A tradução é uma corrida
• Volumes, capacidades, métricas, bitolas, tempo, dinheiro…
• A importância das ferramentas de produtividade
Onde fica a qualidade?
• A qualidade deixou de ser discutida em termos de
subjectividade.
• A qualidade é objectiva e mensurável: • A medida é a tradução humana.
• A responsabilidade pela qualidade é dos tradutores.
![Page 6: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/6.jpg)
E as máquinas correm muito…
Apesar de …
• O Google Translate poluir a água do seu próprio poço (recolhe, alinha e insere nos modelos de aprendizagem traduções produzidas automaticamente) (clicar aqui para referência);
• Ter atingido o limite de aumento de qualidade: a duplicação dos (biliões de) dados produz só uma melhoria de 0,5% nos índices BLEU (referência);
• Apenas 1% das necessidades mundiais de tradução profissional são satisfeitas por tradução automática (referência)…
Os números não mentem…
• A tradução automática traduz 195 vezes mais depressa do que uma pessoa (referência);
• O Google Translate traduz todos os dias 1 milhão de livros por dia (o mesmo que todos os tradutores do mundo fazem num ano) (referência).
![Page 7: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/7.jpg)
Diferentes formas de inteligência
Diferentes papéis e formas de interacção
![Page 8: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/8.jpg)
Inteligência artificial e tradução
• Tradução automática estatística – Aplicação de princípios da Inteligência artificial
• Modelo de aprendizagem de línguas pelo reconhecimento de unidades mínimas e reutilização nos contextos certos
• Produz modelos descritivos de duas línguas e da tradução entre elas
• Integração de conhecimento linguístico (anotação morfológica, sintática e semântica) em modelos factorizados
• Algoritmos eficientes de pesquisa em campos de pesquisa com várias dimensões
• Algoritmos de smoothing e pruning (duas técnicas de limpeza dos dados)
![Page 9: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/9.jpg)
Ferramentas de tradução
• CATs comerciais que podem receber dados de TA:
• SDL Studio, DéjàVu, memoQ, OmegaT, etc…
• Ferramentas comerciais de TA por regras (ou híbridas):
• Systran, ProMT…
• Serviços empresariais baseados em TA estatística:
• Asia Online, Prompsit, Pangeanic…
• Plataformas online de acesso livre:
• OpenTrad (regras); Google Translate, Bing Translator, etc…
• Interfaces de pós-edição de TA online:
• Google Translator Toolkit, KantanMT…
• Ferramentas de pós-edição de TA estatística:
• PET (Universidade de Sheffield)
![Page 10: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/10.jpg)
Fazer depressa e bem
2 modelos de interacção:
máquina/homem OU homem/máquina
• Modelo de pós-edição (máquina/homem)
• A máquina produz rapidamente e em quantidade
• O homem corrige
Risco: tradução voluntária e gratuita (modelo da “computação humana”)
• Modelo de produtividade (homem/máquina)
• TA como ferramenta de produtividade para tradução humana
![Page 11: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/11.jpg)
Modelo de produtividade • O que faz um tradutor?
• PESQUISA
• DECIDE
• ESCREVE/EDITA
• VERIFICA
• As CATs auxiliam e são eficientes nestas tarefas?
• Limites dos segmentos e das bases de dados terminológicas
• Limites das funções de verificação de qualidade (QA) – números, pontuação e pouco mais…
• Que suporte dão à revisão?
![Page 12: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/12.jpg)
Papel da máquina • Em que são úteis os métodos estatísticos?
• Classificar e ordenar dados linguísticos
• Identificar agrupamentos de textos
• Encontrar correspondências com extensões variáveis em grandes volumes de dados
• Aprender operações e repeti-las
![Page 13: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/13.jpg)
O que querem os tradutores
Sugestões e soluções tecnológicas
![Page 14: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/14.jpg)
Do que precisamos?
• Uma nova geração de ferramentas CAT que:
• Facilitem a gestão do conhecimento
• Classifiquem e ordenem dados linguísticos
• Identifiquem agrupamentos de textos
• Encontrem correspondências com extensões variáveis em grandes volumes de dados
• Auxiliem as tarefas repetitivas de correcção
• Aprendam operações executadas e lhes dêem suporte
• Projectos de investigação destas ferramentas:
• Caitra; MateCAT; CasmaCAT; QTLaunchPad; EXPERT…
![Page 15: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/15.jpg)
Duas áreas tecnológicas
• Gestão contextual do conhecimento
• PESQUISAR e DECIDIR
• Organização automática do conhecimento textual recolhido e produzido
• Aprendizagem de edição
• EDITAR e VERIFICAR
• Ferramentas que aprendem as nossas correcções
![Page 16: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/16.jpg)
Contextualização, please!
• PESQUISAR e DECIDIR
• E se houvesse uma tecnologia que apenas pela análise estatística separasse na nossa TM de “Informática” os textos e os segmentos de “software de contabilidade” dos que pertencem a “manuais de utilizador de impressoras”?
• E que agrupasse as nossas pesquisas na web, em núcleos de referências temáticas?
• Essa tecnologia existe.
![Page 17: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/17.jpg)
Information Retrieval
• Segmentação de termos
• Extracção de domínios para treino de modelos de tradução e línguas
• Procura automática - grafos de dependências de termos
• Extracção automática de tópicos através da semelhança entre os termos, por Clustering de Documentos e Termos, Análise da Semântica Latente (LSA) e Relevance Feedback
![Page 18: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/18.jpg)
Information Extraction
• Segmentação de termos
• Reconhecimento de entidades nomeadas
• Procura
• Extracção automática de ontologias (aproveitando os grafos de dependências extraídos com Information Retrieval)
![Page 19: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/19.jpg)
Mapas visuais de recursos
• Information Retrieval
• Clustering de Documentos e Termos
• Expansão/colapso de clusters
• MDS - Multidimensional Scaling
• Técnicas estatísticas para visualização de informação através da exploração das semelhanças nos dados
![Page 20: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/20.jpg)
Trabalho em equipa
• Gestão de recursos
• Identificação de equipas de tradutores e revisores com a mesma especialização
• Atribuição de projectos por domínio de especialização
• Integração com ferramentas de gestão automática de projectos
• Revisão
• Identificação de fontes de referência para validação das traduções
![Page 21: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/21.jpg)
I shall say this only once…
• EDITAR e VERIFICAR
• E se cada vez que nós corrigimos um sintagma nominal, a ferramenta fizesse essa alteração sempre?
• E se cada vez que movemos um adjectivo para depois de um substantivo, de cada vez que inserimos um artigo, que mudamos o género de uma ou várias palavras, que mudamos o número de um verbo, ou que inserimos um “que” para criar uma oração subordinada, a ferramenta pudesse fazer essa alteração novamente no mesmo contexto?
• Yes, they can…
![Page 22: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/22.jpg)
Aprendizagem interactiva
• Extracção de um modelo estatístico online do texto original
• Adicionado aos modelos de tradução e de língua
• Identificação de unidades e sub-unidades
• Usado como modelo de correcção
• À medida que o texto é editado, aprende novos alinhamentos sub-segmento e corrige o modelo de tradução
• Aplica os alinhamentos aprendidos ao modelo de texto, à medida que o tradutor avança
• Pode ou não adicionar os novos alinhamentos ao modelo de tradução global
![Page 23: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/23.jpg)
Aprendizagem de edição
• Tradução automática interactiva
• Projecto Caitra (Universidade de Edimburgo)
• Correcção dos alinhamentos com base na edição
• PET - Post-editing tool
• Editor para pós-edição de tradução automática e avaliação humana das traduções
• SMARTedit - Simple MAcro-Recognition Tool editor
• Paradigma de programação por demonstração
• A aplicação grava operações de edição do utilizador para posterior aplicação em situações semelhantes
![Page 24: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/24.jpg)
Correcção por guias de estilo
Language Tool • Corrector gramatical e de estilo
• Fácil geração de regras
• Pode ser definido para cada um dos projectos de edição/tradução
• Corrector gramatical com regras em Galego
CoGrOO • Corrector gramatical para OpenOffice com regras PT-BR
![Page 25: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/25.jpg)
Conclusões
• Neste momento estão a ser desenvolvidas as ferramentas de tradução do futuro.
• Se os tradutores não participarem na definição do “caderno de encargos”, estas ferramentas vão ter muitos níveis de controlo, mas podem não servir para as necessidades dos tradutores.
• Desde que cumpram as 3 leis da robótica, as máquinas são nossas amigas.
![Page 26: Félix do Carmo e Luís Trigo - Tradutores e máquinas de tradução](https://reader033.fdocument.pub/reader033/viewer/2022052903/557954ecd8b42ab6648b498a/html5/thumbnails/26.jpg)
Obrigado.
Félix do Carmo (TIPS / CLUP)
Luís Trigo (CLUP / INESC)