Presentation deja vu_x2_animated_01-2015_moiseenko

156
Георгий Моисеенко Эксперт и член Правления Союза переводчиков России Независимый консультант и инструктор по системам Déjà Vu X ([email protected]) Введение в систему автоматизированного перевода Déjà Vu X2

Transcript of Presentation deja vu_x2_animated_01-2015_moiseenko

Page 1: Presentation deja vu_x2_animated_01-2015_moiseenko

Георгий Моисеенко

Эксперт и член ПравленияСоюза переводчиков России

Независимый консультант и инструктор

по системам Déjà Vu X

([email protected])

Введение

в систему автоматизированного перевода

Déjà Vu X2

Page 2: Presentation deja vu_x2_animated_01-2015_moiseenko

Объективная необходимость

использования

автоматизированных систем

перевода

Новое направление в технологии перевода

Page 3: Presentation deja vu_x2_animated_01-2015_moiseenko

3

Повторение пройденного

Кто из переводчиков не восклицал однажды:

«А, ведь, нечто похожее я уже переводил!

Déjà vu!»

Практические примеры документов с повторами –

Техническая документация по новой версии продукта (новой модели автомобиля и т.п.)

Документация новой версии программного обеспечения

Реклама нового модельного ряда продуктов

Ситуации разные, смысл один – работа срочная, большая, но déjà vu (уже виденное). Переводчику нужно переводить текст, сходный с ранее переведенным

Page 4: Presentation deja vu_x2_animated_01-2015_moiseenko

4

Прежние переводы хранятся в бумажном виде

При большом объеме хранимых документов поиск

конкретной фразы практически неосуществим

Page 5: Presentation deja vu_x2_animated_01-2015_moiseenko

5

Наглядный пример

В данном фрагменте Руководства пользователя количество повторов уже переведенного составляет 57%.

Page 6: Presentation deja vu_x2_animated_01-2015_moiseenko

6

Современные требования

Необходимость повышения качества переводов:

• Обеспечение единообразия терминологии

• Обеспечение единообразного перевода одних и тех же предложений

Необходимость повышения эффективности (снижение трудозатрат, сокращение сроков):

• Автоматизация рутинных операций

• Исключение полного повторного перевода документации, в которую внесены изменения и дополнения

• Исключение повторного перевода одних и тех же слов и предложений

Page 7: Presentation deja vu_x2_animated_01-2015_moiseenko

7

Структура системы

Память

переводов

Терминологическая

база

Проект

Лет 10 назад компания IBM разработала

«Систему памяти переводов» - Translation memory system

Page 8: Presentation deja vu_x2_animated_01-2015_moiseenko

8

Структура системы

Новое название - Computer-assisted translation tool (CAT tool) –

Автоматизированная система перевода

Память

переводов

Терминологическая

база

Лексикон

Проект

Page 9: Presentation deja vu_x2_animated_01-2015_moiseenko

9

Объективная необходимость

• Высокая конкуренция между переводчиками

• Работодатели требуют владения

автоматизированными системами перевода

• Заказчики требуют представления перевода в

виде базы данных

• Высокие требования к качеству и срокам

Page 10: Presentation deja vu_x2_animated_01-2015_moiseenko

Основные понятия

автоматизированных систем

перевода

Новое направление в технологии перевода

Page 11: Presentation deja vu_x2_animated_01-2015_moiseenko

11

СегментацияИсходный текст

CONFIDENTIALITY AGREEMENT

August ,2004

[address]

Re: Confidentiality Agreement

Ladies and Gentlemen:

You have requested Confidential Information from Company1

Corporation ("Company1") concerning Company1 that is either

confidential, proprietary, or publicly unavailable in connection with your

consideration of a possible business combination ("Transaction")

between you and Company1 involving TLLC. As a condition, and in

consideration, of furnishing to you "Confidential Information" (as defined below), Andrew

requires that you treat the Confidential Information so furnished confidentially as set forth

in this letter agreement (the "Confidentiality Agreement").

1. Confidential Information As used in this Confidentiality Agreement, the term

"Confidential Information" means all information concerning Company1 and its

subsidiaries or affiliates that is furnished or made available to you by Company1 or any

agent or representative of Company1 or that is obtained or derived by you from any of

the foregoing persons as part of your consideration of the Transaction,

Page 12: Presentation deja vu_x2_animated_01-2015_moiseenko

12

Представление информации

Понятие кодов, источники их появления и роль

Текст отражается в окнах DVX2 в единообразном

виде, не зависящем от формата исходного

документа.

Изменение формата, а также наличие переходов

на другой абзац и некоторых специальных

символов, изменения цвета, размера, типа

шрифта или языка, которые не нуждаются в

переводе, обозначаются в DVX2 цифрами в

фигурных скобках, которые называются

«кодами».

Page 13: Presentation deja vu_x2_animated_01-2015_moiseenko

13

Представление информации

Так например, текст

A date corrector recessed in the case allows you to easily and

comfortably set the date.

будет представлен в DVX2 в следующем виде:

{721}A{722} {723}date corrector{724} recessed {725}in the

case{726} allows {727}you{728} to {733}{729}easily and

{730}comfortably set the date.{731} {732}

Это позволяет восстановить формат документа

при его экспорте и, кроме того, повышает

эффективность работы переводчика, позволяя

ему сосредоточиться только на переводе.

Page 14: Presentation deja vu_x2_animated_01-2015_moiseenko

14

Сегментация, Текст, разбитый на сегменты

Сегмент -

абзац,

предложение

и т.п.

Сегмент оригинала

Page 15: Presentation deja vu_x2_animated_01-2015_moiseenko

15

Память переводовСводная таблица

Сегмент оригинала Сегмент перевода

Page 16: Presentation deja vu_x2_animated_01-2015_moiseenko

16

Основные функции систем

• Импорт переводимых файлов в систему

• Анализ трудоемкости перевода

• Создание памяти переводов

• Предварительный глобальный перевод

• Автоматический поиск и подстановка переводов сходных предложений

• Перевод в текстовом редакторе

• Пополнение и ведение терминологической базы данных и памяти переводов

• Экспорт файлов

• Оценка сделанных трудозатрат

Page 17: Presentation deja vu_x2_animated_01-2015_moiseenko

ПОЧЕМУ Déjà Vu X?

Новое направление в технологии перевода

Page 18: Presentation deja vu_x2_animated_01-2015_moiseenko

18

Все системы умеют находить в памяти переводов предложения, сходные с

переведенными

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences и задайте нужные

параметры, чтобы удалить дублирующие записи (проверьте правильность указания

языков).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Удаление ненужных переводов одного и того же оригинала.

Запустите Déjà Vu X2 и откройте нужную память переводов

(Translation memory).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по

алфавиту.

Page 19: Presentation deja vu_x2_animated_01-2015_moiseenko

19

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры,

чтобы удалить дублирующие записи (проверьте правильность указания языков).

Выберите в меню Database команду Find Duplicate Sentences.Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Удаление ненужных переводов одного и того же оригинала.

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по

алфавиту.

Déjà Vu X, кроме того, автоматически подставляет фрагменты предложений

из памяти переводов

Page 20: Presentation deja vu_x2_animated_01-2015_moiseenko

20

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation

memory).

Выберите в меню Database команду Find Duplicate Sentences и задайте нужные

параметры, чтобы удалить дублирующие записи (проверьте правильность

указания языков).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Удаление ненужных переводов одного и того же оригинала.

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре

строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память

переводов по алфавиту.

Déjà Vu X автоматически подставляет слова и из терминологической базы

Page 21: Presentation deja vu_x2_animated_01-2015_moiseenko

21

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation

memory).

Выберите в меню Database команду Find Duplicate Sentences.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Количество символов текста – 1052

Обычная система найдет 190 символов повторяющихся

предложений - 18%:

Обнаруживается больше повторов

Page 22: Presentation deja vu_x2_animated_01-2015_moiseenko

22

Запустите откройте память переводов

Выберите в меню команду задайте

параметры, удалить записи проверьте

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле

Пометьте поле Find sets of duplicate source sentences

Пометьте поле.

Укажите языки.

Пометьте разделе

Удаление переводов оригинала.

Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

просмотра переводов выберите

Déjà Vu X дополнительно найдет 424 символа повторяющихся фрагментов – 40%,

итого - 58%. Не считая английских слов и чисел, которые подставляются в перевод

автоматически (View, Toggle Sorting и т.п., здесь не учтены) .

58% против 18%!C помощью функции "мозаичного перевода " (AutoAssemble) перевод

автоматически собирается из фрагментов сегментов, найденных в

памяти переводов, и терминов из терминологической базы.

Обнаруживается больше повторов

Page 23: Presentation deja vu_x2_animated_01-2015_moiseenko

Удобство и эффективность

Новое направление в технологии перевода

Page 24: Presentation deja vu_x2_animated_01-2015_moiseenko

24

Единое рабочее пространство для всех действий

• Перевод проектов

• Управление памятями переводов и терминологическими базами

• Выравнивание документов на двух языках

• Работа с фильтрами

• Создание проектов, в том числе по шаблону

Page 25: Presentation deja vu_x2_animated_01-2015_moiseenko

25

Открытие проекта

Page 26: Presentation deja vu_x2_animated_01-2015_moiseenko

26

Сохранение проекта в компактном виде

Пакет Pack & Go представляет собой сжатый файл, экспортированный

из проекта, который содержит либо весь проект, либо его часть. Он

может быть использован для передачи как работы переводчикам, так и

выполненного перевода менеджеру проекта.

Page 27: Presentation deja vu_x2_animated_01-2015_moiseenko

27

Экспорт и повторный импорт

Page 28: Presentation deja vu_x2_animated_01-2015_moiseenko

28

Инструменты проекта

• Возможность уплотнения памяти переводов,

терминологической базы, проекта и фильтра• Возможность восстановления поврежденных памяти

переводов, терминологической базы, проекта и фильтра

Page 29: Presentation deja vu_x2_animated_01-2015_moiseenko

29

Конфигурация проекта

• Один проект – несколько файлов

• Один проект – разные форматы файлов

• Возможность одновременного перевода файлов разного типа как цельного сводного документа

• Простой импорт файлов разных форматов

• Возможность добавления новых документов в выполняемый проект без прерывания перевода

Page 30: Presentation deja vu_x2_animated_01-2015_moiseenko

30

Возможность одновременного перевода документа на несколько языков с сохранением переводов на разные языки в одном проекте, одной памяти переводов и одной терминологической базе

Применимы все языки, поддерживаемые

Windows, включая:

• китайский

Поддерживаемые языки

• арабский и иврит

Поддерживаемые языки

Поддерживаемые языки

Page 31: Presentation deja vu_x2_animated_01-2015_moiseenko

32

Особенности

• Возможность использования нескольких вариантов

заполнения исходных памяти переводов,

терминологической базы и Лексикона.

• Возможность параллельного использования памятей

переводов и терминологических баз несколькими

переводчиками и для нескольких проектов.

• Одни и те же памяти переводов и терминологические

базы могут использоваться для противоположных

направлений перевода.

• Возможность создания словарей в формате MS

Office на основе терминологической базы.

• Возможность уплотнения баз данных и проекта

Page 32: Presentation deja vu_x2_animated_01-2015_moiseenko

33

А также:

Rich Text Format, Windows Help, Microsoft Access, Adobe InDesign, ASCII, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, RC, C/C++/Java, Java properties, IBM TM untranslated segments, GNU PO и POT и файлы в кодах ASCII - plain text files.

Импорт файлов разных форматов, без конвертирования в промежуточные форматы.

Представление всех документов в едином формате.

Импорт. Форматы. Совместимость

Page 33: Presentation deja vu_x2_animated_01-2015_moiseenko

34

Импорт-экспорт баз данных, обмен информацией с другими системами

• Обеспечивается обмен информацией с другими

системами

Допустимы в различных форматах (Excel, Access,

text, TMX,..)

• Может применяться для создания резервных

копий

• Создание словарей в формате MS Office по

терминологической базе

• Создание терминологической базы и памяти

переводов по файлам MS Office

Page 34: Presentation deja vu_x2_animated_01-2015_moiseenko

Удобный, легко настраиваемый

интерфейс

Новое направление в технологии перевода

Page 35: Presentation deja vu_x2_animated_01-2015_moiseenko

36

Удобный, легко настраиваемый интерфейс

Гибкость настроек и размещения окон

Page 36: Presentation deja vu_x2_animated_01-2015_moiseenko

37

Привычный интерфейс

Сходен с интерфейсом Windows

Те же клавиши быстрого вызова, что и в Windows

Те же функции Автотекст, Автозамена и Правописание, что и в MS Word

Полностью настраиваются:

• Тип и размер шрифта

• Цвета

• Компоновка окон

Язык можно выбирать

Page 37: Presentation deja vu_x2_animated_01-2015_moiseenko

38

Особенности

• В одну и ту же память переводов и терминологическую

базу могут одновременно записываться переводы на

несколько языков.

• Адаптируемость структуры терминологической базы,

практически неограниченные возможности настройки

атрибутов.

• Возможность создания терминологической базы и

памяти переводов по файлам MS Office.

Page 38: Presentation deja vu_x2_animated_01-2015_moiseenko

39

Перевод и базы данных

Возможность полного управления информацией

в базах данных, не прерывая перевода,

поскольку в процессе перевода доступ к ним не

блокируется

Простота пополнения памяти переводов и

терминологической базы в процессе перевода

• Автоматическое направление перевода в

память переводов (AutoSend)

• Ручное пополнение терминологической базы

Возможность записи в память переводов

отдельных частей сегментов

Page 39: Presentation deja vu_x2_animated_01-2015_moiseenko

40

Возможность импорта и экспорта памяти переводов,

терминологической базы и Лексикона в разных

форматах, что обеспечивает обмен информацией с

другими системами.

Совместимость с другими системами

Page 40: Presentation deja vu_x2_animated_01-2015_moiseenko

41

Рабочее пространство

Сегментированный текст оригинала

Редактируемые ячейки

Фрагменты, найденные в памяти переводов и терминологической

базе

Список импорти-рованных файлов

Предложения, найденные в памяти переводов

Рабочее окно

Page 41: Presentation deja vu_x2_animated_01-2015_moiseenko

42

Выборочный вывод сегментов на экран

Мощная система фильтрации сегментов по более чем десяти

параметрам, включая заданные пользователем на основе SQL

Page 42: Presentation deja vu_x2_animated_01-2015_moiseenko

43

Автоматический контроль (AutoCheck) и обеспечение единообразия

• Обнаружение несоответствия терминов ранее употребленным или терминам в Лексиконе и терминологической базе, а также различия дат, чисел и кодов в оригинале и переводе.

• Обеспечение однократного и единообразного перевода одинаковых сегментов благодаря автоматической подстановке перевода для аналогичных сегментов (Autopropagate) во всех файлах проекта

• Дополнительные возможности обеспечения единообразия при переводе упорядоченного по алфавиту проекта целиком, (легче обнаруживаются опечатки и синонимы)

• Параллельное представление сегментов оригинала и перевода уменьшает риск пропусков в тексте

• При групповой работе редакторы могут начинать работу практически сразу, делая мгновенные рекомендации по терминологии и переводу

Page 43: Presentation deja vu_x2_animated_01-2015_moiseenko

44

• Система работает практически без сбоев, в

случае сбоя информация не теряется

• Осуществляется автосохранение всех

компонентов

• Имеются встроенные средства для

восстановления поврежденных баз данных и

проекта

Надежность и защищенность

Page 44: Presentation deja vu_x2_animated_01-2015_moiseenko

45

Доступ к различным элементам проекта по паролям

• Возможность запрета редактирования текста или записи в память переводов

• 10 уровней индивидуальных полномочий пользователей с различными правами для чтения и записи в соответствии с квалификацией или обязанностями (переводчик, редактор, менеджер)

• Пользователи с низким уровнем (переводчики) не могут исправлять внесенное пользователями более высокого уровня (редакторами). Элементарно реализуется правило "Желание начальника - закон для подчиненных"

• Отслеживается, кто, когда и какие внес изменения в проект и базы данных

Защита от несанкционированного внесения изменений

Page 45: Presentation deja vu_x2_animated_01-2015_moiseenko

46

Особенности

Все базы данных основаны на стандартной СУБД Jet

Базы предназначены для нескольких языков одновременно

Адаптируемая структура терминологической базы

• Добавление атрибутов и категорий -- практически неограниченные возможности настройки.

• Настраивается столько параметров, категорий и связей, сколько требуется пользователю

Термины оригинала

Переводы термина на разные языки, его

синонимы и антонимы

Атрибуты для обоих языков,

включая контекст

Page 46: Presentation deja vu_x2_animated_01-2015_moiseenko

47

Особенности

Четырехмерная структура классификации записей проекта, памяти переводов и терминологической базы

Это позволяет отобрать записи, относящиеся к конкретному заказчику, тематике, проекту, файлу или их комбинации

Page 47: Presentation deja vu_x2_animated_01-2015_moiseenko

Эффективность

Новое направление в технологии перевода

Page 48: Presentation deja vu_x2_animated_01-2015_moiseenko

49

Эффективность

Статистика для одного из больших документов

Точное совпадение с предложениями в памяти переводов 33,1%

Неточное совпадение с предложениями в памяти 4,2%

Автоматическая сборка из фрагментов предложений в памяти и терминов 0,3%

Копирование перевода аналогичных предложений далее по тексту 37,3%

Перевод вручную 25,2%

---------------------------------------------------------------------------------------------------

Примечание: Высокая степень совпадений объясняется тем, что в памяти переводов уже содержался предварительный перевод трех разделов данного документа.

Полученная выгода очевидна

Page 49: Presentation deja vu_x2_animated_01-2015_moiseenko

50

Уникальный пример проекта

42% текста подставлено автоматически,

хотя исходная память составлена по 1 файлу

с переводом 245 сегментов из 2627)

Эффективность

Page 50: Presentation deja vu_x2_animated_01-2015_moiseenko

51

Статистика для одного проекта

Вид документа Паспорта безопасности препаратов

Количество файлов в проекте 18

Объем проекта 52800 слов (29 учетных страниц)

Количество переводчиков 5

Редактор 1

Начальный объем памяти переводов 0

Наличие словаря проекта 0 слов

Повторяемость текста 50%

Расчетное время ручного перевода 5

переводчиками (без учета редактирования) 6 рабочих дней

Реальное время выполнения 3 рабочих дня с редактированием.

Экономические выгоды для бюро

переводов в месяц легко подсчитываются

Page 51: Presentation deja vu_x2_animated_01-2015_moiseenko

52

Эффективность

Средний процент повторений в документах, обнаруживаемый

системой – 20-30%.

Норма переводчика: 1 страница в час

В месяце – 22 рабочих дня по 8 часов = 176 часов

20% от 176 = 35 часов

= 4 рабочих дня !

В больших пакетах документов для некоторых документов

процент повторений достигал 100%.

Легко подсчитать экономию, умножив

на зарплату в час!

Page 52: Presentation deja vu_x2_animated_01-2015_moiseenko

Подготовка к переводу

Новое направление в технологии перевода

Page 53: Presentation deja vu_x2_animated_01-2015_moiseenko

54

Параметры проекта. Общие

Page 54: Presentation deja vu_x2_animated_01-2015_moiseenko

55

Параметры проекта. Общие (продолжение)

Page 55: Presentation deja vu_x2_animated_01-2015_moiseenko

56

Параметры проекта. Отображение

Page 56: Presentation deja vu_x2_animated_01-2015_moiseenko

57

Параметры проекта. Перевод

Page 57: Presentation deja vu_x2_animated_01-2015_moiseenko

58

Параметры проекта. Перевод (продолжение)

Page 58: Presentation deja vu_x2_animated_01-2015_moiseenko

59

Параметры проекта. Сегментация

Page 59: Presentation deja vu_x2_animated_01-2015_moiseenko

60

Параметры проекта. Темы

Page 60: Presentation deja vu_x2_animated_01-2015_moiseenko

Память переводов Терминологическая база

Новое направление в технологии перевода

Page 61: Presentation deja vu_x2_animated_01-2015_moiseenko

66

Создание и пополнение памяти переводов

• Выравнивание (Alignment) –

Создание памяти переводов

по документу-оригиналу и

документу-переводу

• Импорт двуязычного файла MS Office

• Импорт имеющейся памяти переводов

• Импорт памяти в формате TMX

Page 62: Presentation deja vu_x2_animated_01-2015_moiseenko

67

Импорт двуязычного файла

Page 63: Presentation deja vu_x2_animated_01-2015_moiseenko

68

Импорт двуязычного файла

Page 64: Presentation deja vu_x2_animated_01-2015_moiseenko

69

Импорт двуязычного файла

Page 65: Presentation deja vu_x2_animated_01-2015_moiseenko

70

Импорт двуязычного файла

Page 66: Presentation deja vu_x2_animated_01-2015_moiseenko

71

Импорт двуязычного файла

Импорт файла в формате Excel осуществляется

аналогичным образом

Page 67: Presentation deja vu_x2_animated_01-2015_moiseenko

72

Импорт памяти переводов Déjà Vu X3 в память переводов

Page 68: Presentation deja vu_x2_animated_01-2015_moiseenko

73

Импорт памяти переводов Déjà Vu X3в память переводов

Page 69: Presentation deja vu_x2_animated_01-2015_moiseenko

74

Импорт памяти переводов в формате TMXв память переводов

Page 70: Presentation deja vu_x2_animated_01-2015_moiseenko

75

Импорт памяти переводов в формате TMXв память переводов

Page 71: Presentation deja vu_x2_animated_01-2015_moiseenko

76

Импорт памяти переводов в формате TMXв память переводов

Page 72: Presentation deja vu_x2_animated_01-2015_moiseenko

77

Импорт памяти переводов в формате Trados Workbench в память переводов

Page 73: Presentation deja vu_x2_animated_01-2015_moiseenko

78

Импорт памяти переводов в формате Trados Workbench в память переводов

Page 74: Presentation deja vu_x2_animated_01-2015_moiseenko

79

Импорт памяти переводов в формате Trados Workbench в память переводов

Page 75: Presentation deja vu_x2_animated_01-2015_moiseenko

80

Импорт терминологической базы в формате Multiterm

Page 76: Presentation deja vu_x2_animated_01-2015_moiseenko

81

Импорт терминологической базы в формате Multiterm

Page 77: Presentation deja vu_x2_animated_01-2015_moiseenko

82

Импорт терминологической базы в формате Multiterm

Page 78: Presentation deja vu_x2_animated_01-2015_moiseenko

83

Создание и пополнение терминологической базы

• Импорт двуязычного файла MS Office

• Импорт терминологической базы

в формате Multiterm

Page 79: Presentation deja vu_x2_animated_01-2015_moiseenko

84

Импорт памяти переводов в формате TMXв память переводов

Page 80: Presentation deja vu_x2_animated_01-2015_moiseenko

85

Импорт памяти переводов в формате TMXв память переводов

Page 81: Presentation deja vu_x2_animated_01-2015_moiseenko

86

Импорт памяти переводов в формате TMXв память переводов

Page 82: Presentation deja vu_x2_animated_01-2015_moiseenko

87

Импорт памяти переводов в формате TMXв память переводов

Page 83: Presentation deja vu_x2_animated_01-2015_moiseenko

88

Импорт памяти переводов в формате TMXв память переводов

Page 84: Presentation deja vu_x2_animated_01-2015_moiseenko

89

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Большое число допустимых форматов (Word, Excel, Text, Open Office, Quark Xpress XTG, RTF, SGML, XML,…)

Page 85: Presentation deja vu_x2_animated_01-2015_moiseenko

90

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Page 86: Presentation deja vu_x2_animated_01-2015_moiseenko

91

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Page 87: Presentation deja vu_x2_animated_01-2015_moiseenko

92

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Page 88: Presentation deja vu_x2_animated_01-2015_moiseenko

93

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Page 89: Presentation deja vu_x2_animated_01-2015_moiseenko

94

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Page 90: Presentation deja vu_x2_animated_01-2015_moiseenko

95

Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода

Полученная память переводов

Page 91: Presentation deja vu_x2_animated_01-2015_moiseenko

96

Поиск сегментов-дубликатов оригинала с

одинаковым и разным переводом

Эффективный учет и исключение повторов в памяти переводов

Page 92: Presentation deja vu_x2_animated_01-2015_moiseenko

97

Создание терминологической базы

Page 93: Presentation deja vu_x2_animated_01-2015_moiseenko

98

Создание терминологической базы

Page 94: Presentation deja vu_x2_animated_01-2015_moiseenko

99

Создание терминологической базы

Английский (США) Русский

Page 95: Presentation deja vu_x2_animated_01-2015_moiseenko

100

Создание терминологической базы

Page 96: Presentation deja vu_x2_animated_01-2015_moiseenko

101

Импорт словаря в формате MS Officeв терминологическую базу

Преобразуйте словарь в таблицу Word или Excel и добавьте в нее

дополнительные столбцы:

Context для каждого языка, Subject (тематика), Client (заказчик), User,

Date (дата).

Context – контекст, пояснение или определение

User – текущий пользователь, автор или источник информации.

Таблицу Word преобразуйте в формат txt с разделителем tab

English Russian Context_en Context_ru Subject Client User Date

BCT терминал

деловой

связи

Business

communications

terminal.

Цифровой

терминал

данных,

используемый

для деловых

приложений

654 англо-

русский

словарь по

телефонии

19.05.2010

Base

station

Базовая

станция

A fixed site with

network

equipment

Центральный

пункт соты

или сектора

внутри нее

654 Georgiy

Moiseenko

25.01.2005

Page 97: Presentation deja vu_x2_animated_01-2015_moiseenko

102

Импорт словаря в формате MS Officeв терминологическую базу

Page 98: Presentation deja vu_x2_animated_01-2015_moiseenko

103

Импорт словаря в формате MS Officeв терминологическую базу

Page 99: Presentation deja vu_x2_animated_01-2015_moiseenko

104

Импорт словаря в формате MS Officeв терминологическую базу

Page 100: Presentation deja vu_x2_animated_01-2015_moiseenko

105

Импорт словаря в формате MS Officeв терминологическую базу

Page 101: Presentation deja vu_x2_animated_01-2015_moiseenko

106

Импорт словаря в формате MS Officeв терминологическую базу

Импорт файла в формате Excel осуществляется

аналогичным образом

Page 102: Presentation deja vu_x2_animated_01-2015_moiseenko

107

Импорт словаря в формате MS Officeв терминологическую базу

Page 103: Presentation deja vu_x2_animated_01-2015_moiseenko

108

Импорт словаря в формате MS Officeв терминологическую базу

Page 104: Presentation deja vu_x2_animated_01-2015_moiseenko

109

Импорт памяти переводов Déjà Vu X3 в память переводов

Page 105: Presentation deja vu_x2_animated_01-2015_moiseenko

110

Импорт памяти переводов Déjà Vu X3 в память переводов

Page 106: Presentation deja vu_x2_animated_01-2015_moiseenko

111

Импорт памяти переводов Déjà Vu X3 в память переводов

Page 107: Presentation deja vu_x2_animated_01-2015_moiseenko

112

Импорт словаря в формате MS Officeв терминологическую базу

Page 108: Presentation deja vu_x2_animated_01-2015_moiseenko

113

Импорт словаря в формате MS Officeв терминологическую базу

Page 109: Presentation deja vu_x2_animated_01-2015_moiseenko

114

Импорт словаря в формате MS Officeв терминологическую базу

Page 110: Presentation deja vu_x2_animated_01-2015_moiseenko

115

Импорт словаря в формате MS Officeв терминологическую базу

Page 111: Presentation deja vu_x2_animated_01-2015_moiseenko

116

Импорт словаря в формате MS Officeв терминологическую базу

Page 112: Presentation deja vu_x2_animated_01-2015_moiseenko

117

Импорт словаря в формате MS Officeв терминологическую базу

Page 113: Presentation deja vu_x2_animated_01-2015_moiseenko

118

Импорт словаря в формате MS Officeв терминологическую базу

Page 114: Presentation deja vu_x2_animated_01-2015_moiseenko

119

Импорт словаря в формате MS Officeв терминологическую базу

Page 115: Presentation deja vu_x2_animated_01-2015_moiseenko

120

Импорт словаря в формате MS Officeв терминологическую базу

Page 116: Presentation deja vu_x2_animated_01-2015_moiseenko

121

Импорт словаря в формате MS Officeв терминологическую базу

Page 117: Presentation deja vu_x2_animated_01-2015_moiseenko

122

Импорт словаря в формате MS Officeв терминологическую базу

Page 118: Presentation deja vu_x2_animated_01-2015_moiseenko

123

Экспорт терминологической базы в файл txt или Excel

выполняется аналогичным образом

Вид терминологической базы

Page 119: Presentation deja vu_x2_animated_01-2015_moiseenko

124

Несколько баз данных

• Возможность подключения большого числа баз данных

для одного проекта

• Индивидуальное

задание режимов

«Только чтение»,

«Только запись»,

«Чтение и запись» и

упорядочивание по

приоритетам

• Возможность одновременного использования

несколькими переводчиками, переводящими на разные

языки

Page 120: Presentation deja vu_x2_animated_01-2015_moiseenko

125

Режимы перевода

• Перевод отдельных файлов проекта

• Перевод всего пакета файлов разного формата как

единого документа

• Перевод всего пакета файлов, упорядоченного по

алфавиту

• Перевод одним переводчиком

• Перевод отдельными переводчиками,

работающими изолированно

• Перевод группой переводчиков, работающих

одновременно в офисе

• Перевод группой переводчиков в режиме

удаленного доступа

Page 121: Presentation deja vu_x2_animated_01-2015_moiseenko

126

Основные этапы

Создание и настройка проекта

Импорт файлов

Автоматический поиск в памяти

переводов с использованием

нечеткой логики и автоматическая

сборка

Ручной перевод

Экспорт

Переводчик создает и настраивает проект

Переводчик импортирует документы

DVX2 находит сходные предложения

или строит часть перевода

автоматически

Переводчик переводит остальное

DVX2 экспортирует документы

Предварительная обработка

документов проекта

Переводчик приводит документы к виду,

облегчающему перевод и предотвращающему

возникновение проблем

Редактирование и

форматирование переводов

Переводчик редактирует и форматирует

экспортированные переведенные

документы

Page 122: Presentation deja vu_x2_animated_01-2015_moiseenko

128

Импорт и экспорт документов

• Удобная система правил сегментации. Правила сегментации

можно настраивать для совместимости с другими

системами, чтобы обеспечить тождественность их памятей

переводов

• Возможность задания параметров импорта

• В выполняемый проект можно добавлять новые документы,

не прерывая перевода

• Восстановление формата документа при его экспорте.

Page 123: Presentation deja vu_x2_animated_01-2015_moiseenko

130

Анализ наличия и степени повторений в исходных

файлах – оценка трудоемкости будущей работы

Page 124: Presentation deja vu_x2_animated_01-2015_moiseenko

131

Анализ наличия и степени повторений – оценка

трудоемкости будущей работы

Дубликатов – 17%

Сходных элементов - 25% (сходство более 20%), - 16% (сходство до 20%)

Точных совпадений – 21%

Всего

Несходных элементов –23%

Page 125: Presentation deja vu_x2_animated_01-2015_moiseenko

132

Глобальный предварительный перевод (Pretranslation)

DVX2 просматривает памяти переводов и терминологические базы, чтобы автоматически

вставить точный или сходный перевод

Page 126: Presentation deja vu_x2_animated_01-2015_moiseenko

133

Глобальный предварительный перевод

Page 127: Presentation deja vu_x2_animated_01-2015_moiseenko

134

Рабочее пространство

Сегментированный текст оригинала

Редактируемые ячейки

Фрагменты, найденные в памяти переводов и терминологической

базе

Список импорти-рованных файлов

Предложения, найденные в памяти переводов

Рабочее окно

Page 128: Presentation deja vu_x2_animated_01-2015_moiseenko

135

Поиск в памяти переводов

Page 129: Presentation deja vu_x2_animated_01-2015_moiseenko

136

Поиск в памяти переводов

Page 130: Presentation deja vu_x2_animated_01-2015_moiseenko

137

Автоматический поиск переводов сходных предложений (AutoSearch)

Сходные сегменты

Отличие оригинала от найденного

сегмента

Отличие найденного сегмента от оригинала

При единственном выборе перевод

подставляется в поле перевода автоматически

Page 131: Presentation deja vu_x2_animated_01-2015_moiseenko

138

Поиск на основе нечеткой логики

• Как при глобальном предварительном переводе,

так и при любом автоматическом поиске в памяти

переводов и терминологической базе,

обнаружение сходства осуществляется на основе

сложнейшего математического алгоритма,

основанного на «нечеткой логике», который

определяет сходство, используя до десятка

критериев, в том числе и близость тематик

• Гарантированное совпадение – автоматическое

подтверждение (на основе анализа контекста) того,

что найденный схожий перевод является точным.

Page 132: Presentation deja vu_x2_animated_01-2015_moiseenko

139

Нечеткий поиск при предварительном переводе и ручном переводе

При ручном переводе автоматический поиск с

использованием нечеткой логики обнаруживает

большее количество сходных сегментовСимволов

Состояние сегмента: Предварительный

перевод

Ручной

автоматизированный

перевод

Непомечен 142628 78076

Непереведен 27771 13524

Ручной перевод 0 4707

Точное совпадение 33927 2136

Неточное совпадение 3797 896

Сборка 77133 55072

Распространение

точного совпадения

0 1741

Закончено 0 64552

Итого 144388 144388

Page 133: Presentation deja vu_x2_animated_01-2015_moiseenko

140

Автоматическая сборка (AutoAssemble)

Автоматическая сборка перевода из фрагментов

предложений в памяти переводов и элементов

терминологической базы, если не найден перевод

всего предложения, – уникальная функция,

которая имеется только в Déjà Vu X2

Page 134: Presentation deja vu_x2_animated_01-2015_moiseenko

141

Наличие нескольких вариантов перевода

указывается цветом. Просмотр – нажатием правой

кнопки мыши. Выбранный перевод подставляется

в поле перевода автоматически.

Индикация наличия нескольких вариантов перевода

Page 135: Presentation deja vu_x2_animated_01-2015_moiseenko

142

DeepMiner анализирует памяти переводов и подсказывает

варианты перевода фрагментов сегментов.

DeepMiner

Page 136: Presentation deja vu_x2_animated_01-2015_moiseenko

143

Ручной поиск в файлах памяти переводов (Scan)

Сходные сегменты

Искомое слово или

словосочетание

Найденный оригинал Найденный перевод

Page 137: Presentation deja vu_x2_animated_01-2015_moiseenko

144

Поиск с использованием трафаретных символов

Возможен поиск слов и словосочетаний с использованием

трафаретных символов (wildcards). Если ввести в сегмент

перевода con* fil*, выделить этот текст, щелкнуть правой кнопкой

мыши и выбрать в контекстном меню Scan, Déjà Vu X2 покажет

найденные в памятях переводов оригиналы (и их переводы),

содержащие слова, начинающиеся с "con" и "fil", например:

Config Filename:

Config filename:

Confirm File Move

Config file:

configuration file

Confirm File Delete

Confirm Delete of Read-Only File

и т.д.

Page 138: Presentation deja vu_x2_animated_01-2015_moiseenko

145

Принципы ведения памяти переводов

Для того чтобы повысить эффективность автоматической сборки,

целесообразно сохранять в памяти не только сегмент, но и его

фрагменты, которые могут встретиться в дальнейшем как единое

целое (например, "эффективность использования", "в дальнейшем" и

т.п.). Например, для сегмента

In London, traffic congestion is a serious problem

в память переводов целесообразно внести следующие оригиналы и их

переводы:

In London, traffic congestion is a serious problem

In London

traffic congestion

serious problem.

Это помогает предотвратить автоматическую сборку перевода

выражения из фрагментов, имеющихся в памяти переводов (is, a,

serious, problem), вместо подстановки перевода всего выражения,

имеющегося в терминологической базе данных (is a serious problem).

Page 139: Presentation deja vu_x2_animated_01-2015_moiseenko

146

Перевод и базы данных

Возможность записи в память переводов отдельных частей

сегментов

Page 140: Presentation deja vu_x2_animated_01-2015_moiseenko

147

Запись в несколько терминологических баз

Page 141: Presentation deja vu_x2_animated_01-2015_moiseenko

148

Особенности

Термины и предлагаемый вариант из памяти переводов

можно править, не выходя из окна редактирования

Page 142: Presentation deja vu_x2_animated_01-2015_moiseenko

149

Временный экспорт в MS Word для анализа и редактирования его

средствами с возвратом в Déjà Vu X2

Page 143: Presentation deja vu_x2_animated_01-2015_moiseenko

150

Обеспечение качества

Page 144: Presentation deja vu_x2_animated_01-2015_moiseenko

151

Экспорт примечаний

Примечания, введенные при работе в Déjà Vu X2 (как указано

выше), будут видны и в экспортированном файле:

Page 145: Presentation deja vu_x2_animated_01-2015_moiseenko

152

Статистика

Word count: подсчет числа строк, слов и символов в каждом файле – оценка объема работ, выполненного на данном этапе

Page 146: Presentation deja vu_x2_animated_01-2015_moiseenko

153

Лексикон

• Учет терминологической специфики проекта, в частности

непереводимые названия, содержащие переводимые слова.

Частота употребления

Число слов

Упорядочено по частоте

• Учет требований заказчика к терминологии. Наличие Лексикона

позволяет реализовать правило: "Клиент всегда прав" и

переводить, например, по требованию заказчика, mouse не как

"мышь", а как "мышка", не изменяя ничего в основной

терминологической базе

Page 147: Presentation deja vu_x2_animated_01-2015_moiseenko

154

• Это позволяет быстро составить словарь общей лексики, исключив все редко употребляемые термины

Лексикон

• С помощью Лексикона можно пополнить терминологические базы данных и памяти переводов

• Лексикон может импортироваться из файлов MS Office и экспортироваться в них.

• Лексикон позволяет проанализировать частотность терминов

• Кроме того можно составить словарь клише, отобрав все часто встречающиеся словосочетания

Page 148: Presentation deja vu_x2_animated_01-2015_moiseenko

155

Язык структурированных запросов SQL

В руководстве пользователя около 70 стандартных

операторов SQL для глобального удаления, модификации

и экспорта записей баз данных с определенными

атрибутами

определенный период времен

конкретный заказчик

конкретный проект

конкретная тематика

конкретный пользователь

наличие определенного фрагмента текста

Большое количество дополнительных операторов SQL на

форуме dеjavu-I –

http://tech.groups.yahoo.com/group/dejavu-l/

Page 149: Presentation deja vu_x2_animated_01-2015_moiseenko

156

Принципы ведения баз данных

Для того чтобы предотвратить возможную утерю или порчу баз

данных вследствие неопытности пользователей или по другим

причинам, рекомендуется разделить все данные на постоянные,

которые не изменяются или изменяются мало (например,

завершенные проекты) и доступны пользователям только для

чтения), и временные (для текущих проектов), которые

доступны для чтения и записи.

Постоянные данные можно объединить в группы в

соответствии с тематиками и заказчиками, а временные –

в соответствии с проектами.

Перед переносом информации из временной базы данных в

постоянную целесообразно проанализировать ее и, например,

удалить сегменты-дубликаты, а также сегменты, состоящие

только из дат, чисел и непереводимых слов и словосочетаний.

Page 150: Presentation deja vu_x2_animated_01-2015_moiseenko

Версии и информационные

ресурсы

Новое направление в технологии перевода

Page 151: Presentation deja vu_x2_animated_01-2015_moiseenko

158

Новая версия системы – DVX3

Новая версия системы Déjà Vu (DVX3) имеет более удобный

интерфейс и обладает целым рядом новых возможностей.

Более подробную информацию можно получить по адресам:

http://www.atril.com/content/discover-deja-vu-x3

http://www.atril.com/content/compare-our-products

Адрес для загрузки пробной версии и приобретения систем

Déjà Vu X3

http://www.atril.com

Там же можно подписаться на участие в обучающих

семинарах.

Page 152: Presentation deja vu_x2_animated_01-2015_moiseenko

159

Варианты новой системы DVX3

DVX3 WorkgroupDVX3 Professional

DVX3 Free

Free – Бесплатная автономная программа для внештатных

переводчиков, позволяющая работать с проектами-сателлитами,

поступившими от бюро переводов.

Professional – Классическая версия, предназначена для

внештатных переводчиков и имеет все возможности.

Workgroup – Все функции Professional плюс мощные

возможности для управления работой переводчиков и

организации групповой работы.

Page 153: Presentation deja vu_x2_animated_01-2015_moiseenko

160

Новая версия системы – DVX3

Page 154: Presentation deja vu_x2_animated_01-2015_moiseenko

161

Новая версия системы – DVX3

Page 155: Presentation deja vu_x2_animated_01-2015_moiseenko

162

• Сайт компании Atril – http://helpdesk.atril.com/

• Форум dеjavu-L – http://tech.groups.yahoo.com/group/dejavu-L

• Форум Союза переводчиков России –

http://www.translators-

union.ru/index.php?option=com_kunena&view=topic&catid=12&id

=872&Itemid=299

• Translation memory. –

http://en.wikipedia.org/wiki/Translation_memory#References_and_

interesting_links

• Г. Е. Моисеенко. Слова, слова, слова… (О терминологических базах). Мосты, №1(33), 2012, с. 26–30

• Г. Е. Моисеенко. Опыт практического использования системы Deja Vu X Workgroup в режиме рабочей группы и удаленного доступа переводчиков и редакторов. Мосты, №4(23), 2009, с. 69–80

Ресурсы в сети Интернет для Deja Vu X,

Page 156: Presentation deja vu_x2_animated_01-2015_moiseenko

163

Спасибоза внимание!

Успехов!