Presentation deja vu_x2_animated_01-2015_moiseenko
-
Upload
georgy-moiseenko -
Category
Software
-
view
480 -
download
0
Transcript of Presentation deja vu_x2_animated_01-2015_moiseenko
Георгий Моисеенко
Эксперт и член ПравленияСоюза переводчиков России
Независимый консультант и инструктор
по системам Déjà Vu X
Введение
в систему автоматизированного перевода
Déjà Vu X2
Объективная необходимость
использования
автоматизированных систем
перевода
Новое направление в технологии перевода
3
Повторение пройденного
Кто из переводчиков не восклицал однажды:
«А, ведь, нечто похожее я уже переводил!
Déjà vu!»
Практические примеры документов с повторами –
Техническая документация по новой версии продукта (новой модели автомобиля и т.п.)
Документация новой версии программного обеспечения
Реклама нового модельного ряда продуктов
Ситуации разные, смысл один – работа срочная, большая, но déjà vu (уже виденное). Переводчику нужно переводить текст, сходный с ранее переведенным
4
Прежние переводы хранятся в бумажном виде
При большом объеме хранимых документов поиск
конкретной фразы практически неосуществим
5
Наглядный пример
В данном фрагменте Руководства пользователя количество повторов уже переведенного составляет 57%.
6
Современные требования
Необходимость повышения качества переводов:
• Обеспечение единообразия терминологии
• Обеспечение единообразного перевода одних и тех же предложений
Необходимость повышения эффективности (снижение трудозатрат, сокращение сроков):
• Автоматизация рутинных операций
• Исключение полного повторного перевода документации, в которую внесены изменения и дополнения
• Исключение повторного перевода одних и тех же слов и предложений
7
Структура системы
Память
переводов
Терминологическая
база
Проект
Лет 10 назад компания IBM разработала
«Систему памяти переводов» - Translation memory system
8
Структура системы
Новое название - Computer-assisted translation tool (CAT tool) –
Автоматизированная система перевода
Память
переводов
Терминологическая
база
Лексикон
Проект
9
Объективная необходимость
• Высокая конкуренция между переводчиками
• Работодатели требуют владения
автоматизированными системами перевода
• Заказчики требуют представления перевода в
виде базы данных
• Высокие требования к качеству и срокам
Основные понятия
автоматизированных систем
перевода
Новое направление в технологии перевода
11
СегментацияИсходный текст
CONFIDENTIALITY AGREEMENT
August ,2004
[address]
Re: Confidentiality Agreement
Ladies and Gentlemen:
You have requested Confidential Information from Company1
Corporation ("Company1") concerning Company1 that is either
confidential, proprietary, or publicly unavailable in connection with your
consideration of a possible business combination ("Transaction")
between you and Company1 involving TLLC. As a condition, and in
consideration, of furnishing to you "Confidential Information" (as defined below), Andrew
requires that you treat the Confidential Information so furnished confidentially as set forth
in this letter agreement (the "Confidentiality Agreement").
1. Confidential Information As used in this Confidentiality Agreement, the term
"Confidential Information" means all information concerning Company1 and its
subsidiaries or affiliates that is furnished or made available to you by Company1 or any
agent or representative of Company1 or that is obtained or derived by you from any of
the foregoing persons as part of your consideration of the Transaction,
12
Представление информации
Понятие кодов, источники их появления и роль
Текст отражается в окнах DVX2 в единообразном
виде, не зависящем от формата исходного
документа.
Изменение формата, а также наличие переходов
на другой абзац и некоторых специальных
символов, изменения цвета, размера, типа
шрифта или языка, которые не нуждаются в
переводе, обозначаются в DVX2 цифрами в
фигурных скобках, которые называются
«кодами».
13
Представление информации
Так например, текст
A date corrector recessed in the case allows you to easily and
comfortably set the date.
будет представлен в DVX2 в следующем виде:
{721}A{722} {723}date corrector{724} recessed {725}in the
case{726} allows {727}you{728} to {733}{729}easily and
{730}comfortably set the date.{731} {732}
Это позволяет восстановить формат документа
при его экспорте и, кроме того, повышает
эффективность работы переводчика, позволяя
ему сосредоточиться только на переводе.
14
Сегментация, Текст, разбитый на сегменты
Сегмент -
абзац,
предложение
и т.п.
Сегмент оригинала
15
Память переводовСводная таблица
Сегмент оригинала Сегмент перевода
16
Основные функции систем
• Импорт переводимых файлов в систему
• Анализ трудоемкости перевода
• Создание памяти переводов
• Предварительный глобальный перевод
• Автоматический поиск и подстановка переводов сходных предложений
• Перевод в текстовом редакторе
• Пополнение и ведение терминологической базы данных и памяти переводов
• Экспорт файлов
• Оценка сделанных трудозатрат
ПОЧЕМУ Déjà Vu X?
Новое направление в технологии перевода
18
Все системы умеют находить в памяти переводов предложения, сходные с
переведенными
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).
Выберите в меню Database команду Find Duplicate Sentences и задайте нужные
параметры, чтобы удалить дублирующие записи (проверьте правильность указания
языков).
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле Find sets of duplicate source sentences.
Пометьте поле Find sets of duplicate source sentences with identical translations.
Пометьте поле Delete redundant sentences in each set of duplicates.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Удаление ненужных переводов одного и того же оригинала.
Запустите Déjà Vu X2 и откройте нужную память переводов
(Translation memory).
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле Find sets of duplicate source sentences with different translations.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.
Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по
алфавиту.
19
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).
Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры,
чтобы удалить дублирующие записи (проверьте правильность указания языков).
Выберите в меню Database команду Find Duplicate Sentences.Пометьте поле Find sets of duplicate source sentences.
Пометьте поле Find sets of duplicate source sentences with identical translations.
Пометьте поле Delete redundant sentences in each set of duplicates.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Удаление ненужных переводов одного и того же оригинала.
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле Find sets of duplicate source sentences with different translations.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.
Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по
алфавиту.
Déjà Vu X, кроме того, автоматически подставляет фрагменты предложений
из памяти переводов
20
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation
memory).
Выберите в меню Database команду Find Duplicate Sentences и задайте нужные
параметры, чтобы удалить дублирующие записи (проверьте правильность
указания языков).
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле Find sets of duplicate source sentences.
Пометьте поле Find sets of duplicate source sentences with identical translations.
Пометьте поле Delete redundant sentences in each set of duplicates.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Удаление ненужных переводов одного и того же оригинала.
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле Find sets of duplicate source sentences with different translations.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре
строк.
Выберите в меню View команду Toggle Sorting, чтобы упорядочить память
переводов по алфавиту.
Déjà Vu X автоматически подставляет слова и из терминологической базы
21
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation
memory).
Выберите в меню Database команду Find Duplicate Sentences.
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
Количество символов текста – 1052
Обычная система найдет 190 символов повторяющихся
предложений - 18%:
Обнаруживается больше повторов
22
Запустите откройте память переводов
Выберите в меню команду задайте
параметры, удалить записи проверьте
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле
Пометьте поле Find sets of duplicate source sentences
Пометьте поле.
Укажите языки.
Пометьте разделе
Удаление переводов оригинала.
Запустите Déjà Vu X2 и откройте нужную память переводов (Translation memory).
Выберите в меню Database команду Find Duplicate Sentences.
Пометьте поле Find sets of duplicate source sentences
Укажите нужные языки.
Пометьте в разделе Miscellaneous:
просмотра переводов выберите
Déjà Vu X дополнительно найдет 424 символа повторяющихся фрагментов – 40%,
итого - 58%. Не считая английских слов и чисел, которые подставляются в перевод
автоматически (View, Toggle Sorting и т.п., здесь не учтены) .
58% против 18%!C помощью функции "мозаичного перевода " (AutoAssemble) перевод
автоматически собирается из фрагментов сегментов, найденных в
памяти переводов, и терминов из терминологической базы.
Обнаруживается больше повторов
Удобство и эффективность
Новое направление в технологии перевода
24
Единое рабочее пространство для всех действий
• Перевод проектов
• Управление памятями переводов и терминологическими базами
• Выравнивание документов на двух языках
• Работа с фильтрами
• Создание проектов, в том числе по шаблону
25
Открытие проекта
26
Сохранение проекта в компактном виде
Пакет Pack & Go представляет собой сжатый файл, экспортированный
из проекта, который содержит либо весь проект, либо его часть. Он
может быть использован для передачи как работы переводчикам, так и
выполненного перевода менеджеру проекта.
27
Экспорт и повторный импорт
28
Инструменты проекта
• Возможность уплотнения памяти переводов,
терминологической базы, проекта и фильтра• Возможность восстановления поврежденных памяти
переводов, терминологической базы, проекта и фильтра
29
Конфигурация проекта
• Один проект – несколько файлов
• Один проект – разные форматы файлов
• Возможность одновременного перевода файлов разного типа как цельного сводного документа
• Простой импорт файлов разных форматов
• Возможность добавления новых документов в выполняемый проект без прерывания перевода
30
Возможность одновременного перевода документа на несколько языков с сохранением переводов на разные языки в одном проекте, одной памяти переводов и одной терминологической базе
Применимы все языки, поддерживаемые
Windows, включая:
• китайский
Поддерживаемые языки
• арабский и иврит
Поддерживаемые языки
Поддерживаемые языки
32
Особенности
• Возможность использования нескольких вариантов
заполнения исходных памяти переводов,
терминологической базы и Лексикона.
• Возможность параллельного использования памятей
переводов и терминологических баз несколькими
переводчиками и для нескольких проектов.
• Одни и те же памяти переводов и терминологические
базы могут использоваться для противоположных
направлений перевода.
• Возможность создания словарей в формате MS
Office на основе терминологической базы.
• Возможность уплотнения баз данных и проекта
33
А также:
Rich Text Format, Windows Help, Microsoft Access, Adobe InDesign, ASCII, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, RC, C/C++/Java, Java properties, IBM TM untranslated segments, GNU PO и POT и файлы в кодах ASCII - plain text files.
Импорт файлов разных форматов, без конвертирования в промежуточные форматы.
Представление всех документов в едином формате.
Импорт. Форматы. Совместимость
34
Импорт-экспорт баз данных, обмен информацией с другими системами
• Обеспечивается обмен информацией с другими
системами
Допустимы в различных форматах (Excel, Access,
text, TMX,..)
• Может применяться для создания резервных
копий
• Создание словарей в формате MS Office по
терминологической базе
• Создание терминологической базы и памяти
переводов по файлам MS Office
Удобный, легко настраиваемый
интерфейс
Новое направление в технологии перевода
36
Удобный, легко настраиваемый интерфейс
Гибкость настроек и размещения окон
37
Привычный интерфейс
Сходен с интерфейсом Windows
Те же клавиши быстрого вызова, что и в Windows
Те же функции Автотекст, Автозамена и Правописание, что и в MS Word
Полностью настраиваются:
• Тип и размер шрифта
• Цвета
• Компоновка окон
Язык можно выбирать
38
Особенности
• В одну и ту же память переводов и терминологическую
базу могут одновременно записываться переводы на
несколько языков.
• Адаптируемость структуры терминологической базы,
практически неограниченные возможности настройки
атрибутов.
• Возможность создания терминологической базы и
памяти переводов по файлам MS Office.
39
Перевод и базы данных
Возможность полного управления информацией
в базах данных, не прерывая перевода,
поскольку в процессе перевода доступ к ним не
блокируется
Простота пополнения памяти переводов и
терминологической базы в процессе перевода
• Автоматическое направление перевода в
память переводов (AutoSend)
• Ручное пополнение терминологической базы
Возможность записи в память переводов
отдельных частей сегментов
40
Возможность импорта и экспорта памяти переводов,
терминологической базы и Лексикона в разных
форматах, что обеспечивает обмен информацией с
другими системами.
Совместимость с другими системами
41
Рабочее пространство
Сегментированный текст оригинала
Редактируемые ячейки
Фрагменты, найденные в памяти переводов и терминологической
базе
Список импорти-рованных файлов
Предложения, найденные в памяти переводов
Рабочее окно
42
Выборочный вывод сегментов на экран
Мощная система фильтрации сегментов по более чем десяти
параметрам, включая заданные пользователем на основе SQL
43
Автоматический контроль (AutoCheck) и обеспечение единообразия
• Обнаружение несоответствия терминов ранее употребленным или терминам в Лексиконе и терминологической базе, а также различия дат, чисел и кодов в оригинале и переводе.
• Обеспечение однократного и единообразного перевода одинаковых сегментов благодаря автоматической подстановке перевода для аналогичных сегментов (Autopropagate) во всех файлах проекта
• Дополнительные возможности обеспечения единообразия при переводе упорядоченного по алфавиту проекта целиком, (легче обнаруживаются опечатки и синонимы)
• Параллельное представление сегментов оригинала и перевода уменьшает риск пропусков в тексте
• При групповой работе редакторы могут начинать работу практически сразу, делая мгновенные рекомендации по терминологии и переводу
44
• Система работает практически без сбоев, в
случае сбоя информация не теряется
• Осуществляется автосохранение всех
компонентов
• Имеются встроенные средства для
восстановления поврежденных баз данных и
проекта
Надежность и защищенность
45
Доступ к различным элементам проекта по паролям
• Возможность запрета редактирования текста или записи в память переводов
• 10 уровней индивидуальных полномочий пользователей с различными правами для чтения и записи в соответствии с квалификацией или обязанностями (переводчик, редактор, менеджер)
• Пользователи с низким уровнем (переводчики) не могут исправлять внесенное пользователями более высокого уровня (редакторами). Элементарно реализуется правило "Желание начальника - закон для подчиненных"
• Отслеживается, кто, когда и какие внес изменения в проект и базы данных
Защита от несанкционированного внесения изменений
46
Особенности
Все базы данных основаны на стандартной СУБД Jet
Базы предназначены для нескольких языков одновременно
Адаптируемая структура терминологической базы
• Добавление атрибутов и категорий -- практически неограниченные возможности настройки.
• Настраивается столько параметров, категорий и связей, сколько требуется пользователю
Термины оригинала
Переводы термина на разные языки, его
синонимы и антонимы
Атрибуты для обоих языков,
включая контекст
47
Особенности
Четырехмерная структура классификации записей проекта, памяти переводов и терминологической базы
Это позволяет отобрать записи, относящиеся к конкретному заказчику, тематике, проекту, файлу или их комбинации
Эффективность
Новое направление в технологии перевода
49
Эффективность
Статистика для одного из больших документов
Точное совпадение с предложениями в памяти переводов 33,1%
Неточное совпадение с предложениями в памяти 4,2%
Автоматическая сборка из фрагментов предложений в памяти и терминов 0,3%
Копирование перевода аналогичных предложений далее по тексту 37,3%
Перевод вручную 25,2%
---------------------------------------------------------------------------------------------------
Примечание: Высокая степень совпадений объясняется тем, что в памяти переводов уже содержался предварительный перевод трех разделов данного документа.
Полученная выгода очевидна
50
Уникальный пример проекта
42% текста подставлено автоматически,
хотя исходная память составлена по 1 файлу
с переводом 245 сегментов из 2627)
Эффективность
51
Статистика для одного проекта
Вид документа Паспорта безопасности препаратов
Количество файлов в проекте 18
Объем проекта 52800 слов (29 учетных страниц)
Количество переводчиков 5
Редактор 1
Начальный объем памяти переводов 0
Наличие словаря проекта 0 слов
Повторяемость текста 50%
Расчетное время ручного перевода 5
переводчиками (без учета редактирования) 6 рабочих дней
Реальное время выполнения 3 рабочих дня с редактированием.
Экономические выгоды для бюро
переводов в месяц легко подсчитываются
52
Эффективность
Средний процент повторений в документах, обнаруживаемый
системой – 20-30%.
Норма переводчика: 1 страница в час
В месяце – 22 рабочих дня по 8 часов = 176 часов
20% от 176 = 35 часов
= 4 рабочих дня !
В больших пакетах документов для некоторых документов
процент повторений достигал 100%.
Легко подсчитать экономию, умножив
на зарплату в час!
Подготовка к переводу
Новое направление в технологии перевода
54
Параметры проекта. Общие
55
Параметры проекта. Общие (продолжение)
56
Параметры проекта. Отображение
57
Параметры проекта. Перевод
58
Параметры проекта. Перевод (продолжение)
59
Параметры проекта. Сегментация
60
Параметры проекта. Темы
Память переводов Терминологическая база
Новое направление в технологии перевода
66
Создание и пополнение памяти переводов
• Выравнивание (Alignment) –
Создание памяти переводов
по документу-оригиналу и
документу-переводу
• Импорт двуязычного файла MS Office
• Импорт имеющейся памяти переводов
• Импорт памяти в формате TMX
67
Импорт двуязычного файла
68
Импорт двуязычного файла
69
Импорт двуязычного файла
70
Импорт двуязычного файла
71
Импорт двуязычного файла
Импорт файла в формате Excel осуществляется
аналогичным образом
72
Импорт памяти переводов Déjà Vu X3 в память переводов
73
Импорт памяти переводов Déjà Vu X3в память переводов
74
Импорт памяти переводов в формате TMXв память переводов
75
Импорт памяти переводов в формате TMXв память переводов
76
Импорт памяти переводов в формате TMXв память переводов
77
Импорт памяти переводов в формате Trados Workbench в память переводов
78
Импорт памяти переводов в формате Trados Workbench в память переводов
79
Импорт памяти переводов в формате Trados Workbench в память переводов
80
Импорт терминологической базы в формате Multiterm
81
Импорт терминологической базы в формате Multiterm
82
Импорт терминологической базы в формате Multiterm
83
Создание и пополнение терминологической базы
• Импорт двуязычного файла MS Office
• Импорт терминологической базы
в формате Multiterm
84
Импорт памяти переводов в формате TMXв память переводов
85
Импорт памяти переводов в формате TMXв память переводов
86
Импорт памяти переводов в формате TMXв память переводов
87
Импорт памяти переводов в формате TMXв память переводов
88
Импорт памяти переводов в формате TMXв память переводов
89
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
Большое число допустимых форматов (Word, Excel, Text, Open Office, Quark Xpress XTG, RTF, SGML, XML,…)
90
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
91
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
92
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
93
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
94
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
95
Создание памяти переводов. Выравнивание файла-оригинала и файла-перевода
Полученная память переводов
96
Поиск сегментов-дубликатов оригинала с
одинаковым и разным переводом
Эффективный учет и исключение повторов в памяти переводов
97
Создание терминологической базы
98
Создание терминологической базы
99
Создание терминологической базы
Английский (США) Русский
100
Создание терминологической базы
101
Импорт словаря в формате MS Officeв терминологическую базу
Преобразуйте словарь в таблицу Word или Excel и добавьте в нее
дополнительные столбцы:
Context для каждого языка, Subject (тематика), Client (заказчик), User,
Date (дата).
Context – контекст, пояснение или определение
User – текущий пользователь, автор или источник информации.
Таблицу Word преобразуйте в формат txt с разделителем tab
English Russian Context_en Context_ru Subject Client User Date
BCT терминал
деловой
связи
Business
communications
terminal.
Цифровой
терминал
данных,
используемый
для деловых
приложений
654 англо-
русский
словарь по
телефонии
19.05.2010
Base
station
Базовая
станция
A fixed site with
network
equipment
Центральный
пункт соты
или сектора
внутри нее
654 Georgiy
Moiseenko
25.01.2005
102
Импорт словаря в формате MS Officeв терминологическую базу
103
Импорт словаря в формате MS Officeв терминологическую базу
104
Импорт словаря в формате MS Officeв терминологическую базу
105
Импорт словаря в формате MS Officeв терминологическую базу
106
Импорт словаря в формате MS Officeв терминологическую базу
Импорт файла в формате Excel осуществляется
аналогичным образом
107
Импорт словаря в формате MS Officeв терминологическую базу
108
Импорт словаря в формате MS Officeв терминологическую базу
109
Импорт памяти переводов Déjà Vu X3 в память переводов
110
Импорт памяти переводов Déjà Vu X3 в память переводов
111
Импорт памяти переводов Déjà Vu X3 в память переводов
112
Импорт словаря в формате MS Officeв терминологическую базу
113
Импорт словаря в формате MS Officeв терминологическую базу
114
Импорт словаря в формате MS Officeв терминологическую базу
115
Импорт словаря в формате MS Officeв терминологическую базу
116
Импорт словаря в формате MS Officeв терминологическую базу
117
Импорт словаря в формате MS Officeв терминологическую базу
118
Импорт словаря в формате MS Officeв терминологическую базу
119
Импорт словаря в формате MS Officeв терминологическую базу
120
Импорт словаря в формате MS Officeв терминологическую базу
121
Импорт словаря в формате MS Officeв терминологическую базу
122
Импорт словаря в формате MS Officeв терминологическую базу
123
Экспорт терминологической базы в файл txt или Excel
выполняется аналогичным образом
Вид терминологической базы
124
Несколько баз данных
• Возможность подключения большого числа баз данных
для одного проекта
• Индивидуальное
задание режимов
«Только чтение»,
«Только запись»,
«Чтение и запись» и
упорядочивание по
приоритетам
• Возможность одновременного использования
несколькими переводчиками, переводящими на разные
языки
125
Режимы перевода
• Перевод отдельных файлов проекта
• Перевод всего пакета файлов разного формата как
единого документа
• Перевод всего пакета файлов, упорядоченного по
алфавиту
• Перевод одним переводчиком
• Перевод отдельными переводчиками,
работающими изолированно
• Перевод группой переводчиков, работающих
одновременно в офисе
• Перевод группой переводчиков в режиме
удаленного доступа
126
Основные этапы
Создание и настройка проекта
Импорт файлов
Автоматический поиск в памяти
переводов с использованием
нечеткой логики и автоматическая
сборка
Ручной перевод
Экспорт
Переводчик создает и настраивает проект
Переводчик импортирует документы
DVX2 находит сходные предложения
или строит часть перевода
автоматически
Переводчик переводит остальное
DVX2 экспортирует документы
Предварительная обработка
документов проекта
Переводчик приводит документы к виду,
облегчающему перевод и предотвращающему
возникновение проблем
Редактирование и
форматирование переводов
Переводчик редактирует и форматирует
экспортированные переведенные
документы
128
Импорт и экспорт документов
• Удобная система правил сегментации. Правила сегментации
можно настраивать для совместимости с другими
системами, чтобы обеспечить тождественность их памятей
переводов
• Возможность задания параметров импорта
• В выполняемый проект можно добавлять новые документы,
не прерывая перевода
• Восстановление формата документа при его экспорте.
130
Анализ наличия и степени повторений в исходных
файлах – оценка трудоемкости будущей работы
131
Анализ наличия и степени повторений – оценка
трудоемкости будущей работы
Дубликатов – 17%
Сходных элементов - 25% (сходство более 20%), - 16% (сходство до 20%)
Точных совпадений – 21%
Всего
Несходных элементов –23%
132
Глобальный предварительный перевод (Pretranslation)
DVX2 просматривает памяти переводов и терминологические базы, чтобы автоматически
вставить точный или сходный перевод
133
Глобальный предварительный перевод
134
Рабочее пространство
Сегментированный текст оригинала
Редактируемые ячейки
Фрагменты, найденные в памяти переводов и терминологической
базе
Список импорти-рованных файлов
Предложения, найденные в памяти переводов
Рабочее окно
135
Поиск в памяти переводов
136
Поиск в памяти переводов
137
Автоматический поиск переводов сходных предложений (AutoSearch)
Сходные сегменты
Отличие оригинала от найденного
сегмента
Отличие найденного сегмента от оригинала
При единственном выборе перевод
подставляется в поле перевода автоматически
138
Поиск на основе нечеткой логики
• Как при глобальном предварительном переводе,
так и при любом автоматическом поиске в памяти
переводов и терминологической базе,
обнаружение сходства осуществляется на основе
сложнейшего математического алгоритма,
основанного на «нечеткой логике», который
определяет сходство, используя до десятка
критериев, в том числе и близость тематик
• Гарантированное совпадение – автоматическое
подтверждение (на основе анализа контекста) того,
что найденный схожий перевод является точным.
139
Нечеткий поиск при предварительном переводе и ручном переводе
При ручном переводе автоматический поиск с
использованием нечеткой логики обнаруживает
большее количество сходных сегментовСимволов
Состояние сегмента: Предварительный
перевод
Ручной
автоматизированный
перевод
Непомечен 142628 78076
Непереведен 27771 13524
Ручной перевод 0 4707
Точное совпадение 33927 2136
Неточное совпадение 3797 896
Сборка 77133 55072
Распространение
точного совпадения
0 1741
Закончено 0 64552
Итого 144388 144388
140
Автоматическая сборка (AutoAssemble)
Автоматическая сборка перевода из фрагментов
предложений в памяти переводов и элементов
терминологической базы, если не найден перевод
всего предложения, – уникальная функция,
которая имеется только в Déjà Vu X2
141
Наличие нескольких вариантов перевода
указывается цветом. Просмотр – нажатием правой
кнопки мыши. Выбранный перевод подставляется
в поле перевода автоматически.
Индикация наличия нескольких вариантов перевода
142
DeepMiner анализирует памяти переводов и подсказывает
варианты перевода фрагментов сегментов.
DeepMiner
143
Ручной поиск в файлах памяти переводов (Scan)
Сходные сегменты
Искомое слово или
словосочетание
Найденный оригинал Найденный перевод
144
Поиск с использованием трафаретных символов
Возможен поиск слов и словосочетаний с использованием
трафаретных символов (wildcards). Если ввести в сегмент
перевода con* fil*, выделить этот текст, щелкнуть правой кнопкой
мыши и выбрать в контекстном меню Scan, Déjà Vu X2 покажет
найденные в памятях переводов оригиналы (и их переводы),
содержащие слова, начинающиеся с "con" и "fil", например:
Config Filename:
Config filename:
Confirm File Move
Config file:
configuration file
Confirm File Delete
Confirm Delete of Read-Only File
и т.д.
145
Принципы ведения памяти переводов
Для того чтобы повысить эффективность автоматической сборки,
целесообразно сохранять в памяти не только сегмент, но и его
фрагменты, которые могут встретиться в дальнейшем как единое
целое (например, "эффективность использования", "в дальнейшем" и
т.п.). Например, для сегмента
In London, traffic congestion is a serious problem
в память переводов целесообразно внести следующие оригиналы и их
переводы:
In London, traffic congestion is a serious problem
In London
traffic congestion
serious problem.
Это помогает предотвратить автоматическую сборку перевода
выражения из фрагментов, имеющихся в памяти переводов (is, a,
serious, problem), вместо подстановки перевода всего выражения,
имеющегося в терминологической базе данных (is a serious problem).
146
Перевод и базы данных
Возможность записи в память переводов отдельных частей
сегментов
147
Запись в несколько терминологических баз
148
Особенности
Термины и предлагаемый вариант из памяти переводов
можно править, не выходя из окна редактирования
149
Временный экспорт в MS Word для анализа и редактирования его
средствами с возвратом в Déjà Vu X2
150
Обеспечение качества
151
Экспорт примечаний
Примечания, введенные при работе в Déjà Vu X2 (как указано
выше), будут видны и в экспортированном файле:
152
Статистика
Word count: подсчет числа строк, слов и символов в каждом файле – оценка объема работ, выполненного на данном этапе
153
Лексикон
• Учет терминологической специфики проекта, в частности
непереводимые названия, содержащие переводимые слова.
Частота употребления
Число слов
Упорядочено по частоте
• Учет требований заказчика к терминологии. Наличие Лексикона
позволяет реализовать правило: "Клиент всегда прав" и
переводить, например, по требованию заказчика, mouse не как
"мышь", а как "мышка", не изменяя ничего в основной
терминологической базе
154
• Это позволяет быстро составить словарь общей лексики, исключив все редко употребляемые термины
Лексикон
• С помощью Лексикона можно пополнить терминологические базы данных и памяти переводов
• Лексикон может импортироваться из файлов MS Office и экспортироваться в них.
• Лексикон позволяет проанализировать частотность терминов
• Кроме того можно составить словарь клише, отобрав все часто встречающиеся словосочетания
155
Язык структурированных запросов SQL
В руководстве пользователя около 70 стандартных
операторов SQL для глобального удаления, модификации
и экспорта записей баз данных с определенными
атрибутами
определенный период времен
конкретный заказчик
конкретный проект
конкретная тематика
конкретный пользователь
наличие определенного фрагмента текста
Большое количество дополнительных операторов SQL на
форуме dеjavu-I –
http://tech.groups.yahoo.com/group/dejavu-l/
156
Принципы ведения баз данных
Для того чтобы предотвратить возможную утерю или порчу баз
данных вследствие неопытности пользователей или по другим
причинам, рекомендуется разделить все данные на постоянные,
которые не изменяются или изменяются мало (например,
завершенные проекты) и доступны пользователям только для
чтения), и временные (для текущих проектов), которые
доступны для чтения и записи.
Постоянные данные можно объединить в группы в
соответствии с тематиками и заказчиками, а временные –
в соответствии с проектами.
Перед переносом информации из временной базы данных в
постоянную целесообразно проанализировать ее и, например,
удалить сегменты-дубликаты, а также сегменты, состоящие
только из дат, чисел и непереводимых слов и словосочетаний.
Версии и информационные
ресурсы
Новое направление в технологии перевода
158
Новая версия системы – DVX3
Новая версия системы Déjà Vu (DVX3) имеет более удобный
интерфейс и обладает целым рядом новых возможностей.
Более подробную информацию можно получить по адресам:
http://www.atril.com/content/discover-deja-vu-x3
http://www.atril.com/content/compare-our-products
Адрес для загрузки пробной версии и приобретения систем
Déjà Vu X3
http://www.atril.com
Там же можно подписаться на участие в обучающих
семинарах.
159
Варианты новой системы DVX3
DVX3 WorkgroupDVX3 Professional
DVX3 Free
Free – Бесплатная автономная программа для внештатных
переводчиков, позволяющая работать с проектами-сателлитами,
поступившими от бюро переводов.
Professional – Классическая версия, предназначена для
внештатных переводчиков и имеет все возможности.
Workgroup – Все функции Professional плюс мощные
возможности для управления работой переводчиков и
организации групповой работы.
160
Новая версия системы – DVX3
161
Новая версия системы – DVX3
162
• Сайт компании Atril – http://helpdesk.atril.com/
• Форум dеjavu-L – http://tech.groups.yahoo.com/group/dejavu-L
• Форум Союза переводчиков России –
http://www.translators-
union.ru/index.php?option=com_kunena&view=topic&catid=12&id
=872&Itemid=299
• Translation memory. –
http://en.wikipedia.org/wiki/Translation_memory#References_and_
interesting_links
• Г. Е. Моисеенко. Слова, слова, слова… (О терминологических базах). Мосты, №1(33), 2012, с. 26–30
• Г. Е. Моисеенко. Опыт практического использования системы Deja Vu X Workgroup в режиме рабочей группы и удаленного доступа переводчиков и редакторов. Мосты, №4(23), 2009, с. 69–80
Ресурсы в сети Интернет для Deja Vu X,
163
Спасибоза внимание!
Успехов!