Presentation deja vu_x_animated_05-02-20010_gm

83
Георгий Моисеенко Георгий Моисеенко ([email protected]) ([email protected]) Введение в систему автоматизированного перевода Déjà Vu X Workgroup

description

Описание системы DVX и выгоды от ее использования, 83 слайда, 2010 г.

Transcript of Presentation deja vu_x_animated_05-02-20010_gm

Page 1: Presentation deja vu_x_animated_05-02-20010_gm

Георгий МоисеенкоГеоргий Моисеенко

([email protected])([email protected])

Введение

в систему автоматизированного перевода Déjà Vu X Workgroup

Page 2: Presentation deja vu_x_animated_05-02-20010_gm

2

• Объективная необходимость • Современные требования• Основные понятия и базы данных• Краткое сравнение систем• Основные преимущества Deja Vu X• Эффективность и единообразие• Совместимость и многоязычность• Надежность, безопасность и контроль• Интерфейс пользователя• Основные характеристики и функции• Процедура перевода• Экономическая эффективность• Версии и информационные ресурсы

Основные темы

Page 3: Presentation deja vu_x_animated_05-02-20010_gm

Объективная необходимость Объективная необходимость использования использования

автоматизированных систем автоматизированных систем переводаперевода

Новое направление в технологии перевода

Page 4: Presentation deja vu_x_animated_05-02-20010_gm

4

Повторение пройденного

Кто из переводчиков не восклицал однажды:

«А, ведь, нечто похожее я уже переводил!

Déjà Vu!»

Практические примеры документов с повторами –

Техническая документация по новой версии продукта (новой модели автомобиля и т.п.)

Документация новой версии программного обеспечения

Реклама нового модельного ряда продуктов

Ситуации разные, смысл один – работа срочная, большая, но déjà vu (уже виденное). Переводчику нужно переводить текст, сходный с ранее переведенным

Page 5: Presentation deja vu_x_animated_05-02-20010_gm

5

Прежние переводы хранятся в бумажном виде

При большом объеме хранимых документов поиск конкретной фразы практически неосуществим

Page 6: Presentation deja vu_x_animated_05-02-20010_gm

6

Наглядный пример

В данном фрагменте Руководства пользователя количество повторов уже переведенного составляет 57%.

Page 7: Presentation deja vu_x_animated_05-02-20010_gm

7

Современные требования

Необходимость повышения качества переводов:

• Обеспечение единообразия терминологии

• Обеспечение единообразного перевода одних и тех же предложений

Необходимость повышения эффективности (снижение трудозатрат, сокращение сроков):

• Автоматизация рутинных операций

• Исключение полного повторного перевода документации, в которую внесены изменения и дополнения

• Исключение повторного перевода одних и тех же слов и предложений

Page 8: Presentation deja vu_x_animated_05-02-20010_gm

8

Структура системы

Память переводов

Терминологическая база

Проект

Лет 10 назад компания IBM разработала «Систему памяти переводов» - Translation memory system

Page 9: Presentation deja vu_x_animated_05-02-20010_gm

9

Структура системы

Новое название - Computer-assisted translation tool (CAT tool) – Автоматизированная система перевода

Память переводов

Терминологическая база

Лексикон

Проект

Page 10: Presentation deja vu_x_animated_05-02-20010_gm

10

Объективная необходимость

• Высокая конкуренция между переводчиками

• Работодатели требуют владения автоматизированными системами перевода

• Заказчики требуют представления перевода в виде базы данных

• Высокие требования к качеству и срокам

Page 11: Presentation deja vu_x_animated_05-02-20010_gm

Основные понятия Основные понятия автоматизированных систем автоматизированных систем

переводаперевода

Новое направление в технологии перевода

Page 12: Presentation deja vu_x_animated_05-02-20010_gm

12

СегментацияИсходный текст

CONFIDENTIALITY AGREEMENTAugust ,2004[address]Re: Confidentiality AgreementLadies and Gentlemen:You have requested Confidential Information from Company1 Corporation ("Company1") concerning Company1 that is either confidential, proprietary, or publicly unavailable in connection with your consideration of a possible business combination ("Transaction") between you and Company1 involving TLLC. As a condition, and in consideration, of furnishing to you "Confidential Information" (as defined below), Andrew requires that you treat the Confidential Information so furnished confidentially as set forth in this letter agreement (the "Confidentiality Agreement").1. Confidential Information As used in this Confidentiality Agreement, the term "Confidential Information" means all information concerning Company1 and its subsidiaries or affiliates that is furnished or made available to you by Company1 or any agent or representative of Company1 or that is obtained or derived by you from any of the foregoing persons as part of your consideration of the Transaction,

Page 13: Presentation deja vu_x_animated_05-02-20010_gm

13

Сегментация Текст, разбитый на сегменты

Сегмент - абзац, предложение и т.п.

Сегмент оригинала

Page 14: Presentation deja vu_x_animated_05-02-20010_gm

14

Память переводовСводная таблица

Сегмент оригинала Сегмент перевода

Page 15: Presentation deja vu_x_animated_05-02-20010_gm

Наиболее популярные Наиболее популярные системысистемы

Новое направление в технологии перевода

Page 16: Presentation deja vu_x_animated_05-02-20010_gm

16

Основные функции систем

• Импорт переводимых файлов в систему

• Анализ трудоемкости

• Сведение двуязычных файлов для создания памяти переводов

• Предварительный глобальный перевод

• Автоматический поиск переводов сходных предложений

• Перевод в текстовом редакторе

• Пополнение и ведение терминологической базы данных и памяти переводов

• Оценка сделанных трудозатрат

• Экспорт файлов

Page 17: Presentation deja vu_x_animated_05-02-20010_gm

17

Наиболее популярные системыПо данным опроса, проведенного Imperial College London в августе 2006 года среди 900 переводчиков из 54 стран, наибольшей популярностью пользуются системы Trados, Déjà Vu X и Wordfast с разными приоритетами среди разных групп переводчиков

Количество пользователей различно в разных подгруппах (внештатные переводчики, бюро переводов и т.п.). Deja Vu используется равномерно во всех группах.

Page 18: Presentation deja vu_x_animated_05-02-20010_gm

18

Количество пользователей, использующих различные системы

как основные (в %)

Page 19: Presentation deja vu_x_animated_05-02-20010_gm

19

Оценка четырех систем по функциональным и нефункциональным критериям

Рейтинг систем по следующим критериям

Trados Déjà Vu Wordfast SDL Trados

2006

Функциональные возможности

3,5 4,1 3,9 3,6

Нахождение совпадений 3,3 3,8 3,4 3,3

Правильность нахождения совпадений

3,3 3,8 3,4 3,8

Быстродействие 3,7 4,1 3,9 3,7

Надежность 3,3 4,1 3,8 3,4

Удобство использования 3,5 4,2 4,2 3,5

Простота обучения 3,3 4,0 4,1 3,4

Соотношение "цена-качество"

2,9 4,3 4,6 3,1

Поддержка пользователей 2,5 3,7 3,7 2,6

Средний рейтинг 3,3 4,0 3,9 3,4

Page 20: Presentation deja vu_x_animated_05-02-20010_gm

20

Сводные оценки пяти систем

Популярность Удобство пользования• TRADOS 76% 3,3

• Déjà Vu 61% 4,0• Wordfast 51% 3,9• SDL Trados 2006 49% 3,4• SDLX 36%• STAR Transit 25%

Налицо явное противоречие между тем, что наибольшей популярностью пользуется система Trados, и тем, что большинство пользователей отдали превосходство системе Déjà Vu как по функциональным, так и по другим характеристикам.

Многие пользователи, от которых требуют перевести документы в Trados, переводят их в более удобной системе

Déjà Vu X, конвертируя результат в Trados.

Page 21: Presentation deja vu_x_animated_05-02-20010_gm

21

ИсточникиПриведенные результаты взяты из документа: http://www3.imperial.ac.uk/portal/pls/portallive/docs/1/7307707.PDFНекоторые более ранние сведения приведены в документах: http://www.accurapid.com/journal/03TM2.htm http://www.accurapid.com/journal/03TM1.htm http://www.atril.com/docs/Benis-ITI-DVX.pdf http://www.techwr-l.com/techwhirl/magazine/technical/translationmemory.htmlПопытка собрать сведения о сравнительной эффективности популярных систем была сделана на форуме http://www.trworkshop.net/forum/viewtopic.php?t=6254Плюсы и минусы систем неоднократно обсуждались на форумах http://trworkshop.net/forum/viewforum.php?f=16 http://www.libra-k.ru/forum/viewforum.php?f=18&sid=346091f51e807035cfb94de841eaa0b3 http://tech.groups.yahoo.com/group/dejavu-L http://www.lisa.org

Page 22: Presentation deja vu_x_animated_05-02-20010_gm

ПОЧЕМУ Déjà Vu X?ПОЧЕМУ Déjà Vu X?

Новое направление в технологии перевода

Page 23: Presentation deja vu_x_animated_05-02-20010_gm

23

Все системы умеют находить в памяти переводов предложения, сходные с

переведенными

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков). Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentences.Пометьте поле Find sets of duplicate source sentences with identical translations.Пометьте поле Delete redundant sentences in each set of duplicates.Укажите нужные языки.Пометьте в разделе Miscellaneous: Удаление ненужных переводов одного и того же оригинала.

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentences with different translations.

Укажите нужные языки.Пометьте в разделе Miscellaneous: Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по алфавиту.

Page 24: Presentation deja vu_x_animated_05-02-20010_gm

24

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков).

Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.Укажите нужные языки.

Пометьте в разделе Miscellaneous: Удаление ненужных переводов одного и того же оригинала. Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.Укажите нужные языки.Пометьте в разделе Miscellaneous: Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по алфавиту.

Déjà Vu X, кроме того, автоматически подставляет фрагменты предложений

из памяти переводов

Page 25: Presentation deja vu_x_animated_05-02-20010_gm

25

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences и задайте нужные

параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Удаление ненужных переводов одного и того же оригинала. Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.Укажите нужные языки.Пометьте в разделе Miscellaneous:

Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память

переводов по алфавиту.

Déjà Vu X автоматически подставляет слова и из терминологической базы

Page 26: Presentation deja vu_x_animated_05-02-20010_gm

26

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences.

Укажите нужные языки.Пометьте в разделе Miscellaneous:

Количество символов текста – 1052Обычная система найдет 190 символов повторяющихся

предложений - 18%:

Обнаруживается больше повторов

Page 27: Presentation deja vu_x_animated_05-02-20010_gm

27

Запустите откройте память переводов Выберите в меню команду задайте параметры, удалить записи проверьте Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Пометьте поле Find sets of duplicate source sentencesПометьте поле.Укажите языки.Пометьте разделеУдаление переводов оригинала. Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentencesУкажите нужные языки.Пометьте в разделе Miscellaneous: просмотра переводов выберите

Déjà Vu X дополнительно найдет 424 символа повторяющихся фрагментов – 40%, итого - 58%. Не считая английских слов и чисел, которые подставляются в перевод автоматически (View, Toggle Sorting и т.п., здесь не учтены) .

58% против 18%!C помощью функции "мозаичного перевода " (AutoAssemble) перевод автоматически собирается из фрагментов сегментов, найденных в памяти переводов, и терминов из терминологической базы.

Обнаруживается больше повторов

Page 28: Presentation deja vu_x_animated_05-02-20010_gm

ЭффективностьЭффективность

Новое направление в технологии перевода

Page 29: Presentation deja vu_x_animated_05-02-20010_gm

29

Эффективность

Статистика для одного из больших документов

Точное совпадение с предложениями в памяти переводов 33,1%

Неточное совпадение с предложениями в памяти 4,2%

Сборка из фрагментов предложений в памяти и терминов 0,3% Копирование перевода аналогичных предложений далее по тексту 37,3%

Перевод вручную 25,2%---------------------------------------------------------------------------------------------------Примечание: Высокая степень совпадений объясняется тем, что в памяти переводов уже содержался предварительный перевод трех разделов данного документа.

Полученная выгода очевидна

Page 30: Presentation deja vu_x_animated_05-02-20010_gm

30

Analyze: Анализ наличия и степени повторений для другого реального проекта– оценка трудоемкости будущей работы

Дубликатов – 17%

Сходных элементов - 25% (сходство более 20%), - 16% (сходство до 20%)

Точных совпадений – 21%

Всего

Несходных элементов –23%

Page 31: Presentation deja vu_x_animated_05-02-20010_gm

31

Почему Déjà Vu XПример еще одного проекта

44% текста подставлено автоматически (память составлена по одному файлу)

Page 32: Presentation deja vu_x_animated_05-02-20010_gm

32

Статистика для последнего проекта

Вид документа Паспорта безопасности препаратов

Количество файлов в проекте 18

Объем проекта 52800 слов (29 учетных страниц)

Количество переводчиков 5

Редактор 1

Начальный объем памяти переводов 0

Наличие словаря проекта 0 слов

Повторяемость текста 50%

Расчетное время ручного перевода 5 переводчиками (без учета редактирования)

6 рабочих дней

Реальное время выполнения 3 рабочих дня с редактированием. Экономические выгоды для бюро

переводов в месяц легко подсчитываются

Page 33: Presentation deja vu_x_animated_05-02-20010_gm

33

Эффективность

Средний процент повторений в документах, обнаруживаемый системой – 20-30%.

В месяце – 22 рабочих дня по 8 часов = 176 часов

Норма переводчика: 1 страница в час

20% от 176 = 35 часов

= 35 страниц

= 4 рабочих дня !

В больших пакетах документов для некоторых документов процент повторений достигал 100%.

Умножим на зарплату в час!

Page 34: Presentation deja vu_x_animated_05-02-20010_gm

Удобство и эффективность Удобство и эффективность переводаперевода

Этапы и функцииЭтапы и функции

Новое направление в технологии перевода

Page 35: Presentation deja vu_x_animated_05-02-20010_gm

35

Основные этапы

Создание и настройка проекта

Импорт файлов

Автоматический поиск в памяти переводов с использованием

нечеткой логики и автоматическая сборка

Ручной перевод

Экспорт

Переводчик создает и настраивает проект

Переводчик импортирует документы

DVX находит сходные предложения или строит часть перевода автоматически

Переводчик переводит остальное

DVX экспортирует документы

Предварительная обработка документов проекта

Переводчик приводит документы к виду, облегчающему перевод и предотвращающему возникновение проблем

Редактирование и форматирование переводов

Переводчик редактирует и форматирует экспортированные переведенные документы

Page 36: Presentation deja vu_x_animated_05-02-20010_gm

36

Управление проектом

File Navigator:

• Указывает все файлы проекта

• Экспорт одним щелчком мыши

Project Explorer

• Импорт

и экспорт файлов

Page 37: Presentation deja vu_x_animated_05-02-20010_gm

37

Конфигурация проекта

• Один проект –несколько файлов

• Один проект – разные форматы файлов

• Возможность одновременного перевода файлов разного типа как цельного документа

• Один проект – перевод одновременно на несколько языков

Page 38: Presentation deja vu_x_animated_05-02-20010_gm

38

Возможность одновременного перевода документа на несколько языков с сохранением переводов на разные языки в одном проекте, одной памяти переводов и одной терминологической базе

Применимы все языки, поддерживаемые Windows 98/ME/NT4/2000/XP, включая:

• китайский

Поддерживаемые языки

• арабский и иврит

Поддерживаемые языки

Поддерживаемые языки

Page 39: Presentation deja vu_x_animated_05-02-20010_gm

39

Предварительная обработка файлов

Изменение формата обозначается цифрами в фигурных скобках. Если формат элемента текста неоправданно отличается от формата соседнего элемента, появятся дополнительные разделяющие коды:

"связного {111}фрагмента", "сл{112}ова",которые помешают найти сходные фрагменты. Иногда целесообразно проводить предварительную обработку документа для повышения эффективности работы. Пример:

Исходный текст в Word Текст в Déjà Vu

Для переноса использован знак дефиса

Действ-ующего {77}Действ{78}-{79}ующего{80}

Вставлен мягкий перенос

действующего {81}дейс{82}твующего

Использован автоматический перенос

в лице ге-нерального ди-ректора господина Тоно, дей-ствую-щего на основании Устава, именуемое в даль-нейшем «Заказчик»

{85}в лице {86}генерального директора господина Тоно, действующего на основании Устава, именуемое в {88}дальнейшем «Заказчик»{89}

Page 40: Presentation deja vu_x_animated_05-02-20010_gm

40

А также:

RTF RC Файлы справки GNU PO и POT CC++ IBM TM

Импорт файлов разных форматов, без конвертирования в промежуточные форматы.

Представление всех документов в едином формате.

Импорт. Форматы. Совместимость

Page 41: Presentation deja vu_x_animated_05-02-20010_gm

41

Импорт и экспорт документов

• Удобная система правил сегментации. Правила сегментации можно настраивать для совместимости с другими системами, чтобы обеспечить тождественность их памятей переводов

• Возможность задания параметров импорта

• В выполняемый проект можно добавлять новые документы, не прерывая перевода

• Возможность выборочного импорта части документа

• Восстановление формата документа при его экспорте.

Page 42: Presentation deja vu_x_animated_05-02-20010_gm

42

Выборочный импорт части файла (Excel)

Для текста, который не нужно переводить, задайте красный цвет шрифта, а при импорте укажите в параметрах фильтра "Ignore Red Text" . Если сделать копию столбца оригинала и задать для исходного столбца красный цвет шрифта, то первый столбец не будет импортирован и останется неизменным, а второй - будет импортирован и переведен, в результате чего получится таблица с колонками оригинала и перевода.

Page 43: Presentation deja vu_x_animated_05-02-20010_gm

43

Заполнение исходной памяти переводов

• Сведение (Alignment) - Создание памяти переводов по документу- оригиналу и документу-переводу

• Импорт двуязычного файла

• Импорт готовой памяти

• Подключение готовой памяти

Page 44: Presentation deja vu_x_animated_05-02-20010_gm

44

Сведение (Alignment) файла-оригинала и файла-перевода

Большое число допустимых форматов (Word, Open Office, Quark Xpress XTG, RTF, SGML, XML, Text,…)

Оригинал Перевод

Page 45: Presentation deja vu_x_animated_05-02-20010_gm

45

Режимы перевода

• Перевод отдельных файлов проекта

• Перевод всего пакета файлов разного формата как единого документа

• Перевод всего пакета файлов, упорядоченного по алфавиту

• Перевод одним переводчиком

• Перевод группой переводчиков, работающих изолированно

• Перевод группой переводчиков, работающих одновременно в офисе

• Перевод группой переводчиков в режиме удаленного доступа

Page 46: Presentation deja vu_x_animated_05-02-20010_gm

46

Глобальный предварительный перевод (Pretranslation)

DVX просматривает памяти переводов и терминологические базы, чтобы автоматически

вставить точный или сходный перевод

Page 47: Presentation deja vu_x_animated_05-02-20010_gm

47

Автоматический поиск переводов сходных предложений (AutoSearch)

Сходные сегменты

Отличие оригинала от найденного

сегмента

Отличие найденного сегмента от оригинала

При единственном выборе перевод подставляется в поле перевода автоматически

Page 48: Presentation deja vu_x_animated_05-02-20010_gm

48

Поиск на основе нечеткой логики

• Как при глобальном предварительном переводе, так и при любом автоматическом поиске в памяти переводов и терминологической базе, обнаружение сходства осуществляется на основе сложнейшего математического алгоритма, основанного на «нечеткой логике», который определяет сходство, используя до десятка критериев, в том числе и близость предметных областей

• Гарантированное совпадение – автоматическое подтверждение (на основе анализа контекста) того, что найденный схожий перевод является точным.

Page 49: Presentation deja vu_x_animated_05-02-20010_gm

49

Нечеткий поиск при предварительном переводе и ручном переводе

При ручном переводе автоматический поиск с использованием нечеткой логики обнаруживает большее количество сходных сегментов

Символов

Состояние сегмента: Предварительный перевод

Ручной автоматизированный

перевод

Непомечен 142628 78076

Непереведен 27771 13524

Ручной перевод 0 4707

Точное совпадение 33927 2136

Неточное совпадение 3797 896

Сборка 77133 55072

Распространение точного совпадения

0 1741

Закончено 0 64552

Итого 144388 144388

Page 50: Presentation deja vu_x_animated_05-02-20010_gm

50

Автоматическая сборка (AutoAssemble)

Автоматическая сборка перевода из фрагментов предложений в памяти переводов и элементов терминологической базы, если не найден перевод всего предложения, – уникальная функция, которая имеется только в Déjà Vu X

Наличие нескольких вариантов перевода указывается цветом. Просмотр – нажатием правой кнопки мыши. Перевод подставляется в поле перевода автоматически

Page 51: Presentation deja vu_x_animated_05-02-20010_gm

51

Ручной поиск в файлах памяти переводов (Scan)

Сходные сегменты

Искомое слово или

словосочетание

Найденный оригинал Найденный перевод

Page 52: Presentation deja vu_x_animated_05-02-20010_gm

52

Поиск с использованием трафаретных символов

Возможен поиск слов и словосочетаний с использованием трафаретных символов (wildcards). Если ввести в сегмент перевода con* fil*, выделить этот текст, щелкнуть правой кнопкой мыши и выбрать в контекстном меню Scan, Déjà Vu X покажет найденные в памятях переводов оригиналы (и их переводы), содержащие слова, начинающиеся с "con" и "fil", например:

Config Filename:Config filename:Confirm File MoveConfig file:configuration file Confirm File DeleteConfirm Delete of Read-Only File

и т.д.

Page 53: Presentation deja vu_x_animated_05-02-20010_gm

53

Автоматический контроль (AutoCheck) и обеспечение единообразия

• Обнаружение несоответствия терминов ранее употребленным или терминам в Лексиконе и терминологической базе, а также различия дат, чисел и кодов в оригинале и переводе.

• Обеспечение однократного и единообразного перевода одинаковых сегментов благодаря автоматической подстановке перевода для аналогичных сегментов (Autopropagate) во всех файлах проекта

• Дополнительные возможности обеспечения единообразия при переводе проекта целиком, упорядоченного по алфавиту (легче обнаруживаются опечатки и синонимы)

• Параллельное представление сегментов оригинала и перевода уменьшает риск пропусков в тексте

• При групповой работе редакторы могут начинать работу практически сразу, делая мгновенные рекомендации по терминологии и переводу

Page 54: Presentation deja vu_x_animated_05-02-20010_gm

54

Перевод и базы данных

Возможность полного управления информацией в базах данных, не прерывая перевода, поскольку в процессе перевода доступ к ним не блокируется

Простота пополнения памяти переводов и терминологической базы в процессе перевода

• Автоматическое направление перевода в память переводов (AutoSend)

• Ручное пополнение терминологической базы

Эффективный учет и исключение повторов в памяти переводов

• Поиск сегментов-дубликатов с одинаковым и разным переводом

Page 55: Presentation deja vu_x_animated_05-02-20010_gm

55

Временный экспорт в MS Word для анализа и редактирования его средствами с возвратом в Déjà Vu X

Page 56: Presentation deja vu_x_animated_05-02-20010_gm

56

Экспорт примечаний

Примечания, введенные при работе в Déjà Vu X (как указано выше), будут видны и в экспортированном файле:

Page 57: Presentation deja vu_x_animated_05-02-20010_gm

57

Статистика

Word count: подсчет числа строк, слов и символов в каждом файле – оценка объема работ, выполненного на данном этапе

Page 58: Presentation deja vu_x_animated_05-02-20010_gm

58

• Система работает практически без сбоев, в случае сбоя информация не теряется

• Осуществляется автосохранение всех компонентов

• Имеются встроенные средства для восстановления поврежденных баз данных и проекта

• Имеются встроенные средства для уплотнения баз данных и проекта

Надежность и защищенность

Page 59: Presentation deja vu_x_animated_05-02-20010_gm

59

Доступ к различным элементам проекта по паролям

• Возможность запрета редактирования текста или записи в память переводов

• 10 уровней индивидуальных полномочий пользователей с различными правами для чтения и записи в соответствии с квалификацией или обязанностями (переводчик, редактор, менеджер)

• Пользователи с низким уровнем (переводчики) не могут исправлять внесенное пользователями более высокого уровня (редакторами). Элементарно реализуется правило "Желание начальника - закон для подчиненных"

• Отслеживается, кто, когда и какие внес изменения в проект и базы данных

Защита от несанкционированного внесения изменений

Page 60: Presentation deja vu_x_animated_05-02-20010_gm

Удобный, легко Удобный, легко настраиваемый настраиваемый

интерфейсинтерфейс

Новое направление в технологии перевода

Page 61: Presentation deja vu_x_animated_05-02-20010_gm

61

Интерфейс пользователя

Гибкость настроек и размещения окон

Page 62: Presentation deja vu_x_animated_05-02-20010_gm

62

Привычный интерфейс Сходен с интерфейсом Windows Те же клавиши быстрого вызова, что и в Windows Те же функции Autotext, Autocorrect и Spelling, что и в MS Word Полностью настраиваем:

• Тип и размер шрифта

• Цвета

• Компоновка окон Многоязычный

Page 63: Presentation deja vu_x_animated_05-02-20010_gm

63

Интерфейс пользователя

Единое рабочее пространство для всех действий

• Перевод проектов

• Управление памятями переводов и терминологическими базами

• Сведение документов

• Работа с фильтрами

Page 64: Presentation deja vu_x_animated_05-02-20010_gm

64

Сегментированный текст оригинала

Редактируемые ячейки

Фрагменты, найденные в

памяти переводов и

терминологической базе

Предложения, найденные

в памяти переводов

Список импорти-рованных файлов

Рабочее пространство

Page 65: Presentation deja vu_x_animated_05-02-20010_gm

65

Выборочный вывод сегментов на экран

Мощная система фильтрации сегментов по более чем десяти параметрам, включая заданные пользователем на основе SQL

Page 66: Presentation deja vu_x_animated_05-02-20010_gm

Память переводов Память переводов Терминологическая базаТерминологическая база

ЛексиконЛексикон

Новое направление в технологии перевода

Page 67: Presentation deja vu_x_animated_05-02-20010_gm

67

Особенности

Все базы данных основаны на стандартной СУБД Jet Базы предназначены для нескольких языков одновременно

Адаптируемая структура терминологической базы• Добавление атрибутов и категорий -- практически

неограниченные возможности настройки. • Настраивается столько параметров, категорий и связей,

сколько требуется пользователю

Термины оригинала

Переводы термина на разные языки, его

синонимы и антонимы

Атрибуты для обоих языков,

включая контекст

Page 68: Presentation deja vu_x_animated_05-02-20010_gm

68

Особенности Четырехмерная структура классификации записей проекта,

памяти переводов и терминологической базы

Это позволяет отобрать записи, относящиеся к конкретному заказчику, предметной области, проекту, файлу или их комбинации

Page 69: Presentation deja vu_x_animated_05-02-20010_gm

69

Несколько баз данных

Возможность подключения большого числа баз данных для одного проекта

• Индивидуальное задание режимов «Только чтение», «Только запись», «Чтение и запись» и упорядочивание по приоритетам

• Возможность одновременного использования несколькими переводчиками, переводящими на разные языки

Page 70: Presentation deja vu_x_animated_05-02-20010_gm

70

Лексикон

• Учет терминологической специфики проекта

• Учет требований заказчика к терминологии. Наличие Лексикона позволяет реализовать правило: "Клиент всегда прав" и переводить, например, по требованию заказчика, mouse не как "мышь", а как "мышка", не изменяя ничего в основной терминологической базе

Частота употребления

Число слов

Упорядочено по частоте

Page 71: Presentation deja vu_x_animated_05-02-20010_gm

71

• Лексикон позволяет проанализировать частотность терминов

• С помощью Лексикона можно пополнить терминологические базы данных и памяти переводов

• Лексикон может импортироваться из файлов MS Office и экспортироваться в них.

• Это позволяет быстро составить словарь общей лексики, исключив все редко употребляемые термины

• Кроме того можно составить словарь клише, отобрав все часто встречающиеся словосочетания

Лексикон

Page 72: Presentation deja vu_x_animated_05-02-20010_gm

72

Импорт-экспорт баз данных, обмен с другими системами

Импорт-экспорт баз данных в различных форматах (Excel, Access, text, TMX...)

• Обеспечивается обмен информацией с другими системами

• Может применяться для создания резервных копий

• Создание терминологической базы и памяти переводов по файлам MS Office

• Создание словарей в формате MS Office по терминологической базе

Page 73: Presentation deja vu_x_animated_05-02-20010_gm

73

Управление содержанием

Удобство ведения баз данных

• Возможность фильтрации данных

• Настраиваемые фильтры SGML/XML для любых файлов на основе SGML

• Возможность просмотра и удаления дубликатов

• Возможность удаления чисел и дат

• Возможность уплотнения баз данных и проекта

• Возможность восстановления поврежденных баз данных и проекта

Page 74: Presentation deja vu_x_animated_05-02-20010_gm

74

Язык структурированных запросов SQL

В руководстве пользователя около 70 стандартных операторов SQL для глобального удаления, модификации и экспорта записей баз данных с определенными атрибутами

• определенный период времени

• конкретный заказчик

• конкретный проект

• конкретная предметная область

• конкретный пользователь

• наличие определенного фрагмента текста

Большое количество дополнительных операторов SQL на форуме dеjavu-I –

http://tech.groups.yahoo.com/group/dejavu-l/

Page 75: Presentation deja vu_x_animated_05-02-20010_gm

75

Принципы ведения памяти переводов

Для того чтобы повысить эффективность автоматической сборки, целесообразно сохранять в памяти не только сегмент, но и его фрагменты, которые могут встретиться в дальнейшем как единое целое (например, "эффективность использования", "в дальнейшем" и т.п.). Например, для сегмента

"In London, traffic congestion is a serious problem"

в память переводов целесообразно внести следующие оригиналы и их переводы:

[In London, traffic congestion is a serious problem]

[In London]

[traffic congestion]

[serious problem].

Это помогает предотвратить автоматическую сборку перевода выражения из фрагментов, имеющихся в памяти переводов (is, a, serious, problem), вместо подстановки перевода всего выражения, имеющегося в терминологической базе данных (is a serious problem).

Page 76: Presentation deja vu_x_animated_05-02-20010_gm

Версии и Версии и информационные информационные

ресурсыресурсы

Новое направление в технологии перевода

Page 77: Presentation deja vu_x_animated_05-02-20010_gm

77

Варианты систем DVX

DVX WorkgroupDVX Professional

DVX Standard

Standard – Автономная программа для внештатных переводчиков, может создавать проекты, не имеет некоторых развитых и автоматизированных возможностей.Professional – Классическая версия, предназначена для внештатных переводчиков и имеет все возможности.

Workgroup – Все функции Professional плюс мощные возможности для управления работой переводчиков и организации групповой работы.

Page 78: Presentation deja vu_x_animated_05-02-20010_gm

78

• Процессор Pentium III с частотой 600 МГц и 256 Мбайт оперативной памяти

• Система Déjà Vu X совместима со следующими версиями Windows:

Скромные системные требования

Page 79: Presentation deja vu_x_animated_05-02-20010_gm

79

Загрузка и обновление системы Déjà Vu X

Адрес для загрузки систем Déjà Vu X www.atril.com/downloads

Демонстрационная версия

Полностью функционирующую демонстрационную версию можно скачать по адресу

www.atril.com/downloads

бесплатно получив разрешающий код на 30 дней

Page 80: Presentation deja vu_x_animated_05-02-20010_gm

80

Примерная структура каталогов

Page 81: Presentation deja vu_x_animated_05-02-20010_gm

81

1. Форум dеjavu-L – http://tech.groups.yahoo.com/group/dejavu-L/

2. Форумы Города переводчиков -http://www.trworkshop.net/forum

3. Cоветы и приемы работы для переводчиков - tt4t.net – http://www.necco.ca/dv/

4. Wikibooks, коллекция книг с открытым для дополнения содержанием – http://en.wikibooks.org/wiki/CAT-Tools

Ресурсы в сети Интернет для Déjà Vu X, основные форумы , где можно получить

информацию и помощь

Page 82: Presentation deja vu_x_animated_05-02-20010_gm

82

Ресурсы в сети Интернет для Déjà Vu X, основные форумы , где можно получить

информацию и помощь

5. Автоматизированный перевод. Из открытой для дополнения энциклопедии Wikipedia –

http://en.wikipedia.org/wiki/Computer-assisted_translation#Computer-assisted translation

6. Greek Translation Vortal -- http://www.translatum.gr/dics/translation-memory.htm

7. Форум Lingvoda

http://www.lingvoda.ru/forum/actualtopics.aspx?bid=9

8. English Spanish Translator Org: Translation Forum – Translators Forums – CAT Tools - http://www.english-spanish-translator.org/cat-tools/

Page 83: Presentation deja vu_x_animated_05-02-20010_gm

83

СпасибоСпасибоза внимание! за внимание!

Успехов!Успехов!