Presentation deja vu_x_animated_05-02-20010_gm

Post on 14-Jun-2015

657 views 4 download

description

Описание системы DVX и выгоды от ее использования, 83 слайда, 2010 г.

Transcript of Presentation deja vu_x_animated_05-02-20010_gm

Георгий МоисеенкоГеоргий Моисеенко

(gmoiseenko@yandex.ru)(gmoiseenko@yandex.ru)

Введение

в систему автоматизированного перевода Déjà Vu X Workgroup

2

• Объективная необходимость • Современные требования• Основные понятия и базы данных• Краткое сравнение систем• Основные преимущества Deja Vu X• Эффективность и единообразие• Совместимость и многоязычность• Надежность, безопасность и контроль• Интерфейс пользователя• Основные характеристики и функции• Процедура перевода• Экономическая эффективность• Версии и информационные ресурсы

Основные темы

Объективная необходимость Объективная необходимость использования использования

автоматизированных систем автоматизированных систем переводаперевода

Новое направление в технологии перевода

4

Повторение пройденного

Кто из переводчиков не восклицал однажды:

«А, ведь, нечто похожее я уже переводил!

Déjà Vu!»

Практические примеры документов с повторами –

Техническая документация по новой версии продукта (новой модели автомобиля и т.п.)

Документация новой версии программного обеспечения

Реклама нового модельного ряда продуктов

Ситуации разные, смысл один – работа срочная, большая, но déjà vu (уже виденное). Переводчику нужно переводить текст, сходный с ранее переведенным

5

Прежние переводы хранятся в бумажном виде

При большом объеме хранимых документов поиск конкретной фразы практически неосуществим

6

Наглядный пример

В данном фрагменте Руководства пользователя количество повторов уже переведенного составляет 57%.

7

Современные требования

Необходимость повышения качества переводов:

• Обеспечение единообразия терминологии

• Обеспечение единообразного перевода одних и тех же предложений

Необходимость повышения эффективности (снижение трудозатрат, сокращение сроков):

• Автоматизация рутинных операций

• Исключение полного повторного перевода документации, в которую внесены изменения и дополнения

• Исключение повторного перевода одних и тех же слов и предложений

8

Структура системы

Память переводов

Терминологическая база

Проект

Лет 10 назад компания IBM разработала «Систему памяти переводов» - Translation memory system

9

Структура системы

Новое название - Computer-assisted translation tool (CAT tool) – Автоматизированная система перевода

Память переводов

Терминологическая база

Лексикон

Проект

10

Объективная необходимость

• Высокая конкуренция между переводчиками

• Работодатели требуют владения автоматизированными системами перевода

• Заказчики требуют представления перевода в виде базы данных

• Высокие требования к качеству и срокам

Основные понятия Основные понятия автоматизированных систем автоматизированных систем

переводаперевода

Новое направление в технологии перевода

12

СегментацияИсходный текст

CONFIDENTIALITY AGREEMENTAugust ,2004[address]Re: Confidentiality AgreementLadies and Gentlemen:You have requested Confidential Information from Company1 Corporation ("Company1") concerning Company1 that is either confidential, proprietary, or publicly unavailable in connection with your consideration of a possible business combination ("Transaction") between you and Company1 involving TLLC. As a condition, and in consideration, of furnishing to you "Confidential Information" (as defined below), Andrew requires that you treat the Confidential Information so furnished confidentially as set forth in this letter agreement (the "Confidentiality Agreement").1. Confidential Information As used in this Confidentiality Agreement, the term "Confidential Information" means all information concerning Company1 and its subsidiaries or affiliates that is furnished or made available to you by Company1 or any agent or representative of Company1 or that is obtained or derived by you from any of the foregoing persons as part of your consideration of the Transaction,

13

Сегментация Текст, разбитый на сегменты

Сегмент - абзац, предложение и т.п.

Сегмент оригинала

14

Память переводовСводная таблица

Сегмент оригинала Сегмент перевода

Наиболее популярные Наиболее популярные системысистемы

Новое направление в технологии перевода

16

Основные функции систем

• Импорт переводимых файлов в систему

• Анализ трудоемкости

• Сведение двуязычных файлов для создания памяти переводов

• Предварительный глобальный перевод

• Автоматический поиск переводов сходных предложений

• Перевод в текстовом редакторе

• Пополнение и ведение терминологической базы данных и памяти переводов

• Оценка сделанных трудозатрат

• Экспорт файлов

17

Наиболее популярные системыПо данным опроса, проведенного Imperial College London в августе 2006 года среди 900 переводчиков из 54 стран, наибольшей популярностью пользуются системы Trados, Déjà Vu X и Wordfast с разными приоритетами среди разных групп переводчиков

Количество пользователей различно в разных подгруппах (внештатные переводчики, бюро переводов и т.п.). Deja Vu используется равномерно во всех группах.

18

Количество пользователей, использующих различные системы

как основные (в %)

19

Оценка четырех систем по функциональным и нефункциональным критериям

Рейтинг систем по следующим критериям

Trados Déjà Vu Wordfast SDL Trados

2006

Функциональные возможности

3,5 4,1 3,9 3,6

Нахождение совпадений 3,3 3,8 3,4 3,3

Правильность нахождения совпадений

3,3 3,8 3,4 3,8

Быстродействие 3,7 4,1 3,9 3,7

Надежность 3,3 4,1 3,8 3,4

Удобство использования 3,5 4,2 4,2 3,5

Простота обучения 3,3 4,0 4,1 3,4

Соотношение "цена-качество"

2,9 4,3 4,6 3,1

Поддержка пользователей 2,5 3,7 3,7 2,6

Средний рейтинг 3,3 4,0 3,9 3,4

20

Сводные оценки пяти систем

Популярность Удобство пользования• TRADOS 76% 3,3

• Déjà Vu 61% 4,0• Wordfast 51% 3,9• SDL Trados 2006 49% 3,4• SDLX 36%• STAR Transit 25%

Налицо явное противоречие между тем, что наибольшей популярностью пользуется система Trados, и тем, что большинство пользователей отдали превосходство системе Déjà Vu как по функциональным, так и по другим характеристикам.

Многие пользователи, от которых требуют перевести документы в Trados, переводят их в более удобной системе

Déjà Vu X, конвертируя результат в Trados.

21

ИсточникиПриведенные результаты взяты из документа: http://www3.imperial.ac.uk/portal/pls/portallive/docs/1/7307707.PDFНекоторые более ранние сведения приведены в документах: http://www.accurapid.com/journal/03TM2.htm http://www.accurapid.com/journal/03TM1.htm http://www.atril.com/docs/Benis-ITI-DVX.pdf http://www.techwr-l.com/techwhirl/magazine/technical/translationmemory.htmlПопытка собрать сведения о сравнительной эффективности популярных систем была сделана на форуме http://www.trworkshop.net/forum/viewtopic.php?t=6254Плюсы и минусы систем неоднократно обсуждались на форумах http://trworkshop.net/forum/viewforum.php?f=16 http://www.libra-k.ru/forum/viewforum.php?f=18&sid=346091f51e807035cfb94de841eaa0b3 http://tech.groups.yahoo.com/group/dejavu-L http://www.lisa.org

ПОЧЕМУ Déjà Vu X?ПОЧЕМУ Déjà Vu X?

Новое направление в технологии перевода

23

Все системы умеют находить в памяти переводов предложения, сходные с

переведенными

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков). Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentences.Пометьте поле Find sets of duplicate source sentences with identical translations.Пометьте поле Delete redundant sentences in each set of duplicates.Укажите нужные языки.Пометьте в разделе Miscellaneous: Удаление ненужных переводов одного и того же оригинала.

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentences with different translations.

Укажите нужные языки.Пометьте в разделе Miscellaneous: Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по алфавиту.

24

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков).

Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.Укажите нужные языки.

Пометьте в разделе Miscellaneous: Удаление ненужных переводов одного и того же оригинала. Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.Укажите нужные языки.Пометьте в разделе Miscellaneous: Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по алфавиту.

Déjà Vu X, кроме того, автоматически подставляет фрагменты предложений

из памяти переводов

25

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences и задайте нужные

параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences.

Пометьте поле Find sets of duplicate source sentences with identical translations.

Пометьте поле Delete redundant sentences in each set of duplicates.

Укажите нужные языки.

Пометьте в разделе Miscellaneous:

Удаление ненужных переводов одного и того же оригинала. Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).

Выберите в меню Database команду Find Duplicate Sentences.

Пометьте поле Find sets of duplicate source sentences with different translations.Укажите нужные языки.Пометьте в разделе Miscellaneous:

Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.

Выберите в меню View команду Toggle Sorting, чтобы упорядочить память

переводов по алфавиту.

Déjà Vu X автоматически подставляет слова и из терминологической базы

26

Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences.

Укажите нужные языки.Пометьте в разделе Miscellaneous:

Количество символов текста – 1052Обычная система найдет 190 символов повторяющихся

предложений - 18%:

Обнаруживается больше повторов

27

Запустите откройте память переводов Выберите в меню команду задайте параметры, удалить записи проверьте Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Пометьте поле Find sets of duplicate source sentencesПометьте поле.Укажите языки.Пометьте разделеУдаление переводов оригинала. Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).Выберите в меню Database команду Find Duplicate Sentences. Пометьте поле Find sets of duplicate source sentencesУкажите нужные языки.Пометьте в разделе Miscellaneous: просмотра переводов выберите

Déjà Vu X дополнительно найдет 424 символа повторяющихся фрагментов – 40%, итого - 58%. Не считая английских слов и чисел, которые подставляются в перевод автоматически (View, Toggle Sorting и т.п., здесь не учтены) .

58% против 18%!C помощью функции "мозаичного перевода " (AutoAssemble) перевод автоматически собирается из фрагментов сегментов, найденных в памяти переводов, и терминов из терминологической базы.

Обнаруживается больше повторов

ЭффективностьЭффективность

Новое направление в технологии перевода

29

Эффективность

Статистика для одного из больших документов

Точное совпадение с предложениями в памяти переводов 33,1%

Неточное совпадение с предложениями в памяти 4,2%

Сборка из фрагментов предложений в памяти и терминов 0,3% Копирование перевода аналогичных предложений далее по тексту 37,3%

Перевод вручную 25,2%---------------------------------------------------------------------------------------------------Примечание: Высокая степень совпадений объясняется тем, что в памяти переводов уже содержался предварительный перевод трех разделов данного документа.

Полученная выгода очевидна

30

Analyze: Анализ наличия и степени повторений для другого реального проекта– оценка трудоемкости будущей работы

Дубликатов – 17%

Сходных элементов - 25% (сходство более 20%), - 16% (сходство до 20%)

Точных совпадений – 21%

Всего

Несходных элементов –23%

31

Почему Déjà Vu XПример еще одного проекта

44% текста подставлено автоматически (память составлена по одному файлу)

32

Статистика для последнего проекта

Вид документа Паспорта безопасности препаратов

Количество файлов в проекте 18

Объем проекта 52800 слов (29 учетных страниц)

Количество переводчиков 5

Редактор 1

Начальный объем памяти переводов 0

Наличие словаря проекта 0 слов

Повторяемость текста 50%

Расчетное время ручного перевода 5 переводчиками (без учета редактирования)

6 рабочих дней

Реальное время выполнения 3 рабочих дня с редактированием. Экономические выгоды для бюро

переводов в месяц легко подсчитываются

33

Эффективность

Средний процент повторений в документах, обнаруживаемый системой – 20-30%.

В месяце – 22 рабочих дня по 8 часов = 176 часов

Норма переводчика: 1 страница в час

20% от 176 = 35 часов

= 35 страниц

= 4 рабочих дня !

В больших пакетах документов для некоторых документов процент повторений достигал 100%.

Умножим на зарплату в час!

Удобство и эффективность Удобство и эффективность переводаперевода

Этапы и функцииЭтапы и функции

Новое направление в технологии перевода

35

Основные этапы

Создание и настройка проекта

Импорт файлов

Автоматический поиск в памяти переводов с использованием

нечеткой логики и автоматическая сборка

Ручной перевод

Экспорт

Переводчик создает и настраивает проект

Переводчик импортирует документы

DVX находит сходные предложения или строит часть перевода автоматически

Переводчик переводит остальное

DVX экспортирует документы

Предварительная обработка документов проекта

Переводчик приводит документы к виду, облегчающему перевод и предотвращающему возникновение проблем

Редактирование и форматирование переводов

Переводчик редактирует и форматирует экспортированные переведенные документы

36

Управление проектом

File Navigator:

• Указывает все файлы проекта

• Экспорт одним щелчком мыши

Project Explorer

• Импорт

и экспорт файлов

37

Конфигурация проекта

• Один проект –несколько файлов

• Один проект – разные форматы файлов

• Возможность одновременного перевода файлов разного типа как цельного документа

• Один проект – перевод одновременно на несколько языков

38

Возможность одновременного перевода документа на несколько языков с сохранением переводов на разные языки в одном проекте, одной памяти переводов и одной терминологической базе

Применимы все языки, поддерживаемые Windows 98/ME/NT4/2000/XP, включая:

• китайский

Поддерживаемые языки

• арабский и иврит

Поддерживаемые языки

Поддерживаемые языки

39

Предварительная обработка файлов

Изменение формата обозначается цифрами в фигурных скобках. Если формат элемента текста неоправданно отличается от формата соседнего элемента, появятся дополнительные разделяющие коды:

"связного {111}фрагмента", "сл{112}ова",которые помешают найти сходные фрагменты. Иногда целесообразно проводить предварительную обработку документа для повышения эффективности работы. Пример:

Исходный текст в Word Текст в Déjà Vu

Для переноса использован знак дефиса

Действ-ующего {77}Действ{78}-{79}ующего{80}

Вставлен мягкий перенос

действующего {81}дейс{82}твующего

Использован автоматический перенос

в лице ге-нерального ди-ректора господина Тоно, дей-ствую-щего на основании Устава, именуемое в даль-нейшем «Заказчик»

{85}в лице {86}генерального директора господина Тоно, действующего на основании Устава, именуемое в {88}дальнейшем «Заказчик»{89}

40

А также:

RTF RC Файлы справки GNU PO и POT CC++ IBM TM

Импорт файлов разных форматов, без конвертирования в промежуточные форматы.

Представление всех документов в едином формате.

Импорт. Форматы. Совместимость

41

Импорт и экспорт документов

• Удобная система правил сегментации. Правила сегментации можно настраивать для совместимости с другими системами, чтобы обеспечить тождественность их памятей переводов

• Возможность задания параметров импорта

• В выполняемый проект можно добавлять новые документы, не прерывая перевода

• Возможность выборочного импорта части документа

• Восстановление формата документа при его экспорте.

42

Выборочный импорт части файла (Excel)

Для текста, который не нужно переводить, задайте красный цвет шрифта, а при импорте укажите в параметрах фильтра "Ignore Red Text" . Если сделать копию столбца оригинала и задать для исходного столбца красный цвет шрифта, то первый столбец не будет импортирован и останется неизменным, а второй - будет импортирован и переведен, в результате чего получится таблица с колонками оригинала и перевода.

43

Заполнение исходной памяти переводов

• Сведение (Alignment) - Создание памяти переводов по документу- оригиналу и документу-переводу

• Импорт двуязычного файла

• Импорт готовой памяти

• Подключение готовой памяти

44

Сведение (Alignment) файла-оригинала и файла-перевода

Большое число допустимых форматов (Word, Open Office, Quark Xpress XTG, RTF, SGML, XML, Text,…)

Оригинал Перевод

45

Режимы перевода

• Перевод отдельных файлов проекта

• Перевод всего пакета файлов разного формата как единого документа

• Перевод всего пакета файлов, упорядоченного по алфавиту

• Перевод одним переводчиком

• Перевод группой переводчиков, работающих изолированно

• Перевод группой переводчиков, работающих одновременно в офисе

• Перевод группой переводчиков в режиме удаленного доступа

46

Глобальный предварительный перевод (Pretranslation)

DVX просматривает памяти переводов и терминологические базы, чтобы автоматически

вставить точный или сходный перевод

47

Автоматический поиск переводов сходных предложений (AutoSearch)

Сходные сегменты

Отличие оригинала от найденного

сегмента

Отличие найденного сегмента от оригинала

При единственном выборе перевод подставляется в поле перевода автоматически

48

Поиск на основе нечеткой логики

• Как при глобальном предварительном переводе, так и при любом автоматическом поиске в памяти переводов и терминологической базе, обнаружение сходства осуществляется на основе сложнейшего математического алгоритма, основанного на «нечеткой логике», который определяет сходство, используя до десятка критериев, в том числе и близость предметных областей

• Гарантированное совпадение – автоматическое подтверждение (на основе анализа контекста) того, что найденный схожий перевод является точным.

49

Нечеткий поиск при предварительном переводе и ручном переводе

При ручном переводе автоматический поиск с использованием нечеткой логики обнаруживает большее количество сходных сегментов

Символов

Состояние сегмента: Предварительный перевод

Ручной автоматизированный

перевод

Непомечен 142628 78076

Непереведен 27771 13524

Ручной перевод 0 4707

Точное совпадение 33927 2136

Неточное совпадение 3797 896

Сборка 77133 55072

Распространение точного совпадения

0 1741

Закончено 0 64552

Итого 144388 144388

50

Автоматическая сборка (AutoAssemble)

Автоматическая сборка перевода из фрагментов предложений в памяти переводов и элементов терминологической базы, если не найден перевод всего предложения, – уникальная функция, которая имеется только в Déjà Vu X

Наличие нескольких вариантов перевода указывается цветом. Просмотр – нажатием правой кнопки мыши. Перевод подставляется в поле перевода автоматически

51

Ручной поиск в файлах памяти переводов (Scan)

Сходные сегменты

Искомое слово или

словосочетание

Найденный оригинал Найденный перевод

52

Поиск с использованием трафаретных символов

Возможен поиск слов и словосочетаний с использованием трафаретных символов (wildcards). Если ввести в сегмент перевода con* fil*, выделить этот текст, щелкнуть правой кнопкой мыши и выбрать в контекстном меню Scan, Déjà Vu X покажет найденные в памятях переводов оригиналы (и их переводы), содержащие слова, начинающиеся с "con" и "fil", например:

Config Filename:Config filename:Confirm File MoveConfig file:configuration file Confirm File DeleteConfirm Delete of Read-Only File

и т.д.

53

Автоматический контроль (AutoCheck) и обеспечение единообразия

• Обнаружение несоответствия терминов ранее употребленным или терминам в Лексиконе и терминологической базе, а также различия дат, чисел и кодов в оригинале и переводе.

• Обеспечение однократного и единообразного перевода одинаковых сегментов благодаря автоматической подстановке перевода для аналогичных сегментов (Autopropagate) во всех файлах проекта

• Дополнительные возможности обеспечения единообразия при переводе проекта целиком, упорядоченного по алфавиту (легче обнаруживаются опечатки и синонимы)

• Параллельное представление сегментов оригинала и перевода уменьшает риск пропусков в тексте

• При групповой работе редакторы могут начинать работу практически сразу, делая мгновенные рекомендации по терминологии и переводу

54

Перевод и базы данных

Возможность полного управления информацией в базах данных, не прерывая перевода, поскольку в процессе перевода доступ к ним не блокируется

Простота пополнения памяти переводов и терминологической базы в процессе перевода

• Автоматическое направление перевода в память переводов (AutoSend)

• Ручное пополнение терминологической базы

Эффективный учет и исключение повторов в памяти переводов

• Поиск сегментов-дубликатов с одинаковым и разным переводом

55

Временный экспорт в MS Word для анализа и редактирования его средствами с возвратом в Déjà Vu X

56

Экспорт примечаний

Примечания, введенные при работе в Déjà Vu X (как указано выше), будут видны и в экспортированном файле:

57

Статистика

Word count: подсчет числа строк, слов и символов в каждом файле – оценка объема работ, выполненного на данном этапе

58

• Система работает практически без сбоев, в случае сбоя информация не теряется

• Осуществляется автосохранение всех компонентов

• Имеются встроенные средства для восстановления поврежденных баз данных и проекта

• Имеются встроенные средства для уплотнения баз данных и проекта

Надежность и защищенность

59

Доступ к различным элементам проекта по паролям

• Возможность запрета редактирования текста или записи в память переводов

• 10 уровней индивидуальных полномочий пользователей с различными правами для чтения и записи в соответствии с квалификацией или обязанностями (переводчик, редактор, менеджер)

• Пользователи с низким уровнем (переводчики) не могут исправлять внесенное пользователями более высокого уровня (редакторами). Элементарно реализуется правило "Желание начальника - закон для подчиненных"

• Отслеживается, кто, когда и какие внес изменения в проект и базы данных

Защита от несанкционированного внесения изменений

Удобный, легко Удобный, легко настраиваемый настраиваемый

интерфейсинтерфейс

Новое направление в технологии перевода

61

Интерфейс пользователя

Гибкость настроек и размещения окон

62

Привычный интерфейс Сходен с интерфейсом Windows Те же клавиши быстрого вызова, что и в Windows Те же функции Autotext, Autocorrect и Spelling, что и в MS Word Полностью настраиваем:

• Тип и размер шрифта

• Цвета

• Компоновка окон Многоязычный

63

Интерфейс пользователя

Единое рабочее пространство для всех действий

• Перевод проектов

• Управление памятями переводов и терминологическими базами

• Сведение документов

• Работа с фильтрами

64

Сегментированный текст оригинала

Редактируемые ячейки

Фрагменты, найденные в

памяти переводов и

терминологической базе

Предложения, найденные

в памяти переводов

Список импорти-рованных файлов

Рабочее пространство

65

Выборочный вывод сегментов на экран

Мощная система фильтрации сегментов по более чем десяти параметрам, включая заданные пользователем на основе SQL

Память переводов Память переводов Терминологическая базаТерминологическая база

ЛексиконЛексикон

Новое направление в технологии перевода

67

Особенности

Все базы данных основаны на стандартной СУБД Jet Базы предназначены для нескольких языков одновременно

Адаптируемая структура терминологической базы• Добавление атрибутов и категорий -- практически

неограниченные возможности настройки. • Настраивается столько параметров, категорий и связей,

сколько требуется пользователю

Термины оригинала

Переводы термина на разные языки, его

синонимы и антонимы

Атрибуты для обоих языков,

включая контекст

68

Особенности Четырехмерная структура классификации записей проекта,

памяти переводов и терминологической базы

Это позволяет отобрать записи, относящиеся к конкретному заказчику, предметной области, проекту, файлу или их комбинации

69

Несколько баз данных

Возможность подключения большого числа баз данных для одного проекта

• Индивидуальное задание режимов «Только чтение», «Только запись», «Чтение и запись» и упорядочивание по приоритетам

• Возможность одновременного использования несколькими переводчиками, переводящими на разные языки

70

Лексикон

• Учет терминологической специфики проекта

• Учет требований заказчика к терминологии. Наличие Лексикона позволяет реализовать правило: "Клиент всегда прав" и переводить, например, по требованию заказчика, mouse не как "мышь", а как "мышка", не изменяя ничего в основной терминологической базе

Частота употребления

Число слов

Упорядочено по частоте

71

• Лексикон позволяет проанализировать частотность терминов

• С помощью Лексикона можно пополнить терминологические базы данных и памяти переводов

• Лексикон может импортироваться из файлов MS Office и экспортироваться в них.

• Это позволяет быстро составить словарь общей лексики, исключив все редко употребляемые термины

• Кроме того можно составить словарь клише, отобрав все часто встречающиеся словосочетания

Лексикон

72

Импорт-экспорт баз данных, обмен с другими системами

Импорт-экспорт баз данных в различных форматах (Excel, Access, text, TMX...)

• Обеспечивается обмен информацией с другими системами

• Может применяться для создания резервных копий

• Создание терминологической базы и памяти переводов по файлам MS Office

• Создание словарей в формате MS Office по терминологической базе

73

Управление содержанием

Удобство ведения баз данных

• Возможность фильтрации данных

• Настраиваемые фильтры SGML/XML для любых файлов на основе SGML

• Возможность просмотра и удаления дубликатов

• Возможность удаления чисел и дат

• Возможность уплотнения баз данных и проекта

• Возможность восстановления поврежденных баз данных и проекта

74

Язык структурированных запросов SQL

В руководстве пользователя около 70 стандартных операторов SQL для глобального удаления, модификации и экспорта записей баз данных с определенными атрибутами

• определенный период времени

• конкретный заказчик

• конкретный проект

• конкретная предметная область

• конкретный пользователь

• наличие определенного фрагмента текста

Большое количество дополнительных операторов SQL на форуме dеjavu-I –

http://tech.groups.yahoo.com/group/dejavu-l/

75

Принципы ведения памяти переводов

Для того чтобы повысить эффективность автоматической сборки, целесообразно сохранять в памяти не только сегмент, но и его фрагменты, которые могут встретиться в дальнейшем как единое целое (например, "эффективность использования", "в дальнейшем" и т.п.). Например, для сегмента

"In London, traffic congestion is a serious problem"

в память переводов целесообразно внести следующие оригиналы и их переводы:

[In London, traffic congestion is a serious problem]

[In London]

[traffic congestion]

[serious problem].

Это помогает предотвратить автоматическую сборку перевода выражения из фрагментов, имеющихся в памяти переводов (is, a, serious, problem), вместо подстановки перевода всего выражения, имеющегося в терминологической базе данных (is a serious problem).

Версии и Версии и информационные информационные

ресурсыресурсы

Новое направление в технологии перевода

77

Варианты систем DVX

DVX WorkgroupDVX Professional

DVX Standard

Standard – Автономная программа для внештатных переводчиков, может создавать проекты, не имеет некоторых развитых и автоматизированных возможностей.Professional – Классическая версия, предназначена для внештатных переводчиков и имеет все возможности.

Workgroup – Все функции Professional плюс мощные возможности для управления работой переводчиков и организации групповой работы.

78

• Процессор Pentium III с частотой 600 МГц и 256 Мбайт оперативной памяти

• Система Déjà Vu X совместима со следующими версиями Windows:

Скромные системные требования

79

Загрузка и обновление системы Déjà Vu X

Адрес для загрузки систем Déjà Vu X www.atril.com/downloads

Демонстрационная версия

Полностью функционирующую демонстрационную версию можно скачать по адресу

www.atril.com/downloads

бесплатно получив разрешающий код на 30 дней

80

Примерная структура каталогов

81

1. Форум dеjavu-L – http://tech.groups.yahoo.com/group/dejavu-L/

2. Форумы Города переводчиков -http://www.trworkshop.net/forum

3. Cоветы и приемы работы для переводчиков - tt4t.net – http://www.necco.ca/dv/

4. Wikibooks, коллекция книг с открытым для дополнения содержанием – http://en.wikibooks.org/wiki/CAT-Tools

Ресурсы в сети Интернет для Déjà Vu X, основные форумы , где можно получить

информацию и помощь

82

Ресурсы в сети Интернет для Déjà Vu X, основные форумы , где можно получить

информацию и помощь

5. Автоматизированный перевод. Из открытой для дополнения энциклопедии Wikipedia –

http://en.wikipedia.org/wiki/Computer-assisted_translation#Computer-assisted translation

6. Greek Translation Vortal -- http://www.translatum.gr/dics/translation-memory.htm

7. Форум Lingvoda

http://www.lingvoda.ru/forum/actualtopics.aspx?bid=9

8. English Spanish Translator Org: Translation Forum – Translators Forums – CAT Tools - http://www.english-spanish-translator.org/cat-tools/

83

СпасибоСпасибоза внимание! за внимание!

Успехов!Успехов!