%D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF...

23
Учебно-методическое объединение высших учебных заведений Республики Беларусь по гуманитарному образованию Белорусский государственный университет УТВЕРЖДАЮ Ректор Белгосунивероситета ________________ В.И.Стражев (подпись) (И.О.Фамилия) ____________________ (дата утверждения) Регистрационный УД-______/ уч. КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА Учебная программа по специализации для студентов филологического факультета специальностей I – 21 05 01 «Белорусская филология» I – 21 05 02 «Русская филология» I – 21 05 04 «Славянская филология» I – 21 05 05 «Классическая филология» I – 21 05 06 «Романо-германская филология» I – 21 05 07 «Восточная филология» Срок действия учебной программы до 2013 СОГЛАСОВАНО Председатель учебно-методического объединения высших учебных заведений Республики Беларусь по гуманитарному образованию ________________ В. Л. Клюня (подпись) (И.О.Фамилия) 2008 г. 2 БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТ Кафедра прикладной лингвистики КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА Учебная программа по специализации для студентов филологи- ческого факультета специальностей I – 21 05 01 – «Белорусская филология» I – 21 05 02 – «Русская филология» I – 21 05 04 – «Славянская филология» I – 21 05 05 – «Классическая филология» I – 21 05 06 – «Романо-германская филология» I – 21 05 07 – «Восточная филология» Минск 2008

Transcript of %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF...

Page 1: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

Учебно-методическое объединение высших учебных заведений Республики Беларусь по гуманитарному образованию

Белорусский государственный университет

УТВЕРЖДАЮ Ректор Белгосунивероситета ________________ В.И.Стражев (подпись) (И.О.Фамилия)

____________________ (дата утверждения)

Регистрационный № УД-______/уч.

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА Учебная программа по специализации для студентов филологического

факультета специальностей

I – 21 05 01 – «Белорусская филология» I – 21 05 02 – «Русская филология» I – 21 05 04 – «Славянская филология» I – 21 05 05 – «Классическая филология» I – 21 05 06 – «Романо-германская филология» I – 21 05 07 – «Восточная филология»

Срок действия учебной программы – до 2013

СОГЛАСОВАНО

Председатель учебно-методического объединения высших учебных заведений Республики Беларусь по гуманитарному

образованию ________________ В. Л. Клюня

(подпись) (И.О.Фамилия)

2008 г.

2

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТ Кафедра прикладной лингвистики

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА

Учебная программа по специализации для студентов филологи-ческого факультета специальностей

I – 21 05 01 – «Белорусская филология» I – 21 05 02 – «Русская филология» I – 21 05 04 – «Славянская филология» I – 21 05 05 – «Классическая филология» I – 21 05 06 – «Романо-германская филология» I – 21 05 07 – «Восточная филология»

Минск 2008

Page 2: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

3

УДК 81’33(073) ББК 81.1 р К 63 Авторы-составители: В.А. Карпов, доктор филологических наук, профессор

А.В. Лаврененко, кандидат филологических наук, доцент кафедры при-кладной лингвистики А.И. Головня, кандидат филологических наук, доцент кафедры приклад-ной лингвистики Рекомендовано Ученым советом филологического факультета ___ ок-тября 2008, протокол №___. Рецензенты С.Г. Барбук кандидат филологических наук, доцент кафедры славянских языков МГЛУ; Кафедра интеллектуальных информационных технологий Учреждения образования «Белорусский государственный университет информатики и радиоэлектроники» О.Е. Елисеева кандидат технических наук, доцент кафедры интеллекту-альных информационных технологий Учреждения образования «Бело-русский государственный университет информатики и радиоэлектрони-ки» К 63 Лингвистическая номенклатура по курсу специализации «Компью-терная лингвистика»: учебная программа для студентов специальностей I – 21 05 01 – «Белорусская филология», I – 21 05 02 – «Русская фило-логия», I – 21 05 04 – «Славянская филология», I – 21 05 05 – «Класси-ческая филология», I – 21 05 06 – «Романо-германская филология», I – 21 05 07 – «Восточная филология» УДК 81’33(073) ББК 81.1 р БГУ, 2008

3

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

Необходимость внедрения в практику обучения специализации "Ком-пьютерная лингвистика" обусловлена насущными потребностями обще-ства. Исследования языка до середины прошлого века велись без прице-ла на его использование в ЭВМ. Ситуация улучшилась с появлением ра-бот по машинному переводу и подготовкой специалистов по математи-ческой лингвистике с 1962 года в Москве. В нашей стране подготовка специалистов по компьютерной лингвистике ведется с 1996 года в рам-ках соответствующей специализации в БГУ, МГЛУ и ГрГУ. В основу данной «Типовой программы по компьютерной лингвистике

для филологических специальностей» положена «Программа отделения теоретической и прикладной лингвистики» МГУ им. Ломоносова (1996 г.). В Типовой программе представлены все курсы и спецкурсы, читае-мые профессорами, доцентами и преподавателями вузов Беларуси в рам-ках данной специализации; предполагается, однако, что преподаватели вправе формировать ежегодные рабочие программы по своему усмотре-нию, с учетом тематики научной работы и технических возможностей конкретного вуза. Специализация предполагает углубленное знакомство с фундамен-

тальными характеристиками языка-системы, обнаруживаемыми и дока-зуемыми благодаря приложению общесистемных принципов симметрии-асимметрии и простейших математических структур; с формализацией знаний о языке и алгоритмизацией лингвистического анализа; с методи-кой составления компьютерных словарей; с методами работы с некото-рыми программами. Приложение знаний специализации может найти применение в преподавании русского языка с использованием новых информационных технологий (контрольные, лабораторные, целые курсы языка) в школе и вузе; в создании интеллектуальных систем – эксперт-ных, обучающих и т.п.; в создании лингвистических банков данных и научной работе на базе этих банков данных. Специализация рассчитана на 400–450 учебных часов, включающих

лекционные, семинарские, лабораторные занятия. Предполагается орга-низация учебной практики, защита курсовых и дипломных проектов, сдача государственного экзамена.

Page 3: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

4

Весь курс специализации «Компьютерная лингвистика» включает сле-дующие блоки: «Компьютерная лингвистика и естественно-языковой интерфейс», «Инженерия знаний», «Квантитативная лингвистика», «Прикладная лексикология», «Машинные грамматики», Омонимия как система», «Корпусная лингвистика, «Философия языка», «Язык как сис-тема», «Система языковой изомерии», «Теория и практика машинного перевода», «Компьютерные экспертные системы», «Автоматический анализ естетственноязыкового текста». Цель специализации «Компьютерная лингвистика» – подготовка спе-

циалистов-филологов, способных не только использовать естественный язык в экспертных компьютерных программах, но и самим участвовать в их создании. Для достижения этой цели ставятся следующие задачи:

• ознакомить студентов с теоретическими основами, методами и средствами формализации языка; научить студентов составлению лин-гвистических алгоритмов анализа слова и его значения, структуры и се-мантики предложения и текста; познакомить с методикой и программа-ми составления компьютерных словарей разного типа;

• познакомить студентов с теоретическими основами когнитивисти-ки, методами представления и обработки знаний в компьютерных систе-мах, особенностями представления знаний о мире, языке и предметной области в экспертных системах, с основами формальных грамматик, их отличиями от традиционных грамматических описаний языка, с пробле-мами морфологического и синтаксического анализа текста; познакомить студентов с действующими системами машинного перевода (МП), прин-ципами их создания и путями оптимизации, с лингвистическими про-блемами при реализации МП;

• представить явление омонимии и изомерии как необходимые со-ставляющие любой комбинаторной системы, рассмотреть подробно ви-ды омонимов и способы снятия омонимии в речи и при автоматическом анализе текста; рассмотреть подробно виды изомеров, представить изо-мерию как один из возможных способов плотной упаковки информации;

• дать понятие о перспективном направлении в компьютерной лин-гвистике и автоматизации лингвистических исследований, об экспертной системе на примере экспертизации знаний о языке, познакомить с неко-торыми промышленными экспертными системами; дать представление о составе и устройстве машинных словарей разных типов, о методах таг-гирования словоформ в словаре, о требованиях к кодам;

• определить место языка в ряду других предметных областей, пока-зать действие в языке основных законов философии;

5

• доказать системный характер языка в рамках методологии общей теории систем, познакомить студентов с математическим аппаратом Общей теорией систем (ОТС), ее законами и следствиями и их приложе-нием к языку;

• научить студентов применять статистические и статико-комбинаторные методы в лингвистических исследованиях, составлять лингвистические алгоритмы анализа языковых единиц на уровнях языка-системы.

Page 4: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

6

РАЗДЕЛ I

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА КАК СОСТАВЛЯЮЩАЯ СИСТЕМ ИСКУССТВЕННОГО

ИНТЕЛЛЕКТА

ОСНОВЫ ПРИКЛАДНОЙ ЛИНГВИСТИКИ

Введение в прикладную лингвистику. Прикладная лингвис-тика и ее соотношение с общим языкознанием и другими науч-ными дисциплинами. Теоретические аспекты прикладной лингвистики. Объект

изучения прикладной лингвистики. Историческое изменение объема понятия «приложения науки о языке». Современная прикладная лингвистика и ее соотношения с лингводидактикой и компьютерной лингвистикой. Обратное влияние прикладной лингвистики на общее языкознание. Прикладная лингвистика и разработка систем искусственного интеллекта. Текстовые процессоры. Предметные области применения

текстовых процессоров: диалог с ЭВМ на естественном языке в определенной проблемной области; доступ к информации в полнотекстовых БД путем запросов на естественном языке; машинный перевод; автоматизация реферирования текстов; ав-томатизация редактирования и коррекции текста. Уровни анализа в текстовых процессорах: морфологический

анализ; синтаксический анализ на основе морфологического; семантико-синтаксический; лексико-семантический. Технология гипертекста и ее использование в информаци-

онных системах. Терминологические базы данных. Автоматизированные лек-

сикографические системы.

7

Проблемы лингвистического обеспечения современных ав-томатизированных интеллектуальных систем (АИС). Автомати-зированное построение словарей по тексту. Автоматизирован-ный отбор терминов: определение информативности лексиче-ских и словосочетательных единиц. Автоматизированное раз-решение лексической многозначности. Автоматизированная семантическая классификация лексики. Научно-технические и общеязыковые тезаурусы. Проблема оптимизации преподавания родного и иностранных

языков с использованием новых информационных технологий. Учебные автоматизированные лингвистические системы. Проблемы языковой политики и языкового строительства. Проблемы нейролингвистики и психиатрической лингвисти-

ки. Текстовые и словарные базы данных как объект лингвистиче-

ского исследования.

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ЕСТЕСТВЕННОЯЗЫКОВОЙ ИНТЕРФЕЙС

Компьютерная лингвистика в ряду других лингвистических

дисциплин, ее цели и задачи. Предмет и объект компьютерной лингвистики. Проблемы отношений «человек – компьютер» (инженерные и

психологические). Возможности современных компьютеров. Машинные языки. Соотношение естественных и искусственных языков. Теоретические и практические основания компьютерной лин-

гвистики: искусственный интеллект, теория программирования, когнитивистика. Системность человеческой деятельности. Структура поведенческого акта как комбинаторики целей, средств, действий. Речемыслительная деятельность человека и ее результат – тексты. Вывод языка-системы из текстов на ос-нове общей теории систем Ю.А. Урманцева.

Page 5: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

8

Когнитивистика как наука об общих принципах моделирова-нии человеческого мышления. Мышление как процесс. Ком-плекс наук, связанных с деятельностью человеческого мозга. Математизация знаний о деятельности мозга. Математизация мышления. Мозг как кибернетическое устройство. Понятие о моделировании. Естественный язык как модель

действительности и источник компьютерного моделирования. Моделирование языка и моделирование мышления. Моделиро-вание языковых единиц как способ познания. Построение ди-намических моделей языка как способ проверки истинности знаний о языке. Память и знания. Сознание и подсознание, интуиция. Струк-

тура памяти: ассоциативная, оперативная и долговременная па-мять. Язык как комбинаторная система на разных уровнях. Кар-тина мира в ассоциативной памяти. Ассоциативный экспери-мент. «Истинное» и «ложное» в языке. Семантика языка и се-мантика «возможных миров». Соотношение знания и понимания. Уровни понимания текста.

Проверка понимания с помощью интерпретации. Лингвистиче-ские и экстралингвистические факторы понимания. Гипотеза лингвистической относительности. Функции языка как инстру-мента общения, кодирования и хранения знаний, понимания, интерпретации, обучения. Язык как многоуровневая иерархо–неиерархическая система.

ИНЖЕНЕРИЯ ЗНАНИЙ

Инженерия знаний как поиск знаний в информмассивах, раз-

работка средств экономной упаковки знаний, создание систем, позволяющих пользоваться машинными знаниями. Определе-ние информации. Создание и накопление информации в про-цессе полезной человеческой деятельности.

9

Проблема полноты/ неполноты формальных и реальных сис-тем. Теория представления знаний о языке и мире. Проблема знания и понимания – основные проблемы когнитивистики. Знание о знании =хранение информации. Знание об умении = опыт. Знание о передаче знаний = интерпретация. Знание о спо-собах приращения знаний = познание. Основные методы и структуры представления знаний. Виды

знаний: декларативные и процедурные. Алгоритмы работы со знаниями. Фреймы как способы представления понятия и компьютерная

модель значения. Различие лингвистического и инженерного понятия фрейма. Семантические сети, их достоинства и недостатки. Многооб-

разие семантических отношений и причины их плохой форма-лизуемости. Ассоциативный словарь и его сходство со словарем словосо-

четаний. Глубина и мощь связей по ассоциации. Языковая кар-тина мира, отраженная в ассоциативном словаре. Общность и специфика языковых картин мира разных людей и языков. Мо-заичность в отражении мира. Сценарий, план, схема, сеть. Описание значения с помощью

фреймов и сценариев. Сценарии по В.Я. Проппу и их разре-шающие возможности. Моделирование ситуации (сюжета) в диалоговых системах на базе вопросных операторов. Формали-зация ядерного синтаксиса и построение расширенных синтак-сических моделей, относительно полно отражающих ситуацию. Полнозначная лексика и служебная лексика с точки зрения

представления знаний. Описание значения служебных слов в процедурных терминах. УСК–коды по В.В. Мартынову. Продукции по

Г.С. Поспелову. Логика предикатов. Нечеткость понятия «смысл» и его связь со знаниями.

Page 6: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

10

Словарь и грамматика как способы представления знаний. Текст как способ представления знаний. Паралингвистические способы представления знаний. Компьютерные системы пони-мания текста. Гипертекст как теория и компьютерная технология представ-

ления знаний. Основные компоненты гипертекстовых систем. Навигация по гипертексту. Проблема моделирования, приращения положительных зна-

ний о мире. Изоморфизм систем. Связь лингвистики с логикой, биологией, химией, физикой, кристаллографией и другими предметными областями. Унификация и специализация наших знаний о мире как два взаимообусловленных процесса. ОТСУ как единая методология представления знаний и познания.

ПРОБЛЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Искусственный интеллект. ЭВМ – хранилище гигантских

объемов информации. Информационные сети. Реферирование текстов. Смысловой анализ. Машинный перевод. Слово : рисунок. Композиция : рисунок.

Звуковое слово : рисунок. Ситуация : рисунок. Ввод и обработ-ка звуковой информации. Компьютер = советник? помощник? конкурент? Языковые и неязыковые проблемы ИИ. Проблемы ограничения на всех уровнях языка. Естественный

язык как избыточная система. Проблемы сжатия языковой ин-формации без потерь. Системокоды на уровне словаря и ситуа-ции. Машинные (формальные) словари. Достоинства и недостатки

современных методов упаковки знаний в словаре. Машинные грамматики. Грамматические эталоны и проблемы омонимии и многозначности. Машинный синтаксис. Проблема расширенных композиций с

точки зрения структуры порождения текста и смысла. Пробле-ма анализа и синтеза текста.

11

Экспертные системы. Диагностико-обучающие системы. Проблематика вопросно-ответных систем. Данные текста и данные картины мира у пользователя. Языковая картина мира. Неединственность картин мира. Пе-

ресекаемость в системах. Поиск оптимального критерия. Традиционные методы представления знаний на естествен-

ном языке. Декларативные и процедурные знания. Логические методы, семантические сети, фреймы, сценарии. Можно ли соз-дать сценарий жизни индивида? Неоднозначный синтез пред-ложений и текстов. (сборка на базе словаря словоформ по имеющимся отношениям единства и законам композиции). Вы-явление помех. Поиски нестандартных решений. Связность текста. Проблемы семантических связей между

композициями. Обнаружение связей и их формализация. Слож-ность картины мира в виде: персона = Иван Иванович Иванов = он = внук = сын = отец = муж = инженер = футболист = хри-стианин = = водитель = курильщик = друг = … со всеми вытекающими из персонификаций связя-

ми, признаками, действиями, обстоятельствами и т.п. Попытки формализовать этот мир и представить иные миры изоморфно. Неоднозначный синтез композиций (предложений и текстов)

при создании сценариев разных картин мира. Неоднородный синтез композиций (предложений) и текстов (на базе словаря словоформ по отношениям единства и законам композиции). Выяснение помех. Поиски стандартных и нестандартных реше-ний.

КВАНТИТАТИВНАЯ ЛИНГВИСТИКА

Основные статистические категории: выборка и совокуп-

ность, типы переменных, их классификация применительно к соответствующему уровню лингвистического анализа. Частота и распределение частот встречаемости для больших и малых инвентарей. Меры центральной тенденции и рассеяния.

Page 7: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

12

Нормальное распределение. Выборочные статистики и пара-метры распределения: методы оценивания. Планирование ста-тистического эксперимента и проверка гипотез. Параметриче-ские критерии значимости. Методы корреляционного анализа. Прикладная часть: применение статистики в лингвистических

исследованиях. Системная и прагматическая выборки лингвис-тических данных. Частоты: индивидуальная, частота класса, аб-солютная, относительная, условная и позиционная. Статистико-комбинаторные, дистрибутивно-статистические и

дешифровочные методы в грамматике. Меры автономности грамматических структур и их семантики. Функциональная на-грузка грамматических категорий и маркированность. Частотные словари, словари-индексы, машинные фонды лек-

сики. Характеристики частотных словарей и индексы покрытия текста. Оценки повторяемости отдельных элементов.

ПРИКЛАДНАЯ ЛЕКСИКОГРАФИЯ

Соотношение прикладной лексикографии с общей лексиколо-

гией и другими смежными дисциплинами. Задачи прикладной лексикографии. Теоретическое и методическое обеспечение разработок машинных словарей. Существующие машинные словари. Принцип разделения по-

дачи грамматической и семантической информации в машин-ных словарях. Соотношение морфемного, словообразователь-ного, словоизменительного и словосочетательного анализа лек-сических единиц в лингвистических процессорах. Словарь словоформ, его достоинства и недостатки, принципы

разработки. Моделирование полной парадигмы слова. Способы подачи омонимичных словоформ. Словарь типа «машинная ос-нова + машинная флексия», его достоинства и недостатки, принципы разработки. Омонимия машинных основ и машин-ных флексий и способы ее снятия при анализе словоформы.

13

Системное тегирование (кодирование) морфологической ин-формации на уровне словаря. Требования к тегам: полнота, ми-нимальность, непересекаемость (однозначность), избыточность. Автоматизация тегирования парадигм слов при составлении словаря словоформ. Каноническая (начальная) форма слова. Неполнота словарей (печатных и машинных) и ее причины.

Распознавание незнакомых слов человеком. Возможные пути распознавания машиной слов, отсутствующих в словаре. Соз-дание пользовательских словарей. Моделирование парадигмы незнакомого слова на основе симметрии финалей словоформ. Возможности вариантного моделирования парадигмы. Концеп-ция матричного гнездового (словообразовательного) словаря как один из способов снятия неполноты словарей. Семантические машинные словари. Типология толковых сло-

варей и принципы лексикографического описания слов в тра-диционных и машинных словарях. Возможности сетевого и фреймового представления и использования лексико-семантической информации при моделировании семантики словаря и текста. Автоматизация лексикографических работ. Разработка и реа-

лизация принципов построения автоматизированных текстовых лексикографических систем. Автоматизированное построение и использование конкордансов и словоуказателей в лексикогра-фической работе. Автоматизированное построение, анализ и использование семейства частотных словарей – словоформ, лексем, лексико-семантические группы (ЛСГ) лексем, гипер-лексем, синонимов, антонимов, семантических полей, лексико-грамматических групп, словообразовательных гнезд и т.п. Раз-работка лексического компонента лингвистического обеспече-ния автоматизированных информационно-поисковых систем.

Page 8: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

14

Примеры машинных словарей и лексикографических систем. Словарь в системах естественно-языкового анализа и синтеза текстов, информационно-поисковых системах, системах ма-шинного перевода. Одно- и многоязычные терминологические базы данных. Автоматические словари-консультанты и перево-дчики. Словари в автоматизированных системах обучения род-ному и иностранному языкам.

МАШИННЫЕ ГРАММАТИКИ

Методы выявления и обработки синтаксической структуры словосочетаний и предложений в системах МП и автоматиче-ского анализа ЕЯ-текстов. Локальный синтаксический анализ. Выделение именных групп в структуре предложения. Принци-пы контекстно-свободной грамматики (Context Free Grammar). Универсальные алгоритмы многовариантного синтаксическо-

го анализа по непосредственно составляющим: последователь-ный восходящий анализ; последовательный нисходящий ана-лиз; параллельный восходящий анализ; параллельный нисхо-дящий анализ. Методы синтаксического анализа, опирающиеся на грамма-

тику зависимостей: одновариантные алгоритмы анализа струк-туры синтаксических зависимостей; многовариантные алгорит-мы построения структуры синтаксических зависимостей по ме-тоду фильтров. Понятие и структура «признака» в обобщенной грамматике

составляющих (Generalized Phrase Structure Grammar). Пред-ставление структуры предложения в рамках лексико–функциональной грамматики (Lexical Functional Grammar).

15

Возможности учета семантических аспектов естественного языка при синтаксическом анализе текста (предложения). Син-таксическая семантика и ее описание с помощью формальных методов. Концепция «глубинных» падежей Ч. Филлмора и В. В. Бондарко. Трансформационная грамматика. Модели управления глаголов и алгоритмы выделения глагольных групп в структуре предложения в грамматике зависимостей, непо-средственно составляющих и контекстно-свободной граммати-ке. Проблема синтеза связного осмысленного текста на заданную

тему в системах ИИ. Принципы организации лингвистической информации и про-

цедур ее обработки в современных системах МП.

ОМОНИМИЯ КАК СИСТЕМА

Концептуальное поле омонимии. Системы поведенческого акта и концептуального поля омонимии. Системная методоло-гическая, языковая концептуальная и моделирующая компо-ненты и их взаимосвязь. Межпарадигматическая омонимия трех родов. Род, одушев-

ленность и омонимия. Комбинированная омонимия. Система преобразований. Изменения в системе языка и изме-

нения в системе омонимии. Формальная система омонимии. Место омонимии в языке-

системе. Структурно–морфологическая сторона омонимии. Система структурной омонимии. Общая классификация омо-нимов в письменных и устных текстах. Обобщение омонимии существительных. Комбинированная

грамматическая омонимия. Классификация существительных по 3-м базовым признакам (падеж, род, число) и разнообразие (внутрипарадигматическая/межпарадигматическая, внутрикате-гориальная/межкатегориальная, однокорневая/разнокорневая) омонимии в соответствии с теоретической полнотой и непроти-воречивостью.

Page 9: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

16

Обобщение внутрисистемной языковой омонимии (внутри-классовой и межклассовой омонимии). При множественности классов - множественность категориально–позиционных значе-ний и форм их выражения (несколько десятков грамматических позиций - лица, числа, падежа, рода, времени, вида и т.п.), множественность корневых гнезд и словообразовательных мат-риц. При множественности указанных типов может возникать и возникает омонимия. Омофакторы. Межъязыковая омонимия (межсистемная). Если в одной язы-

ковой системе существует омонимия, а в другой системе того же рода также существует омонимия, то и между системами должна существовать межъязыковая, или межсистемная, омо-нимия. Пересечение/ непересечение семантик в аббревиатурах. Омо-

нимия аббревиатур и степень совпадения семантик элементов, составляющих аббревиатурное слово. Пересечение/ непересе-чение структурных элементов моделей сжатия. Представление синтаксической омонимии моделей на кубе. Качественный ана-лиз омонимии аббревиатур. Омонимия ядерных и расширенных моделей. Омонимия аб-

бревиатур в рамках модели на кубе. Снятие омонимии в речи и на письме. Помехи, которые создает омонимия при автоматиче-ском переводе, и возможные пути их устранения.

КОРПУСНАЯ ЛИНГВИСТИКА

17

Языковой материал в лингвистическом исследовании. Новые информационные технологии сбора лингвистического материа-ла. Исходные понятия корпусной лингвистики: проблемная об-ласть, корпус данных, корпус текстов, параллельный много-язычный корпус текстов. Динамические и статические корпусы текстов. Требования к корпусу текстов: репрезентативность, экономичность, полнота. Аннотированные корпусы текстов, ав-томатизация их создания и коррекции. Программное обеспече-ние корпусной лингвистики. Опыт разработки корпусов текстов в Беларуси и за рубежом.

Литература по разделу 1

Основная

Автоматизация подготовки словарей. М., 1988. Алексеев, П. М. Семантические частотные словари // Статистика речи и автоматический анализ текста / П. М. Алексеев. Л., 1973. Алексеев, П. М. Статистическая лексикография / П. М. Алексеев. Л., 1980. Алексеев, П. М. Частотные словари английского языка и их практическое применение // Статистика речи и автоматический анализ текста / П. М. Алексеев. Л., 1971. Апресян, Ю. Д. и. др. Лингвистическое обеспечение системы ЭТАП-2 / Ю. Д. Апресян. М., 1989. Апресян, Ю. Д. Толковый словарь и интегральное описание языка // ВЯ, 1986, № 5. Арапов, М. В. Квантитативная лингвистика / М. В. Арапов. М., 1988. Арапов, М. В., Херц, М. М. Математические методы в исторической лингвистике / М. В. Арапов, М. М. Херц. М., 1975 Ахманова, О. С. Словарь омонимов русского языка / О. С. Ахманова. М., 1986. Баранов, А. Н. Автоматизация лингвистических исследований: корпус текстов как лин-гвистическая проблема // Русистика сегодня / А. Н. Баранов. 1998. № 1 – 2, с. 179 – 191. Баранов, А. Н. Введение в прикладную лингвистику / А. Н. Баранов. М., 2001. Баранов, А. Н. Фреймы и сценарии. Категории искусственного интеллекта в лингвисти-ческой семантике / А. Н. Баранов. М., 1987. Баранов, А. Н., Кобозева, И. М. Метаязыковые средства описания семантики предложе-ния: опыт типологии // Лингвистическое обеспечение информационных систем / А. Н. Баранов, И. М. Кобозева. М., 1987. Баранов, А. Н., Сергеев, В. М. Искусственный интеллект и традиционные методы анализа текста // Когнитивные исследования за рубежом / А. Н. Баранов, В. М. Сергеев. М., 1990. Борода, М. Г., Поликарпов, А.А. Закон Ципфа – Мандельброта и единицы различных уровней организации текста // УЗ Тартуского гос. ун-та. Вып. 689. (Квантитативная лин-гвистика и автоматический анализ текстов) / М. Г. Борода, А. А. Поликарпов. Тарту, 1984. Виноград, Т. Программа, понимающая естественный язык / Т. Виноград. М., 1976.

Page 10: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

18

Герд, А. С. Специальные словари и их источники // Современная русская лексикография: 1981 / А. С. Герд. Л., 1983. Герд, А. С., Богданов, В. В., Роменская, В. Ф. и др. Информационно-поисковый тезаурус как объект лексикографии // Структурная и прикладная лингвистика. Вып. 1. – Л., 1978. Гиндин, С. И. Частота слова и его значимость в системе языка // Труды по лингвостати-стике. УЗ Тартуского ун-та. Вып. 628. Тарту, 1982. Головин, В. Н. Язык и статистика / В. Н. Головин. М., 1971. Головня, А. И. Омонимия как системная категория языка: Дис. … канд. Фил. На-ук:10.02.19. // БГУ. Минск, 1996. Гомон, Д. Н. Системные проблемы лексической омонимии: Дис. … канд. фил. на-ук:10.02.19. // БГУ. Минск, 2004 Городецкий, Б. Ю. Проблемы и методы современной лексикографии // НЗЛ. Вып. XIV. М., 1985. Городецкий, Б. Ю. Актуальные проблемы прикладной лингвистики // НЗЛ. Вып. XII. М., 1983. Грязнухина, Т. А. и др. Использование ЭВМ в лингвистических исследованиях / Т. А. Грязнухина. Киев, 1990. Денисов, П. Н. Лексика русского языка и принципы ее описания. Изд. 2-е / П. Н. Денисов. М., 1993. Жолковский, А. К. О правилах семантического анализа // Машинный перевод и приклад-ная лингвистика. Вып. 8 / А. К. Жолковский. М., 1964. Жолковский, А. К., Мельчук, И. А. О семантическом синтезе // Проблемы кибернетики. Вып. 19 / А. К. Жолковский, И. А. Мельчук. М., 1967.] Жолковский, А. К., Леонтьева, Н. И., Мартемьянов, Ю. С. О принципиальном использо-вании смысла при машинном переводе // Машинный перевод / А. К. Жолковский, Н. И. Леонтьев, Ю. С. Мартемьянов. М., 1961. Задорожный, М. И. О границах полисемии и омонимии / М. И. Задорожный. М., 1971. Звегинцев, В. А. Теоретическая и прикладная лингвистика / В. А. Звегинцев. М., 1968. Златоустова, Л. В. и др. Актуальные проблемы прикладной лингвистики // Вестник МГУ. Сер. 9. Филология. 1989, № 5. Зубов, А. В. Обработка на ЭВМ текстов естественных языков / А. В. Зубов. Минск, 1977. Зубов, А. В., Зубова, И. И. Основы лингвистической информатики. Часть 2. Компьютер-ная лингвистика, Минск, 1992, Часть 3. Искусственный интеллект / А. В. Зубов И. И. Зубова. Минск, 1993. Зубов, А. В., Чапля, А. И., Чапля, С. В. Автоматическое выделение ключевых слов // Структурная и прикладная лингвистика. Вып. 1. Л., 1983. Искусственный интеллект. (В 3-х кн.) Кн. 1. Системы общения и экспертные системы. Кн. 2. Модели и методы. М., 1990. Караулов, Ю. Н. Лингвистическое конструирование и тезаурус литературного языка / Ю. Н. Караулов. М., 1981. Караулов Ю. Н. Общая и русская идеография / Ю. Н. Караулов. М., 1976. Каримова, Г. О., Поликарпов, А. А. Принципы выделения гиперлексемы как единицы лексической системы языка // Деривационные гнезда и типы в синхронии и диахронии. Владивосток, 1989. Карпов, В. А. Язык как система / В. А. Карпов. Минск, 1992; М., 2003. Катц, Дж. Дж. Семантическая теория // НЗЛ. Вып. X. М., 1981. Кибрик, А. Е. Очерки по общим и прикладным вопросам языкознания / А. Е. Кибрик. М., 1992. Колесников, Н. П. Словарь омонимов русского языка / Н. П. Колесников. Тбилиси, 1978.

19

Колодяжная, Л. И., Поликарпов, А. А. Исследование системных характеристик лексики на основе компьютерной версии синонимического словаря // Труды машинного фонда русского языка. Т. 2. М., 1992. Кондратьева, В. А. Оптимизация усвоения лексики иностранного языка / В. А. Кондратьева. М., 1974. Кулагина, О. С. Исследования по машинному переводу / О. С. Кулагина. М., 1979. Кулагина, О. С., Мельчук, И. А. Автоматический перевод: краткая история, современное состояние, возможные перспективы // Автоматический перевод / О. С. Кулагина, И. А. Мельчук. М., 1971. Лакофф, Дж. Мышление в зеркале классификаторов // НЗЛ. Вып. XXIII. Когнитивные аспекты языка. М., 1988. Лекомцев, Ю. К. Введение в формальный язык лингвистики / Ю. К. Лекомцев. М., 1983. Ленерт, В., Дайер, М.-Г., Джонсон, П. Н., Янг, К. Дж., Харли, С. BORIS – эксперимен-тальная система глубинного понимания повествовательных текстов // НЗЛ. Вып. XXIV. Компьютерная лингвистика. М., 1989. Мальковский, М. Г. Диалог с системой искусственного интеллекта / М. Г. Мальковский. М., 1985. Мандельброт, В. Теория информации и психолингвистика: теория частот слов // Мате-матические методы в социальных науках / В. Мандельброт. М., 1993. Мартынов, В. В. Универсальный семантический код: УСК-3 / В. В. Мартынов. Минск, 1984. Марусенко, М. А. О формировании словника словаря статистически устойчивых научно-технических терминов // Структурная и прикладная лингвистика. Вып. 2. Л., 1983. Марчук, Ю. Н. Проблемы машинного перевода / Ю. Н. Марчук. М., 1983. Машинный фонд русского языка: идеи и суждения. М., 1986. Мельников, Г. П. Системология и языковые аспекты кибернетики / Г. П. Мельников. М., 1978. Минский, М. Структура для представления знаний // Психология машинного зрения / М. Минский. М., 1978. Михайлов, М. Н. Компьютерное обеспечение корпуса текстов (взгляд пользователя) // Русистика сегодня. 1998. № 1 – 2, с. 192 – 201. Модина, Л. С., Шаляпина, З .М. Принципы организации лингвистических знаний в объ-ектно-ориентированной модели лексико-морфологической системы японского языка // DIALOG '95. Труды Международного семинара по компьютерной лингвистике и ее при-ложениям. Казань, 1995. Нагао, П., Цудзии, Дз., Накамура, Дз. Машинный перевод с японского языка на англий-ский // Труды Института инженеров по электронике и радиотехнике. Тематический вы-пуск. Обработка естественных языков. Т. 74, № 7, июль 1986. Новое в зарубежной лингвистике. Вып. X. Лексическая семантика. М., 1981. Новое в зарубежной лингвистике. Вып. XII. Прикладная лингвистика. М., 1983. Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. Обработка знаний. М., 1989. Олкер, X. Р. Волшебные сказки, трагедии, и способы изложения мировой истории // Язык и моделирование социального взаимодействия / Х. Р. Олкер. М., 1987. Павиленис, Р. И. Проблема смысла / Р. И. Павиленис. М., 1983. Падучева, Е. В. О способах представления синтаксической структуры предложения // ВЯ, 1964, № 2. Панов, Д. Ю. И.К. Бельская и ее исследования по алгоритму автоматического лингвис-тического анализа // Язык человека и машина / Д. Ю. Панов. М., 1969.

Page 11: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

20

Пешковский, А. М. 10 тысяч звуков // Избранные труды / А. М. Пашковский. М., 1969. Пиотровский, Р. Г. Инженерная лингвистика и теория языка / Р. Г. Пиотровский. Л., 1979. Поликарпов, А. А. Полисемия: системно-квантитативные аспекты // УЗ Тартуского гос. ун-та. Вып. 774. Тарту, 1987. Поликарпов, А. А. Теоретические проблемы прикладной лексикологии // Вестник МГУ. Сер. 9. Филология. 1989. № 5. Поликарпов, А. А., Курлов, В. Я. Стилистика, семантика, грамматика: опыт анализа сис-темных взаимосвязей (По данным толков. словаря) // ВЯ, 1994, № 1. Поликарпов, А. А., Бушуева, О. В. Опыт построения контекстуального словаря и анализ его устройства // Теоретические и практические проблемы прикладной лингвистики / А. А. Поликарпов, О. В. Бушуева. М., 1988. Поликарпов, А. А. Проблемы и перспективы автоматизации лексикологического и лекси-кографического анализа с помощью ЭВМ // Использование ЭВМ в лингвистических ис-следованиях / А. А. Поликарпов. Киев, 1989. Попов, Э. В. Общение с ЭВМ на естественном языке / Э. В. Попов. М., 1982. Представление и использование знаний. М., 1989. Пропп, В. Я. Морфология сказки / В. Я. Пропп. М., 1969. Ревзин, И. И. Структура языка как моделирующей системы / И. И. Ревзин. М., 1979. Ревзин, И. И., Розенцвейг, В. Ю. Основы общего и машинного перевода / И. И. Ревзин, В. Ю. Розенцвейг. М., 1964. Сахарный, Л. В. Частотный словарь индексирования / Л. В. Сахарный. Пермь, 1974. Слокум, Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития // НЗЛ. Вып. XXIV. М., 1989. Субботин, М. М. Гипертекст. Новая форма письменной коммуникации. // Итоги науки и техники. Сер. Информатика. Т. 18. М., 1994. Субботин, М. М. Новая информационная технология: создание и обработка гипертекстов // НТИ. Сер. 2. 1988, № 5. Сухотин, В. В. Исследование грамматики числовыми методами / В. В. Сухотин. М., 1990. Труды Института инженеров по электронике и радиотехнике. Тематический выпуск. Об-работка естественных языков. Т. 74, № 7. М., 1986. Фрэнсис, У. Н. Проблемы формирования и машинного представления большого корпуса текстов // НЗЛ. Вып. XIV. Проблемы и методы лексикографии. – М., 1983. Когнитивные аспекты языка. М., 1988. Цейтин, Г. С., Откупщикова, М. И., Лейкина, Б. М., Невлева, Т. М. Система анализа тек-ста с процедурным представлением словарной информации // Актуальные вопросы практической реализации систем АП. Часть 1. М., 1982. Шайкевич, А. Я. Дистрибутивно-статистический анализ в семантике // Принципы и ме-тоды семантических исследований / А. Я. Шайкевич. М., 1976. Шаляпина, З. М. Текст как объект автоматического перевода / З. М. Шаляпина. М., 1988. Шенк, Р. Обработка концептуальной информации / Р. Шенк. М., 1980. Шенк, Р., Лебовиц, М., Бирнбаум, Л. Интегральная понимающая система // НЗЛ. Вып. XII. М., 1983. Щерба, Л. В. Опыт общей теории лексикографии // Языковая система и речевая деятель-ность Л. В. Щерба. Л., 1974.

21

Дополнительная

Андрющенко, В. М. Концепция и архитектура машинного фонда русского языка / В. М. Андрющенко. М., 1989. Анохин, П. К. Избранные труды. Философские аспекты теории функциональных систем / П. К. Анохин. М., 1978. Ахмеджанов, М. С., Королев, Э. И., Поликарпов, А. А. и др. Дистрибутивно-статистический метод анализа лексики и его реализация на ЭВМ // Прикладные аспекты лингвистики. М., 1989. Баранов, А. Н., Паршин, П. Б. К построению словаря терминов когнитивной науки // Когнитивные исследования за рубежом / А. Н. Баранов, П. Б. Паршин. М., 1990. Белоногов, Г. Г. Кузнецов, Б. А. Языковые средства автоматизированных информацион-ных систем / Г. Г. Белоногов, Б. А. Кузнецов. М., 1983. Блюменау, Д. И. Проблемы свертывания научной информации / Д. И. Блюменау. Л., 1982. Будущее искусственного интеллекта. М.: Наука, 1991. Виноград, Т. Работа с естественными языками // Современный компьютер / Т. Виноград. М., 1986. Городецкий, Б. Ю. Компьютерная лингвистика: моделирование языкового общения // НЗЛ. Вып. XXIV. Компьютерная лингвистика. М., 1989. Дракин, В. М., Попов, Э. В., Преображенский, А. Б. Общение конечных пользователей с системами обработки данных / В. М. Дракин, Э. В. Попов, А. Б. Преображенский. М., 1988. Интеллектуальные процессы и их моделирование. М., 1987. Ким, О. М. Омонимия на уровне частей речи и ее отражение в словаре // Актуальные проблемы русского словообразования / О. М. Ким. Самарканд, 1972. Кочерган, Н. П. Лексическая сочетаемость омонимов и лингвистический статус омони-мии // Филологические науки № 5. М., 1981. С. 47 – 55. Лакофф, Дж., Джонсон, М. Метафоры, которыми мы живем // Язык и моделирование социального взаимодействия / Дж. Лакофф, М. Джонсон. М., 1987. Лингвистические проблемы автоматизации редакционно-издательских процессов. – Ки-ев, 1986. Маккьюин, К. Дискурсивные стратегии для синтеза текста на естественном языке // НЗЛ. Вып. XXIV. Компьютерная лингвистика. – М., 1989. Малаховский Л. В. Теория лексической и грамматической омонимии / Л. В. Малаховский. Л.: Наука, 1990. Марчук, Ю. Н. Проблема машинного перевода / Ю. Н. Марчук. – М., 1983. Маслов, Ю. С. Омонимы в словарях и омонимия в языке (к постановке вопроса) // В кн. Вопросы теории и истории языка / Ю. С. Маслов. Л., 1963. – С. 198 – 202. Мельников, Г. П. Системология и языковые аспекты кибернетики / Г. П. Мельников. М., 1978. Моделирование языковой деятельности в интеллектуальных системах / Под ред. А. Е. Кибрика и А. С. Нариньяни. М., 1987. Морфологический анализ научного текста на ЭВМ. Киев, 1989. Налимов, В. В. Вероятностная модель языка. О соотношениях естественных и искусст-венных языков / В. В. Налимов. М., 1979. Пиотровский, Р. Г. Синергетика текста / Р. Г. Пиотровский. Минск., 2005.

Page 12: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

22

Пиотровский, Р. Г., Бектаев, К. Б., Пиотровская, А. А. Математическая лингвистика / Р. Г. Пиотровский, К. Б. Бектаев, А. А. Пиотровская. М., 1977. Промышленные системы машинного перевода. Вып. 20. М., 1991. Реальность и прогнозы искусственного интеллекта. М., 1987. Реферирование в общественных науках. Теория и методика. М., 1982. Ровдо, И. С. Межъязыковая омонимия в условиях русско-белорусского и белорусско-русского билингвизма: Автореф. дис. … канд. филол. наук, 10.02.01 // БГУ. Минск, 1980. Севбо, И. П. Сквозной анализ как шаг к структурированию текстовых знаний // НТИ. Сер. 2. 1989, № 2. Урманцев, Ю. А. Общая теория систем: состояние, приложения и перспективы. // В сб.: Система. Симметрия. Гармония / Ю. А. Урманцев. М., 1988. Файн, В. С. Распознавание образов и машинное понимание естественного языка / В. С. Файн. М., 1987. Фогель, Л., Оуэнс, А., Уолш, М. Искусственный интеллект и эволюционное моделирова-ние / Л. Фогель, А. Оуэнс, М. Уолш. М., 1969. Якобсон, Р. Лингвистика в ее отношении к другим наукам // Избранные работы / Р. Якобсон. М., 1985. Minsky, M. The Society of Mind. N.Y., etc., 1986. Representation and Understanding. Studies in Cognitive Science / ed. by Bobrow D. G., Collins A. Academic Press. N.Y., etc., 1975. The Handbook of Artificial Intelligence / ed. by Barr A., Feigenbaum E. A. Vols. 1 – 2. N.Y., etc., 1989.

23

РАЗДЕЛ II

ФИЛОСОФСКО-КОГНИТИВНАЯ БАЗА ИНТЕЛЛЕКТУАЛЬНЫХ КОМПЬЮТЕРНЫХ СИСТЕМ

ФИЛОСОФИЯ ЯЗЫКА

Мозг как универсальное отражательное устройство. Опережающее от-

ражение действительности. Функциональный подход. Поведенческий акт как система. Математическая модель условного рефлекса на базе ис-ходных признаков - цель, средство, действие = результат. Язык как эле-мент модели системы "средство". Математическая модель мышления. Объект анализа – язык. Ф. Соссюр, К.–Л. Бюлер о языке. Неданность

языка как объекта. Деятельностный подход. Аксиоматика цепочки "че-ловек – деятельность – процесс – невозможность анализировать процесс с точки зрения системности – продукт (результат) в виде множества тек-стов – анализ текстов и вывод системы языка". Снятие антиномии "язык : речь". Насколько системен продукт – настолько системна речемысли-тельная деятельность. Методы анализа языка. Системный подход. Общая теория систем по

Ю.А. Урманцеву (ОТСУ) как общая методология. Системные цели, сис-темные средства, системные действия – системные результаты. Унифи-кация терминологии. Изоморфизм знаний. Единство мира и единство науки о мире. Объект–система и система объектов одного и того же и разных родов.

Статика и динамика систем. Симметрия как сохранение, совпадение признаков. Асимметрия – предел несохранения. Диссимметрия – частич-ное совпадение при несовпадениях. Обоснование лингвистической то-чечной, линейной и точечно–линейной симметрии, их антиподов. Сим-метро–асимметрийные уровни анализа. Рефлексивность, симметричность и транзитивность на разных языко-

вых уровнях как исходные системные характеристики, их формализм. Теоретико–множественный характер лингвистического универсума на разных уровнях членения. Сочетания, размещения и перестановки. Изоморфизм и полиморфизм языковых объектов. Изо-полиморфизм

как база для системного кодирования и создания базы знаний. Словообразование, словоизменение и текстопорождение как направ-

ленные и ненаправленные изменения в системе. Направленно-ненаправленный характер эволюции языка.

Page 13: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

24

Конвергенция и дивергенция на уровне словообразования и словоиз-менения. Проблема кодирования омонимов. Энмерные кубы и матрич-ные представления лексики и возможность их системного кодирования. Треугольник Паскаля как структура точного исчисления сходств и раз-личий объектов. Взаимодействия и взаимонедействия по Ю.А. Урманцеву. Взаимосо-

действия по П.К. Анохину. Отраженный характер лингвистических взаимодействий. Экстралингвистические факторы. Прикладной аспект симметризации–асимметризации в экспертных

системах, системах искусственного интеллекта и обучающих системах. Понятие лингвистического универсума как предельно достижимого

множества однородных текстов. Понятие множества. Неполнота лин-гвистического универсума. Случайность/детерминированность элементов и связей как основа пе-

риодических систем. Ярусы языка. Иерархо–неиерархические системы, их автономность и переходы. Лингвосимметрика – симметрия, асимметрия, диссимметрия как база

для вывода множеств "первичных" элементов. Классификация первич-ных элементов. Вывод частей речи и групп изменения. Родство через симметрию. Форма и содержание. Синхрония/диахрония/панхрония в симметрично-асимметричном

представлении. Сжатие в системе. Сорбция. Аббревиация. Словосложе-ние. Композиты. Цикличность действия закона сжатия. Транзитивность. Номинация как система. Квазисимметрия (омонимия) и ее не лингвистический, а системный

характер - многогранники и кристаллы. Многозначность как многослой-ная симметрия формы и асимметрия значений. Антонимия как система. Измеримость антонимии. Синонимия как система. Эвфемизмы. Гомологические ряды в биологии и в лингвистике. Системный изо-

морфизм на уровне первичных элементов. Уровни гомологии: словоиз-менение, словообразование, словосложение, композиты, тексты (паро-дии). Ассоциативные словари. Конвергенция и дивергенция. Треуголь-ник Паскаля как симметрично-асимметричная система схождений и рас-хождений. Системы с точки зрения признаков "вход" : "выход". Кибернетический

характер языка=системы. Словообразование, создание новых по напол-нению композиций - вход. Архаизмы, историзмы как выход. Заимство-вания как выход и вход. Изоморфизм систем со входом и выходом.

25

Метафора как система. Метафоричность человеческого мышления. Метафора в физике, биологии, математике. Антропоцентризм и его след-ствия. Формализация метафоры. Отражение в языке действительности разного рода (субъект, действие,

объект, продукт, инструмент, место, адресат) через части речи (субсти-туция и реализация), через грамматические позиции. Взаимонедействия и их отражение в языке. Небытийная лингвистика. Отношения единства первичных элементов как системообразующий

фактор. Ядерная композиция первичных элементов. Классификация ядерных композиций по отношениям единства. Отношения единства как код, группа, трансформационные операции. Разрешения и запреты. Изо-морфизм с генетикой.

3акон композиции как декартово произведение. Снятие двойственно-сти и неопределенности законами композиции. Синтетические, аналити-ческие и синтетико-аналитические композиции. Ядерная композиция и законы ее расширения. Пик встречаемости

расширенных композиций. Пределы памяти (7 плюс/минус 2). RZ-системы. Языковые рефлексивность, симметричность и транзи-

тивность. Лингвистические сочетания, размещения и перестановки. Сис-темный изоморфизм. Вывод модусов, моделей и модификаций на ядерном уровне Лингвис-

тические и экстралингвистические факторы отражения. Ситуативность = модификация. Обобщение ситуаций - логика = модели ситуаций. Обоб-щение обобщений = философии = модусы. Тождественные, количественные, качественные и относительные пре-

образования. Их комбинаторика. Групповой характер преобразований. Операторика и алгоритмика. Порядок слов в ядерной и расширенных композициях. Изомерия в хи-

мии, физике, биологии. Языковая изомерия, ее уровни. Понятие левиз-ны/ правизны / лево–правизны. Системный изоморфизм. Семантика возможных миров. Истинность и ложность. Неединствен-

ность критериев смысла. Логика и язык, их соотношения. Модели могут быть равны, содержание различно. Включенность логики в язык и ее специфика. Логика условий. Симметрия / асимметрия / диссимметрия и информация. Вероятност-

ные модели с переменными. Системный изоморфизм. Асимметризация систем и приращение информации. Изоморфизм

уровней информации. Повторяемость элементов и структур.

Page 14: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

26

Понятие языковой нормы, его нечеткость. Норма и ее нарушение, сис-темный характер отклонений. Кодифицированный и некодифицирован-ный языки. Идиолект. Предметные разновидности текстов (художест-венные – проза, поэзия; деловая проза, научная проза). Фразеологизация синтаксиса. Устойчивость и идиоматичность. При-

чины. Асимметризация фразеологизмов и связь со структурными моде-лями предложений и словосочетаний. Закон композиции как лингвистическое взаимодействие, отражающее

взаимодействие / взаимонедействие объектов материального мира. Закон композиции как упаковка информации о мире. Номинативные

упаковки. Функциональные упаковки. Одномерные и многомерные упа-ковки. Увеличение длины упаковки и усложнение структуры как снятие энтропии сообщения. Простота и сложность. Глубина познания и отра-жения мира через упаковку. Параметры. Формульное представление лек-сики любого языка. Текст как суперинформационная творческая структура. Лингвистиче-

ско-нелингвистический аспекты текста как системы. Белковые цепочки как тексты без пробелов. ОТСУ как база для создания общей теории языка. Неспецифичность

для любых объектов-систем признаков U, А, М, R, Z. Функции язы-ка=системы: отражательная, номинативная (имена, названия, комплексы; действия, процессы; признаки; субституты; количества; служебные сло-ва; знаки). Эмоциональность номинации. Моделирующая (генерирую-щая). Кодирующая/ декодирующая. Эвристическая (творческая). Ком-муникативное намерение и человек. Волюнтативная, социативная, апел-лятивная. Язык ребенка и взрослого. Общность и специфика. Встроенность язы-

ка=системы в человека. Невозможность иметь язык вне общества. Гипо-тезы о происхождении языка. Знание и понимание с точки зрения человека, животного, машины.

Думают ли животные? Будут ли думать машины? Принятие решений и экспертизация. Генезис языка человека и языка животных. Изоморфизм и специфика

систем отражения. Системная модель русского языка. Адаптация как система. Языкознание. Когнитология. Нейролингвистика. Компьютерная лин-

гвистика. Естественный и искусственный интеллект.

27

ЯЗЫК КАК СИСТЕМА

Деятельностный и функциональный подходы. Системный подход и его приложение к языку. Лингвосимметрика как метаязык представления и получения знаний. Наиболее важные антиномии – язык : речь; фонема : буква; левый :

правый порядок слов. Способы разрешения антиномий. Математизация языковых представлений – основа доказательности гипотез. Роль слова, формулы и числа. Теории – теоремы – термины. Лингвистические банки данных и Машинный фонд русского языка.

Возможности компьютеризации обучения. Теории и метатеории. Гёде-лизация в науке. Пути ее преодоления. Смена научных парадигм (Т. Кун). Структуры текстов: проза, поэзия, деловая проза, фольклор, бытовой

диалог. Их общность и специфика, дифференциация стилей – стабили-тет, варьетет, специалитет. Глобальность разрешающих способностей принципов симметрии/

асимметрии. Их универсальные возможности и реализации в различных предметных областях от физики до лингвистики. Системный изомор-физм/полиморфизм. Языковая изомерия. Языковые гомологии. Языко-вые аддитивность и неаддитивность. Системные структуры представления знаний о языке. Кубы, суперку-

бы, декартовы матрицы. Вероятностные модели. Системокоды (грамма-тические и семантические). Внешний отражаемый мир как система и эта система в системе отра-

жения – языке. Неполнота языка=системы на разных уровнях и неполно-та коллективной картины мира, мозаичность. Моделирование знаний. Три формы существования материи - вещество, энергия, информация.

Периодика цивилизации: освоение вещества, создание материального производства, овладение принципом единства материи (от становления человека до наших дней); освоение энергии, создание энергетического изобилия, передача энергии на расстояние, овладение принципом един-ства энергии и ее связи с веществом (18 – 21 вв.); освоение информации языковой (зарождение и эволюция языков), освоение информации как информации, передача информации на расстояние, овладение принци-пом единства процессов обработки информации в естественных и искус-ственных системах. Отражение как процесс и результат. Отражательные системы. Память

= система-хранилище. Безбумажная информатика и экология.

Page 15: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

28

Тенденция к объединению человеческого знания: Менделеев, Вернад-ский, Урманцев. Язык=система как средство познания и приращения знаний. Системная лингвистика – фундаментальная наука о человеке и мире.

СИСТЕМА ЯЗЫКОВОЙ ИЗОМЕРИИ

Явление изомерии – сущность, фундаментальный характер (математи-

ческий и философский аспекты). Изомерия в химии, физике, биологии, геологии. Ускорение в получении результатов по аналогии при исполь-зовании принципов симметро-асимметрии. Необходимость отыскания левизны-правизны и изомерии в языке-системе и ее обнаружение. Основные виды языковой изомерии: субстанциальная = статическая и

динамическая (создание изомеров при словоизменении и словообразова-нии; создание изомерийных композиций). Симметро-асимметрия как сходство различного и различие сходного.

Изомерия – способ различения объектов-систем (объемы, структура, грамматика, семантика, отношения и связи). Изомерия внутрисистемная и межсистемная. Уровни изомерии – слоги, морфемы, лексемы, композиции. Количест-

венно-качественные параметры, семантическая нагрузка. Изомерия на уровне словоформ. Теоретическая возможность образо-

вания слов–изомеров, вероятностные параметры и конкретное наполне-ние. Математический вывод типологии изомеров и омонимов. Изомерия лексики и формульный язык. Цис-, транс- языковые изомеры. Системная изомерия в аббревиатурах. Криптоизомерия. Изомерия и

уплотняющая и склеивающие функции омонимии. Проблемы левого и правого в философии, физике, химии, биологии.

Левые, правые и лево-правые или право-левые языковые объекты-системы на уровне префиксов, корней сложных слов. Условность левиз-ны-правизны. Порядок слов и изомерия. Порядок слов в традиционной лингвистике.

Формула порядка слов и её реализация в языке. Специфика изомеров при увеличении длины словоформ и композиций. Логика и изомерия. Типы изомерии по Ю.А. Урманцеву. Типы лингвистической изомерии.

Специфика языковой изомерии. Изомеризационные факторы. Операто-рика и преобразования. Ядро и периферия изомерии в лексике.

29

Тенденция к максимуму изомеризации в системах барионного кода и изоморфного ему кода аминокислот – причина сверхустойчивости сис-тем. Необходимость изучения изомерии – один из путей формализации

знаний о языке, вскрытия неявных механизмов словоизменения, слово-образования, создания композиций и хранения языковой информации в памяти человека и ЭВМ.

Литература по разделу 2

Основная

Анохин, П. К. Избранные труды. Философские аспекты теории функциональных сис-

тем / П. К. Анохин. М., 1978. Барбук, С. Г. Изомерия как система. АКД / С. Г. Барбук. Минск, 2000. Карпаў, У. Iзамерыя ў беларускай мове // Роднае слова № 11, 2003. Карпов, В. А. Язык как система /В. А. Карпов. Минск, 1992; М., 2003. Карпов, В. А. Языковой универсум как система // Вестник МГЛУ. Сер.1. Филология

№ 13, 2004, (стр. 35 – 46). Принцип симметрии. – М., 1977. Урманцев, Ю. А. Девять плюс один этюд о системной философии / Ю. А. Урманцев.

М., 2001. Урманцев, Ю. А. Общая теория систем: состояние, приложения и перспективы // Сис-

тема. Симметрия. Гармония / Ю. А. Урманцев. М., 1988. Урманцев, Ю. А. Эволюционика / Ю. А. Урманцев. Пущино, 1988.

Дополнительная

Аверьянов, А. Н. Системное познание мира / А. Н. Аверьянов. М., 1985. Исследования по общей теории систем. – М., 1969. Карпов, В. А. Языковые равенства и неравенства // Вестник МГЛУ. Сер.1. Филология

№ 8, 2001, (стр. 24 – 32). Кун, Т. Структура научных революций / Т. Кун. – М., 1977. Овчинников, Н. Ф. Принципы сохранения / Н. Ф. Овчинников. – М., 1966. Свидерский, В. И. О диалектике отношений / В. И. Свидерский. – Л., 1983. Системный анализ и научное знание. – М., 1978.

Page 16: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

30

РАЗДЕЛ III

ПРИКЛАДНЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

ТЕОРИЯ И ПРАКТИКА МАШИННОГО ПЕРЕВОДА

Язык как средство отражения и познания реального мира. Перевод как способ отражения одного и того же мира разными языковыми средства-ми. Неизбежность и границы неточности при переводе. Перевод как вид языковой деятельности. Общая формальная модель

переводческой деятельности человека как основа ее моделирования в системах МП. Виды переводов: письменный и устный. Полный пись-менный, реферативный, аннотационный перевод. Перевод заголовков. Особенности перевода патентов. Перевод «с листа», последовательный и синхронный перевод. Машинный (автоматизированный и автоматический) перевод как одно

из направлений искусственного интеллекта. Возникновение и развитие идеи МП; уроки начального периода разработок в этой области. Три подхода к моделированию процесса перевода в системах МП: прямой (подстрочный) перевод; перевод через язык-посредник; перевод как трехэтапный процесс, включающий анализ, межъязыковые операции и синтез. Инженерные и лингвистические проблемы машинного перевода. Некоторые результаты и анализ ошибок в этой области. Основные типы «человеко-машинных» систем МП, ориентированных

на практическое применение: вспомогательные компьютерные системы в помощь переводчику; практические системы МП с постредактировани-ем; практические системы МП с предредактированием. Лингвистические проблемы МП. Проблема полноты/ неполноты сло-

варей для осуществления перевода. Способы организации машинных словарей в зависимости от стратегии перевода. Полисемия и способы выбора лексического эквивалента при переводе. Омонимия как одна из проблем перевода (устного и письменного).

Общее в системе омонимии в разных языках. Классификация омонимов. Специфика систем омонимии. Межъязыковые омонимы («ложные дру-зья переводчика»). Способы снятия омонимии в языке. Омонимия при автоматическом переводе. Способы обнаружения мор-

фологических омонимов в тексте. Синтаксический анализ как способ снятия грамматической омонимии при автоматическом переводе. Перевод имен собственных, морфологические и орфографические

трудности при передаче имен собственных. 31

Способы отражения при переводе грамматических категорий, отсутст-вующих в языке перевода (определенности/ неопределенности, несовпа-дающих падежных форм имен и временных форм глагола, специфиче-ских для ряда языков синтаксических конструкций). Стилистика перевода. Перевод метафор. Способы перевода игры слов

в художественных текстах. Особенности поэтического перевода: сохра-нение/ несохранение ритмики и рифмы, приоритет формы или смысла. Особенности научного и технического перевода. Перевод терминов.

Терминологические системы разных предметных областей и омонимия в терминологии. Перевод цитат, введенных в текст на другом языке, от-сылка к источнику. Проблема автоматического определения языка цита-ты. Подстрочный перевод, редактирование и оценка качества. Современное состояние промышленных и исследовательских Разрабо-

ток в области АП в Японии, Европе, США и России.

КОМПЬЮТЕРНЫЕ ЭКСПЕРТНЫЕ СИСТЕМЫ

Экспертизация знаний. Знания о языке-системе, знания о предметной области, знания о структурах формализации двух типов (энмерные кубы, гиперкубы и матрицы). Матричное представление знаний. Матрицы как порождающие и клас-

сификационные системы. Прямая и треугольная декартовы матрицы. Теоретическая и системная полнота матричных представлений. Экспертизация науки. Верификация истинности знаний. Критерии на-

дежности (количественные, качественные, структурные). Аппарат полноты и надежности как экспертных оценок. Заложенная

конечность структур при данном числе признаков экспертизации. Связь теории упаковок с теорией информации. Связь теории упаковок с тре-угольными и пирамидальными числами. Экспертизация языковых знаний. Суть треугольных и пирамидальных

чисел как показатель плотных упаковок лексики любого языка мира двумя десятками формул. Экспертизация помех автоматической обработки. Формализация зна-

ний об омонимии как лексико-синтаксическом явлении. Снятие омони-мии. Языковая изомерия и плотные упаковки. Системное представление

знаний с помощью формул. Связь изомерии с омонимией. Количествен-ные и качественные параметры явления изомерии в языке. Изомерия – один из путей формализации знаний о языке, раскрывающий неявные

Page 17: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

32

механизмы связей словоизменения, словообразования, создания ком-позиций и сохранение языковой информации в памяти человека и ЭВМ. Экспертизация лексики. Построение классификационных систем-

матриц открытого типа для словообразования и словоизменения. Мета-фора как система. Метафоричность человеческого мышления. Метафора в физике, биологии, математике. Антропоцентризм и его результаты. Многозначность как симметричная многослойная упаковка формы при асимметрии значений. Антонимия как система. Синонимия как система. Эвфемизмы, дублеты и варианты. Экспертизация синтаксиса. Построение экспертно-классификацион-

ных систем (языковые сочетания, размещения, перестановки). Экспертизация школьных учебников на базе машинных словарей.

Дифференциальный словарь белорусского школьника по пяти учебным дисциплинам как объект экспертизации общности и специфики. Экспертизация обычных и машинных словарей. Проблемы и способы

кодирования грамматики и семантики (омонимия, полисемия). Способы лингвистического кодирования, требования к кодам (простота алгорит-ма, краткость кода, полнота кодирования признаков). Экспертизация языковой симметрии/асимметрии. Связь симметрии и

асимметрии с информацией. Увеличение объема информации при асим-метризации. Причины, вытормаживающие объем информации при жест-ких требованиях симметрии корня, класса и т.п.

АВТОМАТИЧЕСКИЙ АНАЛИЗ ЕСТЕСТВЕННОЯЗЫКОВОГО

ТЕКСТА

Автоматическая обработка текста как проблема компьютерной лин-гвистики. Стратегии обработки информации и место в них естественного языка. Языковая способность как важнейший компонент интеллектуаль-ных способностей человека. Коммуникативные, когнитивные и инфор-мационные процессы. Принципы многоэтапности и многовариантности обработки текста. Проблема глубины обработки. Автоматизированные системы обработки текста и их архитектура.

Лингвистический процессор как сложная автоматизированная система обработки текста. Анализ, синтез, диалоговое взаимодействие, логиче-ская обработка информации. Структура лингвистического банка данных: машинные словари, базы данных и знаний. Виды машинных словарей. Роль и структура информационного тезауруса.

33

Проблема ограничения естественного языка для действующей систе-мы обработки ЕЯ–текстов. Проблема универсальности лингвистических средств обработки текста. Языки представления текста как инструмент его автоматической об-

работки. Семантические метаязыки и представление знаний в лингвис-тических процессорах. Языки представления морфолого-синтаксической информации в лингвистических процессорах. Проблемы глубины лин-гвистических репрезентаций текста. Основные виды понимания текста и методы формализации понима-

ния. Анализаторы текста как модели различных видов понимания. Про-цедуры экспликационного и информационного анализа текста. Морфо-логический, синтаксический и семантический этапы экспликационного анализа текста. Автоматизация синтеза текста. Алгоритмы синтеза текста для верба-

лизации заданного содержания. Семантические, морфологические, син-таксические проблемы синтеза. Диалоговые системы. Принципы организации информационного диа-

лога. Процедуры предупреждения, выявления и преодоления коммуни-кативных неудач. Лингвистическое обеспечение прикладных систем различного назна-

чения. Автоматическое аннотирование и индексирование научно-

технической документации. Автоматическое реферирование. Принцип частотности ключевых слов при автоматическом реферировании. Пути повышения информационности текста за счет восстановления информа-ции, выраженной местоимениями. Типы текстов, подлежащих и не под-лежащих реферированию. Анализ запросов пользователя на естественном языке к информацион-

ной системе. Естественноязыковой интеллектуальный интерфейс для общения с базой данных и базой знаний. Обучающие диалоговые систе-мы. Автоматическое извлечение знаний из текстов для экспертных сис-тем. Системы автоматизированного редактирования. Терминологические банки данных. Системы машинных фондов естественных языков. Созда-ние АРМ лингвиста.

Page 18: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

34

ДИСТАНЦИОННОЕ ОБУЧЕНИЕ

Разработка и внедрение новых информационных технологий в систе-му образования Республики Беларусь. Модернизация и развитие сущест-вующей сетевой инфраструктуры и увеличение пропускной способности используемых каналов доступа к информационным ресурсам. Создание учебных программ и электронных библиотек. Развитие дистанционного обучения. Основные направления и этапы работ по созданию информационной

компьютерной сети системы образования. Развитие коммуникационной инфраструктуры, разработка оптимальных механизмов доступа к ин-формационным образовательным ресурсам. Анализ информационных потоков и выбор информационных технологий для организации сети на различных уровнях. Разработка и реализации архитектуры сети, типовых проектов подключения учебных заведений и индивидуальных пользова-телей. Разработка механизмов доступа к информационным образова-тельным ресурсам на различных уровнях. Обеспечение доступа во внешние сети (RUNET, Internet и др.). Создание национальных и адаптация русскоязычных и иных образова-

тельных информационных ресурсов. Создание и развитие типовых ин-формационных узлов учреждений образования. Создание информацион-ных ресурсов для учащихся школ, для педагогических и научных кадров. Создание информационных ресурсов для управления системой образо-вания. Адаптация и зеркалирование русскоязычных и иных образова-тельных информационных ресурсов. Формирование информационных ресурсов, необходимых для реализации программы дистанционного обучения. Виртуализация библиотечных ресурсов учреждений образова-ния, ведомственных и публичных библиотек с обеспечением к ним сете-вого доступа. Развитие и внедрение новых образовательных информационных тех-

нологий. Создание нормативной правовой и организационно-методической базы дистанционного обучения Республики Беларусь. Создание механизма массовой разработки электронных учебных посо-бий. Опытное внедрение системы дистанционного обучения (БГУ, БГУИР и др.).

35

Литература по разделу 3

Основная Апресян, Ю. Д., Богуславский, И. М., Иомдин, Л. Л. и др. Лингвистический процессор

для сложных информационных систем /Ю. Д. Апресян, И. М. Богуславский, Л. Л. Иомдин. М., 1992 Белоногов, Г.Г., Кузнецов, Б.А. Языковые средства автоматизированных информаци-

онных систем / Г. Г. Белоногов, Б. А. Кузнецов. М., 1983. Виноград, Т. Программа, понимающая естественный язык / Т. Виноград. – М., 1976. Голенков, В.В., Елисеева, О.Е., Гулякина, Н.А. и др. Интеллектуальные обучающие

системы и виртуальные учебные организации / В. В. Голенков, О. Е. Елисеева, Н. А. Гулякина. – Минск: БГУИР, 2001. Городецкий, Б. Ю. Семантические проблемы построения автоматизированных систем

обработки текстовой информации // Вычислительная лингвистика / Б. Ю. Городецкий. М., 1976. Городецкий, Б. Ю., Раскин В. В. Методы семантического исследования ограниченного

подъязыка / Б. Ю. Городецкий. М., 1971. Городецкий, Б. Ю. Компьютерная лингвистика: моделирование языкового общения //

НЗЛ. Вып. XXIV. – М., 1989. Дракин, В. П., Попов, Э. В., Преображенский, А. Б. Общение конечных пользователей

с системами обработки данных / В. П. Дракин, Э. В. Попов, А. Б. Преображенский. М., 1988. Ершов, А. П. Машинный фонд русского языка: внешняя постановка. // В сб.: Машин-

ный фонд русского языка: идеи и суждения / А. П. Ершов. М., 1986. Звегинцев, В. А. Язык как фактор компьютерной революции // НТИ. Сер. 2. 1985, № 9. Искусственный интеллект. (В 3-х кн.) Кн. 1. Системы общения и экспертные системы:

Справочник / Под ред. Э. В. Попова. М., 1990. Карпов, В. А. Язык как система / В. А. Карпов. Минск, 1992; М., 2003. Карпова, Г. Д., Пирогова, Ю. К., Кобзарева, Т. Ю., Микаэлян, Е. В. Компьютерный

синтаксический анализ: описание моделей и направлений разработок (Итоги науки и техники. Серия «Вычислительные науки». Т. 6. М., 1991. Кейтер, Дж. Компьютеры - синтезаторы речи / Дж. Кейтер. М., 1985. Kибрик, А. Е. Очерки по общим и прикладным вопросам языкознания / А. Е. Кибрик.

М., 1992. Мальковский, М. Г. Диалог с системой искусственного интеллекта /

М. Г. Мальковский. М., 1986. Марчук, Ю. Н. Проблемы машинного перевода / Ю. Н. Марчук. М., 1983. Машинный фонд русского языка: Идеи и суждения. М., 1986. Мельчук, И. А. Опыт теории лингвистических моделей «Смысл Текст» /

И. А. Мельчук. М., 1974. Минский, М. Фреймы для представления знаний // Психология машинного зрения /

М. Минский. М., 1978. Моделирование языковой деятельности в интеллектуальных системах. М., 1987. Моль, А. Социодинамика культуры / А. Моль. М., 1973. Научно-технический перевод. – М., 1987. Нелаев, В. В., Казитов, М. В. Активная виртуальная лаборатория в сети Internet как

универсальное средство дистанционного образования // Адукацыя і выхаванне. Минск, 1999, № 7. С. 52 – 56.

Page 19: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

36

Попов, Э. В. Экспертные системы / Э. В. Попов. М., 1987. Поспелов, Д. А. Логико-лингвистические модели в системах управления /

Д. А. Поспелов. М., 1981. Психологические проблемы переработки знаковой информации. М., 1977. Растригин, Л. А. Вычислительные машины, системы, сети / Л. А. Растригин. М., 1982. Реальность и прогнозы искусственного интеллекта. М., 1987. Скрэгг, Г. Семантические сети как модели памяти // НЗЛ. Вып. XII. М., 1983. Урманцев, Ю. А. Общая теория систем: состояние, приложения и перспективы. – В

сб.: Система. Симметрия. Гармония / Ю. А. Урманцев. М., 1988. Файн, B. C. Распознавание образов и машинное понимание естественного языка /

В. С. Файн. М., 1987. Федоров А. В. Основы общей теории перевода / А. В. Федоров. М., 1968. Христочевский, С. А. Электронные мультимедийные учебники и энциклопедии. / Ин-

форматика и образование № 2. М., 2000. Хуторской, А. В. Принципы дистанционного творческого обучения. – http:

//www.eidos.techno. ru/joumal/issue l/khutorskoj/htm Чарняк, Ю. Умозаключения и знания (Части I и II) // НЗЛ. Вып. ХII. М., 1983. Чижаковский, В. А., Беляева, Л. Л. Тезаурус в системах автоматической переработки

текста / В. А. Чижаковский, Л. Л. Беляева. Кишинев, 1983.

Дополнительная

Аллен, Дж. Ф., Перро, Р. Выявление коммуникативного намерения, содержащегося в высказывании // НЗЛ. Вып. XVII. М., 1986. Анохин, П. К. Избранные труды. Философские аспекты теории функциональных сис-

тем / П. К. Анохин. М., 1978. Бергельсон, М. Б., Богуславская, О. Ю., Гафт, Р. И. и др. Моделирование языковой

деятельности в интеллектуальных системах / Под ред. Кибрика А.Е. и Нариньяни А.С. М., 1987. Гиляревский, Р. С. Старостин, Б. А. Иностранные имена и названия в русском тексте

/ Р. С. Гиляревский, Б. А. Старостин. М., 1978. Гончаренко, В. В., Шингарева, Е. А. Фреймы для распознавания смысла текста /

В. В. Гончаренко, Е. А. Шингарева. Кишинев, 1984. Городецкий, Б. Ю. Актуальные проблемы прикладной лингвистики // НЗЛ. Вып. ХІІ.

М., 1983. Городецкий, Б. Ю. К созданию Машинного фонда русского языка (определение, при-

менения, актуальные проблемы) // Машинный фонд русского языка: идеи и суждения / Под ред. Ю. Н. Караулова. М., 1986. Городецкий, Б. Ю. О лингвистическом подходе к теории информационных языков //

Исследования по структурной и прикладной лингвистике / Б. Ю. Городецкий. М., 1975. Городецкий, Б. Ю. Основные направления компьютерной лингвистики // Лекции Все-

союзной школы по основным проблемам искусственного интеллекта и интеллектуаль-ным системам. Ч II. Минск, 1990. Гудман, Б. А. Идентификация референта и связанные с ней коммуникативные неудачи

// НЗЛ. Вып. XXIV. М., 1989. Ершов, А. П. Методологические предпосылки продуктивного диалога с ЭВМ на есте-

ственном языке. // ВФ, 1981, № 8.

37

Зевахина, Т. С. К типологии методик компонентного анализа // Прикладные аспекты лингвистики / Т. С. Зевахина. М., 1989. Казакова, Т. А. Практические основы перевода Т. А. Казакова. С-Пб, 2001. Карбонелл, Дж., Хейз, Ф. Стратегии преодоления коммуникативных неудач при ана-

лизе неграмматичных языковых выражений // НЗЛ. Вып. XXIV. М., 1989. Ленерт, В., Дайер, М. Г., Джонсон, Л. Н., Янг, К. Дж., Харли, С. BORIS – экспери-

ментальная система глубинного понимания повествовательных текстов // НЗЛ. Вып. XXIV. М., 1989. Липатов, Е. П. Теория графов и её применения. – М.: Знание, 1986. – 32 с (Новое в

жизни, науке, технике. Сер. «Математика, кибернетика»; № 2). Маккьюин, К. Дискурсивные стратегии для синтеза текста на естественном языке //

НЗЛ. Вып. XXIV. М., 1989. Павиленис, Р. И. Проблема смысла / Р. И. Павиленис. М., 1983. Пропп, В. Я. Морфология сказки / В. Я. Пропп. М., 1969. Ревзин, И. И. Структура языка как моделирующей системы / И. И. Ревзин. М., 1979. Свидерский, В. И. О диалектике отношений / В. И. Свидерский. Л., 1983. Селфридж, М. Интегральная обработка обеспечивает надежное понимание // НЗЛ.

Вып. XXIV. М., 1989. Скороходько, Э. Ф. Лингвистические проблемы обработки текстов в автоматизиро-

ванных ИПС // Вопросы информационной теории и практики. № 25. – М., 1974. Сухотин, Б. В. Выделение морфем в текстах без пробелов между словами /

Б. В. Сухотин. М., 1984. Сухотин, Б. В. Оптимизационные методы исследования языка / Б. В. Сухотин. М.,

1976. Экспертные системы для персональных компьютеров: методы, средства, реализации.

Справочное пособие. Минск, 1990.

Page 20: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

38

РАЗДЕЛ IV

ВОПРОСЫ К ГОСУДАРСТВЕННОМУ ЭКЗАМЕНУ ПО СПЕЦИАЛИЗАЦИИ «КОМПЬЮТЕРНАЯ

ЛИНГВИСТИКА»

1. Языковые и неязыковые проблемы искусственного интеллекта. 2. Знание и понимание. Основные методы и структуры представления знаний о языке и мире в компьютерных системах. 3. Изомерийно-неизомерийные отношения в синтаксисе. 4. Принципы организации машинных словарей. Словари словоформ, их достоинства и недостатки. 5. База данных и база знаний. Картина мира и ее отражение в базе зна-ний. 6. Вероятностные модели и их реальное наполнение на разных уровнях языка. 7. Машинный перевод как одно из направлений искусственного интел-лекта. 8. Познание как система. 9. Основные виды языковой изомерии. 10. Сценарий как структура логических знаний о ситуации. 11. Моделирование единиц языка на всех функциональных языковых уровнях. 12. Проблемы анализа и синтеза осмысленных текстов в интеллектуаль-ных системах. 13. Поведенческий акт как система. Способы снятия омонимии в естест-венноязыковых компьютерных системах. 14. Системное грамматическое кодирование разных частей речи. 15. Математические структуры для представления полных знаний о языке: плюс-минусовой куб, декартово произведение, симметрично-асимметричные матрицы. Их прогностические возможности. 16. Полисемия и омонимия как проблема автоматического перевода. 17. Способы устранения ошибок с помощью кодирования. 18. Познание как система. Проблема снятия неполноты знаний в интел-лектуальных системах. 19. Системное грамматическое и семантическое кодирование. Концеп-ция матричного машинного словаря. 20. Конвергенция и дивергенция на уровне словообразования и слово-изменения. 21. Уровни понимания текста.

39

22. Машинный синтаксис. Представление ядерных и расширенных ком-позиций. 23. Системное словообразование. Матричное представление словообра-зования и словоизменения. 24. Системное формульное представление знаний. 25. Морфологические трудности при автоматическом переводе имен собственных и возможные пути их устранения. 26. Понятие лингвистического универсума. Мозаичность отражения ре-ального мира с помощью языка 27. Лингвистические проблемы машинного перевода. 28. Машинные грамматики. Проблема создания экономных и однознач-ных кодов 29. Математическая теория вероятностей и ее приложение к языку. 30. Соотношение вероятности, симметрии и информации. 31. Картина мира и база знаний. Фреймы и семантические сети как ме-тоды представления знаний о мире в компьютерных системах. 32. Принципы организации машинных словарей. Словари типа «машин-ная основа + машинная флексия», их достоинства и недостатки. 33. Формальная система омонимии. Способы снятия омонимии в естест-венноязыковых компьютерных системах. 34. Ассоциативный словарь как метод представления знаний о мире. 35. Неполнота словарей и способы ее снятия в компьютерных системах. 36. Номинация как система. 37. Гипертекстовые технологии представления знаний. 38. Предмет и задачи компьютерной лингвистики. 39. Принципы создания обучающих систем по языкам. 40. Гомологические ряды в языке.

Контролируемая самостоятельная работа (КСР) по специализа-

ции “Компьютерная лингвистика” 5 курс

1. Диалоговые системы. 2. Основные типы “человеко-машинных” систем АП. 3. Категория значения в лингвистической семантике и когнитивной лин-гвистике. 4. Теория представления знаний в экспертных системах. 5. Описание значения с помощью фреймов и сценариев. 6. Гипертекст как теория и компьютерная технология представления знаний. 7. Грамматические проблемы компьютерного перевода.

Page 21: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

40

8. Фреймы как методы представления знаний о мире. 9. Проблема снятия неполноты знаний в интеллектуальных системах. 10. Семантические сети как методы представления знаний о мире в ком-пьютерных системах. 11. Машинный перевод как одно из направлений искусственного интел-лекта. 12. Языковые и неязыковые проблемы искусственного интеллекта.

41

РАЗДЕЛ V ПРИМЕРНАЯ ТЕМАТИКА КУРСОВЫХ

И ДИПЛОМНЫХ РАБОТ ПО СПЕЦИАЛИЗАЦИИ «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА»

1. Анализ словосложений как система. 2. Проблемы полипрефиксации и полисуффиксации. 3. Формально-содержательная сторона языковой лево-правизны. 4. Анализ лингвистической изомерии. 5. Проблемы семантики возможных миров. 6. Формально-содержательная сторона грамматики. 7. Анализ дифференциального словаря. 8. Проблемы членения текста без пробелов. 9. Формально-содержательная сторона семантики. 10. Анализ аббревиатур как системы. 11. Проблемы лингвистического кодирования. 12. Формально-содержательная сторона поэтики. 13. Анализ дифференциального словаря. 14. Проблемы компьютерного обучения языку. 15. Формально-содержательная сторона синтаксиса. 16. Анализ лингвистической сорбции. 17. Проблемы метафоризации как системы. 18. Формально-содержательная сторона симметро-асимметрии. 19. Анализ категории вида. 20. Проблема упаковки семантики в компьютере. 21. Формально-содержательная сторона морфологии. 22. Анализ синонимии как системы. 23. Проблемы понимания как системы. 24. Формально-содержательная сторона знаний. 25. Анализ антонимии как системы. 26. Проблемы членения белковых цепочек как текстов. 27. Формально-содержательная сторона транзитивности. 28. Анализ омонимии как системы. 29. Проблемы языка и логики. 30. Формально-содержательная сторона иерархо-неиерархических

систем. 31. Анализ ударения как системы. 32. Проблемы симметро-асимметрии и информации. 33. Формально-содержательная сторона процесса познания. 34. Анализ полисемии как системы. 35. Проблемы создания банков данных и банков знаний.

Page 22: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

42

36. Формально-содержательная сторона изо-полиморфизма. 37. Анализ текстов на неизвестном языке. 38. Проблемы создания экспертных систем. 39. Формально-содержательная сторона метаязыка. 40. Дифференциальный словарь в обучении РКИ. 41. Ассоциативные словари в обучении РКИ 42. Языковая картина мира в русских народных сказках.

43

ОГЛАВЛЕНИЕ

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА……………………………………………….

3

РАЗДЕЛ I. Компьютерная лингвистика как составляющая систем искусственного интеллекта……………………………………….

6

Основы прикладной лингвистики………………………………… 6 Компьютерная лингвистика и естественноязыковой интер-фейс…………..

7

Инженерия знаний………………………………………………… 8 Проблемы искусственного интеллекта…………………………… 10 Квантитативная лингвистика………………………………………… 11 Прикладная лексикология………………………………………… 12 Машинные грамматики……………………………………………… 14 Омонимия как система…………………………………………… 15 Корпусная лингвистика……………………………………………… 16 Литература по разделу 1……………………………………………

17

РАЗДЕЛ II. Философско-когнитивная база интеллектуальных компьютерных систем………………………………………………

23

Философия языка…………………………………………………… 23 Язык как система…………………………………………………… 27 Система языковой изомерии……………………………………… 28 Литература по разделу 2……………………………………………

29

РАЗДЕЛ III. Прикладные интеллектуальные системы………… 30 Теория и практика машинного перевода………………………… 30 Компьютерные экспертные системы……………………………… 31 Автоматический анализ естественноязыкового текста………… 32 Дистанционное обучение………………………………………… 34 Литература по разделу 3……………………………………………

35

РАЗДЕЛ IV. Вопросы к государственному экзамену по специализации «Компьютерная лингвистика»……………………

38

Page 23: %D0%9A%D0%9E%D0%9C%D0%9F%D0%AC%D0%AE%D0%A2%D0%95%D0%A0%D0%9D%D0%90%D0%AF %D0%9B%D0%98%D0%9D%D0%93%D0%92%D0%98%D0%A1%D0%A2%D0%98%D0%9A%D0%90 _%D1%83%D1%87_ %D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0

44

Контролируемая самостоятельная работа (КСР) по специализации «Компьютерная лингвистика» 5 курс……………………………

35

РАЗДЕЛ V. Примерная тематика курсовых и дипломных работ по специализации «Компьютерная лингвистика»……………

36

45

Учебная программа Компьютерная лингвистика

Для студентов филологического факультета

Авторы-составители Карпов Владимир Александрович Лаврененко Анжелла Валерьевна Головня Анастасия Ивановна

В авторской редакции Ответственный за выпуск А. И. Головня

Подписано в печать 2008. Формат 60х84/16. Бумага офсетная. Гарнитура Таймс. Усл.печ.л. 3,72. Уч.-изд. л. 2,82. Тираж 50 экз. Зак.

Белорусский государственный университет

Лицензия на осуществление издательской деятельности № 02330/0056804 от 02.03.2004

220050, Минск, проспект Победителей, 4

Отпечатано с оригинала-макета заказчика Филологический факультет