на соискание ученой степени кандидата...

302
Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «КЕМЕРОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» На правах рукописи Напреенко Галина Викторовна ЛЕКСИКО-КВАНТИТАТИВНОЕ МОДЕЛИРОВАНИЕ ЯЗЫКОВОЙ ЛИЧНОСТИ В ИДЕНТИФИКАЦИОННОМ АСПЕКТЕ (НА МАТЕРИАЛЕ РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ДНЕВНИКОВ) Специальность 10.02.01 – Русский язык Том 1 Диссертация на соискание ученой степени кандидата филологических наук Научный руководитель – д. ф. н., профессор Голев Н. Д. Кемерово 2015

Transcript of на соискание ученой степени кандидата...

Page 1: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«КЕМЕРОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

На правах рукописи

Напреенко Галина Викторовна

ЛЕКСИКО-КВАНТИТАТИВНОЕ МОДЕЛИРОВАНИЕ ЯЗЫКОВОЙ

ЛИЧНОСТИ В ИДЕНТИФИКАЦИОННОМ АСПЕКТЕ (НА МАТЕРИАЛЕ

РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ДНЕВНИКОВ)

Специальность 10.02.01 – Русский язык

Том 1

Диссертация

на соискание ученой степени

кандидата филологических наук

Научный руководитель –

д. ф. н., профессор Голев Н. Д.

Кемерово 2015

Page 2: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

2

ТОМ 1

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ ………………………………………………………........................ 7

ГЛАВА I. ЛИНГВОПЕРСОНОЛОГИЯ И «ИДЕНТИФИКАЦИОННАЯ

ЛИНГВИСТИКА»……………………………………………………………………. 16

§1. Лингвоперсонология: идентификационный аспект описания языковой

личности……………………………………………………………….…................ 17

1.1.1. Направления развития лингвоперсонологии………………………… 17

1.1.2. Языковая личность и персонотекст как объекты идентификационной

лингвоперсонологии………………………………………………………………… 25

§2. Феномен идентификации в лингвистике……………………………………. 29

1.2.1. Идентификация, тождество и различие, общее и частное: философское

обоснование………………….……………………………………………………….. 29

1.2.2. Идентификация в лингвоперсонологии и юрислингвистике…………… 37

§3. Методы моделирования языковой личности в идентификационном

аспекте: оппозиция специальных и универсальных методов……………………. 48

1.3.1. Постановка проблемы методов исследования текста в

идентификационном аспекте..……………………………………………………. 49

1.3.2. «Этюдное» индивидуализированное описание языковой личности и

персонотекста………………………………………………………………………. 63

1.3.3. Универсальные методы идентификации текстов: теоретические

основания …………………………………………………………………............... 75

1.3.4. Формализованные методы и автоматизированные программы по

установлению авторства……………………………………………………………. 91

Выводы по 1 главе…….………………………………………………………… 114

Page 3: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

3

ГЛАВА II. СПЕЦИАЛЬНО-ОРИЕНТИРОВАНЫЙ МЕТОД

МОДЕЛИРОВАНИЯ ТЕКСТОВ В ИДЕНТИФИКАЦИОННОМ

АСПЕКТЕ……………………………………………………………………………..

116

§1. Интернет-дневник как материал идентификационного

исследования…………………………………………………………………………

116

§2. Разработка специально-ориентированного метода идентификации

текста……………………………………………………………………………….. 121

2.2.1. Описание подготовительных этапов: создание частотного

словаря………………………………………..……………………….……………. 121

2.2.2. Гипотеза и реализация специально-ориентированного метода

идентификации текстов……………………………………………………………. 127

2.2.3. Алгоритм специально-ориентированного метода идентификации

текста………………………………………………………………………………….. 144

Выводы по 2 главе………………………………………………………………… 146

ГЛАВА III. УНИВЕРСАЛЬНЫЙ МЕТОД МОДЕЛИРОВАНИЯ ТЕКСТОВ

В ИДЕНТИФИКАЦИОННОМ АСПЕКТЕ………………………………………. 148

§1. Разработка универсального метода идентификационного моделирования

текстов (первый этап идентификации)…………………………………………….. 148

3.1.1. Описание подготовительных этапов…………………………………… 148

3.1.2. Гипотеза исследования………………………………………………........ 151

3.1.3. Реализация универсального метода идентификации текстов…………. 155

3.1.4. Результаты идентификационного моделирования текстов……………. 164

§2. Сопоставление словников по текстам с «абсолютным» показателем

распределения слов по частотности (второй этап идентификации)…………….. 168

3.2.1. Частотный словарь русского языка как объект сопоставления ……....… 168

3.2.2. Идентификационное сопоставление словников по текстам с частотным

словарем современного русского языка…………………………………………. 176

Page 4: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

4

3.2.3. Алгоритм универсального метода идентификации текстов…………… 187

Выводы по 3 главе ……………………………………………………………… 190

ЗАКЛЮЧЕНИЕ ……………………………………………………................... 192

БИБЛИОГРАФИЯ ……………………………………………………………. 197

СПИСОК ИНТЕРНЕТ-ИСТОЧНИКОВ………………………….................. 222

СПИСОК ИСПОЛЬЗОВАННЫХ СЛОВАРЕЙ……………………………. 228

СПИСОК ИЛЛЮСТРАТИВНОГО МАТЕРИАЛА

Таблица № 1. Сопоставление частоты употребления слов но / однако………… 133

Таблица № 2. Сопоставление частоты употребления слов только / лишь ……... 133

Таблица № 3. Сопоставление частоты употребления слов очень / весьма / и т.д. 134

Таблица № 4. Сопоставление частоты употребления слов может / возможно /

видимо / очевидно и т.д……………………………………………………………… 135

Таблица № 5. Сопоставление частоты употребления слов жаль / жалко……… 136

Таблица № 6. Сопоставление частоты употребления слов кой / который…….. 137

Таблица № 7.Сопоставление частоты употребления слов такой / подобный…. 137

Таблица № 8. Сопоставление частоты употребления слов тут / здесь ……….. 138

Таблица № 9. Сопоставление частоты употребления слов теперь / сейчас и

т.д…………………………………………………………………………………….. 139

Таблица № 10. Сопоставление частоты употребления слов нужно /

необходимо / надо и т.д…………………………………………………………...... 140

Таблица № 11. Сопоставление частоты употребления слов быстро / скоро …. 140

Таблица № 12. Сопоставление частоты употребления слов особо / особенно… 141

Таблица № 13. Предпочтения языковых личностей в выборе

словоупотребления………………………………………………………………….. 142

Таблица № 14. Пример частотно-сопоставительной таблицы для специально-

ориентированного метода…………………………………………………………. 143

Таблица № 15. Сравнение уровня ранга ряда слов в частотных словарях

[Частотный словарь 1977] и [Ляшевская 2009]………………………………….. 170

Таблица № 16. Пример частотно-сопоставительной таблицы для

универсального метода……………………………………………………………… 188

Диаграмма 1. Сопоставление результатов идентификации, полученных

способом № 1 (ΔRг= R1г –R2г)……………………………………………………….. 165

Диаграмма 2. Сопоставление результатов идентификации, полученных

Page 5: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

5

способом № 2 (ΔR= R1 – R2)………………………………………………………... 166

Диаграмма 3. Сопоставление результатов идентификации, полученных

способом № 1 (ΔRг= R1г –R2г)………………………………………………………. 183

ТОМ 2:

ОГЛАВЛЕНИЕ

Приложение А. Таблица А.1 – Частотно-сопоставительная таблица по

словникам А – Б……………………………………………………………………. 3

Приложение Б. Таблица Б.1 – Частотно-сопоставительная таблица по

словникам В – Г............................................................................................................ 7

Приложение В. Таблица В.1 – Частотно-сопоставительная таблица по

словникам А– В............................................................................................................. 11

Приложение Г. Таблица Г.1 – Частотно-сопоставительная таблица по

словникам Б – Г……………………………………………………………………. 15

Приложение Д. Таблица Д.1 – Сопоставление слов частотного словаря

современного русского языка [Ляшевская] и словника А……………………… 19

Приложение Е. Таблица Е.1 – Сопоставление слов частотного словаря

современного русского языка [Ляшевская] и словника Б……………………… 23

Приложение Ж. Таблица Ж.1 – Идентификационное моделирование по

таблице А.1 (словники А – Б) первым способом: ΔRг= R1г –R2г………………. 27

Приложение И. Таблица И.1 – Идентификационное моделирование по

таблице Б.1 (словники В – Г) первым способом: ΔRг= R1г –R2г………………. 31

Приложение К. Таблица К.1 – Идентификационное моделирование по В.1

(словники А – В) первым способом: ΔRг= R1г –R2г…………………………….. 36

Приложение Л. Таблица Л.1 – Идентификационное моделирование по

таблице Г.1 (словники Б – Г) первым способом: ΔRг= R1г –R2г……………….. 40

Приложение М. Таблица М.1 – Идентификационное моделирование по

таблице А.1 (словники А – Б) вторым способом: ΔR= R1 –R2………………… 44

Приложение Н. Таблица Н.1 – Идентификационное моделирование по

таблице Б.1 (словники В – Г) вторым способом: ΔR= R1 –R2…………………. 48

Приложение П. Таблица П.1 – Идентификационное моделирование по

таблице В.1 (словники А – В) вторым способом: ΔR= R1 –R2………………… 53

Приложение Р. Таблица Р.1 – Идентификационное моделирование по таблице

Г.1 (словники Б – Г) вторым способом: ΔR= R1 –R2……………………………. 57

Приложение С. Таблица С.1 – Сопоставительная таблица самых частотных

слов всех исследуемых текстов…………………………………………………… 61

Приложение Т. Таблица Т.1 – Сопоставление словника Частотного словаря

современного русского языка [Ляшевская] и словника А (по таблице

Д.1)………………………………………………………………………………….. 65

Page 6: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

6

Приложение У. Таблица У.1 – Сопоставление словника Частотного словаря

современного русского языка [Ляшевская 2009]и словника Б (по таблице

Е.1)……………………………………………………………………………………. 69

Page 7: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

7

Введение

Настоящее диссертационное исследование посвящено проблеме выявления и

изучения системных лексико-квантитативных проявлений индивидуальной

языковой способности в русскоязычном тексте. Под языковой личностью в работе

понимается «совокупность способностей человека, обусловливающих создание и

восприятие им речевых произведений (текстов), которые различаются по степени

сложности, глубины и точности отражения действительности, целевой

направленности» [Караулов 1989: 7]. Таким образом, языковая личность в данном

исследовании трактуется как носитель языковой способности определенного

качества. Мы исходим из предположения о том, качество языковой способности

находит проявления в лексико-квантитативных характеристиках текстов,

порождаемых ее носителем. Они носят в тексте системный характер,

обусловленный устойчивостью качества языковой способности автора текста

(онтологический аспект исследования), которое может быть реконструировано по

его «выходу» в речевой материал (гносеологический аспект исследования).

Теоретическое изучение и формально-количественная реконструкция языковой

личности осуществляется в исследовании в идентификационном формате, под

которым понимается соотнесение текста с языковой личностью его автора как

индивидуального варианта носителя языковой способности. Мы исходим из

положения о том, что текст устроен таким образом, что его лексико-

квантитативная структура, выявляемая на оси частотности слов, отражает

качество языковой способности автора текста. Идентификация текста, таким

образом, – особый аспект описания языковой личности: выявленное качество

языковой способности автора текста решает задачу установления тождества

объектов идентификации на основе лексико-квантитативных параметров текста. В

настоящей работе в качестве объектов идентификации выступили фрагменты

текстов русскоязычных интернет-дневников.

Page 8: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

8

Актуальность предпринятого исследования обусловлена рядом факторов. Во-

первых, объектами описания данной работы являются текст как воплощенная

языковая личность и собственно языковая личность как антропоцентрические

категории. В исследованиях языковой личности обнаруживается тенденция к

доминированию субъективного плана – его преодоление требует выявления

объективных параметров, имеющих массовые проявления. Необходима выработка

особых методов, разработка «матричных» схем, в которых отражается комплекс

лексико-квантитативных параметров текста, способствующих идентификации

языковой личности. Существенным основанием применения подобных методов

следует признать «объективную присущность языку количественных признаков,

количественных характеристик и внутреннюю зависимость, существующую

между ними» [Головин 1971: 13].

Во-вторых, проблема преодоления субъективности является также

фундаментальной задачей экспертологии и решается путем применения

квантитативных методов в исследованиях и создания ряда автоматизированных

программ по атрибуции текста. Задача разработки объективных методов

идентификации текстов актуальна в связи с тем, что сохраняется проблема

соблюдения авторских прав, обусловленная быстротой и легкостью

распространения и передачи информации благодаря электронным ресурсам.

Необходимость в изучении объективных параметров текста отмечается в

современных исследованиях, направленных на установление тождества текстов

или авторства произведений (см.: [Бельская 2014; Верхозин 2013а; Захаров 2007;

Резанова 2013а; Суркова 2004а] и т. д).

В-третьих, настоящая работа включается в процесс формирования новой

научной парадигмы, в которой активно действуют интегративные тенденции –

диссертационное исследование находится в области пересечения разных наук:

лингвоперсонологии, лингвистики текста, квантитативной лингвистики и

юрислингвистики.

Объектом настоящего исследования выступает лексический уровень

русскоязычных текстов, понимаемых как воплощенная в тексте языковая

Page 9: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

9

личность (персонотексты). Предметом исследования является лексико-

квантитативная модель текста и языковой личности, рассматриваемая в

идентификационном аспекте.

В основу исследования положена следующая гипотеза: языковая личность,

воплощенная в тексте, представляется набором индивидуальных лексико-

квантитативных закономерностей, выявление и описание которых по

формализованным алгоритмам позволяет идентифицировать анализируемые

тексты и языковую личность по ним.

Цель работы заключается в выявлении лексико-квантитативных

закономерностей текстов как воплощенных языковых личностей,

способствующих установлению тождества текстов и языковых личностей по ним.

В соответствии с поставленной целью предполагается решить следующие

задачи:

1) сформировать базу способов портретирования языковой личности и

методов идентификации текста;

2) выделить и описать оппозицию интуитивных (в нашей терминологии –

специально-ориентированных) и квантитативных (в нашей терминологии –

универсальных) методов описания языковой личности, в том числе в

идентификационном аспекте;

3) разработать два идентификационных метода обнаружения и описания

лексико-квантитативных закономерностей русскоязычного текста в рамках

выявленной оппозиции методов идентификации текстов и языковой личности по

ним:

a. разработать специально-ориентированный метод идентификационного

моделирования воплощенной языковой личности в тексте по словам, связанным

синонимическими отношениями;

b. разработать алгоритм специально-ориентированного метода

идентификации текстов и языковой личности;

c. разработать универсальный метод идентификационного моделирования

воплощенной языковой личности в тексте по высокочастотным словам текста;

Page 10: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

10

d. разработать алгоритм универсального метода идентификации текстов и

языковой личности;

4) апробировать данные методы на материале русскоязычных интернет-

дневников;

5) сопоставить словники, созданные по текстам, с частотным словарем русского

языка на предмет выявления общего и частного в ранжировании каждого;

6) обобщить и интерпретировать результаты представленных нами методов

идентификации текста.

При решении поставленных задач использовался комплекс методов

исследования: а) метод сплошной выборки при сборе материала; б) сравнительно-

сопоставительный метод, заключающийся в установлении сходств и различий

между ранговыми и частотными показателями лексем в частотных словарях,

принадлежащих одному и разным авторам; в) общенаучный описательно-

аналитический метод с характерными приёмами обобщения, обработки,

интерпретации результатов исследования, дающий возможность выявить

идентификационный потенциал двух методов; г) метод статистического анализа,

применяемый в качестве исходного этапа лексико-квантитативных методов

идентификации.

Материалом исследования послужили русскоязычные интернет-дневники,

размещенные на сайте www.diary.ru. Использование выбранного материала

обусловлено тем, что интернет-дневники индивидуализированы, имеют большой

объем словоупотреблений, а также характеризуются анонимностью, позволяющей

осуществлять формализацию текстовой информации. Интернет-дневник

порожден естественным, спонтанным проявлением языковой способности, а тем

самым данный материал отвечает поставленной цели настоящего исследования.

Нами произвольно отобрано два русскоязычных интернет-дневника, каждый из

которых разделен на две части, тем самым, искусственно создана ситуация

экспертного анализа «множественная неопределенность» [Баранов 2001: 1], когда

«имеется множество текстов или их фрагментов. Необходимо установить,

скольким авторам принадлежат тексты, и атрибутировать каждый текст

Page 11: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

11

конкретному автору» [Баранов 2001: 1]. Таким образом, идентификационному

исследованию подверглось четыре фрагмента интернет-дневника,

принадлежащих двум авторам. Каждому фрагменту интернет-дневника дано

условное буквенное обозначение (А, Б, В, Г), тем самым соблюдая принцип

анонимности, необходимый для объективности полученных идентификационных

выводов. В тексте А – 31 362, в Б – 21 660, в В – 31 624, в Г – 22 053

словоупотреблений. В настоящем исследовании под словом принято считать

«набор букв между двумя пробелами, как это принято в машинном переводе»

[Ахманова 1961: 37]. Количество словоупотреблений – количество распознанных

программой SimWordSorter [SimWordSorter] наборов «букв между двумя

пробелами» [Ахманова 1961: 37] в одном фрагменте текста.

В главе 2, представляющей специально-ориентированый метод идентификации

текстов, для квантитативного анализа отобраны синонимические ряды. В главе 3,

описывающей универсальный метод, анализу подвергнуты первые сто самых

частотных слов каждого текста без различия.

Общетеоретическую и методологическую базу исследования составили труды

ученых в области:

лингвоперсонологии и теории языковой личности: И. В. Башкова,

Л. О. Бутакова, Н. Д. Голев, Е. В. Иванцова; А. Н. Караулов, Н. Б. Лебедева, Н. В.

Мельник, К. Ф. Седов (см.: [Башкова 2010; Бутакова 2011; Голев 2004; Голев

2006; Голев 2007; Иванцова 2002; Иванцова 2008; Иванцова 2009; Иванцова 2010;

Караулов 1989; Лебедева 2006; Лебедева 2006а; Лебедева 2009; Мельник 2011;

Седов 1999; Седов 2004; Седов 2006; Седов 2007; Седов 2008]) и др.;

квантитативной лингвистики, формализации, компьютерной обработки

текстовой информации, статистическим методам в изучении языка:

Н. Д. Андреев, О. С. Ахманова, И. В. Богословская, А. И. Новиков,

А. Я. Шайкевич (см.: [Андреев 1959; Андреев 1967; Ахманова 1961;

Богословская; Новиков 1983; Шайкевич 1968; Шайкевич 1976]) и др.;

лингвокриминалистике, юридической лингвистике, работы по

идентификации языковой личности, идентификационной экспертизе:

Page 12: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

12

А. Н. Баранов, Е. И. Галяшина, Н. Д. Голев, В. В. Наумов (см.: [Баранов 2001;

Баранов 2001а; Баранов 2007; Галяшина 2006; Галяшина 2006а; Голев 1999; Голев

2002; Голев 2003; Голев 2009; Голев 2010; Наумов 2006]) и др.;

идентификации в формализованном, квантитативном русле: Т. В. Батура,

М. А. Марусенко, З. И. Резанова, Е. С. Родионова, А. С. Романов, А. С. Суркова,

Ю. А. Тамбовцев (см.: [Батура; Марусенко 1996; Резанова 2013; Резанова 2013а;

Родионова 2008; Родионова 2008а; Романов 2006; Романов 2008; Романов 2008а;

Романов 2009; Суркова 2004; Суркова 2004а; Тамбовцев 2008; Тамбовцев 2011]).

Научная новизна исследования состоит в том, что:

а) текст исследован с точки зрения его лексико-квантитативной вариативности,

основанной на персоноразличительной функции квантитативных характеристик

отдельных текстовых лексем и всего набора лексем – осуществлена попытка

формализации лингвоперсонологической информации на этой основе;

б) впервые феномен идентификации исследуется в лингвоперсонологическом

аспекте и вводится определения «идентификационная лингвистика» как аспект

лингвоперсонологии;

в) впервые предложена оппозиция двух методов идентификации языковой

личности, воплощенной в персонотексте и отражен переход от «ручного» способа

идентификации к «конвейерному»: методы специально-ориентированные (или

«этюдные») и универсальные (или формализованные).

г) впервые разработан и апробирован универсальный (лексико-ранговый) метод

идентификации текстов и языковой личности по ним;

д) впервые осуществлено сопоставление лексико-ранговых данных частотных

словарей, созданных по текстам, принадлежащим конкретным языковым

личностям, и частотного словаря русского языка [Ляшевская 2009].

Теоретическая значимость исследования обусловлена:

а) вкладом в разработку концепции теории лингвоперсонологии;

б) расширением границ лингвоперсонологии посредством его изучения в

идентификационном аспекте – раскрыты направления взаимодействия разных

научных дисциплин;

Page 13: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

13

в) выделением оппозиции специально-ориентированных и универсальных

методов идентификации текстов и языковой личности и их представлением в

развитии;

г) обоснованием универсального характера проявлений лексико-

квантитативных способностей языковой личности;

д) разработкой двух вариантов методов идентификации текстов и языковой

личности.

Практическая значимость состоит в том, что полученные в ходе

исследования данные могут быть использованы в криминалистике при

проведении экспертизы по идентификации текста и языковой личности, в

автороведческой экспертизе; в лингвоперсонологии при портретировании

языковой личности; в математической лингвистике при исследованиях

квантитативных закономерностей текста и создании автоматизированных

компьютерных программ по установлению авторства; в лингводидактике – в

системе личностно-ориентированного обучения для выявления типа обучаемой

личности и корректировке в соответствии с этим методики обучения.

На защиту выносятся следующие положения:

1. Вариант языковой способности, в том числе индивидуальный, проявляется

на разных уровнях текста и может быть выявлен квантитативным способом на

лексическом уровне. Лексико-квантитативная закономерность как следствие

закона частотно-рангового распределения описывает структуру любого текста и

является общей закономерностью построения любого текста.

2. За частотным словарем стоит не только количественное описание

частотности словоупотреблений, свойственное каждому тексту, но также и

лингвоперсонологические особенности, свойственные каждому автору текста.

3. Существующие методы описания языковой личности и идентификации

текстов предстают в оппозиции специально-ориентированных и универсальных

методов идентификации текстов и языковой личности по ним.

Page 14: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

14

4. Специально-ориентированный метод идентификации текстов и языковой

личности базируется на том, что языковая личность осуществляет выбор

преимущественно одного из слов в синонимическом ряду, зафиксированном в

словаре синонимов русского языка. Выделение в тексте ряда индивидуальных

предпочтений в выборе употребления некоторых синонимов в своей речи и

интерпретации их путем формально-количественного моделирования

способствует идентификации воплощенной в тексте языковой личности.

5. Универсальный метод идентификации текстов и языковой личности

базируется на том, что различное ранжирование текстов обладает

идентификационным потенциалом. Языковая личность проявляется в

предпочтительном употреблении ряда слов в большей степени, чем других.

Апробация исследования. Основные положения работы обсуждались в

докладах на заседании кафедры русского языка Кемеровского государственного

университета. Результаты исследования были представлены на Второй

Всероссийской научно-практической конференции «Письменная русская речь в

ВУЗе и школе: теория и практика» (Кемерово, 2010); Международной научно-

практической конференции студентов, аспирантов и молодых ученых

«Образования, наука, инновации – вклад молодых исследователей» (Кемерово,

2010, 2011, 2012, 2014, 2015); Первой Интернет-конференции по

юрислингвистике «Право как дискурс, текст и слово» (Конференции СИБАЛЭКС)

(2011); Всероссийской конференции молодых ученых «Актуальные проблемы

лингвистики и литературоведения» (Томск, 2011, 2012); 50-й юбилейной

международной научной студенческой конференции «Студент и научно-

технический прогресс» (Новосибирск, 2012); Международной научной

конференции «Проблемы современной лингвистики, литературоведения и

методики преподавания филологических курсов» (Кемерово, 2015).

Основное содержание работы отражено в 12 публикациях общим объемом Х

п. л., в том числе в 3 статьях, опубликованных в рецензируемых научных

изданиях, включенный в перечень ВАК Минобрнауки РФ.

Page 15: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

15

Личный вклад соискателя состоит в постановке цели и задач исследования, в

обосновании положений, выносимых на защиту, в разработке методов

исследования и ее реализации на конкретном материале, в интерпретации

результатов и формулировании выводов.

Структура работы. Диссертация общим объемом 302 страницы (196 страниц

основного текста) состоит из Введения, трех глав, Заключения, Библиографии

(213 наименований), Списка интернет-источников (56 наименований), Списка

использованных словарей (14 наименований) и отдельного тома Приложений (72

страницы).

Во Введении обосновывается актуальность темы исследования, выявляется

степень ее разработанности, формулируются проблема, цели и задачи

исследования, определяются его объект и предмет, перечисляются положения,

выносимые на защиту, указываются научная новизна работы, теоретическая и

практическая значимость результатов исследования.

В первой главе описаны философские предпосылки и теоретическое основание

идентификации, обозначен междисциплинарный характер идентификации как

феномена; очерчены существующие методы идентификации текстов в рамках

выявленной нами оппозиции методов, представлены конкретные примеры

портретирования языковой личности и идентификации текстов.

Во второй главе представлены ход, результаты и алгоритм специально-

ориентированного метода идентификации текстов и языковой личности по ним.

В третьей главе представлены ход, результаты и алгоритм предлагаемого

универсального метода идентификации текстов и языковой личности по ним; а

также осуществлено сопоставление словников по текстам с частотным словарем

русского языка как с «абсолютным» показателем распределения слов по

частотности в русском языке.

В Заключении излагаются основные выводы, приводятся результаты

идентификационного моделирования текстов предлагаемыми методами,

намечаются перспективы дальнейшего исследования.

Page 16: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

16

Глава 1. Лингвоперсонология и «идентификационная лингвистика»

Задачей настоящей главы является освещение направлений

лингвоперсонологии, а также описание взаимоотношений идентификации,

лингвоперсонологии и лингвистической экспертизы1 с целью обозначения

необходимости разработки идентификационного направления

лингвоперсонологии. Идентификационный аспект лингвоперсонологии нуждается

в отдельном изучении2: он ориентирован на выявление качества языковой

способности автора текста, которое способствует установлению тождества

объектов, подвергаемых идентификации. Объектом идентификационного аспекта

лингвоперсонологии является языковая личность и персонотекст. Описание

методов портретирования языковой личности в лингвоперсонологии является

предпосылкой описания языковой личности в идентификационном аспекте.

На фоне множества предлагаемых способов и методов идентификации

обнаруживается проблема отсутствия единого метода идентификации текстов и

собственно языковой личности. В главе отражено развитие методов

моделирования языковой личности, идущей в направлении от субъективного

подхода к более объективному. Данное движение позволило выдвинуть гипотезу

о существовании оппозиции специально-ориентированных и универсальных

1 В частности речь идет об идентификационной экспертизе в рамках

юридической лингвистики. Данный предмет сопоставления выводит

исследование на уровень практической значимости.

2 Для обозначения идентификационного аспекта изучения текста мы

предлагаем использовать термин «идентификационная лингвистика», который

включает в себя идентификацию в лингвистике и лингвоперсонологии. В

настоящей работе исследуется идентификация как аспект лингвоперсонологии.

Page 17: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

17

методов идентификации текстов как воплощенной в нем языковой личности

(персонотекстов).

§1. Лингвоперсонология: идентификационный аспект описания языковой

личности

1.1.1. Направления развития лингвоперсонологии

В центре современной лингвистики находится антропоцентрическая парадигма,

которая большое значение уделяет языковой личности. Антропоцентрическая

парадигма явилась фактором, порождающим лингвоперсонологию (Н. Д. Голев,

В. И. Карасик, В. П. Нерознак). Н. В. Мельник в статье «Языковая личность и

текст как предмет лингвоперсонологии русского языка» [Мельник 2011: 200]

приводит историческую справку о возникновении лингвоперсонологии.

В. П. Нерознак [Нерознак 1996] говоря о становлении новой лингвистической

дисциплины, обобщает опыт французских персоналистов, а также труды

Н. С. Трубецкого. В. П. Нерознак проецирует идеи ученых в область

лингвистической персонологии, под которой подразумевается теория языковой

личности. Истоки формирования теории языковой личности можно найти в

исследованиях художественной литературы, например, в работах

В. В. Виноградова (1930). Труды В. В. Виноградова посвящены анализу образа

автора в структуре художественного текста: «видимо, по этой причине

исследования языковой личности шли по направлению изучения языка творцов

художественных произведений» [Мельник 2011: 200].

Лингвоперсонология как сравнительно новая научная дисциплина активно

развивает теоретико-методологические вопросы, которые представлены в ряду

Page 18: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

18

современных монографий и сборников научных трудов – «количество литературы

по указанной теме возрастает лавинообразно» [Башкова 2014: 569]. К

значительным трудам по лингвоперсонологии относятся: «Лингвоперсонология:

типы языковых личностей и личностно-ориентированное обучение языку» [2006],

«Вопросы лингвоперсонологии» [2007], «Лингвоперсонология и личностно-

ориентированное обучение языку» [2009], «Лингвоперсонология: Основы теории

языковой личности» [Иванцова 2010], а также две части коллективной

монографии «Языковая личность: Моделирование, типология, портретирование.

Сибирская лингвоперсонология» [2014; 2015], отдельные положения которых

рассмотрены в настоящем исследовании.

Н. Д. Голев [Голев 2007] выделяет два аспекта лингвоперсонологии, которые

коррелируют, как отмечает Н. В. Мельник, с двумя подходами к исследованию

языковой личности: «дедуктивным (с позиции личности) и индуктивным (с

позиции языка) [Карасик 2004]: персонология в лингвистическом измерении и

лингвистика в персонологическом измерении» [Мельник 2011; Мельник 2014: 34].

1. Первый аспект лингвоперсонологии – персонология в лингвистическом

измерении – представляет собой аспектуальное направление персонологии как

науки о личности. Предметом изучения в данном аспекте лингвоперсонологии

является языковая личность.

По Ю. Н. Караулову, существует три степени абстрактности языковой

личности:

а) конкретная языковая личность, например, языковая личность автора

художественного произведения, ученого, известного деятеля, историка

Ю.Н. Фадеенкова [Катышев 2009], элитарная языковая личность [Романова];

б) коллективная языковая личность или языковая личность группы людей. К

данной ступени абстрактности можно отнести профессиональный, возрастной,

социальный аспекты описания языковой личности: языковая личность служащего

[Панова 2005]; языковая личность юриста [Кубиц 2005; Лебедева 2009];

в) языковая личность народа или, по Н. С. Трубецкому [Трубецкой 1995],

многочеловеческая или симфоническая языковая личность. Исследованию

Page 19: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

19

национальной языковой личности посвящены следующие работы: [Ким 1999;

Колесов 2006; Шестак 2003]; «общерусского языкового типа»: [Караулов 2004], а

также исследования русской языковой личности в лингвокультурологическом

аспекте: [Воркачев 2001; Городецкая 2007].

Таким образом, персонология в лингвистическом измерении направлена на

решение экстралингвистических задач: языковые параметры дополняют

экстралингвистические характеристики, выделяемые психологами, социологами,

педагогами.

2. Другой аспект лингвоперсонологии – лингвистика в персонологическом

измерении – представляет собой описание языка, текста, речевой деятельности в

персонологическом срезе. Предметом исследования в данном аспекте становится

язык (лексема, текст, речевая деятельность), который рассматривается

посредством характеристик личности. В рамках данного подхода «устройство

языка, разнообразие речевых произведений и типов речевого поведения

объясняется кроме прочего разнообразием языковых личностей, при таком

подходе типы языковых личностей выделяются по результатам исследования,

типологизации (типизации) продуктов речевой деятельности носителей языка –

текстов» [Мельник 2014: 35].

Данная установка позволяет говорить о гипотезе лингвоперсонологической

вариативности языка, предложенной Н. Д. Голевым [Голев 2004], в рамках

которой вводятся понятия лингвоперсонологическое функционирование языка и

затем – лингвоперсонологическое варьирование. Развитие данной гипотезы нашло

свое место в исследованиях Л. Г. Ким, рассматривающей вариативно-

интерпретационное функционирование текста в системно-структурном и

лингвоперсонологическом аспектах [Ким 2009].

Лингвистика в персонологическом измерении предполагает выделение

лингвоперсонологической категории персонотекста как текста в аспекте

проявления в нем свойств языковой личности, которое является предметом

изучения лингвоперсонологии текста [Мельник 2014: 37]. Н. В. Мельник в

параграфе 1.2. «Текстовое моделирование языковой личности» коллективной

Page 20: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

20

монографии [Мельник 2014: 35] выделяет ряд работ, в которых лингвистические

категории рассматриваются в персонологическом аспекте: категория повтора в

исследовании Н. В. Мельник [Сайкова (Мельник) 2006]; грамматическая

категория вида в работе В. О. Макавчик [Макавчик 2006: 223-234]; части речи в

статьях Т. А. Головиной [Головина 2005; Головина 2006]; речевой жанр в труде

Н. Б. Лебедевой [Лебедева 2006а] и т. д.

Глава 1 «Лингвотеоретические основания типологии языковой личности»

монографии [Языковая личность…2014] ориентирована на описание различных

аспектов типологии языковой личности. В связи с данным предметом

рассмотрения главы ставятся проблемы моделирования конкретной языковой

личности и в целом лингвоперсонного пространства. Н. Д. Голев выделяет

оппозицию психолингвистического и социолингвистического аспектов

типологии языковой личности. Содержание моделирования языковой личности в

оппозиционных аспектах, по Н. Д. Голеву, существенно различается. Так,

языковая способность как одна из компонентов структуры языковой личности

представляется компонентом врожденным, «вытекающим из ментально-

психологических особенностей личности, данных ей от природы (в этом плане

языковая личность представляет собой носителя языковой способности

определенного качества)» [Голев 2014:11]; «стихийно (а в отдельных случаях,

возможно, осознанно) обобщенный языковой опыт» – другой компонент

структуры языковой личности, «приобретенный в ходе социальной

коммуникации» [Голев 2014:11].

Н. Д. Голев [Голев 2014] отмечает, что особенно развитым в отечественной

лингвоперсонологии является аспект социолингвистический. Библиография

монографии И. В. Башковой [Башкова 2010] содержит работы, представляющие

разнообразные типы языковых личностей (лингвоперсонемы), портретные

описания языковых индивидуумов (лингвоперсон), а также описывающие типы

языковых личностей или их конкретных представителей – артиста,

государственного служащего, школьника, экономиста и т. п.

Page 21: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

21

Социолингвистический аспект реализуется, например, в статье Н. Д. Голева в

соавторстве с А. В. Кузнецовой [Голев 2009а: 95].

Психолингвистический (особенно ментально-психологический) аспект

отечественной лингвоперсонологии представлен не столь обширно и реализуется

в таких блоках, как онтогенез языковой личности, развитие и возрастные

изменения языковой личности, речетворчество, креативность [Башкова 2010: 179-

182]. Н. Д. Голев отмечает значимую роль К. Ф. Седова в становлении данного

направления. К. Ф. Седов предложил термин «психолингвоперсонология» в

качестве аспектуальной отрасли в учении о языковой личности

лингвоперсонологии [Седов 2008]. Исследователь выделил два направления

психолингвоперсонологии, в рамках которых изучается личность носителя языка:

лингво-психологическая типология языковой личности и лингво-психологическое

портретирование языковой личности, относящееся к лингвистике

индивидуальных различий [Седов 2007]. Психолингвистический аспект изучения

языковой способности широко представлен в монографии и статьях

Л. О. Бутаковой [Бутакова 2011; Бутакова 2014].

Два изоморфных подхода к исследованию языковой личности заключаются в

следующих положениях. Во-первых, создание типологии языковой личности,

основанной на обнаружении ряда особенностей употребления автором

определенных речевых средств в тексте. Данное направление типологии движется

от языка/текста к типу языковой личности, который затем может дополняться

ментально-психологическими характеристиками. Направления «от текста к типу

языковой личности» придерживаются Г. И. Богин, Ю. Н. Караулов и др.;

во-вторых, создание типологии языковой личности, основанной на выявлении

особенностей (гендерных, профессиональных, психических и т. д.) собственно

языковой личности, а также выявление особенностей функционирования

языковых типов в речи. Данное направление осуществляет движение от типа

языковой личности к особенностям его проявления в речевой деятельности и

тексте. Направления «от языковой личности к тексту» придерживаются

Н. Д. Голев, К. Ф. Седов, Л. М. Комиссарова [Комиссарова 2002] и др.

Page 22: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

22

Таким образом, а) персонотекст – результат деятельности языковой личности, в

котором проявляются перечисленные характеристики языковой личности, иначе –

текст таков, потому что такова языковая личность; б) функционирование

персонотекстов позволяет выявить принадлежность языковой личности к

определенному типу.

И. В. Башкова в разделе «Лингвоперсонологические школы Сибири»

коллективной монографии [Башкова 2014: 569] представила обзор истории

лингвоперсонологии, а также существующих направлений

лингвоперсонологических школ Сибири (Томска, Барнаула и Кемерова),

«отличающихся своими целями, задачами, методами и принципами

исследования» [Башкова 2014: 575].

1. Томская диалектологическая школа, представляющая изучение конкретной

языковой личности. Под языковой личностью профессор Е. В. Иванцова

понимает «личность в совокупности социальных и индивидуальных черт,

отраженная в созданных ее текстах» [Иванцова 2002: 10]. Выбор в качестве

объекта лингвоперсонологии конкретной языковой личности Е. В. Иванцова

осуществляет в связи с тем, что «объектом и предметом лингвоперсонологии

В. П. Нерознак называет «частночеловеческую» языковую личность, связывая

изучение «многочеловеческой» языковой личности с лингвокультурологией. Он

противопоставляет две данные области знаний по основной таксономической

единице: в первой из них это идиолект (язык индивидуальной личности), во

второй – полилект (национальный язык как совокупность идиолектов)» [Иванцова

2010: 22-23]. Описывая речь одной языковой личности, носителя сибирских

старожильческих говоров В. П. Вершининой, томские ученые исследуют и

типические, и индивидуальные черты говорящего. Лексикографический аспект

анализа языковой личности становится одним из центральных: создается

«Полный словарь диалектной языковой личности» [Полный словарь… 2006;

Полный словарь… 2007], который содержит всю лексику и фразеологию

идиолекта информанта. Речь реальной языковой личности также изучается в

разных аспектах: речевой этикет, чужая речь в дискурсе языковой личности,

Page 23: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

23

сравнение в речи языковой личности, система речевых жанров и т. п.

И. В. Башкова [Башкова 2014: 578] отмечает, что важным этапом формирования

молодой науки стало издание в Томском университете в 2010 году учебного

пособия Е. В. Иванцовой «Лингвоперсонология: Основы теории языковой

личности» [Иванцова 2010], в котором представлены этапы формирования

лингвоперсонологии, ее терминологический аппарат и т. д.

2. Школа городов Барнаула и Кемерово, разработавшая

лингвоперсонологическую гипотезу языка. И. В. Башкова [Башкова 2014:579]

отмечает весомый вклад в развитие лингвоперсонологической школы монографий

и сборников научных статей: «Становление гуманитарной культуры личности в

системе образования» [2006], «Антропотекст-2» [2006], «Вопросы

лингвоперсонологии» [2007], «Лингвоперсонология: типы языковых личностей и

личностно-ориентированное обучение» [2006], «Лингвоперсонология и

личностно-ориентированное обучение языку» [2009], журнал «Филология и

человек» и т. д. И. В. Башкова отмечает, что «наиболее яркой отличительной

чертой барнаульских и кемеровских исследований является разработка

положений о лингвоперсонологическом функционировании и

лингвоперсонологической вариативности языка, сформулированных идейным

вдохновителем лингвоперсонологической программы <…> профессором

Н. Д. Голевым» [Башкова 2014: 581]. Выше были описаны два аспекта

лингвоперсонологии, выделяемые Н. Д. Голевым и Н. В. Мельник вслед за

В. И. Карасиком. Барнаульская и кемеровская школа разрабатывает положения в

рамках аспекта «лингвистика в персонологическом измерении» [Голев 2007;

Мельник 2014: 35], предполагающем описание речевой деятельности в

персонологическом аспекте. Кроме всего прочего, описываемая школа

отмечается, во-первых, системоцентрическим и антропоцентрическим характером

изучения языка, во-вторых, имеет практический выход – преподавание русского

языка.

Таким образом, лингвоперсонология представляет собой научную дисциплину,

которая рассматривает систему знаний о закономерностях речевого поведения

Page 24: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

24

человека, зафиксированных в его результатах – речевых произведениях разного

типа и прежде всего в тексте, понимаемом как персонотекст.

Существующие направления лингвоперсонологии активно развиваются в

современной научной парадигме. Однако, как нам представляется, необходимо

выделить еще один актуальный аспект линвгоперсонологии, который пока не

получил должного теоретико-методологического развития, –

идентификационный аспект исследования языковой личности, направленный на

выявление качества языковой способности автора текста, способствующей

установлению тождества объектов идентификации.

«Речь и ее продукты – одни из основных средств лингвистической

идентификации, т. к. с их помощью можно проникнуть в сферу внутреннего мира

человека, выявить свойства и способности языковой личности, автора

исследуемого текста» [Напреенко 2014: 17]. Научную основу

«идентификационной лингвистики» составляет «система знаний о

закономерностях речевого поведения человека, обусловливающих

индивидуальность, устойчивость, вариационность письменной речи» [Напреенко

2014: 17]. «Способность языковой личности порождать и воспринимать речь

среди прочего реализуется за счет устойчивых речевых образцов, которые

являются бессознательными маркерами личности» [Напреенко 2014: 17]. В

настоящей работе лингвоперсонология становится методологическим

основанием персонно-текстологического аспекта идентификационного

исследования. Таким образом, портретирование языковой личности является

своего рода предпосылкой идентификации языковой личности, т. к. выделяет ряд

лингвистических особенностей текста, позволяющих отличить его от любого

другого.

Page 25: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

25

1.1.2. Языковая личность и персонотекст как объекты

идентификационной лингвоперсонологии

Понятие «идентификационная лингвистика» включает в себя реализацию

феномена идентификации в лингвистике вообще и в частности идентификацию в

лингвоперсонологии. В последнем случае идентификация становится

аспектуальной разновидностью лингвоперсонологии. Объектами

«идентификационной лингвистики» могут быть: а) текст вообще, текст

безотносительно к личности автора его написавшего; б) текст как воплощенная

языковая личность (персонотекст) и собственно языковая личность (в решении

задачи исследователь может опираться на образ автора – реальный или

подразумеваемый). «При идентификации текста вне обращения к личности его

написавшей речь идет о таком направлении, как синхронная текстология, важной

задачей которой является атрибуция текста. Один из способов атрибуции –

стилометрия – исследование стилистики, включающее статистический анализ»

[Напреенко 2014: 17]. Персонная идентификация («идентификационная

лингвоперсонология») реализуется в решении задачи установления тождества

текста языковой личности его написавшей. Данный тип идентификации сводится

к утверждению, что исследуемый текст написан известным или неизвестным

автором. Идентификация языковой личности «представляет собой разновидность

такого лингвоперсонологического исследования, как портретирование языковой

личности. На основе выявленных параметров <…> создается портрет конкретной

языковой личности» [Напреенко 2014: 17].

Постановка проблемы идентификации персонотекстов, языковой личности и ее

решение важны для построения общей теории лингвоперсонологии и для ее

прикладных отраслей – в частности, для идентификационной лингвистической

Page 26: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

26

экспертизы, необходимой для случаев, в которых нет возможности опереться на

почерк или качественную фонограмму идентифицируемого текста.

В учебном пособии «Лингвоперсонология и личностно-ориентированное

обучение языку» [2009] сформулирована лингвоперсонологическая гипотеза:

«язык устроен так, а не иначе еще и потому, что так устроена персонологическая

сфера» [Голев 2009б: 24]. Языковая личность «осуществляет выбор из

разнообразия средств и способов для выражения разнообразных

коммуникативных намерений и делает этот выбор» [Напреенко 2014: 17] «в

соответствии со своими внутренними личностными потребностями и

способностями» [Голев 2009б: 12]. Выявление параметров, характеризующих

языковую способность, и их сопоставление позволяет идентифицировать

языковую личность и персонотексты.

Понятие языковая личность имеет междисциплинарный характер, т. к. является

объектом изучения психологов, педагогов, социологов, лингвистов: «понятие

языковая личность может служить тем параметром, отношение к которому

выявляет общее и особенное во многих современных лингвистических

концепциях, иными словами, параметром, который объясняет, как разные

направления лингвистики объединяются в единую парадигму знания» [Башкова

2014: 569]. В лингвоперсонологии языковая личность выступает в качестве

основного объекта изучения, однако, как отмечает Е. В. Иванцова, «вопрос о

методологии новой области научного знания, изучающей феномен языковой

личности, пока остается «белым пятном» в ее теоретической сфере» [Иванцова

2008: 27].

В настоящей работе языковая личность вслед за определением А. Н. Караулова

трактуется как носитель языковой способности определенного качества.

«Идентификация языковой личности представляет собой разновидность такого

лингвоперсонологического исследования, как портретирование языковой

личности» [Напреенко 2014: 17]. При портретировании языковой личности

учитываются ее индивидуальные языковые предпочтения: выявленные

особенности конкретной языковой личности позволяют говорить о том, что

Page 27: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

27

наличие определенного рода закономерностей (в частности лексико-

квантитативных) свойственно любому персонотексту. На основе выявленных

качественных характеристик языковой личности проводится ее моделирование,

создается портрет конкретной языковой личности, нередко как языковой

личности, принадлежащей определенному типу. По определению С. В. Леорды,

«речевой портрет – это воплощенная в речи языковая личность» [Леорда 2006].

Е. В. Иванцова в работе «Проблемы формирования методологических основ

лингвоперсонологии» [Иванцова 2008: 33] поднимает проблему методов

исследования языковой личности, которые в настоящее время представляют

собой традиционные общенаучные, сугубо лингвистические, заимствованные из

частных областей лингвистики и собственные специфические методы. Наряду с

описательным, лексикографическим и специфическими методами

лингвоперсонологии (например, метод структурного моделирования) автор

упоминает актуальные для настоящего исследования методы, используемые для

определения авторства текстов, – методы математической лингвистики. Автор

выделяет и распространенный в лингвоперсонологии метод речевого

портретирования, который берет свое начало из речевых портретов персонажей

литературных произведений и воплощается в портретировании различной

направленности1.

Таким образом, Е. В. Иванцова выделяет две методологические установки к

исследованию языковой личности: метод реконструкции языковой личности2

(применяемый для реконструкции обобщенной языковой личности или языковой

личности прошлого) и метод речевого портретирования (обычно используемый

для характеристики современников) [Иванцова 2008: 39]. В настоящем

1 Различные способы портретирования освещены в п. 1.3.2.

2 Метод реконструкции языковой личности «предполагает воссоздание

компонентов ее облика, сведений о которых нет у исследователя» [Иванцова

2008: 39]: биографический метод, метод структурного моделирования и

лингвотеоретической реконструкции.

Page 28: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

28

исследовании наиболее подробно рассматривается метод портретирования

языковой личности в качестве предпосылки идентификационного описания

языковой личности.

В портретировании конкретной языковой личности могут отражаться

различные характеристики личности: гендерные, возрастные, психологические,

социальные и др. Например, осуществляется портретирование

лингвосоционической языковой личности [Замилова 2011], описание речевого

портрета студента-филолога [Солодянкина], экономиста [Махракова 2014] и т. п.

Портретирование языковой личности может решать задачи диагностического1

типа, к которым относятся: место проживания автора текста, профессия, пол

автора по письменному тексту [Ощепкова 2003; Горошко], пол и возраст

[Ермолова 2008а], социальное положение и т. д.

Языковая личность воплощается в тексте, понимаемом в антропоцентрической

парадигме как персонотекст. Анализ персонотекста, позволяющий выявить и

описать характеристики языковой личности, представляющие собой комплекс

индивидуальных особенностей – физиологических, психологических,

социальных, гендерных и др., осуществляется в связи с выдвинутым положением

Ю. Н. Караулова – «за каждым текстом стоит языковая личность» [Караулов 2004:

10]. Персонотекст является «предметом изучения лингвоперсонологии текста –

новой отрасли научного знания, формирующейся в рамках персонологического

измерения лингвистики» [Мельник 2011: 203]. Таким образом, «при

идентификации персонотекста объектом становится текст в аспекте проявления в

нем свойств и способностей языковой личности» [Напреенко 2014: 17].

Персонотекст выступает единством формальных и содержательных

параметров, отражающих индивидуальность его автора. Персонотекст «как

аспектуальная разновидность речевого произведения является репрезентацией

языкового потенциала личности, который реализуется автором в тексте через

1 Более подробно диагностические задачи идентификационной экспертизы

представлены в п. 1.2.2.

Page 29: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

29

языковые характеристики» [Напреенко 2014: 17] в том числе. «Выбор из

бесконечного множества формирует индивидуальные предпочтения языковой

личности – ее идиостиль. За результатами идиостиля стоят варианты качества

языковой способности, которые в дальнейшем обрабатываются личной речевой

практикой и обучением» [Напреенко 2014: 17]. При идентификации текста как

персонотекста «задача лингвиста состоит в том, чтобы извлечь из текста и

характеризовать варианты способностей языковой личности, что позволяет в

дальнейшем при сопоставлении моделировать персонотексты» [Напреенко 2014:

17]. Моделирование текста (в частности лексико-квантитативное) способствуют

дифференциации одного текста от другого и, как следствие, различению одной

языковой личности от любой другой. Конкретные примеры описания

(портретирования) языковых личностей и текстов представлены в п. 1.3.2.

§2. Феномен идентификации в лингвистике

1.2.1. Идентификация, тождество и различие: философское обоснование

Своеобразным эпиграфом к параграфу становится выражение: «Вся история

развития цивилизаций отражается в эволюции языка как эффективном

инструменте идентификации и инфокоммуникации» [Александров 2009].

Феномен идентификации берет свое начало в философии и психологии,

практически же он реализуется в разных научных дисциплинах, что

характеризует его как категорию междисциплинарную. В данном пункте

параграфа обосновывается универсальность феномена идентификации,

обозначается его функционирование в лингвистике.

В научной литературе, посвященной феномену идентификации используется

ряд понятий, требующих описания их взаимосвязи в настоящем исследовании:

Page 30: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

30

идентификация, идентичность, тождество и различие, общее и частное.

Обращение к философским словарям позволяет оценить описываемые категории с

позиции универсальности их применения в разных научных дисциплинах. В ряде

философских энциклопедических словарей понятие идентификация трактуется

посредством понятий тождество, самоотождествление и самоидентификация.

В философском словаре идентификация – «глубинная, трудно

удовлетворяемая потребность человека к уподоблению, к поиску объекта

поклонения» [Философия: Энциклопедический словарь 2004]. В данном

определении понятие идентификация является близким понятиям

самоидентификация и самоотождествление: «он (индивид – наше примечание)

нуждается в системе ориентации, которые дали бы ему возможность

отождествить себя с неким признанным образцом» [Философия:

Энциклопедический словарь 2004]. Идентификация как самоотождествеление

предстает и в другом философском энциклопедическом словаре: [Философский

энциклопедический словарь 1983].

Более широкое определение дается в Новейшем философском словаре (1999):

«Идентификация – 1) осознание, распознание чего-либо, кого-либо; 2)

уподобление, отождествление с кем-либо, чем-либо. В первом значении термин

И. используется в психологии познавательных процессов, моделировании

искусственного интеллекта, юридической психологии и т. п. При этом главное

внимание обращается на процесс сопоставления, сличения определенных

признаков, свойств объектов и установления принадлежности их к одному классу

или различным классам, т. е. определению их сходства или несходства, различия»

[Идентификация].

В статье «Лингвистические и семиотические аспекты конструирования

идентичности в электронной коммуникации» [Макаров] исследуется феномен

идентификации личности в условиях коммуникации в интернете. Авторы

отмечают, что в связи с повышением использования электронной коммуникации

возникает все бо льшая обезличенность текстов: «существует риск забыть о том,

Page 31: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

31

что за напечатанным всегда стоит реальный человек» [Макаров]. Идентификация

личности в статье трактуется как самоидентификация и используется понятие

идентичности.

К. В. Фокина в статье «Самоидентификация как основа моделирования

аксиологической картины мира» [Фокина 2009] рассматривает уровневую модель

самоидентификации языковой личности в эго-текстах, благодаря которой

выявляется специфика ценностных ориентаций представителя творческой

интеллигенции. Автор рассматривает вопрос самоидентификации в рамках

лингвокультурологии, где под самоидентификацией понимается «процесс

достижения тождества с собой, или самоотождествление» (М. А. Щербаков

[Щербаков 1998: 264] цитируется по К. В. Фокиной [Фокина 2009: 264]).

Таким образом, в большинстве философских словарей понятие идентификация

трактуется как «самоотождествление», «потребность человека к уподоблению»,

«отождествление с кем-либо, чем-либо», то есть – самоидентификация. Однако,

употребление термина идентификация в представленных выше значениях

осуществляется исключительно в социологической и социально-психологической

литературе.

Для настоящего исследования в определении, данном в Новейшем

философском словаре (1999), значимым является обозначение процесса слияния

определённых признаков, свойств объектов, «установление принадлежности их

одному классу или различным классам» [Идентификация]. Данный фрагмент

аналогичен поставленным задачам идентификации в настоящем исследовании:

выявление в спорных текстах ряда параметров, которые позволят установить

принадлежность одному или разным авторам, либо установление тождества

текстов.

В указанных словарных статьях употребляется также логическая категория

идентичности, которая, например, в философском словаре [Философия:

Энциклопедический словарь 2004] обозначает «отношение, члены которого

тождественны друг другу (напр., понятия «утренняя звезда» и «вечерняя звезда»

Page 32: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

32

идентичны — обозначают планету Венера); в качестве категории метафизики И.

(тождество) есть характеристика бытия, более фундаментальная, чем различие.

<…> Идентификация исключает различие (ибо исключает иное бытие и, стало

быть, то, что выступает причиной инаковости — изменение)» [Философия:

Энциклопедический словарь 2004]. Согласно данному определению

идентичность и тождество – синонимичны, кроме всего прочего, тождество

представляется категорией фундаментальной. Идентичность, таким образом,

является результатом процесса идентификации.

В энциклопедии [История философии… 2002] идентичность –

«соотнесенность чего-либо ("имеющего бытие") с самим собой в связности и

непрерывности собственной изменчивости и мыслимая в этом качестве. <…>»

[История философии… 2002]. Согласно статье, приведенной в [Истории

философии… 2002], с 1980-х гг. обозначилась тенденция к универсализации

понятия идентификация и преодолению междисциплинарных границ: «В логике

данный термин употребляется в контексте рассмотрения отношений обозначения

(именования), соотносящих имя и объект (в разных вариантах: денотат, десигнат,

предметное значение, референт) и строящихся по принципам однозначности (имя

обозначает только один предмет, что исключает омонимию), предметности (имя

презентирует предмет), взаимозаменяемости (двух имен, обозначающих один и

тот же предмет)» [История философии… 2002].

Значимым является тот факт, что «понятие “идентификация” употребляется при

исследовании знаковых выражений в аспекте установления их равенства

(отношения типа равенства, отношения эквивалентности), что требует их

соответствия условиям (аксиомам) рефлексивности (равенства предмета самому

себе). <…> Отношения этого типа предполагают, что все, что можно высказать на

языке соответствующей теории об одном из знаковых выражений, можно

высказать и о другом, и наоборот (и при этом получить истинные высказывания).

Тем самым построенные разным способом знаковые выражения могут заменять

Page 33: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

33

друг друга в разных контекстах употребления1 (а сами быть обозначены как

равнообъемные, равносильные, равнозначные, эквивалентные, идентичные)»

[История философии… 2002].

Установление отношений равенства предполагает выявление сходства, т. е.

наличия хотя бы одного общего признака у исследуемых объектов, с дальнейшим

анализом выявленных свойств (т. е. «характеристик, позволяющих отличать или

отождествлять их» [История философии… 2002]) и различий (т. е. «признаков,

присутствующих у одних и отсутствующих у других сравниваемых объектов»

[История философии…2002]). Установление тождества следует за признанием

идентичности объектов: отвлечения от того, что нет тождества без различия, а

любое различие также предполагает тождество – «иначе все объекты

превратились бы в один и тот же предмет» [История философии… 2002].

Очевидно, что термины идентификация и идентичность в философии и логике

строятся на философских понятиях тождества и различия. Тождество и различие

– «две взаимосвязанные категории философии и логики. При определении

понятий Т. и Р. используют два фундаментальных принципа: принцип

индивидуации и принцип тождества неразличимых. Согласно принципу

индивидуации <…> всякая вещь универсума обладает уникальными чертами

(наше выделение – Н.Г.)» [Новейший философский словарь 1999]. Согласно

словарной статье «идентичность» в Новейшем философском словаре

[Идентичность 2003], связь понятий идентичности и тождества

«прослеживается и в контексте их употребления в рамках философии»

[Идентичность 2003]. Так, еще от Аристотеля идет традиция понимания

категории тождества как более фундаментальной, чем категория различие.

1 Способность заменять друг друга в разных контекстах коррелирует с

предлагаемыми для идентификации в главе 2 функциональными эквивалентами,

способными заменять друг друга в контекстах и отражающими языковую

способность автора текста в выборе преимущественно одного из них для

употребления.

Page 34: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

34

Однако категория различия представляется немаловажной. В связи со

следующими обстоятельствами. С одной стороны, признание идентификации

объектов представляет установление их тождества, с другой стороны, любые

объекты имеют различия, иначе, как уже было упомянуто, «все объекты

превратились бы в один и тот же предмет» [Идентичность 2003]. Задача, тем

самым, заключается в том, чтобы путем анализа общих (тождественных) и

частных (индивидуальных, специфических) признаков исследуемых объектов

установить преимущество таких характеристик, которые с наибольшей

вероятностью позволили бы установить их тождество или различие.

Категории тождества и различия коррелируют с категориями общего и

частного: «Всякое познание требует четкой ориентации в соотношении

всеобщего (общего), особенного и единичного» [Канке]. Категория общего

представляет собой «род и закон единичных, отдельных особенных явлений. <…>

Общее заключает в себе все богатство особенного», «если общее ориентирует на

поиск законообразного, родового, то единичное связано со специфическим»

[Канке].

Таким образом, настоящее исследование встраивается в логический ракурс

описанных понятий, ориентированных прежде всего на установление категории

схожести текстов и наличия различающих черт, которые исключают полное

слияние объектов. Упомянутая нами категория схожести возникла на фоне

«категории особенности», которая является содержательной «при сопоставлении

текстов разных авторов, осуществленным при максимально тождественных

исходных условиях…» [Голев 2014: 14].

Феномен идентификации реализуется в разных научных дисциплинах,

некоторые из которых рассмотрены также в нашей статье: [Напреенко 2014].

Представление отдельных сторон феномена идентификации позволяет сделать

выводы об универсальности его применения. М. Н. Черкасова отмечает, что

«существуют литературоведческие, компьютерные, психологические,

лингвистические исследования, посвященные идентификации личности автора

Page 35: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

35

текста (В. И. Карасик, М. В. Китайгородская. А. А. Леонтьев, Г. Г. Матвеева,

В. В. Наумов, Н. Н. Розанова)» [Черкасова]. Понятие идентификация выступает в

качестве феномена, берущего свое начало из философской потребности к

уподоблению, и используется в разных научных дисциплинах, сохраняя

содержание – установление тождественности или идентичности.

Идентифицировать объект – значит установить его тождественность самому себе,

что свидетельствует о его неповторимости, индивидуальности, возможности

отличить от других подобных объектов.

Криминалистическая идентификация базируется на индивидуальной

определенности объектов, имеющих устойчивые характерные признаки.

С. М. Потапов представлял идентификацию как универсальный метод познания,

позволяющий отождествлять различные объекты материального мира, события,

различные состояния объектов в любом отрезке времени и на всех стадиях

уголовного процесса. Необходимость выделения различающих параметров

отмечается и в криминалистике как прикладном аспекте лингвистической

идентификации [Потапов 1940]. Таким образом, понятие идентификация является

категорией междисциплинарного порядка.

Идентификация в логике и философии – «установление тождественности

неизвестного объекта известному на основании совпадения признаков»

[Напреенко 2014: 17]. Например, Н. Г. Кожина в статье «Аксиологический подход

к исследованию идентификации современной личности» [Кожина] «в рамках

социально-философского анализа рассматривает вопрос, связанный с ценностным

восприятием современной личности как регулятора процесса аксиологической

идентификации» [Напреенко 2014: 17]. В социальной психологии –

«идентификация – это мысленный процесс уподобления себя партнеру по

общению с целью познать и понять его мысли и представления» [Беседин].

Идентификация в психологии – установление тождества самому себе

(самоидентификация), некоему образцу. Понятие идентификация также

используется в информационных системах, в социальной психологии, в химии и

т. д.

Page 36: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

36

Идентификация в криминалистике «представляет собой установление

тождества объектов или личности по совокупности их идентификационных

признаков. В России учение о криминалистической идентификации было

разработано отечественным ученым С. М. Потаповым» [Напреенко 2014: 17]. В

криминалистике явлением, противоположным идентификации, является

дифференциация, которая решает вопросы установления различия объектов.

Криминалистическая идентификация заключается в «установлении факта

тождества путем взаимного сопоставления объекта и его отображения, иногда с

использованием специальных образцов (экспериментальных пуль, гильз, текстов,

выполненных от руки или на пишущей машинке, и др.). Обязательные требования

успешного отождествления – познание условий следообразования и способа

передачи признаков объекта отражающей среде. <…> При оценке результатов

сравнительного исследования объектов, с учетом природы их различий, качества

и количества последних, возможен один из трех выводов: а) установление

тождества; б) его отсутствие; в) невозможность решить идентификационную

задачу» [Ищенко 2010: 42].

Таким образом, идентификация представляет собой универсальную

междисциплинарную категорию. Данное обстоятельство позволило нам

использовать термин идентификация в качестве обозначения установления

тождества объектов, вследствие чего мы используем в работе словосочетания

идентификационное исследование, идентификационная экспертиза на фоне

существующей в лингвокриминалистике автороведческой экспертизы, которая

обычно имеется в виду, когда объектом установления авторства является

художественное произведение: «Для установления авторства на спорное

произведение может быть назначена судебная экспертиза. В случае если это

литературное произведение, часто назначается автороведческая экспертиза»

[Губаева 2006]. Установление тождества, на которое ориентирована

идентификация, коррелирует с категорией общего, в то время как выявление

различия, иначе – специфического потенциала, позволяет дифференцировать

объекты идентификации.

Page 37: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

37

1.2.2. Идентификации в лингвоперсонологии и юрислингвистике

Феномен идентификации является также одним из важных предметов науки о

языке. Задача идентификации в лингвистике – установление тождества объектов,

атрибуция текста конкретной языковой личности. Непосредственным объектом

идентификации является спорный в плане авторской принадлежности текст

(речевое произведение) или фрагменты текстов. Процесс идентификации в

лингвоперсонологии осуществляется за счет выявления в объекте определенных

признаков, характеризующих языковую способность авторов текстов (языковую

личность). Решить задачу идентификации, таким образом, позволяет «система

знаний о закономерностях речевого поведения человека, обусловливающих

индивидуальность, устойчивость, вариационность» [Напреенко 2014] устной и

письменной речи (лингвоперсонология). В. В. Наумов отмечает, что потенциал

языковой личности реализовывать совокупность языковых средств «в большей

степени вербализуется за счет устойчивых речевых образцов, недавно

получивших название ментального лексикона» [Наумов 2006: 12]. В.В. Наумов

вслед за Э. Сепиром полагает, что «языковые (а точнее речевые. – В. Н.)

привычки являются бессознательными маркерами (индикаторами) личности или

некой части языкового коллектива, объединенной общими (социальными,

возрастными, половыми) признаками. Эта формула индикации личности

«работает» как в анализе механизма порождения речи, так и в процессе

распознавания личности посредством анализа восприятия ею речевого сегмента,

текста» [Наумов 2006: 12]. Таким образом, выявление ряда «индикаторов»

языковой личности способствует установлению тождественности языковых

личностей, написавших текст, или тождественности персонотекстов как

воплощенных языковых личностей.

Письменный текст как идентифицируемый объект выступает единством

«формально-языковых и содержательно-смысловых параметров, отражающих

Page 38: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

38

авторскую индивидуальность» [Губаева 2006]. Языковые структуры текста

содержат информацию о языковых свойствах личности автора; смысловые

структуры – информацию об интеллектуальных свойствах и способностях

личности. С. М. Вул выделяет два вида информации: «основную (содержит

конкретные сведения об авторе: возраст, национальность, место жительства и

т. п.) и дополнительную (содержится в тексте документа в «закодированном»

виде, в его структурных свойствах), указывая, что именно дополнительной

информации следует уделять особое внимание при криминалистической

экспертизе письменной речи» ([Вул 1979] цитируется по: [Потапова 2006: 402]).

Материалом изучения криминалистической идентификации является

письменная речь, которая представляет собой сложную систему, основанную на

комплексе неоднородных языковых и интеллектуальных навыков. Возможности

судебно-автороведческого исследования письменных текстов с целью выявления

характеристик автора документа и установления их тождества базируются на том,

что «текст может рассматриваться как проекция индивидуальной языковой

системы, или шире – психоречевой организации личности» [Теоретические и

методические вопросы… 1977: 12]. Идентификационными признаками

письменной речи являются грамматические, лексические и стилистические

особенности письма. Анализу данных признаков часто предшествует изучение

содержания объекта, однако, «содержание документа – не признак письменной

речи, а сама письменная речь, смысл излагаемой информации. Содержание не

имеет такой четкой индивидуальности, как языковые средства, которыми оно

выражается» [Криминалистика 1993: 250].

Г. Д. Маркова выделяет общие и частные признаки письменной речи, исключая

из своей классификации признаки, относящиеся к содержанию анонимного

документа. Разграничивается пять групп признаков письменной речи

(орфографические, синтаксические, пунктуационные, стилистические и

лексические), в каждом из которых можно выделить общие и частные признаки. К

общим лексическим признакам относятся общий словарный запас, лексика

Page 39: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

39

профессиональная, диалектная, жаргонная, устаревшая, варваризмы,

употребление слов в несвойственном им значении; к частным лексическим

признакам – «привычное употребление слов из перечисленной лексики и частое

употребление одного слова или словосочетания» [Маркова 1956]. В настоящем

исследовании актуальными являются частные лексические признаки,

обозначенные Г. Д. Марковой; в связи с чем осуществляется анализ

моделируемых в идентификационном аспекте текстов, не предполагающий

обращения к их содержанию.

Персонологический подход к идентификации выражается в том, что автор

текста, подлежащего идентификации, предстает уникальным набором

специфических признаков, содержащихся в речевом произведении, которые

позволяют отличить идентифицируемый текст от другого текста и его автора. К

таким специфическим чертам относятся особенности, проявляющиеся на разных

языковых уровнях: лексическом, морфологическом, фразеологическом,

грамматическом, стилистическом. Данные особенности характеризуются

некоторой долей устойчивости во времени, что способствует установлению

идентификации текстов. Выделение специфических признаков объекта

идентификации позволяет идентифицировать эти объекты. Таким образом,

перспектива исследования заключается в выявлении «особенностей текста,

обусловленных особенностями языковой способности автора: языковая

способность обладает своей структурой, включающей собственно языковой,

речевой и интеллектуальный компоненты. Полученные языковые различия мы

можем считать лингвоперсонологическими, то есть такими, которые характерны

для данной “персоны”. Именно такое понимание языковых характеристик как

лингвоперсонологических позволяет говорить об идентифицирующей

возможности данных особенностей как параметров, способных

дифференцировать текст по авторской принадлежности» [Напреенко 2011; 2014а:

545].

Page 40: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

40

Эмпирический выход феномен идентификации находит в юридической

лингвистике, оформленной на стыке юриспруденции и лингвистики. Судебно-

автороведческая экспертиза представляет собой вид криминалистической

экспертизы. М. А. Грачёв в монографии «Лингвокриминалистика» [Грачев 2009]

определяя термин лингвокриминалистика, выделяет три его значения: 1) раздел

науки о языке, изучающий текст в юридических целях; 2) раздел языковедческой

науки, обучающий составлению судебных лингвистических экспертиз; 3) раздел

науки о языке, изучающий социолингвистические аспекты криминальной

субкультуры. Первые два значения, как отмечает М. А. Грачев, Е. И. Галяшина и

Н. Д. Голев имеют в виду, когда используют термин юрислингвистика. В этом

смысле «лингвокриминалистика как раздел науки о языке в широком смысле

преследует цель изучения текста, в узком понимании – составление

лингвистических экспертиз» [Грачев 2009: 7]. Таким образом, юрислингвистика в

эмпирическом аспекте имеет дело с лингвистическими экспертизами, одним из

видов которых является автороведческая лингвистическая экспертиза:

«Экспертиза является инструментом решения коллизионных ситуаций между

субъектами права и, следовательно, инструментом защиты охраняемых правом

интересов личности, общества и государства» [Колдин 2000: 691]. Актуальность

автороведческой экспертизы отмечается исследователями в связи с тем, что

«правонарушения совершаются посредством продуктов речевой деятельности»

[Голев 2002: 9; Голев 2003а].

Криминалистическое исследование документов подразделяется на

почерковедение – изучение особенностей почерка – и автороведение –

идентификацию автора анонимного текста посредством изучения письменной

речи. Почерковедение может дополнять автороведение, если анализируется

анонимный текст, написанный от руки. Т. Губаева, Р. Ситдикова: «Судебная

автороведческая экспертиза (судебное автороведение) традиционно относится к

классу криминалистических экспертиз» [Губаева 2006]. Таким образом, следует

разграничивать фоноскопию, почерковедение и идентификацию. В связи с тем,

что письменная речь «как сложноорганизованная высшая психическая функция

Page 41: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

41

может быть изучена с двух сторон: со стороны графики письма (почерк) и со

стороны реализации собственно речевых навыков (письменная речь)» [Леонтьев

1977: 20], необходимо различать понятия «автор» письменного документа

(прерогатива идентификационного исследования) и «исполнитель» письменного

документа (прерогатива почерковедения, начальным этапом которого является

еще «каллиграфия» – «идентификация исполнителя текста на основе

идентичности в конфигурации букв» [Леонтьев 1977: 21]).

М. А. Грачев определяет автороведческую экспертизу как «исследование

текстов с целью установления авторства или получения информации об авторе

определенного произведения при исследовании текста на основе специальных

познаний в области автороведения» [Грачев 2009: 85]. Н. В. Вязигина

устанавливает ряд задач, решаемых в рамках автороведческой экспертизы: «как

правило, в рамках автороведческой экспертизы эксперту предлагается провести

идентификационное исследование – сравнить спорный текст с образцом, или два

спорных текста между собой, и в результате принять решение, были ли данные

тексты написаны одним и тем же лицом. Вопрос о диагностике тех или иных

характеристик автора текста (пола, а также возраста, уровня и характера

образования, профессии и т.д.) возникает в случаях, когда круг лиц, которые

могут быть его авторами, слишком широк или не может быть четко определен»

[Вязигина].

Идентификационные исследования также необходимы, например, в случаях

нарушения авторского права: «Автору принадлежит исключительное право на

распоряжение произведением, он контролирует его воспроизведение и

распространение, имя автора должно быть указано на каждом экземпляре

произведения, и, наконец, он имеет право на получение вознаграждения за

использование произведения. Поэтому споры об авторстве на то или иное

произведение не редкость в судебной практике по делам о защите авторских прав.

Установление авторства предшествует разбирательству по существу практически

по всем делам данного рода» [Губаева 2006]. Е. И. Галяшина в соавторстве с

Page 42: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

42

Е. В. Приводновой выделяют еще одну области применения автороведческой

идентификационной экспертизы: «Социальный заказ на автороведческие

экспертизы можно объяснить не только усовершенствованием законодательства и

изменением правоприменительной практики, но и тем, что вопрос установления

авторства либо его отрицание может стать актуальным при рассмотрении любого

уголовного и гражданского дела» [Галяшина 2006: 755].

Атрибуция как «одна из областей приложения структурно-вероятностной

модели языка, образованной рамках квантитативной лингвистики» [Баранов

2001а: 41] ориентирована на прямое или косвенное определение авторства текста.

Вопросы поиска автора (атрибуция) связаны с существованием анонимных или

псевдононимных текстов. Е. И. Галяшина выделяет идентификационные и

диагностические задачи атрибуции. Идентификационные задачи позволяют

«а) проверить тот факт, что автором текста является один и тот же человек»

[Батура]; б) «автор, написавший текст, является его настоящим автором»;

в) «подтвердить авторство определенного лица» [Батура]; г) «исключить

авторство определенного лица» [Батура]. Таким образом, идентификационные

задачи связаны «с установлением индивидуально-конкретного тождества

объектов» [Напреенко 2014а: 546]. Они включают в себя решение следующего

круга проблем: а) «установление конкретного автора одного или нескольких

документов; б) исключение предполагаемого автора документов; в) установление

факта создания документа одним или несколькими авторами; г) выяснение того,

является ли исполнитель документа его автором» [Напреенко 2014а: 546].

Диагностические задачи (или неидентификационные) позволяют решать более

частные вопросы, к которым, например, относятся установление пола, возраста

автора текста, его образовательный уровень, а также факт сознательного

искажения письменной речи и т. п. (например, работа [Ширшова]). Судебно-

автороведческие диагностические задачи предполагают, кроме всего прочего,

установление эмоционального состояния автора в момент создания им текста.

Page 43: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

43

Задачи двух типов обозначаются и другими авторами: например, [Грачев 2009;

Вязигина; Горошко]. Е. И. Горошко приводит идентификационные и

неидентификационные задачи, решаемые в рамках судебно-автороведческой

экспертизы как вида криминалистической экспертизы. Неидентификационные

задачи, в свою очередь, подразделяются на классификационные и

диагностические. К идентификационным задачам относится «установление

конкретного автора (или группового авторства, соавторства) текста из ряда

предполагаемых лиц, причастных к его созданию, или, например, отрицание

авторства лица, подозреваемого в составлении какого-либо текста» [Горошко].

Судебно-автороведческие классификационные задачи, по Е. И. Горошко,

посвящены установлению «определенных общих характеристик в отношении

личности создателя текста – его возраст, профессию, родной язык, место

формирования языковых навыков, половую принадлежность» [Горошко].

В статье С. С. Верхозина «К вопросу о лингвотеоретических основах методик

авторизации текста» авторизация текста – «направление прикладной лингвистики

<…> Соотнесение тексту соответствующих ему атрибутов, к которым

причисляется имя создателя, но также жанр, время и место создания текста»

[Верхозин 2013].

А. Н. Баранов выделяет типовые случаи авторизации текста:

1. «Множественная неопределенность: имеется множество текстов или их

фрагментов. Необходимо установить, скольким авторам принадлежат тексты, и

атрибутировать каждый текст конкретному автору» [Баранов 2007: 45];

2. «Сравнение по образцу: имеется пример текста (текстов) некоторого автора Х.

Необходимо установить, является ли он и автором некоторого другого текста

(текстов)» [Баранов 2007: 45]; 3. «Конкуренция образцов: имеются образцы

текстов авторов Х, Y, Z... Необходимо установить, кто из них является автором

текстов Т, Т, ..., Т» [Баранов 2007: 45].

Идентификация представляется нам феноменом универсальным,

охватывающим разные области научного знания и практического применения. В

связи с этим идентификационные задачи, обозначаемые наряду с

Page 44: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

44

диагностическими, представляются частными, выделяемыми конкретно в рамках

атрибуции и лингвистической экспертизы в криминалистике. В настоящей работе

мы актуализируем внимание на феномене идентификации вообще и в частности

на идентификационных задачах в рамках судебно-экспертной практики.

Таким образом, текст, рассматриваемый сквозь призму лингвоперсонологии,

становится материалом проведения идентификационной экспертизы, связанной с

установлением индивидуально-конкретного тождества объектов: «основой для

выявления юридически значимых обстоятельств дела является, прежде всего,

текст, именно из него извлекаются те категории, которыми оперирует

юриспруденция в делах такого рода» [Голев 2002а: 9; Голев 2003]. В данном

утверждении отражается корреляция лингвоперсонологии и юрислингвистики:

рассмотрение текста в лингвоперсонологическом аспекте решает задачу

идентификации в юрислингвистике в том числе.

Раздел «Лингвоперсонология и юрислингвистика» коллективной монографии

«Языковая личность: моделирование, типология, портретирование» [Языковая

личность… 2014: 515-567] направлен на отражение эвристических возможностей

лингвоперсонологических методик. В разделе представлены автороведческие

экспертизы и исследования идентификационного характера, направленные на

диагностику типа языковой личности, позволяющие решать прикладные задачи

юрислингвистики.

Так, в разделе монографии приведена автороведческая экспертиза

«Сравнительное лингвистической и автороведческое исследование трех текстов»

Н. Д. Голева [Голев 2014а: 515], рассмотренная нами в статьях [Напреенко 2014;

Напреенко 2015; Напреенко 2015а; Напреенко 2015б] и в п. 1.3.2. настоящего

исследования.

П. 5.2.4. «Интернет-дневники и проблема идентификации личности»

[Напреенко 2014а: 544] представлена нами − ее целью является разработка

«лексико-квантитативного» способа идентификации личности, в котором в

качестве параметра-идентификатора является параметр частотности употребления

Page 45: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

45

определенного слова в тексте. Представлению данного метода посвящена глава 2

настоящего исследования.

Л. А. Араева и М. А. Осадчий в п. 5.2.3. «Языковая личность экстремиста (о

специфике автороведческой экспертизы по криминальным проявлениям

экстремизма)» [Араева 2014: 533-543] коллективной монографии рассматривают

задачи экспертизы по криминальным проявлениям экстремизма в соответствии с

новой редакцией закона «О противодействии экстремистской деятельности»,

согласно которой уголовно наказуемым является не только публикация, но и

создание текстов экстремистского содержания. В связи с этим авторы статьи

рассматривают задачи и методы судебно-автороведческой экспертизы, обозначая

сложность в выделении определенного метода, способствующего установлению

авторства текста экстремистского содержания. Данная проблема в том числе

вызвана тем, что «в большей степени на выбор доминирующего метода влияет

характер самого следствия» [Араева 2014: 533-543]: автороведческое

исследование в данном контексте имеет определенную специфику, на которую

влияет сам вид преступления. В заключении параграфа авторы отмечают, что в

связи с новой редакцией закона «судебно-лингвистическая экспертиза из разряда

нестандартных, разовых следственных ходов перейдет в разряд обязательных

экспертно-криминалистических мероприятий по расследовании вербальных форм

проявления экстремизма» [Араева 2014: 533-543].

Л. А. Араева и М. А. Осадчий отмечают, что не всегда диагностические задачи

решаются в первую очередь ‒ встречаются случаи, когда «идентификационная

автороведческая экспертиза обходится без подготовительной классификационной

фазы. Такая методика актуальна в случае, когда эксперт-лингвист заведомо не

обладает достаточными знаниями в области психо-, социолингвистики и не берет

на себя ответственность по определению половой, социальной и культурной

принадлежности автора. Такой эксперт основывается исключительно на

лингвистических данных: специалист сравнивает стилевые (лексические и

синтаксические) особенности представленных на исследование текстов и делает

Page 46: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

46

выводы об их идентичном/неидентичном авторстве. Чисто идентификационное

исследование также имеет место в случаях, когда автороведческая экспертиза

основывается на статистическом методе» [Араева 2014: 533-543].

Отметим, что автороведческие задачи могут быть поставлены не только с

целью непосредственного установления авторства, но также могут быть

ориентированы на решение других задач: например, на выявление деятельности

экстремистской направленности, установление факта плагиата и т. п. Применение

автороведческой экспертизы является необходимым в качестве специального

знания, например, при расследовании преступлений, связанных с незаконным

оборотом алкогольной продукции. Автороведческая экспертиза производится

наряду с экспертизами типа судебно-товароведческой, трасологической,

криминалистической экспертизы веществ и материалов с целью установления

автора поддельных сопроводительных документов, черновых записей, этикеток и

т. д. Установление авторства необходимо также, когда документ выполнен под

диктовку, напечатан на принтере и т. п. [Полещук]. В таком случае

автороведческое исследование осуществляется для установления

«образовательного и интеллектуального уровня, профессиональной

принадлежности, происхождения из определенной местности» [Полещук] автора

письменного текста, а также для возможности «судить о факторах, действовавших

на исполнителя в период изготовления (выполнения) документа» [Полещук]

(решение классификационных и диагностических задач автороведческой

экспертизы).

Проблема соблюдения авторского права обостряется все больше в связи с

развитием электронной коммуникации и как следствие преобладанием печатного

способа набора текстов на фоне рукописного. Как литературоведческая (и

историческая) проблема идентификации реализуется непосредственно в

установлении авторства текста. Известны такие литературные тексты, авторство

которых продолжает вызывать сомнения. Например, авторство нескольких глав

романа «Тихий Дон» М. А. Шолохова приписывают писателю Ф. Д. Крюкову.

Page 47: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

47

Почерковедческая экспертиза подтвердила, что черновики романа написаны

М. А. Шолоховым, однако, «вопрос о том, пользовался ли он при этом какими-

либо источниками, остается открытым. Аналогично зарубежные исследователи

подвергают сомнению авторство ряда произведений, приписанных У. Шекспиру»

[Романов 2009].

В настоящее время проблемным аспектом с точки зрения соблюдения

авторского права является и сфера образования: «школьники и студенты всё реже

сами выполняют рефераты, курсовые работы и доклады, предпочитая не тратить

на это время и просто скачать готовые работы из сети Интернет. Использование

методик определения авторства в этом случае позволит более объективно

оценивать учащихся» [Романов 2009].

Таким образом, феномен идентификации реализуется в лингвистике в качестве

процесса установления тождества или различия объектов, под которым могут

пониматься текст безотносительно к личности автора его написавшего

(неперсонная идентификация) и персонотекст и языковая личность (персонная

идентификация). Изучение и выявление «закономерностей речевого поведения

человека, обусловливающих индивидуальность, устойчивость, вариационность

письменной речи» [Напреенко 2014], позволяют находить решение

идентификационных задач, как самостоятельно, так и посредством выявления

диагностических характеристик. В следующих главах более подробно будет

изложено, каким образом феномен идентификации реализуется в

лингвистических и междисциплинарных исследованиях.

Page 48: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

48

§ 3. Методы моделирования текстов и языковой личности в

идентификационном аспекте: оппозиция специальных и универсальных

методов

Разнообразие методов, используемых в идентификационных экспертизах, также

явилось основанием для выявления и представления в диссертационном

исследовании оппозиции специальных и универсальных методов идентификации

текстов в «идентификационной лингвоперсонологии». Правомерность выделения

данной оппозиции подтверждается путем анализа исследований в разных

областях применения проблемы идентификации: например, потретирование

языковой личности как предпосылка идентификации, установление авторства

художественного произведения, идентификация текстов как проблема

юрислингвистики. Идентификационное исследование представляется прикладной

отраслью лингвоперсонологии. Проблема идентификации также входит в область

лингвокриминалистики, а потому ее решение осуществляется и в автороведческой

идентификационной экспертизе. В обоих случаях идентификационное

исследование и идентификационная экспертиза испытывают недостаток

разработки универсальной методологии, что ведет к отдалению от объективности

получаемых идентификационных результатов. Н. Д. Голев отмечает, что «у

лингвистов отсутствуют единые принципы, методы и приемы проведения

экспертизы, отсутствует согласование лингвистических понятий с правовыми,

обозначающими юридически значимые обстоятельства для данной категории

дел» [Голев 2002: 15; Голев 2003а]. Объективность результатов важна как в

идентификации автора текстов, так и в установлении тождества текстов друг

другу, в связи с чем проблема объективности результатов идентификации

обращает на себя все большее внимание исследователей. В следующих частях

параграфа, во-первых, представлена оппозиция существующих методов

Page 49: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

49

идентификации текста и языковой личности, во-вторых, отражен переход от

«ручного» способа идентификации к «конвейерному» в так называемой

«идентификационной лингвистике».

1.3.1. Постановка проблемы методов исследования текста в

идентификационном аспекте

В настоящее время работы по идентификации в широком смысле ее

применения распространены: попытки найти ответ на практический вопрос об

авторстве определенного текста или на теоретический вопрос о методе и способах

проведения данной процедуры встречаются достаточно часто в научной

литературе. С другой стороны, при всем многообразии разработок проблема

универсальности методов установления авторства остается открытой. В качестве

наиболее объективных методов все чаще предлагаются методы, использующие

квантитативные способы анализа единиц письменного текста. Действительно,

такие методы можно считать объективными, т. к. они выявляют объективные

характеристики текста, выражаемые посредством количественных параметров.

Такие методы противопоставляются методам традиционным, этюдным или

«рукописным». Разработки количественных методов по установлению авторства

являются актуальными и потому, что, несмотря на обилие подобных работ,

единой точки зрения об универсальности применения параметров-

идентификаторов пока не существует.

Необходимость получения достоверных результатов идентификации

персонотекста или языковой личности является следствием ряда причин.

Page 50: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

50

Идентификационное исследование направлено на получение достоверного

результата. Отсутствие четких методов проведения идентификационного

исследования, как отмечают многие исследователи (например, [Галяшина 2006а;

Голев 2002а] и др.), ослабляет надежность ее результатов. Решение данной

проблемы в юрислингвистике как практической области реализации

идентификации представляется все более важным еще в связи с тем, что

идентификационное исследование обретает форму лингвистической экспертизы1.

В данном случае речь идет о правовой ответственности2 исполнителя

лингвистической экспертизы: «лингвисты слабо представляют себе, что судебная

экспертиза — это не только лингвистическое исследование, но и особый способ

доказывания, строго регламентированный в гражданском и уголовном процессе»

[Голев 2002: 17]. Н. Д. Голев как один из самых авторитетных учёных в области

юрислингвистики отмечает: «юридическая строгость предполагает, прежде всего,

максимальную (насколько это возможно) правовую однозначность ответа: именно

с целью ее достижения правовые органы и обращаются чаще всего к экспертизе и

именно ее ожидают от экспертов. Другими словами, требование объективности

выводов лингвистической экспертизы потенциально нацеливает эксперта на дачу

вероятностного заключения. Все это говорит о необходимости серьезных научных

исследований по разработке и унификации принципов, методов и приемов

лингвистической экспертизы текстов, включению ее в общую систему судебных

1 Лингвистическая экспертиза может проводиться в рамках уголовных,

арбитражных, гражданских и административных дел. Если экспертиза проводится

в рамках судебного процесса, выдается заключение эксперта, если исследование

осуществляется во внесудебном порядке, то − заключение специалиста-лингвиста.

2 Согласно статье 25 Федерального закона от 31.05.2001 г. «О государственной

судебно-экспертной деятельности в Российской Федерации» [Статья 25] в

заключении эксперта необходимо отразить предупреждение эксперта в

соответствии с Законодательством Российской Федерации об ответственности за

дачу заведомо ложного заключения.

Page 51: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

51

экспертиз и нормативному закреплению ее положения в этой системе» [Голев

2002: 16; Голев 2003а]. Е. И. Галяшина и Е. В. Приводнова выделяют одну из

проблем современного судебного автороведения, рассматриваемую также в

настоящем исследовании: «необходимость выработки среди практикующих

судебных экспертов-автороведов единого подхода к проблемам речеведческих

экспертиз, в том числе и автороведческой, а также восполнение пробела в

методической литературе и экспертной практике. Для этого необходимо

усовершенствовать разработанные ранее методики с целью их адаптации для

исследования новых нетрадиционных объектов автороведения (сетевых жанров

интернет-коммуникации со смешением письменной и устной форм речевого

общения), а также автоматизировать отдельные этапы автороведческого

исследования путем создания электронных блоков формализованных бланков

экспертных заключений» [Галяшина 2006]. Отсутствие единой методики

идентификации отмечает и М. Н. Черкасова [Черкасова]. Автор полагает, что

создание универсальной методики является невозможной в связи с тем, что выбор

методов зависит как от поставленной исследователю задачи, так и от жанра и

стилистического оформления текста. Данное замечание правомерно, т. к.

различная жанровая направленность исследуемых текстов1, как то текст договора

или текст художественного произведения, требует применения различных

методов2.

М. А. Марусенко отмечает, что отсутствие обобщающих работ по методологии

и методики атрибуции объясняется тем, что долгое время проблема атрибуции

1 Пример идентификационного исследования на материале текстов разной

дискурсивной принадлежности представлен в п. 1.3.2. диссертационной работы

[Чернышова 2011; Чернышова 2014].

2 Однако в настоящем исследовании понимание универсального метода имеет

другое основание – оппозиционное к специальному. О возможности его

применения на материале, принадлежащем разным жанрам и стилям, говорить на

данный момент не представляется возможным.

Page 52: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

52

решалась как сугубо текстологическая проблема. Данный факт влияет и на

«появление большого количества произвольных атрибуций, вызывающих

возражения литературоведов» [Марусенко 1996: 3]. Задача атрибуции выступает

как междисциплинарная задача, которая должна решаться, по мнению

М. А. Марусенко, в том числе, с помощью широкого круга естественно-

технических наук, например, статистики и теории вероятностей, теории

коммуникации, семиотики и т. д. М. А. Марусенко отмечает, что проблема

атрибуции может решаться в психологии, искусствоведении, психопатологии и

т. д. [Марусенко1996: 5]. Отметим, что и в современных работах проблема

идентификации и в частности автороведческая экспертиза не представляет собой

исключительно филологическую задачу – «автороведческая экспертиза юристами

рассматривается лишь как один из разрядов криминалистической экспертизы»

[Грачев 2009: 21], с которой ее объединяют общие черты: «известно деяние

(текст), необходимо найти лицо, совершившее его (автора). При решении этой

задачи возникают две проблемы: нужно исключить всех ложно подозреваемых

лиц и обнаружить истинного виновника» [Марусенко 1996: 5].

Отсутствие объективных и возможно однозначных результатов идентификации

связано с отсутствием установленного алгоритма проведения

идентификационного исследования, основанного на утвержденном наборе

параметров идентификации и ограниченном объеме речевого произведения,

предложенного для идентификации: бо льшая часть работ представляет собой

субъективный анализ выявленных исследователем индивидуальных особенностей

текста.

В современных исследованиях, предпринятых с целью совершенствования

лингвистической идентификационной экспертизы, выделяются задачи,

направленные на решение проблемы достоверности методов идентификации:

а) необходимость преодоления субъективного характера большинства методов

идентификации текстов с целью их объективизации, б) необходимость и

возможность создания универсального метода идентификации, в) выявление

Page 53: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

53

критериев отбора количественных параметров идентификации и в результате –

создание автоматизированных методов исследования [Напреенко 2015б]. Таким

образом, осознание требуемой объективности результатов идентификации

коррелирует с осознанием необходимости создания универсального метода1.

Процесс идентификации реализуется в двух направлениях.

Идентификационные исследования на основе содержательных характеристик

(содержательно-идейный и документальный анализ [Ефременко 1960; Штокмар

1960]) текста чаще всего строятся по принципу выделения в текстах

грамматических или семантико-стилистических особенностей. Так, для каждого

текста или группы анализируемых текстов всякий раз формируется свой набор

параметров идентификации. Такой тип исследования можно считать этюдом или

портретным очерком, если речь идет об идентификации личности.

В это же время ряд исследователей предлагает использовать нефилологический

аппарат описания языковых особенностей текста с целью достижения большей

объективности получаемых результатов. Речь идет о применении

количественного анализа лингвистических параметров, к которым относятся,

например, «лингвистические спектры» [Морозов 1915], «формальные

характеристики текста» [Батов 1975; Батов 1977], лингвистическая статистика

[Ароцкер 1966] и другие, которые будут описаны в следующих пунктах

параграфа.

Л. А. Араева, М. А. Осадчий в работе «Языковая личность экстремиста (о

специфике автороведческой экспертизы по криминальным проявлениям

экстремизма)» определяя задачи и методы автороведческой экспертизы отмечают,

что «методические вариации судебно-автороведческой экспертизы обусловлены

не только и не столько знаниями и навыками специалистов. В большей степени на

выбор доминирующего методы влияет характер самого следствия» [Араева 2014:

1 Теоретическое обоснование универсального метода идентификации описано в

п. 1.3.4., опыт практической реализации представлен в главе 3.

Page 54: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

54

535]. Речь идет в том числе об объеме исследуемого спорного текста. Очевидно,

что для успешного применения статистического метода необходим достаточно

большой объем текста.

Вопрос о необходимости перехода от субъективных методов определения

автора (атрибуции литературных произведений) к каким-либо более объективным

поднимал В. В. Виноградов: «субъективные методы определения автора отжили

или, во всяком случае, отживают свой век. Осуществленные с применением

субъективно-эстетических или субъективно-психологических, а также

субъективно-идеологических приемов удачные, т.е. оказавшиеся правильными,

атрибуции – результат интуиции или личной одаренности изыскателей, а не итог

правильно найденного пути поисков и открытий в области изучения проблем

«авторства» [Виноградов 1961: 159]. В. В. Виноградов отмечал интерес к

статистико-лингвистическим и статистико-стилистическим методам атрибуции

художественных произведений, однако, как замечает М. А. Марусенко

[Марусенко 1996], в то время еще не было определенной точки зрения на методы

подобного типа. Критическое отношение к возможностям использования

статистико-вероятностных методов установления авторства оформляется в связи с

выходом работы Н. А. Морозова «Лингвистические спектры» [Морозов 1915],

которая вызвала много несогласий как со стороны литературоведов (пр., [Сеземан

1918]), так и со стороны математиков (пр., [Марков 1916]).

Решение проблемы атрибуции часто носит субъективный характер,

проявляющийся в выделении черт индивидуального стиля автора текста и, как

следствие, в осуществлении «субъективно-мотивированного приписывания

анонимных произведений тем или иным авторам» [Марусенко 1996: 7].

М. А. Марусенко заявляет о трудности выявления объективного параметра

атрибуции типа отпечатка пальца, утверждающего авторскую принадлежность,

например, литературного произведения. В. Фукс предлагал такие параметры,

которым должен обладать текст для его объективного отнесения к определенному

автору:

Page 55: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

55

1) стилевые характеристики должны сохраняться у автора на протяжении всей

жизни неизменно, как дактилоскопический узор пальца человека;

2) данный неизменный «отпечаток» должен однозначно выделять

определенного автора среди других;

3) «отпечаток» должен быть легко выделяем в объекте (тексте) ([Фукс 1975]

цит. по [Марусенко 1996]).

М. А. Марусенко, оценивая параметры, предлагаемые В. Фуксом, отмечает их

противоречие: при бесспорности двух последних параметров, первое условие

«противоречит данным, устанавливающим эволюцию параметров авторского

стиля во времени» [Марусенко 1996: 8]; кроме прочего, «сложилось убеждение,

что литературного «отпечатка пальца», который удовлетворял бы этим трем

условиям вместе, не существует» [Марусенко 1996: 8].

Ю. А. Тамбовцев, А. Ю. Тамбовцева и Л. А. Тамбовцева также относя

проблему установления авторства в область криминалистики, выделяют

параметры, предлагаемые В. Фуксом для идентификации. Параметр, согласно

которому «отпечаток» автора должен быть выделяем в объекте, определен

авторами как такой, который «должен быть легко опознаваем по форме и

подсчитан» [Тамбовцев 2008: 89]. Однако вывод о том, что литературного

«отпечатка» быть не может авторы предлагают решать путем исключения «всех

ложно подозреваемых лиц» и обнаружения «истинного «виновника» [Тамбовцев

2008: 89], что является уделом исследователей в области литературоведения

(материалом для установления авторства в указанной работе явились спорные

произведения И. А. Крылова)1.

Первое условие («стилевые характеристики должны сохраняться у автора на

протяжении всей жизни неизменно» [Фукс 1975]), предлагаемое В. Фуксом,

действительно является неоднозначным. Существует мнение относительно

устойчивости авторских особенностей на протяжении всей жизни, согласно

1 О методе, применяемом в работе [Тамбовцев 2008], – в п. 1.3.4.

Page 56: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

56

которым эти самые устойчивые параметры содержатся исключительно на уровне

«тех составляющих речи, которым автор не уделяет особого внимания»

[Марусенко 1996: 8] – частицы, междометия.

Проблема устойчивости авторских особенностей во времени поднимается в

работе Ю. Н. Павлова и Е. А. Тихомировой [Павлов 2011]. Авторы работы

отмечают, что правило «чем больше выборка, тем точнее оценка среднего» не

совсем правомерна, т. к. «совершенно очевидно, что все произведения автора

написаны в разное время и временной интервал между публикациями порой

составляет десятки лет» [Павлов 2011: 1]. Данное утверждение авторы

иллюстрируют творчеством Ф. М. Достоевского: «свой первый роман “Бедные

люди” 25-летний Ф. М. Достоевский опубликовал в 1846 году, а последний –

“Братья Карамазовы” в 1881 году, когда ему было уже 60 лет. В некотором

смысле это два разных человека, поскольку с течением времени писатель (как и

всякий другой человек) приобретает жизненный опыт, у него расширяется

кругозор и образованность, изменяются вкусы и суждения и, наконец, сам словарь

русского языка претерпевает за это время небольшие, но изменения» [Павлов

2011: 1–2]. Авторы ставят целью своего исследования оценить устойчивость

авторских словарей во времени.

Изменчивость слов (спряжение, склонение, числа), являющаяся проблемой при

автоматизации поиска слов в исследуемых текстах, решается автором путем

выделения в словах их основ – неизменяемой части слова. Авторы

проанализировали относительные частоты наиболее часто встречающихся слов

(сто слов по каждому автору) в текстах Ф. М. Достоевского (общий объем слов

29и произведений – 28 481 слов) и М. Горького (общий объем слов 31го

произведения – 29 164 слов) и обнаружили, что относительные частоты

одинаковых слов в произведениях авторов значительно различаются. Данный

вывод важен и в контексте настоящего исследования: относительные частоты

наиболее часто встречающихся слов в текстах, принадлежащих разным авторам,

Page 57: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

57

контрастно различаются и могут способствовать установлению тождества или

различия текстов и авторов по текстам.

Следующим этапом исследования Ю. Н. Павлова и Е. А. Тихомировой [Павлов

2011] является анализ устойчивости употребления слов человек и общий за все

время творчества Ф. М. Достоевского и М. Горького. Ю. Н. Павлов и

Е. А. Тихомирова отмечают неустойчивость и изменение частоты встречаемости

указанных слов во времени (от ранних произведений авторов к более поздним).

Средние значения относительных частот данных слов у разных авторов также

различны. Исследование показало, что большой процент неразличимых слов

лежит в пределах самых частотных слов, в связи с чем авторы приходят к выводу

о том, что метод частотных словарей не достаточно надежен1.

В диссертационной работе идентификационному исследованию подвергаются

интернет-дневники, обладающие характерными чертами жанра естественной

письменной речи, в связи с чем наиболее актуальной представляется позиция

Н. А. Морозова, который еще в 1915 году в качестве единицы идентификации

брал наиболее часто встречающиеся и общие «для всех родов литературы» слова,

т. е. служебные, или, по терминологии Н. А. Морозова, распорядительные

частицы – союзы, предлоги, местоимения и т. п. Сравнивая, например,

употребление союзов потому что и так как, автор отмечал их «способность к

взаимозаменяемости почти в каждой фразе и в то же время разное предпочтение у

разных авторов при их употреблении. Причина того, что одни авторы почти

исключительно употребляют потому что и редко вспоминают о существовании

так как, называются чисто машинальными причинами, обусловленными целым

1 Данный вывод о ненадежности использования метода частотных словарей в

некоторой степени опровергается настоящим исследованием, согласно которому

ранжирование текста, воплощенное в формате словника, отражает языковую

способность личности: общие и единичные проявления идентификационных

признаков в текстах.

Page 58: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

58

рядом предыдущих внешних и внутренних лингвистических влияний, ушедших

от нас уже давно в область бессознательного» [Морозов 1915: 94].

С. С. Верхозин отмечает, что «на сегодняшний день методы атрибуции текста

отличаются большим разнообразием: одни направлены на изучение лексических

показателей, другие на изучение синтаксических или грамматических

характеристик» [Верхозин 2013: 24]. Действительно, «исследователями проблемы

идентификации текстов были предложены различные методы определения

авторства» [Напреенко 2014: 17] на разных языковых уровнях. Чаще всего

отдается предпочтение комплексной лингвистической идентификации,

проводимой в совокупности на нескольких языковых уровнях текста (например,

[Голев 2010]).

Идентификация автора по письменной речи производится на основе

сравнительного анализа грамматических, лексических и стилистических

особенностей проявления языковой способности в исследуемых текстах. Так,

например, изучение лексических признаков1 предполагает выявление характерных

языковых средств и особенностей их использования. К таким языковым средствам

относятся лексика, фразеология и изобразительно-выразительные средства,

изучение богатства речи, употребления определенных слов в речи и т. д. Вместе с

тем в тексте могут выявляться особенности, приобретающие значение как

идентификационные признаки: архаизмы, неологизмы, профессионализмы, слова

из жаргона, диалектизмы.

Экспертная деятельность как прикладная отрасль лингвистики испытывает

потребность в получении объективных результатов исследования, в сведении к

минимуму возможности принятия необъективных решений. Один из возможных

вариантов достижения этой цели – разработка универсальных схем и образцов

экспертизы. В связи с этим «наблюдается повышенный интерес к

1 Настоящее исследование предполагает идентификационный анализ лексического

состава текста.

Page 59: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

59

формализованным методам анализа текстовой информации на основе слабо

контролируемых человеком характеристик текста» [Напреенко 2014: 18], которые,

в отличие от традиционных методов установления авторства, претендуют на

бо льшую объективность результатов.

М. Н. Черкасова в статье «О некоторых спорных вопросах при установлении

авторства текста (из опыта лингвистических экспертиз)» анализируя некоторые

дела о нарушении авторских и смежных прав выделяет следующие методы,

применяемые для установлении идентификации: общенаучные,

общефилологические и частные филологические [Черкасова]. Так, например,

использованный количественно-статистический метод относительно языковых

единиц, использованных в тексте, а затем сравнительно-сопоставительный метод,

позволяющий сравнить частоты в разных текстах, классифицируются автором как

общенаучные методы, который не нуждаются в специальных познаниях в области

идентификации лингвистической направленности. Однако именно

квантитативные и статистические методы на данном этапе идентификационных

исследований характеризуются способностью производить наиболее объективные

идентификационные выводы и впоследствии автоматизировать процесс

идентификации, что побуждает исследователей создавать методы, основанные на

неязыковых характеристик1 (например, [Батов 1977; Верхозин 2013; Верхозин

2013а]).

Анализ существующих методов теоретического и прикладного характера,

проведенный нами, позволил представить в данном параграфе выявленную нами

1 Представлению подобных методов посвящены п. 1.3.3 и п. 1.3.4 настоящего

исследования. Практические разработки представлены в главе 2 и главе 3.

Page 60: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

60

оппозицию специально-ориентированных и универсальных методов1

идентификации текстов и языковой личности по ним.

В лингвоперсонологии – этюдный или интуитивный метод, а в

лингвокриминалистике –специально-ориентированный метод идентификации

представляет собой вариант идентификации текстов и языковой личности на

основе выявления специфических особенностей конкретного текста,

подвергаемого идентификации. Выявленные содержательные особенности текста,

будучи параметрами-идентификаторами, способствуют установлению его

тождества или различия с другим текстом.

В настоящее время идентификационные исследования на основе

содержательных характеристик текста чаще всего строятся по принципу

выделения грамматических или семантико-стилистических особенностей с

дальнейшим сопоставлением этих особенностей и установлением

принадлежности текстов одному или разным авторам. Таким образом, для

каждого текста или группы текстов всякий раз формируется свой набор

специфических признаков – параметров идентификации. Идентификационное

исследование такого рода носит «штучный» характер и может быть названо

этюдным. На этом фоне возникает теоретико-методический вопрос: можно ли

создать универсальный алгоритм идентификации текста, который позволил бы от

«штучного» принципа и ручной работы перейти к «конвейерному» принципу.

Универсальный метод идентификации текста и языковой личности

представляет собой вариант идентификации на базе квантитативного и

статистического анализа слов. Под определением слова универсальный в

философском словаре понимается «всеобщий, всеохватывающий,

разносторонний, относящийся к универсуму» [Философский энциклопедический

1 Специально-ориентированные методы объединяют портретирование и

юрислингвистические исследования; универсальные – квантитативное и

статистическое моделирование и юрислингвистические исследования.

Page 61: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

61

словарь 2010]. Важным в данном определении является понимание всеобщности,

которое вписывается в наше представление метода идентификации как метода

универсального. В настоящем исследовании универсальный метод

осуществляется в рамках конкретного идентификационного лингвистического

анализа и обладает некоторыми особенностями: а) предполагает применение

квантитативных и статистических методов, б) применим на разных материалах,

в) подвергает анализу либо весь текст, либо один из его уровней без выявления

единичной спецификации, какая есть в специально-ориентированных подходах1.

В данном методе важным являются формализация и универсализм, которые

реализуются в представлении слова как знака (без обращения к его значению и

смыслу), использовании каждого знака в качестве параметра-идентификатора, а

также исключении различия омонимов и многозначных слов.

Выявленная оппозиция является фундаментальной для настоящего

исследования. В следующем параграфе будет приведен анализ существующих

разработок идентификационных методов каждого вида, а в главе 2 и главе 3

представлены разработанные нами методы установления тождества объектов в

рамках описанной оппозиции методов идентификации текстов.

Проблема универсальности и универсальных методов ставится в разных

науках, в том числе, в лингвоперсонологии. Например, проблема универсальности

типологии языковой личности ставится в работе Н. Д. Голева и А. В. Кузнецовой

(А. В. Замиловой): «до сих пор отсутствует универсальная, системная типологии

языковой личности, в которой акцент делался бы не на индивидуальное

проявление языковых черт, а на типичное…» [Голев 2009а: 95]. А. В. Замилова

осуществляет лингвосоционическое моделирование русской языковой личности

посредством последовательного перевода ментально-психологических

характеристик в лингвистические, подборе проявлений психических свойств,

характеризующих определенный социотип, которые воплощаются в языковых

1 Например, разница между квантитативным анализом употребления служебных

слов в тексте и анализом синонимии или антонимии между служебными словами.

Page 62: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

62

формах [Замилова 2011]. О необходимости универсального описания языковых

личностей говорит К. Ф. Седов: «изучение языковой личности всегда

сталкивается с проблемой определения меры единичного и общего, типического и

уникального, индивидуального и коллективного в объекте исследования. Эта

проблема вызывает необходимость создания классификации языковых личностей

на основе особенностей речевого поведения разных носителей языка» [Седов

2004: 6].

На современном этапе разработок методов идентификации напрашивается

синтез методов двух типов, специально-ориентированных и универсальных, с

целью достижения достоверности результатов исследования. С. С. Верхозин

отмечает, что «использование методов установления авторства, основанных на

анализе формальных характеристик, или, наоборот, на чисто стилистическом и

литературном анализе текста, не представляется возможным» [Верхозин 2013:

23]. В связи с чем некоторые исследователи совмещают «качественные методики

и количественные» [Верхозин 2013]1, дополняя результаты анализа каждого из

методов. С. С. Верхозин также отмечает, что формальные методы определения

авторства кажутся более объективными, т. к. «позволяют установить некоторые

языковые явления, которые очень трудно, если вообще возможно подделать, как

то процент использования автором служебных слов» [Верхозин 2013: 23].

Таким образом, мы отмечаем смену приоритетов в выборе методологии

идентификации: все чаще исследователи обращаются к использованию

квантитативных методов, среди которых пытаются найти наиболее эффективный.

В следующих пунктах параграфа будут представлены исследования и разработки

методов идентификации языковой личности и текстов двух типов.

1 В нашей терминологии – специально-ориентированные и универсальные. Однако,

оппозиция качественных и количественных методик не в полной мере

тождественна оппозиции специально-ориентированных и универсальных.

Page 63: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

63

1.3.2. «Этюдное» индивидуализированное описание языковой личности и

персонотекста

Большинство лингвистических исследований строится путем выделения в

анализируемых текстах специфических параметров, позволяющих при

необходимости установить тождество объектов идентификации. Специально-

ориентированные методы идентификации текстов представляют собой

интуитивные исследования по типу портретных очерков (этюдов), в которых

каждая ситуация стимулирует применение методик, вытекающих из

специфических возможностей идентифицируемых текстов. Таким образом,

каждое идентификационное лингвистическое исследование, каждая

идентификационная лингвистическая экспертиза представляет собой единичное

исследование, которое анализируя определенный текст, применяет методики,

разрабатываемые непосредственно для анализа конкретного текста. Такого рода

описание конкретных языковых личностей и их типов в лингвоперсонологии, как

уже было сказано, получает название «портретирование». В связи с тем, что

методика идентификации создается каждый раз для конкретного текста, встает

вопрос о подходах и методах реконструкции языковой личности, частичное

решение которого является основной целью исследования в параграфе.

В настоящем диссертационном исследовании «языковая личность

рассматривается как носитель комплекса лексико-квантитативных особенностей,

на основе которых моделируется конкретная языковая личность. При таком

подходе, во-первых, актуализируется специфический тип моделирования

личности по тексту, который мы определяем как идентификационный. В этом

случае некоторый текст или фрагмент текста выступают в качестве образца, а

другой либо идентифицируется как тот же текст (часть того же текста) или как

текст, авторство которого принадлежит той же языковой личности. В последнем

Page 64: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

64

варианте, как отмечено выше, текст рассматривается исследователем как

персонотекст. Во-вторых, собственные языковые особенности (в нашем случае

лексические) предстают в максимальной обобщенной форме существования,

которую представляют количественные характеристики текстовых лексических

единиц. Они заслуживают отдельного обсуждения» [Напреенко 2015а].

Примеры «очеркового» портретирования языковой личности уже довольно

многочисленны – это портреты языковых личностей конкретных людей разных

профессий, возрастов и эпох или портреты языковых личностей персонажей

художественных произведений и т.п. Анализ существующих способов

портретирования языковых личностей, приведенный в настоящем параграфе,

представлен также в нашей статье [Напреенко 2015а]. При портретировании

языковой личности учитываются ее индивидуальные языковые предпочтения,

которые предстают как качественные характеристики языковой личности. Так, в

упоминаемой монографии1 [Лингвоперсонология… 2006] имеется глава 3

«Типология и портретирование языковой личности» (с. 143 – 214), посвященная

этому направлению лингвоперсонологии. Ее раздел 3.1.2. «Опыты речевого

портретирования» отражает результаты исследования языковой личности наших

современников, проведенного К. Ф. Седовым – женщин, филологов,

преподавателей [Седов 2006]. Автор пишет, что созданные портреты «не

претендуют на исчерпывающую полноту; они представляют собой своего рода

контурные наброски наиболее показательных особенностей речевого

поведения носителей языка»2 (выделено нами – Г.Н.) [Седов 2006: 167].

1 Анализ главы «Типология и портретирование языковой личности» монографии

[Лингвоперсонология… 2006: 143-214] частично представлен в наших статьях

[Напреенко 2015], [Напреенко 2015а].

2 Е. В. Иванцова отмечает, что при портретировании, осуществляемом на

отдельном уровне языка, некоторые авторы «определяют жанр описания как

''штрихи к речевому портрету'' или ''фрагменты портрета''» [Иванцова 2008: 37].

Page 65: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

65

Основные параметры описания «”объектов” изображения»1 [Седов 2006] –

социально-психологические характеристики, особенности речевой культуры

(элитарный, среднелитературный, литературно-разговорный, фамильярно-

разговорный типы [Седов 2006]), особенности поведения в экстремальных

ситуациях общения (типы коммуникативных стратегий), организация дискурса,

стилистические регистры.

«Более аспектуализированны очерки речевого поведения персонажей

тургеневских рассказов «Хорь и Калиныч» и «Певцы», написанные

Н. Б. Лебедевой [Лебедева 2006]. В них ставится акцент на зависимость поведения

героев названных рассказов от коммуникативной ситуации. Автором выявляются

коммуникативная цель (например, информативная), коммуникативно-речевое

поведение (например, взаимодействие с коммуникантом), лингвистические

признаки речи (которые рассматриваются «с точки зрения отбора языковых

средств для реализации речевой деятельности (идиостиль), а именно –

использования лексических, морфемных и синтаксических средств» [Лебедева

2006: 202]) персонажей рассказа И.С. Тургенева. Н. Б. Лебедева соотносит

персонажей рассказов с соционическими типами личности «Максим» (Хорь) и

«Есенин» (Калиныч), которые, по мнению автора, «наиболее характерны для

русского национального “типологического пейзажа”» [Лебедева 2006: 206], а

персонажи Хорь и Калиныч «являются ядерными типами русской речевой

личности» [Лебедева 2006: 206]» [Напреенко 2015].

«Ряд исследований языковой личности осуществляется в аспекте ее

метаязыковой деятельности» [Напреенко 2015]. Данный тип описания языковой

1 Примечательно, что К. Ф. Седов в своем исследовании при создании речевого

портрета современников употребляет выражения «речевые портреты,

нарисованные нами» (выделено нами - Г.Н.), «объектов изображения»

(выделено нами - Г.Н.), которые, как нам кажется, точно характеризуют характер

методологии портретирования, обозначенный нами как «этюдный».

Page 66: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

66

личности представлен в главе 4 монографии1 «Обыденное метаязыковое

сознание: онтологические и гносеологические аспекты» (ч.1.). Такой способ

портретирования языковой личности базируется на основе выявления

особенностей их метаязыкового мышления и метаязыкового дискурса

[Обыденное… 2009: 267-371].

Среди них портрет Георгия Георгиевича Зубкова [Зубкова 2009] – яркого

представителя советской эпохи, автора большого письменного наследия (писем,

воспоминаний). Авторы раздела описывают творческую личность Г. Г. Зубкова в

аспекте его метаязыковой рефлексии относительно ряда знаменательных слов

разных частей речи, фразеологизмов, пословиц и т. п. Например, анализируются

способы толкования Г. Г. Зубковым слов война, Родина, имени Рая,

наименования села Павшино и т.д., которые осуществляются посредством

явления звукосимволизма и механизма внутренней формы слова. Авторы создают

портрет языковой личности Г. Г. Зубкова путем выявления и описания его

метаязыкового сознания, которое «есть прежде всего отражение реальной

действительности» (выделение Л. Г. Зубковой и Н. Г. Зубковой) [Зубкова 2009:

297] и в котором «находит отражение также диалогическая природа человека и

его языка» [Зубкова 2009: 297].

Проблематика раздела монографии [Обыденное… 2009: 299-312], написанного

П. А. Катышевым и С. В. Оленевым [Катышев 2009], заключается в

представлении истории как модальности личностного миропонимания на примере

деятельности непрофессионального историка Ю. Н. Фадеенкова. Авторы раздела

подвергли анализу способы этимологического воссоздания Ю. Н. Фадеенковым

имени Сростки, которое «символизирует историческое самосознание автора»

[Катышев 2009: 306], и пришли к выводу, что «Ю. Н. Фадеенков

продемонстрировал личностный вклад в историческое понимание языкового

1 Анализ главы монографии [Обыденное… 2009] частично представлен в наших

статьях [Напреенко 2015], [Напреенко 2015а].

Page 67: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

67

знака, в процессе познания которого субъект приходит к необходимости

осуществлять дальнейшие этимологические изыскания» [Катышев 2009: 308].

Н. Б. Лебедева создает групповой портрет профессиональных юристов

[Лебедева 2009]. На основе анализа ряда юридических текстов автор выделяет

некоторые особенности металингвистического мышления юристов-

профессионалов, к таковым относятся: «книжноцентризм», «проявляющийся в

несколько пренебрежительном отношении к естественному, разговорному языку,

названному «жаргонным» [Лебедева 2009: 317]; наивное этимологизирование как

частный случай «смешения диахронного и синхронного аспектов» [Лебедева

2009: 320] и т. д.

Портрет языковой личности диалектоносителя, созданный Е. В. Иванцовой

[Иванцова 2009], представляет собой исследование индивидуальных

особенностей метаязыкового сознания отдельного индивида. Систематическое

наблюдение над речью В. П. Вершининой (в течение 23 лет) позволил

Е. В. Иванцовой выделить свойства метаязыкового сознания диалектоносителя, к

которым автор раздела относит, например: осмысление основных правил речевой

деятельности, значимых для диалектоносителя, осмысление лексического и

фонетического ярусов языка, высокая степень конкретности и т.п.

Глава 4 монографии «Обыденное метаязыковое сознание: онтологические и

гносеологические аспекты» (ч.1.) завершается портретом ребенка – Светы

Гарганеевой [Гарганеева 2009], созданным на основе анализа ее метаязыковой

рефлексии, функции которой предстают как оценочная (например, исправления

собственных ошибок), гносеологическая (например, поиск внутренней формы

слова) и коммуникативная (например, поддержание контакта).

В портретировании конкретной языковой личности «отражаются различные

характеристики личности (гендерные, возрастные, психологические, социальные

и др.)» [Напреенко 2014]. В статье «Портретирование языковой личности

экономиста (на материале интернет-форумов» [Махракова 2014] создается

Page 68: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

68

комплексный дискурсивный портрет коллективной языковой личности на основе

выявления возрастных, социально-культурных и языковых особенностей.

Примерами моделирования элитарной языковой личности являются

исследование Т. В. Романовой «Языковая личность Д. С. Лихачева как элитарная

языковая личность русского интеллигента» [Романова 2006]; а также

М. С. Силантьевой «О типах языковых личностей в отношении к элитарной

речевой культуре» [Силантьева].

Примером специально-ориентированного типа идентификации текста является

исследование «О доминантных признаках в автороведческой экспертизе: речевая

агрессия как стилевая характеристика говорящего» [Месропян 2012],

представляющее собой лингвистический анализ текста с целью выявления

доминантных признаков стилевой манеры автора. Таким доминантным признаком

является речевая агрессия, с одной стороны, свойственная каждому члену

коммуникации, с другой стороны, имеющая различную степень проявления и

формы выражения у каждого индивидуально. Стилевые манеры автора позволяют

проанализировать другие спорные тексты с точки зрения выявленных

доминантных признаков у исходного текста. Аналогичность доминантных

признаков в разных текстах способствует установлению их тождества

(идентичности).

Параметров, используемых исследователями при создании портрета языковой

личности, множество, однако, данные параметры характеризуются нами как

специфические, то есть характерные для каждого исследуемого текста

индивидуально. Опыты создания очерков-портретов содержатся в

библиографических списках к книгам «Лингвоперсонология: типы языковых

личностей и личностно-ориентированное обучение» [Лингвоперсонология…

2006], «Лингвоперсонология и личностно-ориентированное обучение языку»

[Лингвоперсонология… 2009], а также к монографии И. В. Башковой [Башкова

2010]. Во многих портретах языковой личности анализируются лингвистические

и экстралингвистические параметры: например, языковые особенности,

Page 69: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

69

тематическая представленность, социально-культурные признаки языковой

личности, возрастная отнесенность и т.д. Такие портреты представлены в работах:

Г. И. Богина [Богин 1998], Н. Д. Голева [Голев 2003], Е. И. Ермоловой [Ермолова

2008б], И. Ю. Кречетовой [Кречетова 2001], К. Ф. Седова [Седов 1999],

М. Н. Пановой [Панова 2005]1.

В работе [Иванцова 2008] приводится ряд исследований, в которых

представлены фрагментарный портреты различной направленности. К некоторым

их них относятся: а) портреты в социолингвистическом аспекте – портреты

диалектоносителей [Оглезнева 2004], старшеклассников [Аниськина 2001] и т.п.;

б) портреты в уровневом аспекте, создаваемые при анализе одного из ярусов

языковой системы, – портреты, изображаемые на основе фонетических,

орфографических или других характеристик речи (пример орфографического

способа описания языковой личности представлен в монографии

[Лингвоперсонология… 2006: 49-51]); в) в коммуникативном аспекте – портреты,

создаваемые на основе характеристик речевого поведения; г) генезисный тип

потретирования, воссоздающий «связь между особенностями речи и причинами,

объединяющими своеобразие этих особенностей» [Иванцова 2008: 37; Седов

2006], а также тип недифференциального комплексного речевого портера.

Последний разрабатывается исследователями Томской лингвистической школы и

заключается в системном описании фонетических, грамматических, лексических,

синтаксических и текстовых особенностей идиолекта конкретной языковой

личности. Основы данного типа описания портрета диалектоносителя

представлен, например, в исследованиях Л. Г. Гынгазовой [Гынгазова 2009].

Таким образом, нами проанализированы примеры способов портретирования

языковых личностей в лингвоперсонологических исследованиях.

Портретирование как предпосылка описания языковой личности в

идентификационном аспекте оказывается фактом наблюдения, интуитивного

1 Ряд исследований представлен в библиографическом списке к монографии

[Лингвоперсонология…2006].

Page 70: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

70

выделения значимого языкового материала. Далее проанализированы

непосредственно идентификационные исследования, относимые нами к типу

специально-ориентированных методов идентификации языковой личности автора

текста и текстов относительно друг друга по принадлежности одному или разным

авторам.

Принцип идентификации по типу портретного очерка лежит в основе

лингвистической экспертизы Н. Д. Голева [Голев, 2010]. В результате

использования специального метода идентификации анализ и сравнение текстов в

нормативном аспекте позволяют «реконструировать образ автора исследуемого

текста и отнести языковую личность, стоящую за ним, к определенному

ментально-языковому и психо-языковому типу» [Голев, 2010]. Этот параметр

дополняется культурно-языковым параметром, в частности проводится сравнение

текстов в нормативном аспекте, которое показывает, что имеющиеся ошибки в

обоих текстах могут служить основанием для выводов о тождестве или различии

авторов сравниваемых текстов. Идентификационная лингвистическая экспертиза

также включает в себя анализ орфографических, синтаксических, графических и

т.п. особенностей спорных текстов; на первый план выдвигаются контрастивные

особенности, которые при их сопоставлении позволяют сделать вывод о

тождестве или различии авторства разных текстов.

На сходной основе строится судебная экспертиза Л. Г. Ким [Ким, 2014]. В

исследовании Л. Г. Ким на основе речевого жанра обращения в официальную

инстанцию применен метод реконструкции типа языковой личности по

особенностям лексического, пунктуационно-синтаксического, жанрово-

стилистического анализа текстов, благодаря чему осуществляется идентификация

спорных текстов по принадлежности разным типам языковой личности:

эмоциональному или рациональному.

Примером, когда идентификационная задача является второстепенной,

решаемой в исследовании, является экспертиза Н. А. Кузьминой «Дело о шантаже

и идентификации личности шантажиста» [Кузьмина 2007]. В идентификационном

Page 71: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

71

аспекте актуальным является поставленный эксперту вопрос: «Каковы наиболее

существенные и значимые индивидуальные психолингвистические и

лингвостилистические особенности представленных на исследование письма № 1 в

сравнении с письмами № 2, № 3 и № 4? Свидетельствуют ли указанные особенности

об исполнении писем одним или разными авторами?». Для ответа на данный вопрос

Н. А. Кузьмина использует сравнительный содержательно-языковой подход к

анализу спорных текстов, анализ семантических и лингвостилистических

особенностей документов, а также выделение идентифицирующих семантических

маркеров, отражающих содержание требований в письме, подвергаемом

идентификации.

Т. В. Чернышова в статье [Чернышова 2011], а также в п. 5.2.2. «Описание

дискурсивных признаков спорных текстов как основа установления их авторства»

монографии [Чернышова 2014: 524] для установления авторства текстов

применяет метод выделения дискурсивных признаков спорных текстов (газетных

текстов и sms-сообщений), обобщая теоретико-методические предпосылки

анализа спорных текстов разной дискурсивной принадлежности. Автором

последовательно выделены дискурсивные признаки, характерные для газетных

текстов и для sms-сообщений, анализ которых позволил автору статьи описать

уровень речевой культуры авторов двух текстов. Выявленный уровень речевой

культуры в совокупности с качественно-количественным совпадением в текстах

служебных слов и синтаксических конструкций позволил установить тождество

одних текстов и различие других по принадлежности одному автору.

Электронный ресурс «Судебная лингвистика» [Судебная лингвистика]

представляет различные виды экспертиз: лингвистические, психологические,

экологические, почерковедческие и другие. В разделе «Автороведческая

экспертиза» представлено две экспертизы, которые представляют собой, на наш

взгляд, примеры специально-ориентированного исследования.

1. Автороведческая экспертиза текстов адвоката Б. (в количестве 7 образцов) и

текстов судьи А. (в количестве 3 образца), представляющих жанр юридических

Page 72: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

72

документов: приговоры, надзорные жалобы, ходатайства и т.д. На разрешение

данной экспертизы поставлено два вопроса:

1) Является ли автором текста приговора ZZZ районного суда от ХХ.ХХ.20ХХ

г. в отношении Иванова А.Б. одно лицо, если да, то является ли им адвокат Б. или

судья А.?

2) Имеются ли в приговоре ZZZ районного суда от ХХ июля 20ХХ г. в

отношении Иванова А.Б. признаки разного авторства, которые совпадают с

авторством текстов, составленных адвокатом Б., если да, то какие именно.

Решение двух задач данной экспертизы осуществляется путем анализа текстов

А. и Б. в аспекте лексических, грамматических и синтаксических признаков

авторов, проявившихся в спорном тексте. Эксперты отмечают, что при решении

задач экспертизы признаки, которые устанавливают непосредственное авторство

текстов, и признаки, которые могут иметь отношение к исполнению текстов, не

разграничиваются.

Таким образом, были выявлены некоторые специфические признаки текстов А.,

которые отличают его от текстов Б.: а) запятая после союза и перед причастным

оборотом в случаях, не предусмотренных правилами русского языка; б) часто

встречающиеся уточнения в виде фамилий в скобках; в) часто встречающаяся

конструкция на вопрос…ответил…; г) двойной знак препинания «,-» (запятая и

тире).

Некоторые специфические признаки текстов Б., которые отличают его от

текстов А.: а) в текстах Б. уточнения в виде фамилий в скобках выделены

запятыми; б) в текстах Б., в отличие от текстов А., употребляется слово

неизвестно с вопросительными местоимениями; в) в текстах Б. встречаются

сокращения: др., т.е., т.к. и т.д. Отмечаются также графические различия.

Более подробному анализу подвергся лексический состав текстов А. и Б., по

которым были составлены частотные словари образцов текстов А. и Б. Путем

удалений из частотных словарей некоторых слов (например, слов, которые

Page 73: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

73

отсутствуют в другом спорном тексте, фамилии, имена и т.п.), были оставлены

для исследования только слова, которые являются уникальными для каждого из

анализируемого текста. Многозначные слова подвергаются исследованию, в связи

с тем, что в некоторых случаях авторы текстов употребляют одни и те же слова в

разных значениях. Большое внимание уделяется рассмотрению таких лексем, на

месте которых в другом тексте в аналогичных ситуациях используется иное

слово. Например, ситуация выбора лексем, возможная для автора текста:

вышеперечисленный / вышеуказанный, вышеназванный / приведенный выше;

ситуация выбора употребления разных грамматических форм:

свидетельствующий / свидетельствовавший бы. Далее анализируется

непосредственно спорный текст с образцами текстов А. и Б. на предмет

установления авторства. В спорном тексте выделяются признаки, которые

отождествляют его с текстом Б. (например, оформление ссылки с дефисом) и с

текстом А., выраженные в меньшей степени (например, два уточнения фамилии в

скобках). Кроме прочего эксперты выявляют факт копирования одного фрагмента

текста в разные тексты.

Выводом идентификационного анализа стало предположение о том, что текст

приговора написан не одним, а двумя или более авторами. В спорном тексте были

выявлены индивидуальные особенности, которые отождествляются с некоторыми

фрагментами спорного текста с образцами текста Б. (таких большинство), а также

с образцами текста А.; в некоторых фрагментах установить авторство не

представилось возможным.

2. Другая экспертиза, опубликованная на сайте [Судебная лингвистика],

подвергает идентификации научный текст в качестве материала автороведческой

экспертизы. На рассмотрение данной экспертизы поставлены следующие

вопросы:

1) Имеется ли в тексте У. из файла текст У.doc заимствование чужого текста

(плагиат)?

2) Является ли У. автором текста из файла текст У.doc?

Page 74: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

74

Для установления плагиата необходимо исследовать тексты, преследуя цель

выявления совпадений, в случае установления таковых, необходимо определить

первоисточник текста. Большинство выявленных различий носит характер

редакторской правки: например, размер междустрочных интервалов и т.д.

Различия, выявленные в спорных текстах, представлены экспертом в таблице, с

указанием комментариев специалиста.

Анализ показал, что тексты под условным обозначениями К. и З. являются

первоисточником, а текст У. является плагиатом. Специалистом устанавливается

процентное соотношение наличий заимствования в каждом параграфе текста У.

Таким образом, специалист, отвечающий на вопросы данной экспертизы,

делает следующий вывод: в тексте У. есть фрагменты, которые представляют

собой заимствования из другого текста, а также являются кратким изложением

лекций К. и З. Таким образом, данная экспертиза строилась путем выявления в

тексте совпадений слов и словосочетаний.

Очерковое представление языковой личности предполагает, таким образом, что

для описания каждого песонотекста или двух сравниваемых персонотекстов

создаются индивидуальные комплексы признаков-параметров, вытекающих из их

особенностей, или, иными словами, каждый раз создается «разовая» методика

описания. В связи с этим, возникает вопрос о возможности создания

универсальных методов. Недостатком специально-ориентированных методов

А. Романов считает «высокую вероятность подмены типичных особенностей

индивидуального стиля автора. Кроме того, выявление отличительных черт

авторского языка носит субъективный характер, так как зависит от личности

исследователя» [Романов 2010].

Таким образом, в «идентификационной лингвистике» можно обозначить

тенденцию, двигающуюся в направлении от интуитивных исследований по типу

очерков-портретов ко все более объективистскому исследованию текста по

апробированным схемам на основе количественных параметров. В связи с этим

все более востребовано формально-количественное описание языковой личности:

Page 75: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

75

моделирование языковой личности по тексту на основе комплекса признаков,

рассматриваемых в их количественном проявлении.

1.3.3. Универсальные методы идентификации текстов: теоретические

основания

В данном параграфе представлены теоретические основания существующих

методов идентификации (называемых нами универсальными), и

автоматизированных программ по установлению авторства1. В связи с

дальнейшим освещением методов междисциплинарного характера,

использующих способы и приемы, выходящие за пределы сугубо

лингвистических, необходимо представить различные направления лингвистики,

среди которых актуальными для настоящего исследования являются

квантитативная лингвистика, компьютерная лингвистика, математическая

лингвистика, прикладная лингвистика.

Прикладная лингвистика – одна из актуальных областей современной

лингвистики, представляющая «деятельность по приложению научных знаний об

устройстве и функционировании языка в нелингвистических научных

дисциплинах и в различных сферах практической деятельности человека, а также

теоретическое осмысление такой деятельности» [Баранов 2001а:7].

Значительными работами в этом русле являются, например, «Ведение в

прикладную лингвистику» А. Н. Баранова [Баранов 2001а], в которой подробно

говорится как о прикладной лингвистике, так и о ее отраслях, «Введение в

1 Примеры универсальных методов и автоматизированных программах – в

п. 1.3.4.

Page 76: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

76

прикладную лингвистику» Е. В. Сосниной [Соснина 2012]. В СССР данный

термин с 50-х годов широко употребляется в связи с разработкой компьютерных

технологий, усовершенствованием технических средств и появлением систем

автоматической обработки информации1 (систем информационного поиска,

автоматизированных систем управления, автоматизированных систем обработки

текста и пр.) [Баранов 2001а: 6; Соснина 2012]. Именно в указанном значении

термина прикладная лингвистика используются и такие термины, как

компьютерная лингвистика, вычислительная лингвистика, автоматическая

лингвистика, инженерная лингвистика. А. Н. Баранов отмечает не очень удачное

смешение значений данных терминов, т. к. каждая из этих дисциплин обладает

своим предметом и методами работы. Прикладная лингвистика является более

широким направлением лингвистики, существующим наряду с теоретической

лингвистикой, с одной стороны, с другой, прикладная лингвистика объединяет

такие разделы, как практическая лексикография, проблемы перевода,

юридическая лингвистика, психолингвистика и т. д. В русской традиции принято

именно широкое понимание прикладной лингвистики, на что указывает

А. Н. Баранов в своей монографии [Баранов 2001а].

Активное развитие информационных технологий побудило и развитие

компьютерной лингвистики как направления прикладной лингвистики, возникшее

на стыке информатики и лингвистики, которую А. Н. Баранов определяет как

«широкую область использования компьютерных инструментов – программ,

компьютерных технологий организации и обработки данных – для моделирования

функционирования языка в тех или иных условиях, ситуациях проблемных

областях, а также сфера применения компьютерных моделей языка не только в

лингвистике, но и в смежных с ней дисциплинах» [Баранов 2001а:13]. Первые

эксперименты компьютерной лингвистики связывают с машинным переводом в

начале 50-х гг. 20 века [Соснина 2012]. В область компьютерной лингвистики

1 В зарубежной лингвистике этот термин больше связывается с преподаванием

иностранных языков, преподаванием языка как родного и иностранного.

Page 77: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

77

входят, например, машинный перевод, компьютерная лексикография (подготовка

электронных словарей), автоматическая обработка естественных языков,

компьютерная лингводидактика.

Компьютерная лингвистика охватывает практически все, что связано с

использованием компьютеров в лингвистике: «Термин “компьютерная

лингвистика” задает общую ориентацию на использование компьютеров для

решения разнообразных научных и практических задач, связанных с языком,

никак не ограничивая способы решения этих задач» [Городецкий 1989: 10].

Глобальная информационная среда, возрастающие объемы информации повлияли

на рост автоматизированных информационных систем, оптимизации

информационных процессов и т.п., что повлияло на массовое применение

компьютерных возможностей при изучении языковой системы. Одним из

основных направлением компьютерной лингвистики является автоматическая

обработка языка. С проблемами автоматической обработки текста связаны задачи

машинного перевода, автоматического контент-анализа, авторизации текста,

корпусной лингвистики, компьютерной лингводидактики и т.д. Также «отдельно

в рамках компьютерной лингвистики выделяют задачи <…> использования

автоматической лингвистатистики» [Соснина 2012: 26].

Корпусная лингвистика и компьютерная лингвистика, таким образом, вносят

вклад в квантитативную лингвистику. А. Н. Баранов определяет квантитативную

(количественную) лингвистику как «междисциплинарное направление в

прикладных исследованиях, в котором в качестве основного инструмента

изучения языка и речи используются количественные или статистические методы

анализа» [Баранов 2001а: 38]. Квантитативная лингвистика1 занимается

исследованием процесса изучения языка, структуры естественных языков. Для

квантитативной лингвистики характерно использовать количественные и

1 Квантитативная лингвистика противопоставляется комбинаторной лингвистике

[Пеотровский 1977: 8-9]), основной чертой последней является неколичественный

математический аппарат – математическая логика, теория множеств и т. д.

Page 78: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

78

статистические методы анализа в качестве основного инструмента изучения языка

и речи. Значимым для настоящего исследования является то, что квантитативная

лингвистика исследует язык при помощи статистических методов; её конечная

цель – «сформулировать законы, по которым функционирует язык и, в конечном

счете, построить общую теорию языка в виде совокупности взаимосвязанных

законов функционирования языков» [Левицкий 2007]. Статистический метод

анализа, определяющий статистическую закономерность функционирования

языковой системы, лежит, например, в основе контент-анализа, который часто

используется в политической лингвистике для «выявления структуры и состояния

общественного сознания» [Баранов 2001а:40].

В рамках квантитативной лингвистики выявлены некоторые статистические

закономерности, описывающие определенные языковые законы:

1. «Закон диверсификации: если лингвистические категории (такие, например,

как части речи или грамматические окончания) появляются в различных формах,

то можно сказать, что частоты их появления в текстах контролируются

определенными законами» [Левицкий 2007].

2. «Распределение длин: исследование частот различных языковых единиц с

точки зрения их длин в текстах и словарях регулярно приводит к выявлению

целого ряда распределений в зависимости от изучаемой единицы» [Левицкий

2007]. На данный момент были выведены следующие законы на основании

изучения некоторых единиц:

а) «закон распределения длин морфов;

б) закон распределения длин ритмических единиц;

в) закон распределения длин предложений;

г) закон распределения длин слогов;

д) закон распределения длин слов» [Левицкий 2007];

Page 79: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

79

3. Законы частотно-рангового распределения, заключающиеся в том, что

«практически любая языковая единица подчиняется этим закономерностям»

[Левицкий 2007]. К таковым законам относятся, например, следующие:

а) «Слова в тексте организованы в соответствии с частотой их появления в

тексте, и каждому из них присвоен номер ранга и соответствующая частота»

[Левицкий 2007]. Собственно, это и есть известный закон Ципфа (Джорджа

Кингсли Ципфа), интерпретируя который учеными было предложено большое

количество математических моделей, описывающих отношения между рангом и

частотой. Закон Ципфа: «частота слова обратно пропорциональна их рангу в

списках частотности» [Левицкий 2007] (описание статистических

закономерностей по В. В. Левицкому [Левицкий 2007]). Именно закон частотно-

рангового распределения (и в частности закон Ципфа) является

основополагающей для универсальных (согласно нашей терминологии) методов

идентификации, создаваемых в науке и в настоящем исследовании;

б) подобное распределение также наблюдается между рангом и частотой

звуков, фонем и букв.

4. Закон текстового блока, который заключается в следующем:

«лингвистические единицы (например, слова, буквы, синтаксические функции и

конструкции) демонстрируют определенное распределение частоты в одинаково

больших блоках текстов» [Левицкий 2007].

Таким образом, квантитативная лингвистика

1) «Изучает и эксплицирует лингвистические явления с помощью методов

"количественной" математики» [Нелюбин 2011: 76], противопоставляемой

комбинаторной лингвистике, которая применяет «неколичественный»

математический аппарат.

2) «Может рассматриваться как а) техника лингвистического наблюдения и

описания, обработки данных наблюдения, как б) метод исследования языка и

речи, не обязательно противополагаясь сопоставленному, сравнительно-

Page 80: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

80

историческому и другим методам языкознания, как (в) концепция, как система

количественных идей и представлений об объекте лингвистической науки»

[Нелюбин 2011: 76].

Как уже было сказано, компьютерная лингвистика решает задачи, связанные со

статистической лингвистикой информацией (ее методы используются в

настоящем исследовании), в основе которой лежит предположение о том, что

некоторые численные характеристики и функциональные зависимости между

ними, полученные для ограниченной совокупности текстов, характеризуют язык в

целом или его функциональные стили (публицистический, научный,

художественный и т.п.). Статистическая лингвистика изучает количественные

закономерности естественного языка, проявляющиеся в текстах. Термин

«статистическая стилистика» указывает на то, что «признаки письменной речи,

используемые в целях судебного автороведения, имеют типовые различия в

зависимости от принадлежности текста к одному из стилей литературного языка –

научному, публицистическому, официально-деловому, обиходному (бытовому)

либо художественно-беллетристическому» [Губаева 2006.]1.

Полагаем, что приведенные нами некоторые закономерности

функционирования языка не только отражают строй языка вообще: данные

закономерности проявляются и индивидуально в тексте – в них отражаются

языковые способности языковой личности. Таким образом, частотно-ранговые

закономерности (в частности в настоящем исследовании лексико-

квантитативные и лексико-ранговые закономерности, реализованные в методах

двух типов), с одной стороны, отражают структуру текста, с другой стороны, в

1 При изучении поэтических тексов используются методы квантитативной

лингвистики, образующие направление стилометрия / стилеметрия –

«квантитативное изучение литературы». Развитию направления квантитативной

лингвистики – стилометрии – посвящен журнал «Forensic linguistics. The

Intеrnational. Language and the Law», выходящий в Лондоне с 1994 г. [Губаева

2006.].

Page 81: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

81

аспекте лингвоперсонологии интерпретируются нами как проявления

индивидуальных предпочтений языковой личности в выборе употребления одних

слов перед другими.

Применение количественных методов изучения текста ставит проблему

формализации – «представление какой-либо содержательной области знания

<…> в виде формальной системы или исчисления; связана с усилением роли

формальной логики и математических методов в научных исследованиях» [БЭС].

Значение формализации для современной науки «определяется проектами

«кибернетизации» знания – поиском перехода к машинным методам решения

научных проблем, ранее составляющим прерогативу чисто человеческой

интеллектуальной деятельности. Метод формализации призван сыграть здесь

важную роль, а именно – обеспечить те приемы, следуя которым машины смогут

получать новые результаты, перебирая и выбирая такие варианты, которые не

может перебрать и не привык выбирать человек. Это способствует процессу

приведения наук в строгую систему» [Философия: Энциклопедический словарь

2004]. «В настоящее время наблюдается повышенный интерес к

формализованным методам анализа текстовой информации на основе слабо

контролируемых человеком характеристик текста» [Напреенко 2014; Напреенко

2015]1: «наиболее распространенные методики судебного автороведения

формализованы, что дает возможность автоматизированного выявления и

подсчета идентификационных и диагностических признаков письменной речи с

помощью специальных компьютерных программ» [Губаева 2006].

В связи с постановкой задачи формализации мы сталкиваемся и с проблемой

интерсемиотического перевода – перевода лексем текста (вербальных знаков) на

количественные характеристики (невербальные знаки): «сущность перевода

лежит в основе понимания значения как чисто семиотического факта» [Ахманова

1 Идеальный практический выход формализации лингвоперсонологических

проявлений в тексте – создание компьютерной программы, подробнее о примерах

которой, – в п. 1.3.4.

Page 82: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

82

1961: 18]. В этом смысле «слово» представляет собой лингвистический «знак».

Значение лингвистического «знака» с этой точки зрения, не что иное, как перевод

его посредством другого знака: «перевод всегда предполагает оперирование

определенными знаковыми системами, т. е. имеет знаковую, семиотическую

сущность» [Гарбовский 2004: 34].

Впервые проблема перевода в общесемиотическом плане была поставлена

Р. О. Якобсоном [Якобсон 1985]. Он «различал три способа интерпретации

вербального знака: знак может быть переведен в другие знаки того же языка на

другой язык или в другую, невербальную систему символов»: [Ахманова 1961:

21]. В связи с этим Р. О. Якобсоном [Якобсон 1985] выделяются три вида

перевода:

1) «внутриязыковой перевод – интерпретация вербальных знаков с помощью

других знаков того же языка» (цит. по: [Ахманова 1961: 21]);

2) «межъязыковой перевод – интерпретация вербальных знаков посредством

какого-либо иного языка» (цит. по: [Ахманова 1961: 21]);

3) «межсемиотический / интерсемиотический перевод, или трансмутация –

интерпретация вербальных знаков посредством невербальных знаковых систем»

(цит. по: [Ахманова 1961: 21]).

Различение трех видов перевода Р. О. Якобсоном легло в основу определения

интерсемиотического перевода, данного О.С. Ахмановой в Словаре

лингвистических терминов: «Перевод интерсемиотический – передача данного

содержания не средствами того же или другого естественного («словесного»)

языка, а средствами какой–либо несловесной семиотической системы, такой как

хореография, музыка и т.п., с одной стороны, и информационно-логические языки

– с другой» [Ахманова 1969: 317]. В применении к количественным методам

идентификации языковой личности интерсемиотический перевод – перевод

лексики текста на невербальные характеристики: если используется метод

частотных словарей, то невербальными параметрами становятся порядок слова в

частотном словаре (ранг) и частота употребления слова. Такие квантитативные

Page 83: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

83

данные заменяют лексические характеристики и выступают в роли параметров-

идентификаторов идентифицируемого текста. Таким образом, актуальным для

настоящего исследования, как и для других методов, моделирующих текст для

идентификации путем внедрения невербального аппарата, является

интерсемиотический перевод1.

А. И. Новиков [Новиков 1983] выделяет особенность формализации –

абстрагированность символов от содержания (решение проблемы зависимости

лингвистического содержания и лингвистической формы), которое символы

замещают при формализации. А. И. Новиков писал, что «невозможно добиться

полного абстрагирования от содержания, следовательно, «чисто» формальных

систем не существует. Содержание, как известно, выражается знаковыми

средствами естественного языка, который и становится объектом формализации»

[Богословская].

И. В. Богословская в работе «Текст как объект формализации» характеризует

задачу формализации таким образом: «если учесть, что в основе любого процесса

формализации лежит создание искусственного языка, то перед нами ставится

задача создания искусственного языка для описания формальными средствами

языка естественного» [Богословская: 58].

1 Естественный язык не может полностью быть формализован, в связи с чем

искусственные языки входят в прикладные отрасли лингвистики. Искусственные

языки – «знаковые системы, создаваемые для использования в тех областях науки

и техники, где применение естественного языка ограничено, менее эффективно

или невозможно» (цит. по [Соснина 2012: 29]). К искусственным языкам

относятся языки компьютерного общения, языки информационных систем.

Большую роль в этом играет семиотика как «наука наука об общей теории знака,

исследующая любые знаковые системы как средства обозначения и передачи

значения или информации» [Соснина 2012: 17].

Page 84: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

84

В таком «постоянно снимаемом и вместе с тем вновь возникающем

несоответствии между формализующим и формализуемым содержанием можно

усмотреть диалектическое противоречие – внутренний источник развития, как

самой науки, так и ее логических средств» [Яновская 1972]. Метод формализации

призван дополнять содержательный семантический анализ в науках. При этом,

конечно, не снижается важная в методологическом и эвристическом отношении

логико-математическая работа по созданию «готового для употребления запаса

формальных систем, из которого для любой теории можно было бы выбрать

систему, правильно представляющую результаты опыта» [Богословская: 42].

Более узкое понимание формализации заключается в уточнении «изучаемого

содержания, которое, с одной стороны, делает возможным применение к нему

математических (или подобных математическим, например, формально-

логических) средств, а с другой стороны, само совершается с применением таких

средств» [Формализация].

Возможность формализации и применения математических методов

относительно лексической стороны текста поднимает «проблему строгого

определения зависимости между лингвистическим значением и лингвистической

формой» [Андреев 1967: 3]. Данная проблема разграничения формы и значения

ставит вопрос о возможности формализованного похода в лингвистических

исследовании.

И. В. Богословская [Богословская] на основе книги А. И. Новикова «Семантика

текста и ее формализация» [Новиков 1983] исследует этапы и условия

формализации научно-популярного текста, рассматривает процесс осмысления

текста на основе перехода от его лексико-грамматической структуры к структуре

содержания. И. В. Богословская вслед за А. И. Новиковым отмечает

«абстрагированность символов от содержания, которое символы замещают при

формализации» [Богословская: 89]. Одним из этапов формализации является

выявление соотношения имплицитной и эксплицитной информации, при котором

Page 85: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

85

имплицитная информация (по А. И. Новикову) становится основным

препятствием в процессе формализации.

Для того, чтобы операции из области интуиции перевести в область

логического иррационального, без чего не может действовать ни одна машина,

необходимо, чтобы «каждой минимальной единице значения закономерно и

последовательно соответствовала бы определенная минимальная единица

выражения. Однако в естественном человеческом языке одной минимальной

единице выражения нередко соответствует не одна минимальная единица

значения. Картина еще более осложняется, если учесть, что очень часто одна и та

же минимальная единица значения оказывается воплощенной в совершенно

различных минимальных единицах выражения, например, при существовании в

языке разных типов склонения имен, разных способов выражения одних и тех же

категорий глаголов и т.п.» [Ахманова 1961: 8]. В нашем исследовании данная

проблема решается вслед за работами по проблеме формализации текста: за

единицу анализа принимается «машинное понимание лексемы», которое

исключает разграничения значений омонимов, многозначных слов и

контекстуальных синонимов.

Структурная (дескриптивная) лингвистика считала базисом исследования

исключительно форму: «при осуществлении классификации не должно быть

никакого обращения к значению» [Андреев 1967: 5]. В этом плане структурная

лингвистика потерпела неудачу, а потому стала обращаться к методам других

наук. Н. Д. Андреев об опыте отказа от содержания говорил следующее:

«Отыскивая причину затруднений структурной лингвистики, равно как и причину

того, почему ни алгебра логики, ни теория множеств не вывели ее из этих

затруднений, мы находим пропущенное звено в вероятностных свойствах языка.

При всей важности теоретико-множественных (структурных) и алгоритмических

(трансформационных) характеристик языковых единиц решающими оказались их

статистические характеристики в речи. Именно неучет последних определил

неуспех ранних попыток исследовать план выражения без обращения к плану

Page 86: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

86

содержания» [Андреев 1967: 6]. Однако применить формализованный подход на

практике оказывается делом чрезвычайно трудным. Человеческий язык не

является таким кодом, который предполагает однозначное соответствие

определенного содержания определенному выражению. Отсюда неизбежны

самые разнообразные трудности и осложнения, которые являются допущениями,

возможными при любой разработке подобных методов. Так, в частотном словаре

современного русского языка [Ляшевская] разрешается следующее допущение:

«Поскольку автоматическое разрешение омонимии и интерпретация несловарных

форм допускают определенную, хотя и незначительную, погрешность, омонимы,

входящие в первые 20 тысяч частотных слов, подверглись дополнительной

ручной проверке» [Ляшевская].

Языковые характеристики текста должны быть «подготовлены»

(формализованы) подобным образом настолько, чтобы была возможность их

обработки компьютерными программами и дальнейшего использования для

получения объективного результата. Лингвоперсонология помогает решить эту

задачу. В основе многих формализованных методов лежит зависимость слова и

частоты его употребления в тексте согласно закону Ципфа. Закон Ципфа в 2009

году был учтен в методе шведского учёного Себастьяна Бернгардссона (Sebastian

Bernhardsson) в докторской диссертации «The meta book and size dependent

properties of written language» (2009). «Сущность подхода заключается в изучении

концепта «мета-книги» (meta book) как способа описания зависимости от размера

некоторых статистических свойств, наблюдаемых в книгах» [Верхозин 2013: 25].

Полагаем, что можно говорить о лингвоперсонологических основаниях

следующих выводов: «Шведские физики в своей статье показали, что этот закон

не так универсален, как считал Джордж Ципф. Они обнаружили, что частота

появления новых слов по мере роста объёма текста меняется у разных авторов по-

разному, причём эта закономерность не зависит от конкретного текста, а только

от автора» [Верхозин 2013: 25]. В связи с этим «перспективным видится

использование целого комплекса различных статистических методов,

Page 87: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

87

рассматривающих различные аспекты атрибутируемого текста» [Верхозин 2013:

25].

В результате первого эксперимента в 1959 году по алгоритмизированному

извлечению сведений о языке из речевого массива для оценки статистико-

комбинаторного анализа вообще доказали, что «фундаментально важные для

языка единицы, как морфемы и слово, могут быть извлечены из речи на базе

статистических и комбинаторных характеристик речевых единиц без

предварительного задания их лексических или грамматических значений, без

предварительного задания правильности и неправильности исследуемых

текстовых структур» [Андреев 1967: 8].

Статистико-комбинаторное моделирование успешно решает задачу построения

строго формальной области в грамматике. В. А. Москович отмечает, что «резко

возрастает роль статистических данных как объективного показателя

количественных взаимоотношений между единицами семантики и статистики

речи как метода, позволяющего вскрыть некоторые закономерности

функционирования этих единиц» [Москович 1969: 25]. Статистическая методика

используется В. А. Московичевым при анализе взаимоотношений значений слов в

пределах одного языка или разных языков. В его исследовании ставится задача

характеристики значения слов, их места в семантической системе через

вероятностные параметры. В качестве типового семантического объекта, на

материале которого проверяются различные варианты статистической методики,

избрано поле цветообозначений. На основе этого исследования решаются и

некоторые прикладные задачи: осуществление автоматического индексирования и

построения словарей для систем автоматической обработки информации

[Москович 1969: 25].

Таким образом, необходимо научиться представлять грамматические,

лексические, лексико-фразеологические и другие закономерности языка в таком

виде, чтобы их можно было непосредственно подавать на приборы. Иными

словами, необходимо «расшифровать» те процессы, посредством которых

Page 88: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

88

осуществляется языковое общение. О. С. Ахманова отдает эту роль математике:

«математика с ее неисчерпаемыми возможностями должна дать основания для

гораздо более глубокого проникновения в «механизм» языка и вполне строгого и

логического, вполне «рационального» описания открываемых ею

закономерностей» [Ахманова 1961: 6]. Формализация должна способствовать

автоматизации процесса исследования: полной обработке текстов

компьютерными программами.

Автоматизация судебной экспертизы как одно из кардинальных направлений

совершенствования экспертной практики заключается в применении

математических методов и технических средств, освобождающих эксперта

частично или полностью от непосредственного участия в процессах получения,

преобразования и выдачи вывода анализа.

Проблема изменчивости слов, употребление их в различных формах

(спряжение, склонение, числа) может повлечь за собой проблему автоматизации

исследований, один из способов решить которую заключается в выделении в

словах их основ (неизменяемую часть). В работе Ю. Н. Павлова,

Е. А. Тихомировой [Павлов 2011] для выделения основы в словах используется

модифицированный алгоритм Портера, созданный для обработки слов

английского языка. Во Второй версии частотного списка частотного словаря

современного русского языка [Шаров] лемматизация была «проведена с помощью

морфологического анализатора Диалинг1» [Шаров].

Поднимая проблему формализации необходимо отметить еще одно важнейшее

свойство методов прикладной лингвистки – оптимизация (А. Н. Баранов), под

которой понимается «такое описание (модель) проблемной области, при котором

эта область сохраняет в результирующем представлении только те существенные

свойства, которые необходимы для данной практической задачи» [Баранов 2001а:

10].

1 Примеры процесса лемматизации описаны в п. 3.2.1. настоящего исследования.

Page 89: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

89

Оптимизация способствует более успешному моделированию. Для каждой

области прикладной лингвистики существует свой набор методов, однако можно

выделить некоторые общие черты методов, которые предлагает А. Н. Баранов на

основе анализа методов описательной, теоретической и прикладной лингвистики.

Главным в описательной лингвистике является метод классификации, решающий

задачу описания фактов языка различных уровней, в теоретической –

моделирование, в прикладной лингвистике применяется метод классификации и

метод моделирования. Особое внимание уделим методу моделирования объекта, в

том числе в рамках теоретической лингвистики, позволяющему выявить

поведение объекта при иных условиях. «Исходный пункт использования метода

моделирования – представление о входной и выходной информации <…>

характеризующей функционирование объекта моделирование» [Баранов 2001а: 9].

А. Н. Баранов вслед за [Апресян 1966: 79] отмечает, что моделированию

поддаются те характеристики, которые связаны со структурной организацией

объекта. Перенесение особенностей организации модели (неструктурных свойств)

оказывается более сложным. Из выделяемых в теоретической лингвистики типов

моделей [Баранов 2001а: 9] отметим тип, характеризующийся формулировкой «из

чего сделан Х» – компонентные модели или модели структуры. Моделирование,

осуществляемое в настоящем исследовании (глава 3), выполняет

идентифицирующую функцию посредством анализа параметров, «из которых он

сделан»1.

1 В рамках прикладных исследований моделирование непосредственно связано

с оптимизацией, которая определяется конкретной задачей, в связи с чем

применяется познавательная установка «Фокус-покус» («Инженерный подход» –

в рамках этой установки важным оказывается не изучение того, «как все обстоит

на самом деле», а решение конкретных задач) [Баранов 2001: 10]. Кроме прочего

модели в прикладной лингвистике требуют большей степени формализации,

«прикладные модели используют знания о языке выборочно», «прикладные

модели в существенно большей степени огрубляют моделируемый объект, чем

Page 90: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

90

Таким образом, рассмотрение квантитативных характеристик сквозь призму

лингвоперсонологии позволяет идентифицировать тексты, а также увидеть связь

лингвоперсонологии и квантитативной лингвистики. Идентификации

подвергается объект (текст), в котором, как во всяком тексте, содержащем

проявление свойств языковой личности, существуют определенные языковые

характеристики. В свою очередь языковые характеристики, представленные в

квантитативном аспекте, отражают авторскую индивидуальность.

Важно отметить, что сам по себе факт формализованности не является

показателем лингвистической (так же, как и какой-либо другой) значимости.

Любое формальное описание значимо не само по себе, а лишь в силу своей

полезности для чего-то. В настоящем исследовании формализация способствует

автоматизации и объективизации полученных результатов идентификационных

исследований, а также использованию методики идентификационной экспертизы

без участия субъекта. Таким образом, обнаруживается лингвоперсонологический

подход к исследованию языковых единиц с применением методов квантитативной

лингвистики в идентификационном аспекте.

Формализация текста, интерсемиотический перевод и стремление к

автоматизации процесса исследования текста способствовал тому, что уже

«значительный ряд современных исследований посвящен созданию

универсальной методики атрибуции текстов и поиску путей совершенствования

лингвистической автороведческой экспертизы» [Напреенко 2014; Напреенко

2015]. Отражению разработок подобных методов установления авторства

посвящена следующая часть настоящего исследования (п. 1.3.4.).

теоретические модели и, наконец, прикладные модели не налагают никаких

сущностных ограничений на инструмент моделирования» [Соснина 2001: 11].

Page 91: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

91

1.3.4. Формализованные методы и автоматизированные программы по

установлению авторства

В данном пункте параграфа представлены существующие разработки и

автоматизированные программы по установлению авторства, относящиеся к

универсальным методам согласно представленной нами классификации методов

идентификации текстов и языковой личности по ним1.

Количественные методы давно используются в лингвистике2 – «исходной

точкой <…> появления в лингвистике количественных методов в современном

понимании принято считать начало ХХ века» [Верхозин 2013б: 145]. К

современным исследованиям, в которых используются статистические и

количественные методы анализа текста в лингвоперсонологическом аспекте,

относятся, например, статьи и кандидатская диссертация Т. А. Головиной

[Головина 2006; Головина 2007; Головина 2008]. Т. А. Головина исследуя

лингвоперсонологические функционирование частей речи в статистическом

аспекте, «просчитывает» объем частей речи в произведениях русских писателей.

Статистический анализ употребления частей речи, используемый исследователем,

«может наглядно показать отличие одного авторского языка от другого и

диагностировать разные типы языковой личности писателя» [Головина 2007: 149].

Результатом исследования частоты встречаемости разных частей речи в

1 Оппозиция методов идентификации текста представлена в п. 1.3.1.

2 Отметим, что в зарубежной лингвистике применение количественных методов

появилось несколько раньше, чем в отечественной: «история применения

количественных методов в зарубежной лингвистике берет свое начало в

XVIII веке в работах Э.Мэлоуна, а в отечественной в XX веке в статье Н.А.

Морозова» [Верхозин 2013а].

Page 92: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

92

кандидатской диссертации явилось следующее распределение маркеров,

характеризующих определенных авторов: глагольная константа – маркер текстов

В. В. Быкова и В. М. Шукшина, субстантивная константа – маркер выборок

текстов В.П. Астафьева и К. Г. Паустовского и т.п. Исследователь на основе

анализа «наличия или отсутствия систематической проявленности в плане

частеречного выражения» [Головина 2008: 17] создает типологию

персонотекстов, которая способствует созданию типологии собственно языковых

личностей: частеречно-характеризованный и частеречно-нехарактеризованный

типы языковых личностей.

Я. А. Дударева в кандидатской диссертации «Номинативные единицы с

близким значением как компоненты ассоцитативно-вербальной сети носителей

русского языка» [Дударева 2012] использует количественный анализ при

определении «степени близости совпадающих ассоцитативных пар

сопоставляемых лексических единиц» [Дударева 2012: 12]. Применение

коэффициента корреляции К. Пирсона позволяет определить степень

семантической близости анализируемых единиц.

В рамках идентификационных исследований выделяются исследования

промежуточные, в которых при выявлении в идентифицируемом объекте его

специфических особенностей используются количественные подсчеты1.

Е. С. Родионова отмечает, что «любое стилистическое исследование будет носить

субъективный характер без учета количественных показателей, именно

количественная оценка однородности или неоднородности состава и структуры

сравниваемых языковых систем составляет основу лингвостилистического

анализа, без которого невозможна объективная атрибуция» [Родионова 2008б:

1 Применения количественных методов анализа текста ставит проблему объема,

необходимого для эффективности такого синтеза. Е. Ворончак пришел к выводу

о том, что минимальный объем, требуемый для установления автора текста путем

квантитативного описания параметров текста, составляет 5 000 (пять тысяч)

словоформ [Ворончак 2007].

Page 93: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

93

118]. Такие методы установления авторства текста, удачно сочетая специальный и

квантитативный методы исследования, сделали существенный шаг в преодолении

субъективности путём попытки формализации1 идентифицируемых параметров

2.

Одним из первых трудов, в котором применяется статистический метод

исследования текста, является работа А. А. Маркова 1913 года, в которой

проводится статистический анализ по достоверно установленным текстам автора.

Результатом применения статистического анализа является оценка частоты

появления отдельных слов в текстах автора. Автор предстает уникальным

набором частот, что позволяет его отличить от другого автора. Для этого «в

качестве критерия близости текстов служит введенное понятие «расстояния»

между соответствующими текстами, которое и является, в конечном счете,

определяющим фактором при вынесении решения о принадлежности текста тому

или иному автору» [Павлов 2011].

Н. А. Морозов в работе «Лингвистические спектры. Средство для отличия

плагиатов от истинных произведений того или другого известного автора.

Стилеметрический этюд» [Морозов 1915] в качестве единицы анализа

использовал наиболее часто встречающиеся и общие «для всех родов

литературы» слова, т.е. служебные, или, по терминологии Н. А. Морозова,

распорядительные частицы – союзы, предлоги, местоимения и т. п., т. к. они не

связаны с темой и содержанием текста, а потому характеризуют идиостиль

автора. В указанной работе Н. А. Морозов выдвинул предположение о том, что

именно подобные слова являются показательными для индивидуального стиля

писателя.

Н. А. Морозов отмечает перспективу объективности подхода и объективизации

результатов исследования: «с тех пор было выработано и предложено множество

1 О формализации – в п.1.3.3.

2 Глава 2 представляет собой метод, выполненный в русле данного переходного

типа.

Page 94: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

94

различных методов авторизации текста, но ни один из них не является

общепризнанным. С точки зрения разных подходов, в качестве достоверных

количественных критериев определения авторства текста признавались: доля

служебных слов как авторский инвариант, средняя длина слова, средняя длина

предложения, индекс разнообразия лексики и многие другие. У каждого из

подходов есть свои преимущества и свои недостатки, свои сторонники и свои

противники» [Морозов, 1915]. Н. А. Морозов для установления авторства текста

предлагал переводить частоты встречаемости анализируемых единиц на графики,

«обозначая каждую распорядительную частоту на горизонтальной линии, а число

ее повторений на вертикальной, и сравнить эти графики между собой у различных

авторов» [Морозов, 1915]. Именно данные графики, отражающие частоту

встречаемости слов в текстах разных авторов, получили название

«лингвистические спектры».

Значительным исследованием в вопросе атрибуции явилось экспериментальное

исследование, проведенное в 1973 – 1978 гг. в Институте языкознания АН СССР и

Всесоюзном институте по изучению и разработке мер предупреждения

преступности Прокуратуры СССР В. И. Батовым и Ю. А. Сорокиным [Батов

1980]. Выводы, полученные в результате работы указанных ученых отразились,

например в статьях [Батов 1975; Батов 1977; Батов 1980].

Статья «Опыт построения методики для установления авторства текстов»

[Батов 1977] В. И. Батова и Ю. А. Сорокина ориентирована на преодоление

недостатка метода анализа «формальных характеристик» текста, которое

заключается в том, что «с его помощью можно атрибутировать тексты объемом в

несколько тысяч словоупотреблений, но не тексты гораздо меньшего объема

(100–300 словоупотреблений)» [Батов 1977: 345]. Авторы статьи на материале

текстов М. Е. Салтыкова-Щедрина объемом не более 333 слов провели

эксперимент, заключающийся в том, что испытуемым было предложено оценить

отрывки из текстов, неоднозначно относящихся к творчеству М. Е. Салтыкова-

Щедрина, по предлагаемой шкале: энергичный – спокойный, характеризующий

Page 95: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

95

автора – не характеризующий автора, мужественный – женственный, холодный –

теплый и т.д. [Батов, Сорокин 1977: 346]. Авторы статьи применили «метод,

позволяющий ориентировать факторы семантического пространства на

формальные характеристики текста» [Батов, Сорокин 1977: 346]: «концепция

семантического пространства преодолевается введением формальных

(объективных) характеристик» [Батов, Сорокин 1977: 347], к котором относятся

средняя длина предложений текста в словоупотреблениях, отношение числа

глаголов, личных местоимений, всех местоимений, предлогов, прилагательных к

общему числу словоупотреблений в тексте, среднеквадратичное отклонение

длины предложений текста. Статья «Субъективная модель текста и вопросы

атрибуции» [Батов 1980] явилась итоговой, отражающей выводы эксперимента.

Важным для настоящего диссертационного исследования является вывод,

сделанный авторами в результате анализа формальных характеристик текста,

который заключается в том, что синтез субъективных и объективных

характеристик позволяет приблизить идентификационное исследование (в статье

[Батов 1980] – атрибуцию) к объективному выводу в связи с однозначным

построением идентификационных параметров (в статье [Батов 1980] в частности –

семантического пространства) и их однозначной интерпретацией (в статье в

частности – факторов как семантических импликатов объективных

характеристик).

Современные исследователи продолжают развивать работы предшественников,

применяя формализованные методы для анализа специфических особенностей

текста. А. В. Морозов в автороведческой экспертизе текста договора [Морозов

2004: 290] объединяет нормативно-стилистический и статистический метод

анализа текстов. Ситуация экспертного анализа, предложенного для установления

авторства, – «сравнение по образцу» [Баранов 2007: 45]. В связи с тем, что

идентифицируемые тексты принадлежат официально-деловому стилю,

«установление авторства <…> возможно лишь на уровне допущения с той или

иной степенью вероятности» [Морозов 2004: 291]. Идентификационными

параметрами явились, таким образом: совпадение отдельных слов и

Page 96: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

96

словосочетаний (наречий, союзов, частиц, модальных слов: вообще, в связи с чем,

согласно и т.п.), выявление стилистических и грамматических ошибок и т. д.

Статистический метод не является основным: он предполагает анализ

распределения союзов со значением следствия в разных текстах (анализ

предпочтения употребления слова однако позволяет сделать вывод о том, что

данное слово характеризует индивидуальный стиль автора). В связи с тем, что

статистический метод, используемый А. В. Морозовым, предполагает узкий

спектр анализа текста (союзов), данное исследование также относится нами к

специально-ориентированному типу.

А. Н. Баранов в работе «Авторизация текста: пример экспертизы» [Баранов

2001; Баранов 2002] использует методику количественного анализа

квазисинонимичных лексем в экспертизе художественного текста – выявление

авторских предпочтений в выборе из ряда квазисинонимов, близких по значению

слов или фразеологизмов. В его исследовании (как и у Н. А. Морозова)

анализируются служебные и тематически нейтральные слова (лексемы с общей

семантикой), которые не связаны с темой художественного произведения,

отражают идиостиль автора и плохо поддаются имитации. Материалом

исследования явились художественные произведения (представлена стилеметрия

в литературоведческой авторизации). Подобный анализ проводится и на примере

анализа частотностного распределения некоторых служебных и модальных слов в

романах М. Булгакова «Мастер и Маргарита» и «Белая гвардия»,

Ф.М. Достоевского. В статье дается не только статистический анализ, но и

лингвистическая интерпретация таких слов, как показателей идеологической и

творческой позиции писателя.

Серьезный импульс движению персонологии к объективистскому (формально-

количественному) портретированию языковой личности дает линвоэкспертная

деятельность, всегда испытывающая потребность отвлечения от субъективных

проявлений и склонность к анализу по установленным схемам (методикам). В

настоящее время высокого уровня объективизма достигли почерковедение и

Page 97: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

97

фоноскопия (см., например, [Леонтьев 1977]). Однако широкое распространение

анонимных письменных текстов (СМС, Интернет и т.п.) предъявляет требование

разработки объективистских схем идентификации текста и авторства по тексту

без присутствия поверхностной информации об авторе типа почерка и

особенностей произношения. Развивая сюжет движения лингвоперсонологии в

направлении достижения уровня объективистского моделирования языковой

личности, нельзя не отметить работ, выполненных с опорой на количественные

характеристики персонотекста [Напреенко 2015]. Исследователи отмечают, что

«применение статистических и/или количественных методик на данный момент

является обязательным требованием любого лингвистического проекта»

[Малышева]. Развитие вычислительной техники позволило реализовать методы,

совершающие большие вычисления и облегчающие работу эксперта.

Программные продукты способны учитывать различные лингвостатистические

параметры, что позволяет подвергать идентификационному анализу текст с

разных сторон, то есть рассматривать параметры текста на разных его уровнях как

возможные идентификаторы. Т. В. Батура отмечает, что «в настоящее время для

атрибуции текстов применяются подходы из теории распознавания образов,

математической статистики и теории вероятностей, алгоритмы нейронных сетей,

кластерного анализа и др.» [Батура 2013].

Современные исследователи в сфере лингвистики, математической

лингвистики и математики усовершенствуют существующие и разрабатывают

новые методы идентификации: «в настоящее время для атрибуции текстов

применяются подходы из теории распознавания образов, математической

статистики и теории вероятностей, алгоритмы нейронных сетей и кластерного

анализа и многие другие» [Батура 2013: 287]. Универсальные методы

идентификации текста и языковой личности, во-первых, основаны на

формализованном анализе текстов, квантитативном описании языковых единиц,

выступающем в качестве основного и единственного, во-вторых, предполагают

анализ преимущественного всего текста или его уровней без выявления

специфических особенностей отдельных элементов. Универсальные методы

Page 98: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

98

идентификации текста, в том числе, разрабатываются с целью идентификации

спорных текстов разного стиля и объема словоупотреблений.

Е. С. Родионова в своих статьях (например, [Родионова 2008а]) поднимает

проблему установления авторства в сфере литературоведения с применением

формализованных методов. Несмотря на то, что сфера применения

разрабатываемого метода – литературоведение, в настоящей диссертационной

работе важным являются выбор и разработка методологии, т. к. в сфере

лингвокриминалистики в качестве спорных объектов могут выступать также и

художественные произведения. В статье «Методы атрибуции художественных

текстов» Е. С. Родионова [Родионова 2008а] описывает существующие методы

атрибуции в исторической перспективе, уделяя наибольшее внимание

квантитативным методам и математическому аппарату, «поскольку разнообразие

математических методов анализа объектов различной природы позволяет

успешно использовать их в практике установления авторства» [Родионова 2008а:

118].

Методика атрибуции текстов М. А. Марусенко [Марусенко 1996], позволяющая

выявлять характеристики всего текста, а не отдельного его элемента, легла в

основу кандидатской диссертации «Лингвистические методы атрибуции и

датировки литературных произведений (К проблеме «Корнель – Мольер»)»

Е. С. Родионовой, которая «посвящена разработке языковедческой теории в

области атрибуции и датировки литературных произведений на материале

стихотворных пьес, приписываемых Мольеру» [Родионова 2008: 3]. Решение

проблемы атрибуции начинается с выдвижения ряда атрибуционных гипотез,

которые строятся подобным образом:

1. «тексты стихотворных пьес, приписываемых Мольеру, полностью

принадлежат Мольеру (нулевая гипотеза);

2. тексты стихотворных пьес, приписываемых Мольеру, полностью

принадлежат П. Корнелю (первый вариант альтернативной гипотезы);

Page 99: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

99

3. тексты стихотворных пьес, приписываемых Мольеру, являются

произведениями П. Корнеля, Ф. Кино и одного или нескольких неизвестных

авторов (второй вариант альтернативной гипотезы)» [Родионова 2008: 5].

Атрибуция текстов решается, вслед за работой [Марусенко 1996], путем

применения метода теории распознавания образов. Е. С. Родионова «при

формировании набора информативных параметров» применяет схему

М. М. Бонгарда, предусматривающую «двухступенчатое свертывание

параметрического пространства»)» [Родионова 2008: 14]. Результатам

проведенного исследования явился атрибуционный вывод о том, что десять

произведений, анализируемых Е. С. Родионовой, принадлежит авторству

П. Корнеля, одна – Ф. Кино.

Исследование Е. С. Родионовой [Родионова 2008] послужило основой для

разработки А. Ю. Хоменко «Алгоритм автоматизации идентификации автора

письменного речевого произведения для судебного автороведения» [Хоменко

2014]. А. Ю. Хоменко ставит задачу определения эффективности применения

методов математической статистики и стилометрического анализа для

идентификации текстов. Цель, обозначенная в статье [Хоменко 2014], – проверка

работоспособности математических методов для атрибуции текстов и создание

методики именно универсальной, предполагающей применение относительно

текстов разных стилей и объемов. В статье представлен последовательный

идентификационный анализ – от анализа языковой личности каждого

исследуемого текста до квантитативного и стилометрического преобразования

данных, полученных в результате анализа языковой личности. Предлагаемая

автором методика является совокупностью имеющихся методик квантитативной

лингвистики по атрибуции текстов [Родионова 2008], с применением постулатов

Н. А. Морозова [Морозов 1915], А. Н. Баранова [Баранов 2001] и других

исследователей, занимающихся проблемами автороведения, а также с

использованием методов анализа языковой личности автора текста по

Ю. Н. Караулову [Караулов 1989].

Page 100: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

100

Приводимая в статье методика базируется на предположении о том, что у

различных авторов есть свой неповторимый идиостиль, который характеризуется

определенным набором параметров. Ставится вопрос, насколько квантитативная

сторона данных параметров значима в идентифицирующем отношении, то есть,

возможно ли путем математического анализа параметров текста отличить один

текст о другого по авторской принадлежности.

А. Ю. Хоменко предлагает методику атрибуции текстов на основе

художественных текстов (тексты С. Д. Довлатова), которая показала свою

достоверность на 50 %. Объем материала известного текста – 330 709 слов,

экспериментального текста № 1 (текст С. Д. Довлатова) – 21 230 слов и

экспериментального текста № 2 (текст В. П. Астафьева) – 15 168 слов. Апробация

методики осуществляется с построением атрибуционных гипотез, согласно

которым тексты принадлежат одному или разным авторам. Анализ языковой

личности включает в себя анализ репрезентантов, маркирующих идиостиль

автора, лингвокогнитивного (плохо, светлый), мотивационного (бы, ладно, ну) и

вербально-семантического (я, ты) уровней. Далее осуществляется

квантитативное и стилометрическое моделирование данных с помощью

использования некоторых постулатов теории вероятности. Результаты,

приведенные в статье, наталкивают на мысль о том, что создание универсальной

методики идентификации (в аспекте ее применения для идентификации текстов,

принадлежащих разным стилям, жанрам или объему словоупотреблений) в случае

применения стилометрии пока не представляется возможным. На данный момент

существующие методики релевантны для идентификации текстов, ограниченных

одинаковым (близких к одинаковым) объемом и одним функциональным стилем.

Если Е. С. Родионова [Родионова 2008а] для моделирования выбирает

характеристики обобщенного вида (синтаксический уровень, например), то

А. Ю. Хоменко – конкретные слова, «репрезентанты, описывающие даже не

целый класс, а фрагменты этого класса» [Хоменко 2014] – в этом автор

анализируемой статьи А. Ю. Хоменко видит слабое место своей методики.

Page 101: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

101

Разработка атрибуции методов осуществляется в исследовании «Типология

распределения некоторых лингвистических единиц в тексте как показатель

авторства текста» Ю. А. Тамбовцева, А. Ю. Тамбовцевой, Л. А. Тамбовцевой

[Тамбовцев 2008]. Спорным с точки зрения идентификации текстов

определенному автору становятся произведения И. А. Крылова. Авторы

рассматривают конкретное художественное произведение как «нечто уникальное,

имеющее особую компоненту внутреннего строения, которая проявляется через

различные признаки» [Тамбовцев 2008: 89].

Для настоящего диссертационного исследования значимой является

методология, предпринятая с целью идентификации авторства текстов. Для

анализа авторы использовали двадцать пять простых и первообразных предлогов

в значениях, указанных в словаре русского языка (например, анализировались

предлоги в, к, на, от, до и т.п.). С точки зрения авторов исследования (и мы

придерживаемся данного понимания), количественная составляющая

встречаемости определенных слов в тексте является «изучением структуры

отношений явлений, признаков и процессов, которые отражены в тексте»

[Тамбовцев 2008: 90]: «частоту встречаемости предлогов следует признать

универсальным и информативным признаком текста. На основе этого параметра

можно говорить о разной пространственной ориентации авторов» [Тамбовцев

2008: 90].

Для установления авторства в качестве гипотезы о принадлежности спорного

текста авторству И. А. Крылова или другим возможным авторам, а также для

сопоставления дистрибуции предлогов, были проанализированы шестьдесят пять

текстов классической и современной литературы, а также научных исследований

разных авторов. Гипотеза методологической части исследования заключается в

том, что «степень схожести будет тем больше, чем ближе величины частоты

встречаемости каждого из предлогов» [Тамбовцев 2008: 91]. Для измерения

однородности (схожести) двух или более текстов применен метод математической

статистики – «хи-квадрат». Вхождение текстов в одну или разные генеральные

Page 102: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

102

совокупности по критерию «хи-квадрат» позволяет авторам исследования

установить тождество текстов по принадлежности авторам: например, оценка

распределения предлогов в произведениях Радищева позволила сделать вывод с

надежностью 95 % о том, что один из спорных текстов ему не принадлежит.

Таким образом, один из выводов авторов статьи, основанный на применении

описываемого метода, заключается в том, что «произведения одного и того же

автора имеют самые близкие расстояния. Это может говорить о том, что

пространственно-временные структуры, отображаемые предлогами, близки»

[Тамбовцев 2008: 95].

Предлоги как идентификационные параметры, рассматриваемые в призме

применения метода математической статистики «хи-квадрат», анализируются

также в работе Ю. А. Тамбовцева «Кто написал тексты Бахтина, Волошинова и

Медведева?» [Тамбовцев 2011]. Ю. А. Тамбовцев используя частоту

употребления простых непроизводных предлогов в спорных текстах, установил,

что тексты М. М. Бахтина не были написаны В. Н. Волошиновым или

П. Н. Медведевым.

Томское направление, развивающее методологию исследований, направленных

на установление авторства текстов, представляют и активно развивают

З. И. Резанова, А. С. Романов и Р. В. Мещеряков. В статье «О выборе признаков

текста, релевантных в автороведческой экспертной деятельности» [Резанова

2013а] исследователи «дают совокупное представление о существующих

параметрах, которые могут выполнять идентифицирующую функцию.

Рассматриваются как чисто формальные признаки, так и формально-

семантические, оценивается их релевантность, степень апробации, выделяются

слабые стороны. Авторами отмечается существенная проблема: многие методики

(в том числе квантитативные) не предназначены для их применения на русском

языке, именно поэтому есть необходимость создания специальной методики для

русского языка или апробации существующих методик для русского языка»

[Напреенко 2014]. Исследователи оценивают особенности словаря автора в

Page 103: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

103

качестве параметра идентификации: «ярких характерных особенностей лексикона

у текста, равно как и у автора, может и не быть. Если текст имеет выраженные

особенности, то существует большая вероятность их намеренного моделирования

<…> выявление отличительных черт авторского лексикона во многом носит

субъективный характер, зависит от личности исследователя. Кроме того, данный

признак проявляет значительную зависимость от смены темы и жанра

коммуникации (данное замечание справедливо, прежде всего, относительно

знаменательных единиц, но в целом справедливо по отношению к единицам всех

грамматических классов) и, вследствие этого, не может выступать в качестве

надежного идентификатора при вовлечении в экспертизу разножанровых текстов

одного автора» [Резанова 2013а: 6]. Действительно, методы идентификации на

данный момент субъективны − они зависимы в том числе от жанра, к которому

относятся. Однако намеренное моделирование текста может быть распознанным с

помощью специальных методов, кроме того, есть некоторые слои языка, которые

не полностью поддаются сознательному искажению1. «Наличие или отсутствие

«ярких характерных особенностей» у текста или автора, безусловно, зависимо от

жанра речевого произведения, при этом в обозрении лингвоперсонологии каждая

языковая личность обладает совокупностью определенных языковых

особенностей, реализующихся в речевом произведении» [Напреенко 2014].

З. И. Резанова, А. С. Романов, Р. В. Мещеряков в другой статье «Задачи

авторской атрибуции текста в аспекте гендерной принадлежности (к проблеме

междисциплинарного взаимодействия лингвистики и информатики)» [Резанова

2013] обсуждают проблемы гендерного анализа текста в автороведении.

Коллективом авторов сделан вывод о том, что «последовательное применение

методов количественного анализа с привлечением новейших приемов

информатики и вовлечение полученных с их помощью новых гендерно-

1 Задача определения факта сознательного искажения письменной речи входит в

диагностические задачи автороведческой экспертизы.

Page 104: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

104

релевантных признаков речевого поведения в научный лингвистический контекст

создаст основу дальнейшего развития гендерной теории» [Резанова 2013: 27]1.

К работам, посвященным поиску наиболее эффективного квантитативного и

статистического метода исследования, моделирования и атрибуции текста

отнесем статью А.С. Романова [Романов 2008], в которой описывается структура

программного комплекса для исследования существующих подходов к

идентификации авторства текстов и характеристик текста, позволяющих

идентифицировать их авторство текстов.

В статье А.С. Романова [Романов 2009] разрабатывается методика для

ситуации, при которой имеется множество текстов и множество авторов. Для ряда

подмножества текстов авторы установлены. Идентификационная задача –

установить, кто из множества A является истинным автором остальных текстов

(анонимных или спорных). Для некоторого подмножества текстов авторы

известны. Идентификационная задача – установить, кто из множества A является

истинным автором остальных текстов (анонимных или спорных). Для решения

данной задачи используется классификатор на основе аппарата опорных

векторов, который был предложен В. Н. Вапником [Романов 2009]. Текст при

такой методике рассматривается как иерархическая структура и на любом уровне

анализируется «как последовательность отдельных составляющих его элементов

(символов, словоформ, грамматических классов и т. д.) или групп элементов

длиной N–N-грамм» [Романов 2009: 37]. Кроме того, исследованию подвергались

уровни символов и слов – «использовались биграммы и триграммы символов,

наиболее частые слова русского языка» [Романов 2009: 37]. В работе

А. С. Романова используется корпус из 215 текстов художественных

произведений. В работе отмечается проблема требуемого объема текста для

1 Определение пола автора спорного текста входит в диагностические задачи

автороведческой экспертизы, решающие более частные вопросы (возраст,

образовательный уровень автора и т.п.) на фоне идентификационных, связанных с

установлением индивидуально-конкретного тождества объектов.

Page 105: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

105

установления авторства, которая является слишком большим, чтобы решать

конкретные практические задачи.

Целью диссертации А. С. Сурковой [Суркова 2004а] является «построение

модели текста как системы установления структурных инвариантов текста

различного уровня и на их основе разработка методов и алгоритмов

идентификации текстов» [Суркова 2004а: 4]. Объектом исследования являются

тексты 19-20 вв. разной жанрово-стилевой принадлежности (художественные,

научные, публицистические), что приобретает особую теоретическую значимость.

А. С. Суркова предлагает методику идентификации текстов на основе

полученных в ходе системного анализа инвариантов текста; автором разработаны

алгоритмы сравнения структурно-иерархических моделей (уровень букв, уровень

слов, уровень предложений) текстов на основе сравнения сечений многомерных

законов распределения букв в словах [Суркова 2004а: 5]. В работе

обосновывается необходимость выявления критериев, позволяющих различать

авторские инварианты (стиля писателя), жанровые инварианты (инварианты для

текстов определенного жанра), инварианты, характеризующие время создания

текста и т.д. Автором предлагается уровневая схема инвариантов [Суркова 2004а:

12]. А. С. Суркова строит «информационные портреты текстов», отражающие их

внутреннюю структуру: «структура языка писателя начинает проявляться в связях

между элементами текста низшего уровня, то есть связь между словами в

предложении отражена в структуре слова» [Суркова 2004а: 12]. Автором

установлено, что «индивидуальные особенности автора проявляются как

авторские инварианты текста на уровне букв и их сочетаний в виде

соответствующих многомерных законов распределения» [Суркова 2004а: 17].

Методы и алгоритмы идентификации текстов созданы на основе объединения

результатов сравнения отдельных «информационных портретов». По данным

А. С. Сурковой предлагаемый ею метод идентификации текстов верно

идентифицировал 99 % текстов.

Page 106: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

106

Разработка универсальных методов в аспектах формализации, перевода

каждого этапа идентификации на автоматизированный уровень, выявления

условий, при которых осуществляется успешная идентификация, реализуется в

автоматизированных программах по установлению авторства. Большинство

автоматизированных программ атрибутирует тексты на основе заложенной в них

базы произведений.

Т. В. Батура в статье «Формальные методы установления авторства текстов и

их реализация в программных продуктах» [Батура] предлагает обзор

существующих программ по установлению авторства на русском языке. Автором

предпринята попытка выявить преимущества и недостатки каждого из методов.

Большая часть программ ориентирована на установление авторства, в связи с чем

выдвигается проблема выборки эталонных текстов для сопоставления с

исследуемым текстом. А. С. Суркова также приводит обзор основных методов

определения авторства текста, недостатком которых автор определяет

«стихийность выбора параметра, по которым производится идентификация»

[Суркова 2004а: 8-9] и предполагают участие человека в предварительной

обработке текста (кроме программы «Атрибутор»). В нашем исследовании мы

опираемся в том числе на выводы о программах по установлению авторства,

сделанные Т. В. Батурой [Батура], А. С. Сурковой [Сурковаа 2004],

А. С. Романовым [Романов 2008], а также Е. И. Галяшиной [Галяшина 2006].

В данном параграфе представлены некоторые автоматизированные программы,

созданные для установления авторства как в зарубежной, так и в отечественной

лингвистике. Большинство существующих программ ориентировано на

установление соответствия исследуемого объекта одному или нескольким

текстам, заложенным в базе произведений программы.

Приведем пример некоторых автоматизированных программ, разработанных в

зарубежной лингвистике:

1. Компьютерная программа Prostyle (США), которая осуществляет анализ

вводимого объекта (текста) и «выводит в порядке номеров факторы, позволяющие

Page 107: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

107

провести статистический анализ значения в любых расхождениях в двух

исследуемых текстах» [Галяшина]. Компьютерная программа Prostyle при

обработке текстов учитывает следующих характеристики:

1) предельный индекс четкости (насколько анализируемый текст легок или труден

для понимания);

2) частотность страдательных конструкций, позволяющих выявить особенности,

характеризующие конкретного автора;

3) «количество используемых лексических единиц, которое при вычислении

процента соотношения с общим количеством слов в тексте дает показатель

словарного запаса автора» [Галяшина];

4) процент сложных слов по количеству слогов;

5) «средняя длина предложения, коррелирующая с уровнем образования автора»

[Галяшина];

6) предполагаемый возраст читателя текста;

7) количество погрешностей письменного стиля в тексте (данный параметр

характеризуют различные ошибки, допускаемые автором): «неправильное

употребление абстрактных существительных, глагольных форм и предлогов,

грубых и непристойных слов; неуместное употребление сленга и жаргона;

использование устаревших слов; нарушение пассивных конструкций»

[Галяшина]; слабое знание английского языка.

2. Программа текстового анализа IEA (Intelligent Essay Assessor), разработанная

для оценки студенческих работ, «позволяет выявить стилистические ошибки»

[Галяшина] текста и полноту раскрытия темы по заданным семантическим

критериям.

3. Инструмент для установления авторства текста JStylo [JStylo],

осуществляемого путем лингвистического анализа материалов, опубликованных в

Интернете (представлена группой аспирантов из американского Университета

Дрекселя). Одним из главных ориентиров, позволяющих вычислить личность

Page 108: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

108

создателя идентифицируемого текста, являются служебные слова как слова,

служащие для выражения отношений между членами предложения и создающие

уникальное строение предложения в каждом конкретном случае. Соблюдение

ряда следующих условий способствует успешному установлению авторства: а)

круг «подозреваемых» не должен превышать пятьдесят человек, б) на каждого

«подозреваемого» необходимо собрать языковой материал объемом не менее

6 500 слов, в)длина идентифицируемого объекта (текста) должна превышать 500

слов.

Тексты на языках, отличных от английского, переводятся на английский и

анализируются данной программой с точки зрения установления авторства текста.

Разработчики отмечают, что текст, переведенный машинным путем, может

успешно выступать материалом для анализа. В этом мы видим особую

значимость зарубежной программы. Интересно отметить, что в рамках данного

проекта также ведется разработка программ, которые помогают авторам

«избавиться» от уникальности своих текстов. Кроме прочего, разработчики

заявили, что данная программа позволить определить авторство текстов разных

стилей (возможно установить автора научной работы по его сообщениям на

форумах, чатах, и наоборот).

А. С. Романов в исследовании «Обзор программного обеспечения для

идентификации авторства текста» [Романов 2008] классифицирует отечественные

программы по следующим основаниям:

1) Непосредственное определения авторства текстов. К таковым относятся,

например, программы Штампомер, СМАЛТ, Лингвоанализатор,

Стилеанализатор.

2) Выявление факта плагиата: Антиплагиат, Плагиат Информ.

3) Интеллектуальный анализ данных. А. С. Романов приводит ряд примеров

автоматизированных программ, которые предназначены для «сбора и анализа

лингвистической информации о тексте, классификации, кластеризации,

реферирования текстов, выделения ключевых понятий текста» [Романов 2008:

Page 109: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

109

183]. К данным разработках относятся зарубежные исследования типа Intelligent

Miner for Text, TextAnalyst, PolyAnalyst и т.п.

4) Определение психологического портрета автора текста и психологического

содержания текста: ЛИНГВА-ЭКСПРЕСС (разработана В. И. Батовым с

коллегами), позволяющий «представить речевое произведение в виде трехзвенной

эмпирической модели: формальные характеристики текста — формы

коммуникации замысла — психологические характеристики автора» [Галяшина

2003]; ВААЛ (В.П. Белянин), позволяющий выявлять акцентуацию автора текста.

«Психиатрический анализ текста предполагает выявление соотнесенности между

лексическими элементами текста и возможной акцентуацией его автора»

[Галяшина]; определение выраженности в анализируемом тексте «таких

акцентуаций, как паранойяльность (в терминах автора — “светлые” тексты),

возбудимость, или эпилептоидность — («темные» тексты), гипертимность, или

маниакальность (“веселые” тексты), депрессивность (“печальные” тексты),

истероидность, или демонстративность («красивые» тексты)» [Галяшина] и т. д.

В рамках настоящего исследования актуальными для анализа являются

отечественные программы по установлению авторства, которые

классифицируются А. С. Романовым [Романов 2008] как программы, созданные

для определения авторства текстов: Штампомер, СМАЛТ, Лингвоанализатор,

Стилеанализатор. Представение их в настоящем пункте параграфа позволяет

оценить их с точки зрения обработки и выдачи идентификационного результата.

1. Программа Штампомер (автор Л.Л. Делицын) [Штампомер]. Программа

предполагает статистический и сравнительный анализ текстов:

1) Статистический анализ текста реализуется следующим образом. Необходимо

заполнить поля программы, одним из которых является указание автора

анализируемого текста и название произведения. Данное требование

представляется нам не результативным, т. к. именно для установления авторства

обращаются к подобным программам.

Page 110: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

110

В ходе анализа программа собирает статистические данные, записывая их в

файл результатов в виде таблиц отношений или процентного содержания

(например, количество знаков препинания, предложений в абзаце, слов в

предложении), а также таблиц анализа штампов (например, повторение штампов

n-го уровня, повторение штампов n-го уровня в одном абзаце). Штамп n-го уровня

‒ словосочетание из n слов: штамп 1-го уровня ‒ это одно слово, штамп 5-го

уровня ‒ словосочетание из 5 слов.

2) Сравнительный анализ текстов. В поля Первый файл статистики и Второй

файл статистики необходимо вписать результаты статистического

анализа сравниваемых авторских текстов. В результате сравнительного анализа

«программа вычисляет выраженные в процентах разности соответствующих

таблиц данных, полученных на этапе статистического анализа текстов»

[Штампомер]. Полученные данные характеризуют отличие созданных таблиц:

«чем выше их значение, тем ниже вероятность идентичности авторства исходных

текстов» [Штампомер]. Таким образом, программа позволяет находить наиболее

часто встречающиеся фразы (штампы) в авторских текстах. Данный проект в

настоящее время заморожен по данным, приведенным в «Каталоге

лингвистических программ и ресурсов в Сети» [Каталог…].

2. Информационная система «Статистические методы анализа литературного

текста (ИС СМАЛТ) [СМАЛТ]. Программа представляет собой морфологический

и синтаксический анализ текста с целью выявления статистических признаков

литературных текстов по жанру и авторству. Информационная система содержит

базу данных также литературных произведений: публицистические статьи из

журналов «Время», «Эпоха», «Современник», «Гражданин» и др.) [Рогов 2004].

3. Программа Лингвоанализатор (автор Д.В. Хмелев) [Лингвоанализатор]. По

информации сайта, данная программа — первый литературный эксперимент по

распознаванию авторства текста, написанный на русском языке: «программа

ЛингвоАнализатор является первой в мире программой, которая с большой

Page 111: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

111

уверенностью устанавливает автора текста (выражаясь филологическими

терминами, атрибутирует текст)» [Лингвоанализатор].

Программа определяет близость любого анализируемого текста к одному из

авторских эталонов, определенных заранее. Электронный ресурс также, как и

Атрибутор, представленный ниже, содержит базу — список произведений

русской фантастики. Объём текста, который необходим для установления

авторства, должен быть не менее 50-100 Килобайт.

Программа анализирует входной текст и выдает имена трех писателей, которые

могли бы быть его авторами, и три произведения каждого из авторов наиболее

близких анализируемому тексту. Возможная жанровая вариативность входного

текста, который может быть обработан, — «простой текст, фрагмент, роман,

повесть, рассказ» [Лингвоанализатор]. Выдача результата может быть как в

научном, так и в литературном виде.

Так, при попытке нами атрибутировать статью [Резанова 2013а] программа

выдает результат, сопоставляя текст с заложенной в программе базе: «В первом

столбце находится энтропия данного текста относительно матрицы

коэффициентов автора. 2.553144 | Виталий Бабенко 2.553175 | Александр

Лазаревич 2.558681 | Владимир Савченко». При анализе фрагмента романа

«Идиот» Ф. М. Достоевского, предложенного для атрибуции нами, программа в

литературном виде атрибутирует: «Вообще-то, приведенный фрагмент

сравнительно мал, и имеется немного оснований для того, чтобы судить о его

существенной близости к одному из 134 авторских эталонов. Ниже приведена

тройка ближайших авторских эталонов, возможно, не содержащая истинного

автора» с дальнейшим указанием авторов, на тексты которых похож фрагмент

романа “Идиот”» [Лингвоанализатор].

4. Программа СтилеАнализатор1 (Томск, ТГУ, О. Г. Шевелев)

[СтилеАнализатор-2]. Программа предполагает лингвистический анализ

1 Работа системы СтилеАнализатор-2 более подробно представлена в

электронном ресурсе [СтилеАнализатор-2].

Page 112: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

112

исторических текстов и авторского стиля литературных произведений при

помощи статистических методов. Суть проекта заключается в создании

многооконного (MDI) приложения для проведения разнообразных

лингвистических исследований. Работа в программе делится на три этапа: 1)

предобработка текстов, 2) преобразование текстов к количественному виду, 3)

анализ количественных данных. Каждый этап независим и предоставляет данные,

доступные для использования в других системах.

5. Еще одним лингвистическим процессором является программа Атрибутор

(А. А. Поликарпов и др.) [Атрибутор], не представленная в обзоре А.С. Романова

[Романов 2008]. Программа содержит «Перечень текстов эталонной выборки»,

состоящий из 103 русских и советских писателей 19 и 20 веков, например,

Б.Акунин, М.А.Булгаков, А.Войнович, Ф.М.Достоевский и другие. Программа

сравнивает только тексты романов и атрибутирует их с базой художественной

литературы, заложенной в программе. Для атрибуции достаточно 20 Кб текста

(около 6 страниц). В программе прописаны некоторые условия выдачи

результатов: 1) если писатель, текст которого Вы захотите проверить, имеется в

базе данных Атрибутора, Атрибутор постарается его узнать; 2) если Вы

предложите ему неизвестного писателя, он ответит, на кого из имеющихся в базе

данных писателей он больше всего похож. Так, в программе Атрибутор

реализуется задача установления автора текста при условии наличия автора в базе

данных.

При попытке атрибутировать, например, научную статью [Резанова 2013а],

программа Атрибутор выдает ответ: «Этот текст больше похож на научно-

техническую статью, чем на художественную прозу». При анализе фрагмента

романа «Идиот» Ф. М. Достоевского Атрибутор выдает такой результат: «Скорее

всего, этот текст принадлежит Ф. М. Достоевскому».

Таким образом, «в последнее время наметился формализованный подход к

решению задачи идентификации личности» [Галяшина] по текстам с помощью

Page 113: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

113

экспертных автоматизированных программ, которые помогают проводить анализ

независимо от эксперта. В связи с вышесказанным, подчеркнем, что настоящее

исследование также направлено на достижение объективности процесса

проведения экспертизы и ее результатов, поэтому при разработке методов

идентификации текстов мы используем квантитативные методы анализа.

Анализ существующих отечественных программ по установлению авторства

показал, что бо льшая их часть, во-первых, осуществляет идентификацию

художественных текстов, во-вторых, атрибутирует исследуемый объект текстам,

находящимся в базе художественных произведений. Разработка метода,

представленного в главе 3, имеет принципиально иную задачу – идентификацию

текстов друг другу и идентификацию языковой личности по данным текстам в

рамках базовых задач идентификации, представленных А. Н. Барановым1

[Баранов 2007: 45]. Перспектива разрабатываемого нами метода заключается в

качестве получаемого идентификационного вывода: необходимо установить, один

ли автор у идентифицируемых текстов, сколько авторов у них. В связи с этим

программа должна обрабатывать хотя бы два текста и сопоставлять их друг с

другом, но не с заложенной в программе базой.

1 Базовые задачи идентификации представлены в п. 1.2.2.

Page 114: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

114

Выводы по 1 главе

В настоящей главе освещение направлений лингвоперсонологии определило

необходимость выделения идентификационного аспекта изучения языковой

личности в качестве отдельного аспекта лингвоперсонологии, предполагающего

выявление особенностей текста с целью установления тождества объектов.

Идентификация, включающая в себя лингвоперсонологическую составляющую

(объект – текст как воплощенная языковая личность и собственно языковая

личность), обозначается нами «идентификационной лингвистикой». Задачи

лингвоперсонологической идентификации текстов важны для построения общей

теории лингвоперсонологии и для ее прикладных отраслей – в частности, для

идентификационной лингвистической экспертизы, которая осуществляется без

опоры на почерк или фонограмму идентифицируемого текста.

В главе отражено, как в исследовании пересекаются разные научные

дисциплины: а) лингвоперсонология, б) лингвистика текста, в) квантитативная

лингвистика и г) юрислингвистика. Синтез различных подходов к исследованию

языковых фактов способствует тому, что лингвоперсонологические данные

становятся средством решения проблем в области лингвокриминалистики.

В главе представлено развитие методов описания языковой личности, идущей в

направлении от специально-ориентированного подхода к более универсальному.

Данное движение позволило выдвинуть гипотезу, а затем подтвердить ее в

течение теоретического исследования о существовании оппозиции интуитивных и

статистических методов описания языковой личности и текстов, в том числе в

идентификационном аспекте. Если интуитивные методы представляют собой

«штучное» исследование, т. к. каждый раз выявляют специфические особенности

конкретного исследуемого текста, то методы универсального типа более

формализованы, т. к. для идентификации применяют заранее установленный ряд

параметров. Бо льшая часть методов последнего типа представляет полностью или

Page 115: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

115

частично автоматизированные продукты, примеры которых были приведены в

настоящей главе.

В данной работе оппозиция специально-ориентированных и универсальных

методов коррелирует с логико-философскими понятиями тождества и различия

определения которых представлены в п. 1.2.1, а реализация этих феноменов

отражена на протяжении всего диссертационного исследования. Феномен

идентификации представляется нам категорией универсального

(междисциплинарного) типа, т.к. используется в разных научных дисциплинах с

целью установления тождества различных объектов.

На фоне разнообразия существующих методов идентификации текстов

(персонотекстов) и языковой личности, предстающих в оппозиции,

обнаруживается проблема отсутствия единого метода идентификации. В связи с

чем осознается необходимость разработки формализованных алгоритмов по

выявлению индивидуальной языковой способности, проявляющейся в тексте на

разных уровнях. Использование формализованных алгоритмов позволяет

преодолеть субъективность в исследованиях идентификационного характера. В

следующих главах будет представлено два метода идентификации, один из

которых – универсальный алгоритм идентификации текстов, позволяющий от

ручной работы исследователя перейти к «конвейерному» принципу, то есть

автоматизированному.

Page 116: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

116

Глава 2. Специально-ориентированный метод моделирования текстов в

идентификационном аспекте

Данная глава посвящена разработке специально-ориентированного метода

идентификации текстов как воплощенной языковой личности и собственно

языковой личности. Одной из многих работ, представляющих специальные

методы идентификации, является экспертиза А. Н. Баранова [Баранов 2001;

Баранов 2002], в которой реализуется квантитативный анализ квазисинонимов

служебных частей речи и модальных слов. Настоящая часть исследования

модифицирует метод в двух аспектах. Во-первых, материалом исследования

становится интернет-дневник, особенности жанра которого представлены в § 1

настоящей главы. Во-вторых, анализ функциональных эквивалентов в данной

работе не предполагает интерпретации их значений, а также описания причин

выбора автором того или иного слова, что позволяет как можно полнее

формализовать данный метод при последующих разработках за пределами

настоящего исследования.

§1. Интернет-дневник как материал идентификационного исследования

Описание интернет-дневника как материала настоящего исследования частично

представлено в наших статьях [Напреенко 2011; Напреенко 2014а] и развивается

далее в параграфе.

Page 117: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

117

Виртуальная коммуникация как явление современности независимо

функционирует наряду с реальным общением. Виртуальная коммуникация

понимается как «коммуникативное взаимодействие субъектов, осуществляемое

посредством компьютера, при котором создается особая модель реальности,

характеризующаяся эффектом присутствия в ней человека и позволяющая

действовать с воображаемыми и реальными объектами» [Асмус 2005: 5].

Е. И. Горошко [Горошко 2009] характеризуя интернет-коммуникацию,

возникающую между пользователями посредством естественного языка, отмечает

следующие ее особенности: виртуальность, интерактивность,

гипертекстуальность, глобальность, креативность, мозаичность, анонимность

([Михайлов 2004] цит. по [Горошко 2009]), а также «автоматизация,

возможность использования технологий баз данных, мультимедийность,

временная и пространственная независимость, добровольность и желаемость

контактов [Дедова 2006: 172] <…> смешение речевых стратегий, компьютерный

сленг, элементы которого переходят в общеупотребительную лексику;

возрождение эпистолярного жанра (что четко демонстрирует постоянно

растущая популярность живых журналов и всей блогосферы Сети в целом)» и

т.д. (выделено нами – Г.Н.) [Горошко 2009]. Е. И. Горошко подчеркивает, что

«возможность практически полной анонимности в карнавальной стихии чата

соседствует в интернет-пространстве с открытой публичностью социальных сетей

или полным самораскрытием личности на персональной веб-странице [Горошко

2009].

«Одной из форм речевой деятельности – как жанра электронной коммуникации

– является интернет-дневник» [Напреенко 2011; Напреенко 2014а: 544]. Интернет-

дневник, выступающий материалом настоящего исследования и разработок по

идентификации текста, характеризуется особенностями, отражающими

проявление свойств языковой личности и обусловленными открытостью,

авторефлексией, самораскрытием личности автора, рефлексией языковой

личности над своей речемыслительной деятельностью.

Page 118: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

118

Главным признаком жанра дневника А. Зализняк определяет характеристику

адресата: «автор является одновременно адресатом, и при этом имеется

потенциальный второй, косвенный, адресат» [Зализняк]. Данная характеристика

приобретает еще большее значение при включении дневника в интернет-

коммуникацию. «Интернет-дневник различествует с традиционным личным

дневником наличием широкого круга адресатов, возможностью появления

дискуссий: это открытый полилог, форма коммуникации между пишущим и

читающими и комментирующими» [Напреенко 2011; 2014а: 544].

«В восприятии и понимании веб-общения имеются некоторые сложности,

обусловленные спецификой языковой коммуникации в виртуальной среде (сленг,

тенденция к смешению письменной и устной форм речевой деятельности т.д.)»

[Напреенко 2011; Напреенко 2014а: 544]. В условиях интернет-среды текст

является одним из основных средств репрезентации языковой личности.

Отображение средствами языковой системы окружающей действительности

репрезентируется в семантике текста. Разнообразие семантики текстов

определяется множеством ситуаций реальной жизни. Так, интернет-дневник

отражает любые явления окружающей действительности, связанные с личностью

автора, – круг тем обширен. Интернет-дневник, с одной стороны, как жанр

дневника является целенаправленным описыванием своего «Я», своей личности, с

другой стороны, как продукт речемыслительной деятельности, является более

глубокой формой отражения языковой личности пишущего субъекта. Последний

аспект репрезентирует психо-, ментально-языковую составляющие личности

автора: «эмоциональное состояние, особенности мыслительной деятельности

автора, определенная манера изложения мысли, выражающиеся в языковых

элементах и формулах данного текста» [Напреенко 2011; Напреенко 2014а: 544].

«Письменная речь имеет свою форму, в которую облечено её содержание,

языковые средства, материализующие содержащиеся в ней мысли в виде

словарного запаса, употребленного в определенных синтаксических

конструкциях, в той или иной степени соответствующих нормам литературного

языка. Идентификационные параметры текста представляют проявляющиеся в его

Page 119: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

119

особенностях письменно-речевые навыки индивидуума» [Напреенко 2011;

Напреенко 2014а: 547].

«Естественные тексты — продукт повседневной письменной коммуникации,

все больший процент которой переходит в виртуальное пространство»

[Алтухова]. В связи с данным обстоятельством можно полагать, что дневник как

продукт письменной речевой деятельности в интернет-среде продолжает обладать

такими характеристиками естественной письменной речевой деятельности, как

неофициальность, «спонтанность, непрофессиональность исполнения»

[Лебедева]. Под естественной письменной русской речи понимается «речевая

деятельность (и ее результат – тексты), обладающая следующими

характеристиками: письменная форма, спонтанность и непрофесиональность

исполнения, неофициальность сферы бытования, отсутствие промежуточных

инстанций (редакторов, цензоров, корректоров и пр.) между воплощением

замысла автора и получением текста реципиентом» [Лебедева 2001: 4]. Именно

данные признаки естественной письменной речи1 позволяют обнаруживать в

текстах интернет-дневников ярко выраженное проявление способностей и свойств

языковой личности2.

Таким образом, «возрастание роли виртуальной коммуникации не изменяет

существующего в рамках теории языковой личности положения» [Напреенко

2014а: 544], которое мы упоминали в п. 1.1.2: «за каждым текстом стоит языковая

личность» [Караулов 1989: 5]. Интернет-дневник представляется персонотекстом,

в котором репрезентируется языковой потенциал и способность языковой

личности. Как таковой, интернет-дневник выступает единством формально-

языковых и содержательно-смысловых характеристик, отражающих

1 Термин естественная письменная русская речь (ЕПРР) и развитие концепции

ЕПРР предложено Н. Б. Лебедевой [Лебедева; Лебедева 2001].

2 В отличие от текстов некоторых других жанров и стилей: например, текстов

официального стиля, которые характеризуются шаблонностью и клише.

Page 120: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

120

индивидуальность конкретного автора, создавшего исследуемый текст. Данная

индивидуальность в большей части «бессознательно реализуется автором в тексте

через определенные языковые характеристики, которые способствуют

дифференциации одного персонотекста от другого и, как следствие,

дифференциации одной языковой личности от любой другой» [Напреенко 2011;

2014а].

«В связи с потребностью исследовать тексты, извлеченные из интернет-среды,

в качестве источника возможных коллизионных ситуаций, связанных с

проблемами авторства» [Напреенко 2014а: 546], одна из задач настоящей работы

– разработать методологию идентификации по данному типу текстов.

Применение квантитативного анализа направленно на выявление языковых

параметров, которые являются отражением авторской языковой личности.

Важным условием разрабатываемого метода является отсутствие почерка и

невозможность фоноскопического анализа, что обусловлено характером самого

жанра: «интернет-дневник – дневник, существующий как продукт письменной

речевой деятельности в веб-коммуникации» [Напреенко 2014а].

Интернет-дневники представляют собой датированные блоки, записываемые

авторами, они характеризуются фрагментарностью и принципиальной

незавершенностью. Существуют различные определения границ текста: 1) «текст

– это предложение, 2) текст – законченное произведение (И. А. Фигуровский –

“целый текст”), 3) текст – массив текстов, в котором нет разграничения целых

текстов и его отрывков» [Закономерности…1982: 5]. В настоящем исследовании

актуальным становится третье определение текста: под текстом понимается

массив дневниковых записей, без разрыва их на отдельные блоки.

Обращаясь «к определению задач автороведческой идентификационной

экспертизы («анализ особенностей текста любого формата как носителя

информации о его авторе» [Горошко 2006: 197])» [Напреенко 2011; Напреенко

2014а: 545], отметим, что интернет-дневник, предстающий как жанр виртуальной

коммуникации и как продукт письменной рефлектирующей деятельности

Page 121: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

121

языковой личности, может правомерно являться объектом идентификационной

экспертизы. Потребности в подобного рода исследованиях в описываемой

области коммуникации связаны с увеличением её использования и

возникновением, как следствие, конфликтных речевых ситуаций: «новая

правоприменительная практика вызвала потребность в исследовании

нетрадиционных для автороведения текстов, направляемых на автороведческую

идентификационную экспертизу. Так, например, на автороведческую экспертизу

нередко представляют тексты в виде твердой копии электронных документов,

размещаемых на сайтах в Интернете» [Галяшина 2006а: 156].

§2. Разработка специально-ориентированного метода идентификации

текстов

2.2.1. Описание подготовительных этапов: создание частотного словаря

Материалом исследования явились два интернет-дневника, опубликованных на

сайте www.diary.ru. Каждый из интернет-дневников разделен нами на две части.

Таким образом, идентификационному исследованию подверглось четыре

фрагмента интернет-дневников, принадлежащих двум авторам. А. Н. Баранов

определяет подобную базовую ситуацию экспертного анализа как

«множественная неопределенность», когда «имеется множество текстов или их

фрагментов. Необходимо установить, скольким авторам принадлежат тексты, и

атрибутировать каждый текст конкретному автору» [Баранов 2002: 1].

Page 122: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

122

Названия интернет-дневникам даны условно и произвольно с целью придания

анонимности текстам: А, Б, В, Г. Для настоящего исследования диагностические

данные о языковой личности (гендерная принадлежность, возраст, место

проживания и т.п.), написавшей текст, не актуальны. В тексте А – 31 362, в Б – 21

660, в В – 31 624, в Г – 22 053 словоупотреблений.

Идентификационное моделирование теста в специально-ориентированном и

универсальном подходах включает несколько этапов анализа текста. Первый этап

совпадает в двух подходах и заключается в том, что лексический уровень каждого

текста с помощью компьютерной программы SimWordSorter [SimWordSorter]

автоматически переводится в формат словников. При составлении словников

реализуется статистический анализ: основной материал трансформируется в

специфирующий путем частотностного ранжирования. Словники составляются в

процессе сплошного подсчета лексических единиц каждого текста.

Под количеством словоупотреблений принято понимать количество элементов,

полученных в результате токенизации – разбиения потока текста на элементы

(токены), которые включают орфографические слова, числа, знаки пунктуации и

другие символы. «В соответствии с разными подходами под размером корпуса

можно понимать общее количество токенов за исключением пунктуации или

количество орфографических слов. В последнем случае двадцатъ пять считается

двумя словами, а 25 – одним» [Ляшевская]. Процесс токенизации в настоящей

работе связан с «машинным» пониманием лексем, при котором исключается

различие омонимов и многозначных слов. Таким образом, слово представляет

собой «набор букв между двумя пробелами, как это принято в машинном

переводе» [Ахманова 1961: 37], «токен» или словоформа.

В настоящей работе словоформы подвергаются процессу лемматизации, в

результате которого единицей счета словника становится лексема. Во введении к

частотному словарю русского языка под ред. Л. Н. Засориной [Частотный

словарь… 1977] говорится о некоторых принципах построения частотного

словаря: «частотные словари составляются с опорой на различные единицы счета:

Page 123: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

123

словоформы, лексемы (с различением или неразличением разных типов

омонимов) или словосочетания. Обычно противопоставляют друг другу две

методики составления частотных словарей: за единицу словника принимается

либо словоформа, либо лексема. Первый способ имеет кажущиеся преимущества

перед вторым, он кажется более последовательным. Выбирая в качестве единицы

счета словоформу, составитель словаря опирается только на графическую

эквивалентность, почти никакого анализа текста не производится» [Частотный

словарь… 1977: 11]. Согласно данным в «Частотном словаре русского языка»

осуществить переход от словоформы к лексеме сложно: «Правила идентификации

словоформ далеко не просты, эксплицитно не формулируются, из-за чего

невозможен машинный анализ текста. Кроме того, при большой выборке словаря

объем статистических перерасчетов при такой методике был бы так велик, что

приблизился бы по затратам времени и труда к обработке материала заново»

[Частотный словарь… 1977: 11].

В словаре под ред. Л. Н. Засориной используется вторая методика: за элемент

словника принимается лексема1. При этом исходно «материалом для отбора

элементов словника служили тексты, расчлененные на отрезки, букворяды и

другие графические символы, разделенные пробелами» [Частотный словарь…

1977: 13]. Переход от словоформы к лексеме должен регулироваться правилами

грамматики, которые зафиксированы в словаре относительно каждой части речи в

разделе «Аналитическая грамматика словаря». Преследуя цель максимально

формализовать методику проведения идентификационных исследований (в том

числе идентификационной экспертизы) на всех уровнях, мы принимаем за

элемент словника «набор букв между двумя пробелами», предлагаемый

1 В Частотном словаре современного русского языка О. Н. Ляшевской и

С. А. Шарова [Ляшевская 2009], используемом в части универсального метода

идентификации текста, элементами словника являются как словоформа, так и

лемма - представлено несколько вариантов словника. Однако для анализа нами

выбран словник с леммой (п. 3.2.1. главы 3).

Page 124: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

124

А. С. Ахмановой [Ахманова 1961: 37]. Этим «набором букв» необходимо считать

как сами лексемы, так и некоторые «недописанные» слова, сокращения (например

«ещ» вместо «еще»): подобные сокращения могут быть «общепризнанными» в

виртуальной коммуникации, для которой характерны сокращения и

преобразования слов разного рода, а также могут отражать проявления

индивидуальных особенностей языковой личности. Более подробно процедура

лемматизации в «Частотном словарем современного русского языка» [Ляшевская

2008] и в словниках по текстам в настоящем исследовании представлена в п. 3.2.1.

главы 3, где лингвоперсонологическому идентификационному моделированию

подвергается весь словник без спецификации отдельных элементов.

Таким образом, в частотных словарях каждое слово рассматривается как

отдельная единица учета и характеризуется некоторыми индивидуальными

показателями: во-первых, числом употреблений слова в исследуемых текстах; во-

вторых, порядковым номером (рангом) при расположении слов в списке по

убывающей частоте. Первый из этих показателей переводится в относительную

частоту употребления и затем сопоставляется со вторым: «эти два показателя,

будучи индивидуальными в том смысле, что они привязаны к отдельному слову,

все же остаются суммарными, поскольку в них затушевана специфика смысловых

связей слова» [Андреев 1967: 85]. Так, очевидно, что количественная

характеристика важна не сама по себе: в ней отражаются связи между словами.

За частотным словарем стоит не только количественное описание частотности

словоупотреблений, свойственное каждому тексту, но также и

лингвоперсонологические особенности, свойственные каждому автору текста.

Составление частотного словаря предстает прежде всего в качестве способа

исследования языковой личности как результата целенаправленного

эксперимента над языковой способностью человека. Таким образом,

количественная характеристика связана с лингвоперсонологическими

особенностями, которые являются методологической базой атрибуции текста.

Page 125: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

125

В специально-ориентированном методе идентификации текстов словник

представляет собой список слов по убывающей частоте, в котором при каждом

слове указана абсолютная частота его появления в тексте. Таким образом,

осуществляется интерсемиотический перевод языковых параметров

идентификации в неязыковые – квантитативные. Актуальная частота (т. е. шкала

значений частоты слова) определяется тем, что слово не может иметь частоту,

равной нулю – рассматриваются только слова, действительно встретившиеся в

данном тексте. В специально-ориентированном методе анализу подвергается

слово, которое встречается хотя бы в одном тексте, но в другом может быть

равным нулю.

При анализе лексической системы языка, в частности при составлении

словника каждого текста с последующей его интерпретацией, «фундаментальной

описательной характеристикой» [Напреенко 2011] в специально-

ориентированном методе идентификации является параметр частотности

анализируемых языковых элементов. Именно лексическое и квантитативное

содержание словников становится объектом идентификационного специально-

ориентированного моделирования. «Необходимо заметить, что предполагаемый

параметр-идентификатор (частотность) является своего рода “околоязыковым”»

[Напреенко 2011]: с одной стороны, мы имеем дело с неязыковым –

квантитативным – параметром (абсолютной и относительной частотой слова в

тексте), с другой стороны, данный параметр описывает лексическую

составляющую текста, характеризуя ее по количеству встречаемости его

элементов. Таким образом, неязыковой параметр является параметором-

идентификатором языковой системы, в частности, лексической системы языка.

Сравнение статистической структуры текстов применяется для установления их

тождества.

Page 126: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

126

Название каждого частотного словаря по тексту соответствует названию текста:

А, Б, В, Г. Частотные словари1 представляют собой список слов по убывающей

частоте, в которых единицей счета является лексема. С помощью количественных

методов установленная абсолютная частота фиксируемых лексических единиц в

словниках переводится в относительную частоту употребления. В специально-

ориентированном методе, представленном в данном исследовании, сопоставление

слов происходит в следующих аспектах: а) анализируются авторские

предпочтения в выборе слова в рамках одного словника по одному тексту,

б) сопоставляется частотность слова в каждом словнике по текстам, когда

актуальным становится выявление лингвоперсонологических различий в частоте

употребления слова разными языковыми личностями. Различное ранжирование

текстов и конкретно синонимов в тексте обладает специфирующим и

идентификационным потенциалом.

Второй этап идентификационного моделирования заключается во введении

словников в частотно-сопоставительные таблицы, позволяющие сопоставлять

лексико-квантитативные параметры отдельных единиц в разных текстах.

Частотно-сопоставительные ряды в рамках специально-ориентированного

исследования содержат синонимические ряды по текстам в рамках таких частей

речи, как наречия, союзы и союзные слова, частицы и т. п. и частоту их

словоупотребления.

Третий этап моделирования текста в специально-ориентированном и

универсальном подходах существенно отличается. Описанию третьего этапа

моделирования в специально-ориентированного подходе посвящен п. 2.2.2.

1 Далее наряду с «частотным словарем» могут встречаться определения «список»,

«словник», которые являются аналогичными друг другу. Однако в данном

исследовании принято следующее разграничение в употреблении: словник –

частотный словарь, созданный по конкретному тексту; частотный словарь –

частотный словарь современного русского языка [Ляшевская 2009] или любого

другого Частотного словаря русского языка.

Page 127: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

127

2.2.2. Гипотеза и реализация специально-ориентированного метода

идентификации текстов

Суть специально-ориентированного метода идентификации текста, в частности

его лексико-квантитативного способа, заключается в фиксации частотности

слова в тексте как индивидуализирующего свойства. В настоящем исследовании

проводится анализ лексического уровня языка, который исследует словарный

запас автора. Исследуя настоящий аспект, мы выдвигаем гипотезу о том, что

частотность в случае лексико-квантитативного анализа текста является

идентификационным параметром в идентификационных исследованиях и в

частности в экспертизе идентификационного характера.

В основе специально-ориентированного подхода лежит представление о выборе

языковой личности в своем употреблении преимущественно одного синонима из

существующего синонимического ряда, представленного в словаре синонимов

русского языка: «В языковом поведении каждого человека отражается

динамический стереотип, т. е. человек склонен употреблять одни синонимы, а не

другие» [Ароцкер 1961: 142]. Синонимы – вслед за «широким» подходом

А. П. Евгеньевой к пониманию данного понятия – «слова, выражающие одно и то

же понятие, тождественные или близкие по своему значению, которые

отличаются один от другого или оттенком значения, или стилистической

окраской (сферой употребления) или одновременно обоими названными»

[Словарь синонимов]. Кроме того, «широкий» подход А. П. Евгеньевой в

настоящем исследовании сочетается с формализованным подходом, под которым

нами понимается исключение различия омонимов, многозначных слов, а также

контекстных синонимов. В рамках специально-ориентированного метода

формализованный подход не может быть реализован в полной мере в связи с тем,

Page 128: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

128

что единицами идентификационного моделирования являются слова, связанные

синонимическими отношениями. Однако, во-первых, данные слова (союзы,

предлоги, местоимения и т. п. – служебные или распорядительные частицы, а

также некоторые наречия, анализируемые в настоящем исследовании) являются

общими «для всех родов литературы» [Морозов 1915], во-вторых, согласно опыту

К. А. Морозова, употребление некоторых союзов в тексте осуществляется

машинальным образом и обусловлено внешними и внутренними

лингвистическими обстоятельствами, которые не являются предметом

настоящего исследования. В связи с этим полагаем, что дальнейшие разработки

специально-ориентированного метода идентификации в аспекте его

формализации помогут сделать шаг к автоматизации процедуры проведения

данного метода.

Наряду с термином синонимы в статье А. Н. Баранова используется понятие

квазисинонимы [Баранов 2001; Баранов 2002]), которое актуально для настоящего

исследования в связи с попыткой формализовать специально-ориентированный

метод идентификации текстов, являющийся на данный момент «интуитивным».

Если синонимы предполагают более узкое значение, подразумевающее слова,

использование которых зависит от сферы употребления, то под квазисинонимами

или функциональными эквивалентами (в нашей терминологии) понимаются

слова, способные взаимозаменять друг друга в любом тексте. В данном аспекте

следует отметить определение синонимов, данное В. К. Фавориным:

«Синонимами в строгом смысле слова следует считать только слова, легко

заменимые в том или ином контексте» [Фаворин 1953: 20].

К. А. Морозов сравнивая употребление союзов потому что и так как, отмечал

их «способность к взаимозаменяемости почти в каждой фразе» [Морозов 1915:

94]. В настоящей работе, таким образом, мы исходим из предположения о том,

что синонимы, включенные в синонимический ряд словаря синонимов русского

языка, могут взаимозаменять друг друга в любом контексте. Выбор синонима

зависит исключительно от авторских предпочтений, обусловленных

Page 129: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

129

способностью языковой личности. На выявление данных предпочтений

направлено лингвоперсонологическое моделирование текстов.

Специально-ориентированный подход реализуется путем выделения в тексте

специфических параметров. В лексико-квантитативном способе идентификации

текста таковым параметром является ряд индивидуальных предпочтений в выборе

употребления некоторых синонимов в своей речи. Интерпретация указанного

параметра путем лексико-квантитативного моделирования позволяет осуществить

идентификацию текстов. С точки зрения анализируемого лексического уровня

данный подход обозначается нами как специально-лексический или

синонимический, т.к. предполагает выявление синонимов для

идентификационного моделирования текста.

Лингвоперсонологическому моделированию в специально-ориентированном

методе подверглись «некоторые группы квазисинонимов для следующих слоев

лексической системы языка: наречия, союзы и союзные слова, частицы»

[Напреенко 2011]. «Выбор для исследования представленных слоев лексической

системы языка обусловлен тем, что именно данные слова отражают психо-

речевую организацию автора наиболее полно, т. к. они связаны с отражением

эмоционального состояния, выражают отношение пишущего субъекта к

сказанному к действительности» [Напреенко 2011]. Именно поэтому

квантитативному анализу не подвергаются, например, существительные ‒ они

зависимы от тематики конкретного текста (о примере частого включения слова

хоббит в произведении о хоббитах ‒ в п. 3.2.1). «Данная языковая система при ее

анализе с точки зрения частотности использования лексических единиц позволяет

говорить о наибольшей объективности полученного результата и возможности в

перспективе делать экспертное заключение без участия субъекта» [Напреенко

2011]. Ю. А. Тамбовцев, А. Ю. Тамбовцева и Л. А. Тамбовцева также отмечают,

что «при распознавании авторства текстов следует анализировать прежде всего те

слова, которые пишущий человек употребляет неосознанно. Такими словами

являются служебные слова, которые находятся на периферии сознания пишущего

Page 130: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

130

и, на первый взгляд, служат только для грамматической связи слов. Между тем,

выражая отношения между знаменательными, они показывают индивидуальные,

присущие тому или иному автору способы представления этих отношений, и,

следовательно, отражают особенности мышления того или иного писателя»

[Тамбовцев 2008]. Анализ носит статистический характер: постоянно использует

количественную информацию о встречаемости элементов в тексте.

Специально-ориентированный метод идентификации направлен на

установление тождества идентифицируемых объектов, которыми могут быть

текст и языковая личность по тексту. В главе 1 мы описали важность логико-

философских категорий тождества и различия для более глубокого понимания

феномена идентификации в лингвистике и идентификационной экспертизе. В

данном методе лексико-квантитативная закономерность как следствие закона

частотно-рангового распределения описывает структуру любого текста и является

общей закономерностью построения любого текста. Индивидуальное

распределение выражается в разном соотношении количества употребления

определенного синонима в текстах, принадлежащих разным авторам. Так, в

текстах, принадлежащих разным языковым личностям, содержится

индивидуальный набор лексико-квантитативных закономерностей, которые

позволяют отличить тексты друг от друга. Мы полагаем, что специально-

ориентированный метод идентификации текста предполагает установление

лексико-квантитативного тождества в следующих аспектах

идентификационного моделирования: а) выявление лексического тождества, т. е.

внутренней семантической общности (синонимии), представленной в словаре

синонимов русского языка и воплощенной в конкретных текстах интернет-

дневников; б) выявление тождества и различия в предпочтениях употребления

определенных синонимов в своей речи разными авторами, описываемые

квантитативной характеристикой вхождения слова в текст – выявляется при

анализе частотно-сопоставительной таблицы «по-вертикали»; в) установление

идентичной частотности и отсутствия таковой в употреблении определенного

Page 131: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

131

слова в разных словниках по текстам – выявляется при анализе частотно-

сопоставительной таблицы «по-горизонтали».

Для каждого из четырех анализируемых словников составляется частотно-

сопоставительная таблица с указанием количественных характеристик,

описывающих тип распределения и отражающих различие в распределении

отдельных слов для разных текстов. Частотно-сопоставительная таблица

содержит квазисинонимические ряды с указанием абсолютной и относительной

частот встречаемости каждого слова в четырех словниках по четырем текстам.

Первое слово в ряду квазисинонимов – слово с большим числом употребления в

тексте, имеющее меньший ранг соответственно. Такое слово правомерно можно

считать доминантой индивидуального синонимического ряда как показателя

индивидуально-авторского предпочтения в выборе синонима. Далее к доминанте

приписываются в порядке убывания (сохраняя правило строения частотного

словаря) синонимы, включенные в Словарь синонимов русского языка.

Актуальными для анализа словника (и далее – для идентификации текстов)

являются а) синонимы, использование которых наличествует в текстах,

б) синонимы, частота встречаемости которых может быть равна нулю в одних

текстах, но больше нуля в других. Если квантитативные характеристики двух

текстов близки друг другу и противостоят двум другим текстам по показателю

относительной частотности вхождения слова в текстах, то есть основания

полагать, что группы слов, представляющие индивидуальные предпочтения одной

языковой личности, противопоставляются другой группе слов, отражающей

выбор другой языковой личности. Данные индивидуально-авторские

предпочтения, описываемые квантитативной характеристикой, позволяют

идентифицировать тексты и языковые личности по текстам.

Понимание квантитативных параметров как лингвоперсонологических

характеристик «позволяет говорить об их идентифицирующей возможности −

способности дифференцировать текст по авторской принадлежности» [Напреенко

2011] в рамках лингвистического идентификационного исследования.

Page 132: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

132

Идентификационное моделирование текста предполагает анализ частотно-

сопоставительных таблиц, а) в которых доминанта индивидуального

синонимического ряда одинаковая для разных текстов, б) в которых доминанта

индивидуального синонимического ряда для разных текстов разная. Рассмотрим

полученные ряды синонимов из представленных групп лексем для словников по

текстам А, Б, В, Г. Анализ лексико-квантитативных данных частотно-

сопоставительных таблиц «по-вертикали» отражает авторские предпочтения в

выборе одного из возможных синонимов. Анализ «по-горизонтали» позволяет

сопоставить квантитативное различие в использовании определенного слова во

всех четырех текстах. Понятие контрастной разницы между относительными

частотами как критерия разграничения текстов по авторской принадлежности

актуально в обоих случаях.

1. Квазисинонимические ряды, в которых доминанта для разных текстов

одинаковая: преимущественно осуществляется выявление разницы в частоте

употребления не доминантного функционального эквивалента во всех текстах1.

1.1. Сопоставление частоты употребления слов но / однако в словниках по

текстам2 (см. таблицу № 1).

1 Специально-ориентированное моделирование текста в идентификационном

аспекте частично представлено в разделе монографии [Языковая личность…

2014] ([Напреенко 2014а]).

2 Моделирование в настоящей части исследования осуществляется путем выборки

синонимов из «Словаря синонимов» по ред. А. П. Евгеньевой [Словарь

синонимов 1975].

Page 133: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

133

Таблица № 1.

Сопоставление частоты употребления слов

но / однако

Анализ лексико-квантитативных данных частотно-сопоставительной таблицы в

направлении по-вертикали показывает, что авторские предпочтения в выборе

одного из синонимов тождественны. Авторы всех анализируемых текстов

(фрагментов интернет-дневников) в равной степени предпочитают употреблять

слово но: разброс относительных частот однороден: 0,55 %; 0,628 %; 0,564 %;

0,423 %.

Актуальным для дифференциации текстов в данном ряду является слово

однако. Сравнение относительных частот показывает, что авторы текстов Б и Г

употребляют данное слово значительно реже, чем авторы текстов А и В: 0,008 %

– 0,006 %; 0,041 % – 0,063 %. Анализ показателей относительной частотности

слова однако позволяет предположить следующее распределение групп текстов

по принадлежности одной языковой личности: А и В; Б и Г.

1.2. Сопоставление частоты употребления слов только / лишь в словниках по

текстам (см. таблицу № 2).

Таблица № 2.

Сопоставление частоты употребления слов

только / лишь

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

но 173 0,55 % 136 0,628 % 178 0,564 % 93 0,423 %

однако 12 0,041 % 1 0,008 % 19 0,063 % 1 0,006 %

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

только 86 0,276 % 72 0,336 % 83 0,265% 82 0,376%

лишь 11 0,037 % 29 0,135 % 13 0,043% 44 0,2%

Page 134: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

134

Анализ лексико-квантитативных данных частотно-сопоставительной таблицы

по-вертикали отражает авторские предпочтения в выборе слова только в каждом

тексте в равной степени: 0,276 %; 0,336 %; 0,265 %; 0,376 %.

На данном этапе актуальным для анализа является слово лишь, так как его

употребление в разных текстах контрастно различествует. Анализ по-горизонтали

позволяет сопоставить различие в частоте использования слова лишь во всех

четырех текстах. В словниках А и В: 0,037 % и 0,043 %; в словниках Б и Г: 0,135

% и 0,2 %. По относительным частотам употребления этого слова во всех текстах

можно установить следующее индивидуально-конкретное тождество объектов: А

и В; Б и Г.

1.3. Сопоставление частоты употребления слов очень / весьма / крайне /

бесконечно в словниках по текстам (см. таблицу № 3).

Таблица № 3.

Сопоставление частоты употребления слов

очень / весьма / и т. д.

Авторы каждого словника употребляют слово очень чаще, чем другие

представленные в таблице слова: 0,131 %; 0,291 %; 0,134 %; 0,183 %. Анализ

частотно-сопоставительной таблицы по-вертикали показал, что доминантой

индивидуального синонимического ряда в каждом словнике явилось слово очень.

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

очень 41 0,131 % 63 0,291 % 42 0,134 % 40 0,183 %

весьма 4 0,015 % 0 0 5 0,016 % 0 00

крайне 0 0 0 0 1 0,004 % 0 0

бесконечно 0 0 1 0,006 % 0 0 2 0,013 %

Page 135: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

135

Анализ частотно-сопоставительной таблицы по-горизонтали дает больше

оснований для идентификации текстов. Сравнение относительной частоты слова

весьма выражает авторские индивидуальные предпочтения в употреблении

данного слова в текстах А и В (0,015 % и 0,016 %), в то время как в словниках Б и

Г данное слово не употребляется. Относительные частоты употребления слов

крайне и бесконечно во всех четырех словниках не представляют контрастного

различия, а значит, характеризуются наименьшим идентификационным

потенциалом.

1.4. Сопоставление частоты употребления слов может / возможно / видимо /

очевидно /вероятно / наверное / кажется / пожалуй / похоже в словниках

(см. таблицу № 4).

Таблица № 4.

Сопоставление частоты употребления слов

может / возможно / видимо / очевидно и т.д.

А Б В Г

абсолтю

т.

частота

относит.

частота

абсолют.

частота

отност.

частота

абсолт.

частота

отност.

частота

абсолт.

частота

отност.

частота

может 36 0,117% 55 0,258% 43 0,136% 55 0,249%

возможно 6 0,02 % 11 0,051% 6 0,021% 6 0,03 %

видимо 8 0,025% 12 0,058% 6 0,021% 8 0,04 %

очевидно 4 0,013% 0 0 2 0,007% 0 0

вероятно 0 0 0 0 1 0,006% 0 0

наверное 12 0,041% 17 0,079% 4 0,039% 18 0,082%

кажется 10 0,033% 16 0,075% 4 0,039% 19 0,085%

пожалуй 1 0,005% 4 0,021% 1 0,004% 8 0,028%

похоже 2 0,008% 9 0,042% 2 0,007% 9 0,03 %

Page 136: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

136

Авторы словников А, Б, В и Г преимущественно используют в своем

употреблении слово может, однако, частота использования данного слова

превалирует в текстах Б и Г: 0,258 % и 0,249 %. Анализ относительной частоты

слов наверное, кажется, пожалуй, похоже отражает авторский выбор в

употреблении данных слов преимущественно в словниках Б и Г. Относительные

частоты слов возможно, видимо, вероятно, очевидно в разных словниках не

представляют контрастной разницы и не могут выступать в качестве параметра

идентификации.

1.5. Сопоставление частоты употребления слов жаль / жалко в словниках

(см. таблицу № 5).

Таблица № 5.

Сопоставление частоты употребления слов

жаль / жалко

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

жаль 23 0,073 % 5 0,023 % 13 0,041 % 6 0,027 %

жалко

(разг.)

3 0,009 % 0 0 8 0,025 % 0 0

Доминантной индивидуальных синонимических рядов всех анализируемых

словников является слово жаль. Однако относительные частоты слова жаль во

всех текстах также дают основания для установления их тождества: в текстах А и

В данное слово употребляется чаще, чем в текстах Б и Г. Согласно распределению

частоты функционирования лексемы жалко (разг.) текст Б тождественен тексту Г

в связи с отсутствием данного словоупотребления в обоих словниках.

1.6. Сопоставление частоты употребления слов кой / который в словниках

(см. таблицу № 6).

Page 137: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

137

Таблица № 6.

Сопоставление частоты употребления слов

кой / который

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

кой

(устар.)

0 0 4 0,018 % 0 0 4 0,018 %

который 34 0,108 % 14 0,064 % 24 0,075 % 20 0,09 %

Анализ лексического уровня предполагает анализ авторского предпочтения в

выборе редко используемых слов и архаизмов в том числе. В связи с этим

необходимо обратить внимание, например, на наличие

словоупотребления кой (устар.) наряду с который. Анализ таблицы по-

горизонтали отражает предпочтения авторов текстов Б и Г, выражающиеся в

употреблении устаревшего слова кой, в то время как в словниках А и В данного

слова не обнаруживается.

1.7. Сопоставление частоты употребления слов такой / подобный в словниках

(см. таблицу № 7).

Таблица № 7.

Сопоставление частоты употребления слов

такой / подобный

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

такой 66 0,21 % 31 0,143 % 54 0,17 % 28 0,126 %

подобный 2 0,006 % 0 0 5 0,015 % 0 0

По распределению относительных частот употребления представленных лексем

текст Б тождественен тексту Г в связи с отсутствием слова подобный в обоих

текстах, в то время, как в словниках А и В оно используется. Идентификационный

потенциал обнаруживает частотность слова такой: в текстах А и В оно

употребляется чаще, чем в текстах Б и Г.

Page 138: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

138

2. Квазисинонимические ряды, в которых доминанта для разных текстов

разная: а) осуществляется выявление тождества и различия в употреблении

определенного слова во всех текстах, б) осуществляется выявление различия в

частоте употребления остальных слов, не представляющих доминанту

индивидуального синонимического ряда.

2.1. Сопоставление частоты употребления слов тут / здесь в словниках

(см. таблицу № 8).

Таблица № 8.

Сопоставление частоты употребления слов

тут / здесь

Анализ выбора автором каждого текста наиболее употребительного слова

(индивидуальной доминанты из квазисинонимического ряда) показал, что авторы

текстов А и В в большей степени предпочитают использовать слово тут: 0,102 %

и 0,096 %. Данные предпочтения характеризуются как индивидуально-авторские

и несут в себе потенциально идентифицирующий характер.

Выявляя идентификационный потенциал частотно-сопоставительной таблицы

по-горизонтали, отметим, что слово тут является не только доминантой в текстах

А и В, но также чаще используется в этих текстах по сравнению с текстами Б и Г:

0,102 % и 0,096 % (А и В) – 0,062 % и 0,049 % (Б и Г).

В текстах Б и Г доминантой является слово здесь, однако, относительные

частоты не являются контрастными. При сопоставлении частотности

употребления данного слова во всех словниках обнаружено, что его

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

тут 31 0,102% 13 0,062% 30 0,096% 10 0,049%

здесь 15 0,05% 14 0,065% 14 0,046% 20 0,095%

Page 139: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

139

относительная частотность во всех текстах не дает возможности сделать

категоричный вывод об индивидуально-конкретном тождестве объектов.

2.2. Сопоставление частоты употребления слов теперь / сейчас / нынче в

словниках (см. таблицу № 9).

Таблица № 9.

Сопоставление частоты употребления слов

теперь / сейчас и т.д.

Идентификационное моделирование на примере данной частотно-

сопоставительной таблицы выдает не определенные идентификационные

результаты. Слово нынче не выражает авторские предпочтения, т. к. количество

словоупотреблений очень мало, однако, вписывая квантитативные

характеристики по данным словам в общие результаты идентификационного

моделирования, установим индивидуально-конкретное тождество следующих

объектов: А и В (нынче: 0,008 % и 0,004 %), Б и Г (нынче: 0 – 0,001 %).

Разница в употреблении слова теперь во всех текстах не представляется

контрастной: 0,093 %; 0,109 %; 0,088 %; 0,142 %. Слово теперь является

доминантой только в словнике А. Сравнение относительной частоты

употребления слова сейчас в текстах Б и Г показывает, что данное слово является

самым употребительным в них, кроме того при анализе частоты данного слова во

всех словниках очевидно контрастное различие в частотности его употребления: в

текстах Б и Г слово сейчас употребляется чаще, чем в текстах А и В.

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

теперь 29 0,093% 23 0,109% 28 0,088% 31 0,142%

сейчас 26 0,085% 49 0,228% 27 0,088% 32 0,149%

нынче 2 0,008% 0 0 5 0,004% 0 0

Page 140: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

140

2.3. Сопоставление частоты употребления слов нужно / необходимо / надо в

словниках (см. таблицу № 10).

Таблица № 10.

Сопоставление частоты употребления слов

нужно / необходимо / надо и т.д.

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

нужно 32 0,102 % 4 0,018 % 72 0,227 % 1 0,004 %

необходимо 1 0,003 % 1 0,004 % 1 0,003 % 1 0,004 %

надо 3 0,009 % 61 0,281 % 12 0,037 % 58 0,263 %

Относительная частота употребления слова необходимо во всех четырех текстах

тождественна, поэтому не представляет интереса для анализа: 0,003 %, 0,004 %,

0,003 %, 0,004 %. Частота употребления слов нужно и надо дает следующие

результаты. Относительная частота функционирования слова нужно имеет

наибольший показатель в текстах А и В и является доминантой индивидуальных

синонимических рядов в данных текстах: 0,102 % – 0,227 %. В словниках Б и Г чаще

используется слово надо − оно и является доминантой индивидуальных

синонимических рядов в данных текстах: 0,281 % – 0,263 %.

2.4. Сопоставление частоты употребления слов быстро / скоро в словниках

(см. таблицу № 11).

Таблица № 11.

Сопоставление частоты употребления слов

быстро / скоро

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

быстро 20 0,063 % 7 0,032 % 17 0,053 % 7 0,031 %

скоро 4 0,012 % 8 0,036 % 10 0,031 % 8 0,036 %

Page 141: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

141

Идентичны показания частоты словоупотреблений быстро и скоро в текстах Б

и Г (анализ по-горизонтали). В данных текстах выделить доминанту

синонимического ряда авторов текстов не представляется возможным, т. к.

указанные слова употребляются в равной мере. В словниках А и В доминантой

индивидуального синонимического ряда является слово быстро, которое

употребляется несколько чаще, чем слово скоро: 0,063 % и 0,012 % в тексте А,

0,053 % и 0,031 % в тексте В.

2.5. Сопоставление частоты употребления слов особо / особенно в словниках

(см. таблицу № 12).

Таблица № 12.

Сопоставление частоты употребления слов

особо / особенно

А Б В Г

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

Частота

особо 29 0,092 % 0 0 2 0,006 % 0 0

особенно 8 0,025 % 10 0,046 % 19 0,06 % 5 0,022 %

Анализ относительной частоты употребления слов особо и особенно позволяет

выявить контрастные данные в пределах каждого текста. Так, тексты Б и Г

идентичны в связи с отсутствием употребления слова особо (в текстах А и В оно

наличествует).

Квантитативное анализ квазисинонимических рядов позволил установить

соответствие ряда синонимов текстам, в которых они употребляются с такой

квантитативной специфичностью, что их сопоставление дает возможность

установить тождество между текстами. Так, в таблице (таблица № 13) отражены

предпочтения авторов текстов А, Б, В и Г в выборе словоупотребления,

позволяющие установить индивидуально-конкретное тождество объектов.

Page 142: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

142

Таблица № 13.

Предпочтения языковых личностей

в выборе словоупотребления

А Б В Г

но

только

очень

жаль

такой

может

однако лишь однако лишь

весьма бесконечно весьма бесконечно

надо возможно надо возможно

тут видимо тут видимо

жалко наверное жалко наверное

подобный кажется подобный кажется

нужно пожалуй нужно пожалуй

сейчас похоже сейчас похоже

быстро нужно быстро нужно

здесь здесь

надо надо

кой кой

теперь теперь

Таким образом, идентификационное моделирование в специально-

ориентированном подходе, осуществляемое с целью выявления индивидуальных

предпочтений в выборе определенного синонима, позволил установить

следующее тождество текстов по написанию текстов одной или разными

языковыми личностями: тексты А и В принадлежат одной языковой личности, Б и

Г – одной, другой языковой личности. Словники А и Б, В и Г и тексты по ним

принадлежат разным языковым личностям. Важно, что данный вывод

осуществляется не по принципу подсчета количества характерных синонимов для

каждого текста, а по идентичности их относительной частотности в разных

текстах. Так, в текстах А и В превалирует в использовании слова однако, весьма,

может, надо, требуется, тут, жалко, подобный, нужно, сейчас, быстро. В

текстах Б и Г – лишь, бесконечно, может, возможно, видимо, наверное, кажется,

пожалуй, похоже, нужно, здесь, сейчас, надо, кой, теперь. Одинаковые слова в

разных группах текстов – это доминанты индивидуальных синонимических рядов

в каждом анализируемом словнике, которые, однако, характеризуются

Page 143: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

143

контрастной относительной частотой употребления в них: но, только, очень,

жаль, такой.

Проведенное исследование позволяет говорить о том, что существуют

характерные лексико-квантитативные особенности, позволяющие в перспективе

дифференцировать анализируемые тексты и объединить их в группы по

принадлежности одному или разным авторам. Данные особенности являются

составляющими лексического уровня языка, с одной стороны, с другой стороны,

они характеризуются количественным критерием, способным нести

идентифицирующую функцию. Таким образом, мы представили специально-

ориентированный метод, который основывается на исчислении и сопоставлении

относительной частотности синонимов (функциональных эквивалентов).

Лексико-квантитативный подход к анализу лексического уровня языка, таким

образом, направлен на выявление специфирующих особенностей текста.

Идентичность текстов устанавливается путем анализа относительной

частотности вхождения слов в разных текстах, под которым понимается этюдное

описание полученных в результате идентификационного моделирования

результатов. Дальнейшие разработки по формализации данного исследования и

выведение границ контрастного различия относительных частот в разных текстах,

способствующих разграничению текстов по принадлежности разным авторам,

позволят вывести специально-ориентированный метод идентификации текстов на

уровень наибольшей универсальности, понимаемой в контексте настоящего

исследования.

Page 144: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

144

2.2.3. Алгоритм специально-ориентированного метода идентификации

текстов

Алгоритм хода специально-ориентированного метода идентификации текстов

определяется следующими этапами:

1. Лексический уровень каждого идентифицируемого текста

автоматизированным путем1 перевести в формат словников. Название (условное

обозначение) словника должно соответствовать названию (условному

обозначению) текста.

2. Отобрать синонимические ряды в словаре синонимов русского языка

(наречия, союзы и союзные слова, частицы) для включения в частотно-

сопоставительные таблицы.

3. Составить частотно-сопоставительную таблицу, в которую включить

синонимический ряд и абсолютную частоту использования слова в тексте.

Количество частотно-сопоставительных таблиц должно совпадать с количеством

моделируемых синонимических рядов.

4. Перевести абсолютную частоту анализируемого слова в относительную

частоту2 словоупотребления. Пример частотно-сопоставительной таблицы, если

идентификации подвергается три текста1 приведен ниже (см. таблицу № 14):

1 Например, с помощью компьютерной программы SimWordSorter

[SimWordSorter].

2 «Под относительной частотой появления выбранного слова понимается

отношение абсолютного числа появления слова в литературном произведении

исследуемого автора к общему числу слов в конкретном произведении этого

автора» [Павлов 2011]. Так, относительная частота в настоящем исследовании –

отношение абсолютной частоты встречаемости слова в словнике по тексту к

Page 145: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

145

Таблица № 14.

Пример частотно-сопоставительной таблицы

для специально-ориентированного метода

Синонимический

ряд

Текст № 1 Текст № 2 Текст № 3

Слово

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

абсолют.

частота

относит.

частота

Слово -//- -//- -//- -//- -//- -//-

Слово -//- -//- -//- -//- -//- -//-

5. Сопоставить относительную частотность слов в рамках полученных

квазисинонимических рядов: а) по-вертикали: выявление предпочтений авторов,

выраженных в наиболее частом употреблении одного слова перед другим;

б) по-горизонтали: выявление разницы

относительной частоты употребления слова в разных текстах.

6. Установить тождество объектов идентификации на основе анализа в пункте

5 настоящего алгоритма.

общему количеству словоупотребления в данном тексте, выраженное в

процентном отношении.

1 Ситуация авторизации текста «сравнение по образцу» [Баранов 2007: 45].

Page 146: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

146

Выводы по 2 главе

Результатом главы 2 стало представление одного из двух предлагаемых

вариантов методики идентификации языковой личности на основе обнаружения и

описания лексико-квантитативных закономерностей текста. Этим вариантом стал

специально-ориентированный метод идентификации текстов и языковой личности

на материале интернет-дневников, представленных четырьмя фрагментами,

средний объем которых составляет 27 тысяч словоупотреблений. Задача

специально-ориентированного метода – идентифицировать тексты по их

принадлежности одному автору и соответственно идентифицировать языковые

личности на основе выявления специфических лексико-квантитативных

параметров в тексте.

В основе данного подхода лежит представление о выборе языковой личностью

преимущественно одного синонима из существующего ряда, представленного в

словаре синонимов русского языка. Обнаружение синонимической связи между

словами существенно отличает данный подход от универсального, в котором не

выделяется качественной связи между словами для идентификационного

моделирования. Вариант языковой способности автора выявляется путем

выделения лексико-квантитативных закономерностей идентифицируемых

текстов. Таким образом, специально-ориентированный метод предполагает

выделение в тексте специфических параметров, выражающихся в ряде

индивидуальных предпочтений в выборе употребления ряда синонимов в своей

речи, и интерпретации их путем лексико-квантитативного моделирования.

Обнаружение лексико-квантитативного тождества способствует идентификации

или дифференциации текстов.

Обоснование проявления идентифицирующей функции выдвинутого параметра

частотности проводится путем анализа лексических единиц текста на степень

проявления в тексте данного параметра, а также характеристики особенностей его

Page 147: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

147

существования в конкретном тексте. Анализ частотно-сопоставительных таблиц в

специально-ориентированном подходе способен характеризовать частотность

использования слова как параметра-идентификатора в случае, когда данное слово

превалирует в функционировании над другим. Исследование данного уровня

позволяет сделать вывод об идентичности текстов по определенному авторству,

т. к. «характеризует лингвоперсонологический авторский выбор в

количественном предпочтении определенного словоупотребления» [Напреенко

2011]. Несмотря на то, что данный подход предполагает выявление

специфических параметров, таких как синонимические предпочтения языковой

личности, степень объективности вывода увеличивается, так как мы имеем дело с

количественным результатом, который наиболее «объективно характеризует язык

по количеству встречаемости его элементов» [Напреенко 2011]. Специально-

ориентированный подход является своего рода переходным этапом от

исследований чисто этюдного типа к исследованиям формализованным.

Дальнейшие разработки в квантитативном аспекте позволят формализовать

данный метод и сделать его автоматизированным. В связи с этим перспектива

специально-ориентированного исследования – разграничение разницы между

средними значениями относительных частот групп текстов по шкале: высокий,

средний, нулевой (последний – невозможность считать данный показатель

идентифицирующим).

Page 148: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

148

Глава 3. Универсальный метод моделирования текстов в

идентификационном аспекте

Данная глава посвящена разработке универсального метода идентификации

текстов и языковой личности, основанного на анализе предпочтений языковой

личности, выражающихся в использовании определенных слов в своей речи.

Предпочтения языковой личности отражаются в ранжировании текста и

выявляются путем применения предлагаемых формул для идентификационного

моделирования текстов, основанных на формализованном подходе к слову и

анализе каждого слова в словнике без спецификации, присутствующей в

специально-ориентированных методах.

§1. Разработка универсального метода идентификационного

моделирования текстов (первый этап идентификации)

3.1.1. Описание подготовительных этапов

В универсальном варианте идентификации текстов актуализируется частотно-

ранговая закономерность и в частности лексико-ранговая, которая заключается в

том, что слово, используемое в тексте наиболее часто, имеет наименьший ранг его

частоты (второе по используемости слово встречается приблизительно в два раза

реже, чем первое, третье — в три раза реже, чем первое). В связи с данной

Page 149: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

149

закономерностью в универсальном методе фундаментальной описательной

характеристикой является ранг частоты слова (R) как параметр-идентификатор,

который позволяет сопоставлять качественную наполненность словников (для

специально-ориентированного подхода актуальным параметром-

идентификатором явилась частота словоупотребления). Материалом данного

типа исследования явились фрагменты интернет-дневников, описанные в §1

главы 2.

Идентификационное моделирование текста в рамках универсального подхода

включает несколько этапов анализа текста. Первый этап совпадает с этапом

интерсемиотического перевода языковых параметров идентификации в

неязыковые в специально-ориентированном подходе: лексический уровень

текстов с помощью компьютерной программы SimWordSorter [SimWordSorter]

переводится в формат словников, представляющих список слов по убывающей

частоте с указанием ранга. Выбор для исследования лексического уровня языка

связан с тем, что именно «данная языковая система при ее анализе с точки зрения

частотности <…> позволяет говорить о наибольшей объективности полученного

результата и возможности в перспективе делать идентификационное заключение

без участия субъекта» [Напреенко 2011]. Таким образом, словники по текстам

предстают как способ исследования проявлений языковых способностей в

тексте.

Второй этап – составление частотно-сопоставительных таблиц, которые

позволяют сопоставлять ранг частоты слова в разных текстах, выявляя языковые

предпочтения языковых личностей. Каждая частотно-сопоставительная таблица

включает два словника с перечислением ста самых частотных слов1 и указанием

ранга каждого. Таким образом, сгруппировано четыре частотно-

сопоставительных таблицы на основе идентификационных выводов, полученных

при использовании специально-ориентированного метода, согласно: а)

1

То есть словоформ исходного текста, подвергшихся лемматизации, о которой

сказано в п. 3.2.1.

Page 150: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

150

гипотетической принадлежности разных словников текстам разных языковых

личностей, б) гипотетической принадлежности разных словников текстам одной

языковой личности:

I. Частотные таблицы по текстам разных языковых личностей.

1. Частотно-сопоставительная таблица А.1 (см. приложение А), содержащая

словник А и словник Б и их ранговое положение от R=1 (самое частотное) до

R=100 (наименее частотное).

2. Частотно-сопоставительная таблица Б.1 (см. приложение Б), содержащая

словник В и словник Г.

II. Частотные таблицы по текстам одной языковой личности.

3. Частотно-сопоставительная таблица В.1 (см. приложение В), содержащая

словник А и словник В.

4. Частотно-сопоставительная таблица Г.1 (см. приложение Г), содержащая

словники Б и словник Г.

В связи с анализом ста самых частотных слов текста данный подход

обозначается как вариант идентификации на базе слов-идентификаторов с

высокой частотностью. К высокочастотным словам анализируемых текстов

относятся:

в словнике А: от R=1 – я до R=100 – теперь;

в словнике Б: от R=1 – есть до R=100 – на;

в словнике В: от R=1 – это до R=100 – сейчас;

в словнике Г: от R=1 – есть до R=100 – со.

Как видно по частотно-сопоставительным таблицам (приложения А, Б, В, Г), на

позициях самых частотных слов в большей степени расположены предлоги и

местоимения. Этот факт является вполне закономерным, т. к. самыми частотными

словами согласно любому частотному словарю русского языка являются предлоги

и местоимения. Дальнейшее исследование в части сопоставления словников по

Page 151: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

151

текстам с Частотным словарем современного русского языка [Ляшевская]

покажет, что бо льшая их часть используется одинаково часто.

3.1.2. Гипотеза исследования

А. Ю. Хоменко [Хоменко 2014] в результате применения метода атрибуции,

основанного на синтезе анализа языковой личности и стилометрического анализа,

приходит к некоторым выводам, одним из которых является следующий: «отбор

параметров должен происходить на основе глубокого анализа языковой личности

автора текста-образца, причем в большем объеме именно на мотивационном

уровне» [Хоменко 2014]. Исключая прием выделения отдельных слов для

идентификационного моделирования, отметим: мы опускаем анализ конкретной

языковой личности и подвергаем анализу все слова (в рамках ста

высокочастотных слов) без спецификации с целью выявления в тексте и

типичного, и индивидуализированного1. В данном способе отбора параметров

идентификационного описания заключается формализм, характерный для

универсального метода идентификации текстов и языковой личности.

В основе предлагаемого нами подхода лежит представление о том, что

языковая личность проявляется в предпочтительном использования некоторых

слов (любых частей речи) в большей степени, чем других. При сопоставлении

текстов выявляется, насколько разнообразно ранжирование одного и того же

слова в разных словниках. Таким образом, текст, построенный в ранговом

1 Осуществляется на примере сопоставления с частотным словарем русского языка

(§ 2 главы 3).

Page 152: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

152

отношении, отражает бессознательное распределение языковой личностью слов в

тексте, а различное ранжирование позволяет установить тождество и различие

объектов идентификации.

Универсальный подход к моделированию текстов предполагает два этапа

анализа полученных частотно-сопоставительных таблиц.

Первый этап моделирования представлен двумя способами1, базирующимися

на разном определении ранга. Сто самых частотных слов в пределах каждого

словника разделено на десять групп, таким образом,

1) слова сопоставляются в пределах групп, тогда Rг – это ранг группы

(десяти) слов;

2) слова сопоставляются в пределах всей сотни слов, тогда R – это ранг

каждого слова.

«За основу метода принято идеальное условие, как, например, «материальная

точка» (идеальная модель) или «вакуум» (идеальное условие) в физике.

Заключается оно в следующем: существует некоторое идеальное распределение»

[Напреенко 2014: 19], при котором

1) для Rг – «у одного автора в разных текстах одно и то же слово

преимущественно располагается в пределах одной группы или соседних группах»

[Напреенко 2014: 19] (например, расположение одного слова в Rг=3 и в Rг=4 в

разных текстах соответственно);

2) для R – у одного автора ранг слова совпадает в разных текстах, при этом

допустимая максимальная разность – 10 рангов.

Несоблюдение перечисленных условий выявляет различия текстов, а значит,

способствует разграничению текстов по написанию их разными языковыми

1 Два способа, базирующихся на разном представлении о ранге, – разные

способы, не зависящие друг от друга.

Page 153: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

153

личностями, т.к. словники, принадлежащие разным языковым личностям, имеют

разное ранжирование.

Рабочая формула для 1 способа (Rг):

ΔRг= R1г –R2г, где ΔRг – разность рангов групп лексем в 1м и 2м текстах

частотно-сопоставительной таблицы,

R1г – ранг частоты лексемы первого текста в частотно-

сопоставительной таблице,

R2г – ранг частоты лексемы второго текста.

Если ΔRг = 0, < 2, т.е. слова находятся в одной группе или в соседних группах,

то тексты принадлежат одной языковой личности.

Если ΔRг ≥ 2, т.е. слова находятся в разных группах, то – разным языковым

личностям.

Рабочая формула для 2 способа (R):

ΔR= R1 – R2, где ΔR – разность рангов частот лексем 1го и 2го текстов,

R1 – ранг частоты лексемы первого текста в частотно-

сопоставительной таблице,

R2 – ранг частоты лексемы второго текста.

Если ΔR = 0; ≤ 10, т.е. слова находятся на одном ранге, либо разность ранга

лексемы в разных текстах не более 10, то тексты принадлежат одной языковой

личности.

Если ΔR> 10, разницу между рангами можно считать контрастной и,

следовательно, разграничить тексты по написаю их разными языковыми

личностями1.

1 Знак «–», получаемый при подсчете разницы ΔR, не актуален: важна

исключительно количественная наполненность, которую описывают полученные

данные.

Page 154: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

154

Результатом моделирования является подсчет суммы лексем двух типов (тип а

– лексем, подтверждающих написание текстов одной языковой личностью, и тип

б – лексем, подтверждающих написание текстов разными языковыми личностями)

и отражение распределения лексем двух типов относительно каждого текста в

диаграммах. Затем обознаются выводы по идентификационному моделированию

текстов.

Второй этап моделирования заключается в сопоставлении словников с

частотным словарем русского языка [Ляшевская 2009] «как с «абсолютным»

показателем распределения слов по частотности» [Напреенко 2014: 21]. Словники

по текстам представляются нам показателями «относительной» частотности слов,

т.к. они составлены на основе ограниченного числа текстов (в данной работе на

основе четырех фрагментов интернет-дневников). Частотный словарь русского

языка – показатель «абсолютной» частотности, т. к. построен на основе

представительного корпуса русского языка. Следовательно, распределение слов в

частотных словарях по текстам – «относительные» показатели; распределение

слов, представленных в частотном словаре русского языка, – «абсолютные»

показатели. Для сопоставления строятся частотно-сопоставительные таблицы,

включающие словник по тексту и данные частотного словаря русского языка (см.

приложения Д, Е). «Наиболее частотные единицы русского языка содержатся в

любом тексте» [Напреенко 2014: 19] в качестве высокочастотных. Выпадение их в

словнике «конкретного текста из этого статуса или, напротив, появление в списке

высокочастотных единиц» [Напреенко 2014: 19] иных слов, позволяет

утверждать, что этот текст нетиповой. Если такая индивидуальность в

распределении слова повторяется в разных текстах, то это также дает основания

для их идентификации.

В связи с тем, что метод идентификации направлен на установление

тождества объектов, необходимо понимать, тождество какого вида реализуется

в данном конкретном методе. Лексико-ранговая закономерность описывает

структуру всего текста и является общим правилом построения любого текста,

которое отражается в «абсолютном» показателе, в качестве которого выступает

Page 155: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

155

частотный словарь русского языка – выявлению единичного посвящен ранговый

анализ структуры текстов. Полагаем, что универсальный метод идентификации

предполагает установление лексико-рангового тождества: выявляется, во-

первых, наличие слова в разных словниках, во-вторых, их идентичный ранг

частоты в соответствии с приведенными формулами вычисления

тождественности.

3.1.3. Реализация универсального метода идентификации текстов

В универсальном методе идентификации языковой личности анализируется

каждое слово, включенное в частотно-сопоставительные таблицы1. Анализ

проводится в следующей последовательности по способам и формулам,

представленным в п. 3.1.2.

I. Сравнение словников по текстам, предположительно принадлежащим

разным языковым личностям.

Словники сравниваются с целью выявления ранга частоты каждого слова в

разных словниках. Показатель ранга является преимущественным для анализа и

является показателем авторского предпочтения в использовании слова в тексте.

Полагаем, если ранг слова является контрастным2 в двух словниках, то можно

1 В данном пункте параграфа приведены примеры анализа словников по тексту

предлагаемыми способами идентификации. Полные таблицы анализов приведены

в соответствующих приложениях.

2 Контрастность определяется путем решения предлагаемых выше формул.

Page 156: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

156

говорить о разности индивидуальных предпочтений языковой личности в выборе

употребления слов в своей речи1. В связи с этим ранг частоты слова может

являться критерием идентификации текстов и языковой личности.

На данном этапе проводится сопоставление рангов слов в частотных словарях

А и Б; В и Г:

1. Частотно-сопоставительная таблица А.1 (см. приложение А), содержащая

словник А и словник Б.

2. Частотно-сопоставительная таблица Б.1 (см. приложение Б), содержащая

словник В и словник Г.

II. Сравнение словников по текстам, предположительно принадлежащим

одной языковой личности.

Словники, принадлежащие предположительно одной языковой личности,

сравниваются с целью выявления степени приближенности ранга частоты

каждого слова в разных словниках. Полагаем, если слово имеет одинаковый или

приближенный ранг в двух словниках2, то можно говорить о тождественности

индивидуальных предпочтений языковой личности в выборе слов в своей речи.

Уровень ранга слова является показателем авторского предпочтения в

использовании слов в письменной речи. На данном этапе проводится

сопоставление рангов слов в частотных словарях А и В; Б и Г:

1. Частотно-сопоставительная таблица В.1 (см. приложение В), содержащая

словник А и словник В.

1 Показатель контрастности ранга частоты должен подтверждаться показателями

большинства слов, иметь последовательный характер.

2 Показатель приближенности ранга частоты должен подтверждаться

показателями большинства слов, иметь последовательный характер.

Page 157: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

157

2. Частотно-сопоставительная таблица Г.1 (см. приложение Г), содержащая

словники Б и словник Г.

III. Сопоставление словников по текстам с «абсолютным» показателем

распределения слов по частотности – частотным словарем русского языка.

1 способ (единица – ранг группы из десяти слов): ΔRг= R1г –R2г

I. Сравнение словников по текстам, предположительно принадлежащим

разным языковым личностям.

Пример идентификационного моделирования по частотно-сопоставительной

таблице А.1 (словник А – словник Б)1:

я: ΔRг= 1-1=0 → одна ЯЛ (здесь и

далее – языковая личность);

но: ΔRг= 1-2=1→ одна ЯЛ;

как: ΔRг= 1-1=0 → одна ЯЛ;

по: ΔRг= 1-3=2=2 → разные ЯЛ;

так2: ΔRг=2- Х=Х → разные ЯЛ;

за: ΔRг= 2-4=2→ разные ЯЛ;

из: ΔRг= 2-5=3 → разные ЯЛ;

если: ΔRг= 3-2=1 → одна ЯЛ;

даже: ΔRг=5-3=2 → разные ЯЛ;

когда: ΔRг=5-3=2 → разные ЯЛ;

вообще: ΔRг=7-7=0 → одна ЯЛ;

еще: ΔRг=7-2=5 → разные ЯЛ;

очень: ΔRг=8-5=3 → разные ЯЛ;

можно: ΔRг=8-8=0 → одна ЯЛ;

где: ΔRг=9-8=1 → одна ЯЛ;

надо: ΔRг=9-9=0 → одна ЯЛ;

хотя: ΔRг=10-8=2 → разные ЯЛ;

1 В данном параграфе приведены примеры идентификационного моделирования

текста на основе двадцати слов, идущих в порядке следования в частотно-

сопоставительной таблице. Полный анализ слов 1м способом (ΔRг= R1г –R2г) по

частотно-сопоставительной таблице А.1 (словники А – Б) приведен в

приложении Ж.

2 Символ Х обозначает, что моделируемое слово отсутствует в пределах ста слов

словника.

Page 158: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

158

только: ΔRг=4-4=0 → одна ЯЛ;

для: ΔRг=5-7=2 → разные ЯЛ;

сейчас: ΔRг=нет-6=Х → разные ЯЛ.

Анализ и сравнение рангов лексем в частотно-сопоставительной таблице А.1

способствует обозначению вывода по количеству лексем, указывающих на то, что

словники написаны одной языковой личностью, и количеству лексем,

указывающих на написание текстов разными языковыми личностями (такой

вывод будет сделан по итогам каждого этапа идентификационного

моделирования). Таким образом, количество лексем в тексте1, указывающих на

принадлежность одной языковой личности, – 46; количество лексем в тексте,

указывающих на принадлежность словников и текстов по ним разным языковым

личностям, – 73.

Пример идентификационного моделирования по частотно-сопоставительной

таблице Б.1 (словник В – словник Г)2:

а: ΔRг=1-10=9 → разные ЯЛ;

как: ΔRг=1-1=0 → одна ЯЛ;

но: ΔRг=1-3=2 → разные ЯЛ;

по: ΔRг=1-2=1 → одна ЯЛ;

у: ΔRг=1-2=1 → одна ЯЛ;

из: ΔRг=2-4=2 → разные ЯЛ;

если: ΔRг=3-4=1 → одна ЯЛ;

и: ΔRг=3-4=1 → одна ЯЛ;

для: ΔRг=4-6=2 → разные ЯЛ;

уже: ΔRг=4-4=0 → одна ЯЛ;

самый: ΔRг=6-Х=Х → разные ЯЛ;

когда: ΔRг=6-2=4 → разные ЯЛ;

даже: ΔRг=6-4=2 → разные ЯЛ;

другой: ΔRг=7-Х=Х → разные ЯЛ;

при: ΔRг=7-Х=Х → разные ЯЛ;

очень: ΔRг=8-8=0 → одна ЯЛ;

тоже: ΔRг=9-Х=Х → разные ЯЛ;

надо: ΔRг=9-Х=Х → разные ЯЛ;

можно: ΔRг=9-6=3 → разные ЯЛ;

потом: ΔRг=10-Х=Х → разные ЯЛ.

1 Всего проанализировано 119 слов.

2 Полный анализ слов 1м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице Б.1 (словники В – Г) приведен в приложении И.

Page 159: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

159

Количество лексем в тексте1, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 43; количество лексем в

тексте, указывающих на принадлежность словников и соответственно текстов

разным языковым личностям, – 83.

II. Сравнение словников по текстам, предположительно принадлежащим

одной языковой личности.

Пример идентификационного моделирования по частотно-сопоставительной

таблице В.1 (словник А – словник В)2:

как: ΔRг=1-1=0 → одна ЯЛ;

но: ΔRг=1-1=0 → одна ЯЛ;

у: ΔRг=1-1=0 → одна ЯЛ;

так: ΔRг=2-2=0 → одна ЯЛ;

за: ΔRг=2-3=1 → одна ЯЛ;

из: ΔRг=2-2=0 → одна ЯЛ;

если: ΔRг=3-3=0 → одна ЯЛ;

или: ΔRг=5-5=0 → одна ЯЛ;

для: ΔRг=5-4=1 → одна ЯЛ;

даже: ΔRг=5-6=1 → одна ЯЛ;

просто: ΔRг=6-7=1 → одна ЯЛ:

чтобы: ΔRг=6-8=2 → разные ЯЛ;

вообще: ΔRг=7-8=1 → одна ЯЛ;

можно: ΔRг= 8-9=1 → одна ЯЛ;

под: ΔRг=8-8=0 → одна ЯЛ;

очень: ΔRг=8-8=0 → одна ЯЛ;

без: ΔRг=8-9=1 → одна ЯЛ;

где: ΔRг=9-9=0 → одна ЯЛ;

тоже: ΔRг=9-9=0 → одна ЯЛ;

надо: ΔRг=9-9=0 → одна ЯЛ.

Количество лексем в тексте3, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 86; количество лексем в

тексте, указывающих на принадлежность словников и текстов разным языковым

личностям, – 19.

1 Всего проанализировано 126 слов.

2 Полный анализ слов 1м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице В.1 (словники А – В) приведен в приложении К.

3 Всего проанализировано 105 слов.

Page 160: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

160

Пример идентификационного моделирования по частотно-сопоставительной

таблице Г.1 (словник Б – словник Г)1:

как: ΔRг=1-1=0 → одна ЯЛ;

но: ΔRг=2-3=1 → одна ЯЛ;

еще: ΔRг=2-2=0 → одна ЯЛ;

у: ΔRг=2-2=0 → одна ЯЛ;

если: ΔRг=2-4=2 → разные ЯЛ;

по: ΔRг=3-2=1 → одна ЯЛ;

когда: ΔRг=3-2=1 → одна ЯЛ;

даже: ΔRг=3-4=1 → одна ЯЛ;

за: ΔRг=4-3=1 → одна ЯЛ;

только: ΔRг=4-4=0 → одна ЯЛ;

из: ΔRг=5-4=1→ одна ЯЛ;

или: ΔRг=5-5=0 → одна ЯЛ;

очень: ΔRг=5-8=1 → одна ЯЛ;

без: ΔRг=6-7=0 → одна ЯЛ;

ничего: ΔRг=6-6=0 → одна ЯЛ;

сейчас: ΔRг=6-9=3 → разные ЯЛ;

для: ΔRг=7-6=1 → одна ЯЛ;

нужно: ΔRг=7-7=0 → одна ЯЛ;

всегда: ΔRг=9-9=0 → одна ЯЛ;

совсем: ΔRг=10-9=1 → одна ЯЛ.

Количество лексем в тексте2, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 73; количество лексем в

тексте, указывающих на принадлежность словников и текстов разным языковым

личностям, – 33.

2 способ (единица – ранг каждого слов): ΔR= R1 – R2

I. Сравнение словников по текстам, предположительно принадлежащим

разным языковым личностям.

Пример идентификационного моделирования по частотно-сопоставительной

таблице А.1 (словник А – словник Б)3:

как: ΔR= 6-4=2<10 → одна ЯЛ; для: ΔR=42-64=22>10 → разные ЯЛ;

1 Полный анализ слов 1м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице Г.1 (словники Б – Г) приведен в приложении Л.

2 Всего проанализировано 106 слов.

3 Полный анализ слов 2м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице А.1 (словники А – Б) приведен в приложении М.

Page 161: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

161

но: ΔR= 7-13=6>10 → разные ЯЛ;

у: ΔR= 8-13=5<10 → одна ЯЛ;

по: ΔR= 9-25=16>10→ разные ЯЛ;

так: ΔR=12- Х =Х → разные ЯЛ;

за: ΔR= 16-39=23>10 → разные ЯЛ;

из: ΔR= 17-45=28>10 → разные ЯЛ;

если: ΔR= 23-20=3<10 → одна ЯЛ;

такой: ΔR=27-13=14>10 → разные ЯЛ;

уже: ΔR=34-48=14>10 → разные ЯЛ;

даже: ΔR=43-28=15>10 → разные ЯЛ;

какой: ΔR=44-35=9<10 → одна ЯЛ;

когда: ΔR=45-27=18>10 → разные ЯЛ;

или: ΔR=50-46=4<10 → одна ЯЛ;

на: ΔR=64-100=36>10 → разные ЯЛ;

под: ΔR=71-Х=Х → разные ЯЛ;

очень: ΔR=72-50=22>10 → разные ЯЛ;

тоже: ΔR=88-73=15>10 → разные ЯЛ;

надо: ΔR=89-84=5<10 → одна ЯЛ.

Количество лексем в тексте1, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 32; количество лексем в

тексте, указывающих на принадлежность словников и текстов разным языковым

личностям, – 87.

Пример идентификационного моделирования по частотно-сопоставительной

таблице Б.1 (словник В – словник Г)2:

как: ΔR=6-5=1<10 → одна ЯЛ;

но: ΔR=8-24=16>10 → разные ЯЛ;

по: ΔR=9-21=3<10 → одна ЯЛ;

из: ΔR=14-40=26>10 → разные ЯЛ;

они: ΔR=18-11=7<10 → одна ЯЛ;

за: ΔR=21-23=2<10 → одна ЯЛ;

если: ΔR=24-38=14>10 → разные ЯЛ;

для: ΔR=36-53=17>10 → разные ЯЛ;

только: ΔR=39-34=5<10 → одна ЯЛ;

до: ΔR=43-48=5<10 → одна ЯЛ;

или: ΔR=47-54=7<10 → одна ЯЛ;

когда: ΔR=55-18=37>10 → разные ЯЛ;

даже: ΔR=58-39=19>10 → разные ЯЛ;

другой: ΔR=62- Х =Х → разные ЯЛ;

там: ΔR=70-64=6<10 → одна ЯЛ;

очень: ΔR=72-71=2<10 → одна ЯЛ;

после: ΔR=84- Х =Х → разные ЯЛ;

тоже: ΔR=86- Х =Х → разные ЯЛ;

1 Всего проанализировано 119 слов.

2 Полный анализ слов 2м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице Б.1 (словники В – Г) приведен в приложении Н.

Page 162: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

162

уже: ΔR=40-37=3<10 → одна ЯЛ; сейчас: ΔR=100-81=9<10 → одна ЯЛ.

Количество лексем в тексте1, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 35; количество лексем в

тексте, указывающих на принадлежность словников и соответственно текстов

разным языковым личностям, – 91.

II. Сравнение словников по текстам, предположительно принадлежащим

одной языковой личности.

Пример идентификационного моделирования по частотно-сопоставительной

таблице В.1 (словник А – словник В)2:

как: ΔR=6-6=0<10 → одна ЯЛ;

но: ΔR=7-8=1<10 → одна ЯЛ;

у: ΔR=8-10=2<10 → одна ЯЛ;

по: ΔR=9-9=0<10 → одна ЯЛ;

так: ΔR=12-19=7<10 → одна ЯЛ;

за: ΔR=16-21=5<10 → одна ЯЛ;

из: ΔR=17-14=3<10 → одна ЯЛ;

если: ΔR=23-24=1<10 → одна ЯЛ;

только: ΔR=31-39=8<10 → одна ЯЛ;

уже: ΔR=34-40=6<10 → одна ЯЛ;

для: ΔR=42-36=6<10 → одна ЯЛ;

даже: ΔR=43-59=16>10 → разные ЯЛ;

какой: ΔR=44-50=6<10 → одна ЯЛ;

когда: ΔR=45-55=10=10 → одна ЯЛ;

самый: ΔR=55-51=4<10 → одна ЯЛ;

вообще: ΔR=65-71=6<10 → одна ЯЛ;

очень: ΔR=72-73=1<10 → одна ЯЛ;

можно: ΔR=75-90=15>10 → разные ЯЛ;

тоже: ΔR=88-87=1<10 → одна ЯЛ;

надо: ΔR=89-89=0<10 → одна ЯЛ.

Количество лексем в тексте3, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 72; количество лексем в

тексте, указывающих на принадлежность словников и текстов разным языковым

личностям, – 33.

1 Всего проанализировано 126 слов.

2 Полный анализ слов 2м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице В.1 (словники А – В) приведен в приложении П.

3 Всего проанализировано 105 слов.

Page 163: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

163

Пример идентификационного моделирования по частотно-сопоставительной

таблице Г.1 (словник Б – словник Г)1:

ты: ΔR= ΔR=2-4=2<10 → одна ЯЛ;

но: ΔR=12-24=12>10 → разные ЯЛ;

такой: ΔR=13-22=9<10 → одна ЯЛ;

еще: ΔR=18-19=1<10 → одна ЯЛ;

если: ΔR=20-38=18>10 → разные ЯЛ;

по: ΔR=25-12=13>10 → разные ЯЛ;

когда: ΔR=27-18=9<10 → одна ЯЛ;

какой: ΔRг=35-32=3<10 → одна ЯЛ;

за: ΔR=39-23=16>10 → разные ЯЛ;

только: ΔR=40-34=6<10 → одна ЯЛ;

от: ΔR=43-26=17>10 → разные ЯЛ;

или: ΔR=46-54=8<10 → одна ЯЛ;

уже: ΔR=48-37=11>10 → разные ЯЛ;

без: ΔR=58-69=11>10 → разные ЯЛ;

ничего: ΔR=59-51=8<10 → одна ЯЛ;

сейчас: ΔR=60-81=21>10 → разные ЯЛ;

потому: ΔR=61-57=4<10 → одна ЯЛ;

нужно: ΔR=69-83=14>10 → разные ЯЛ;

надо: ΔR=84- Х =Х → разные ЯЛ;

всегда: ΔR=85-89=4<10 → одна ЯЛ.

Количество лексем в тексте2, указывающих на принадлежность словников и

соответственно текстов одной языковой личности, – 50; количество лексем в

тексте, указывающих на принадлежность словников и текстов разным языковым

личностям, – 56.

Таким образом, проведенное идентификационное моделирование текстов

универсального типа по двум разным способам основывается на разных

определениях ранга частоты слова. Выводы по идентификационному

моделированию и алгоритм метода приведены в следующих пунктах параграфа.

1 Полный анализ слов 2м способом (ΔRг= R1г –R2г) по частотно-сопоставительной

таблице Г.1 (словники А – В) приведен в приложении Р.

2 Всего проанализировано 106 слов.

Page 164: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

164

3.1.4. Результаты идентификационного моделирования текстов

В данном пункте параграфа приведены и описаны результаты

идентификационного моделирования текстов в универсальном методе,

использующем два способа идентификации, основанных на разных определениях

ранга частоты слова. Диаграммы отражают количество лексем двух типов,

наполняющих каждый текст: 1) слова типа а, подтверждающие написание

текстов одной языковой личностью, − одинаковые слова, приближенные по

ранговому расположению; 2) слова типа б, подтверждающие написание текстов

разными языковыми личностями, − одинаковые слова, отдаленные по ранговой

принадлежности; 3) слова типа б, подтверждающие написание текстов разными

языковыми личностями, − разные слова, встречающиеся в сотне самых частотных

слов одного словника и отсутствующие в сотне самых частотных слов другого

словника. Подсчет суммы лексем двух типов позволил отразить результаты

идентификационного моделирования в двух диаграммах по каждому способу.

Диаграмма 1 построена вследствие анализа словников в рамках четырех

частотно-сопоставительных таблиц согласно формуле: ΔRг= R1г –R2г.

Количественное выражение диаграммы1:

Частотно-сопоставительная таблица А.1 (А – Б): 46 – 73;

Частотно-сопоставительная таблица Б.1 (В – Г): 43 – 83;

Частотно-сопоставительная таблица В.1 (А – В): 86 – 19;

Частотно-сопоставительная таблица Г.1 (Б – Г): 73 – 33.

1 Первое значение – количество лексем типа а, указывающих на принадлежность

словников и соответственно текстов одной языковой личности; второе значение –

количество лексем типа б, указывающих на принадлежность словников и

соответственно текстов разным языковым личностям.

Page 165: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

165

Диаграмма 1.

Сопоставление результатов идентификации,

полученных способом № 1 (ΔRг= R1г –R2г)

Диаграмма, построенная по общему количеству лексем двух типов,

подтверждает идентификационный вывод, сделанный в результате специально-

ориентированного метода: объекты А и Б принадлежат разным языковым

личностям, объекты В и Г – разным языковым личностям: лексем, указывающих

на отсутствие тождественности текстов и отнесенность каждой группы объектов

разным языковым личностям в два раза больше лексем, указывающих на

принадлежность каждой группы объектов одной языковой личности. Объекты А и

В принадлежат одной языковой личности, объекты Б и Г – одной (другой)

языковой личности.

Данный идентификационный вывод сделан вследствие анализа словников в

рамках четырех частотно-сопоставительных таблиц согласно формуле: ΔRг= R1г –

R2г. Работающими условиями явились:

1) если ΔRг = 0, < 2, то языковая личность, написавшая тексты, – одна.

0

10

20

30

40

50

60

70

80

90

100

Част-сопост.

таблица А.1 (А

- Б)

Част-сопост.

таблица Б.1

(В - Г)

Част-сопост.

таблица В.1

(А - В)

Част-сопост.

таблица Г.1

(Б - Г)

Количество слов,

указывающих на

принадлежность текстов

одной ЯЛ

Количество слов,

указывающих на

принадлежность текстов

разным ЯЛ

Page 166: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

166

2) если ΔRг ≥ 2, то тексты принадлежат разным языковым личностям.

Диаграмма 2 построена вследствие анализа словников в рамках четырех

частотно-сопоставительных таблиц по формуле: ΔR= R1 – R2.

Количественное выражение диаграммы1:

Частотно-сопоставительная таблица А.1 (А – Б): 32 – 87;

Частотно-сопоставительная таблица Б.1 (В – Г): 35– 91;

Частотно-сопоставительная таблица В.1 (А – В): 72 – 33;

Частотно-сопоставительная таблица Г.1 (Б – Г): 50 – 56.

Диаграмма 2.

Сопоставление результатов идентификации,

полученных способом № 2 (ΔR= R1 – R2)

1 Первое значение – количество лексем типа а, указывающих на принадлежность

словников и соответственно текстов одной языковой личности; второе значение –

количество лексем типа б, указывающих на принадлежность словников и

соответственно текстов разным языковым личностям.

0

10

20

30

40

50

60

70

80

90

100

Част-сопост.

таблица А.1 (А

- Б)

Част-сопост.

таблица Б.1

(В - Г)

Част-сопост.

таблица В.1

(А - В)

Част-сопост.

таблица Г.1

(Б - Г)

Количество слов,

указывающих на

принадлежность текстов

одной ЯЛ

Количество слов,

указывающих на

принадлежность текстов

разным ЯЛ

Page 167: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

167

Данный вывод сделан вследствие анализа словников в рамках каждой из

четырех частотно-сопоставительных таблиц согласно формуле: ΔR=R1–R2.

Работающими условиями явились:

1) если ΔR = 0; ≤ 10, то – языковая личность, создавшая тексты, – одна;

2) если ΔR> 10, то тексты принадлежат разным языковым личностям.

Диаграмма 2 отражает очевидную принадлежность разным авторам в

словниках А и Б, В и Г. Тексты А и В принадлежат одному автору. Столб № 4

(объекты Б и Г) не позволяет определенно разграничить объекты в связи с тем,

что количество лексем двух типов близко к 50 % нахождения каждого типа в

тексте: авторы текстов Б и Г используют практически в равной мере а) лексемы

одинаковые и приближенные по рангу, б) лексемы одинаковые, но отдаленные по

ранговой отнесенности и в) лексемы, которых нет в сотне самых частотных слов

другого словника, находящегося в паре анализа. Необходимой преимущественной

тождественности в предпочтениях не наблюдается. В данном случае (возможная

принадлежность словников и текстов одному автору в рамках частотно-

сопоставительных таблиц В.1 и Г.1) более категоричным явился способ № 1, в

котором единицей анализа явился ранг групп слов (Rг). В действительности, оба

способа доказали возможность их применения для идентификации текстов.

Обязательным является учет всех предложенных условий, включая жанр текстов

и количество словоупотреблений в них. Алгоритм хода универсального метода

идентификации текстов представлен в п. 3.2.3. настоящей главы.

Следующий параграф посвящен сопоставлению полученных в результате

моделирования выводов с «абсолютным» показателем распределения слов по

частотности в русском языке, которое приведено в электронной версии

Частотного словаря современного русского языка [Ляшевская 2009].

Page 168: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

168

§2. Сопоставление словников по текстам с «абсолютным» показателем

распределения слов по частотности (второй этап идентификации)

3.2.1. Частотный словарь русского языка как объект сопоставления

В данном параграфе осуществляется сопоставление значения ранга лексем

словников по текстам с частотным словарем русского языка. Выбор частотного

словаря русского языка требует обоснования. Частотные словари содержат списки

слов с указанием их частотности (степени их употребительности) в текстах, на

основе которых создан тот или иной словарь. Для русского языка разработано

несколько частотных словарей: [Штейнфельд 1963], [Частотный словарь 1977] и

др., однако, все эти словари «были созданы на основе относительно небольших

коллекций текстов (400 тысяч – 1 миллион слов) и в большой степени отражают

специфику русского языка советского периода: частоты слов товарищ и партия в

них сопоставимы со служебными словами» [Шаров: 1].

В настоящем исследовании в качестве «абсолютного» показателя

распределения слов по частотности при сопоставлении с ранжированием

словников мы используем Частотный словарь современного русского языка

О. Н. Ляшевской и С. А. Шарова [Ляшевская 2009]. Предпочтение отдано

указанному словарю в связи с тем, что частотный словарь русского языка под

ред. Л. Н. Засориной [Частотный словарь 1977], используемый наиболее часто до

недавнего времени в качестве источника информации, представляется нам

устаревшим в связи со следующими его особенностями:

1) Корпус, на основе которого была подсчитана частота слов в Частотном

словаре русского языка под ред. Л. Н. Засориной, по современным стандартам

очень мал: около одного миллиона слов. Список частотного словаря

современного русского языка [Ляшевская 2009] построен на основе

Page 169: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

169

значительного корпуса современного русского языка. Корпус современного

русского языка «включает в себя подборку современной прозы, политических

мемуаров, современных газет и научно-популярной литературы: около 40

миллионов слов, проза составляет примерно чуть больше половины объема»

[Шаров: 1]. Частотный словарь русского языка основан на коллекции текстов

Национального корпуса русского языка1, содержащего тексты периода 1950–2007

годов. Объем выборки, на которой строятся разделы словаря, составляет 100

миллонов словоупотреблений. Корпус, на котором основан Частотный словарь

современного русского языка, «включает тексты разных авторов; помимо

литературных произведений, в него входит публицистика и другие жанры

нехудожественной литературы, записи устной речи» [Шаров: 1]. Таким образом,

«в словаре представлен срез всего потенциально бесконечного множества текстов,

функционирующих в современном русском языке» [Ляшевская 2009: 1].

2) Отсутствие частотного словаря под ред. Л. Н. Засориной в электронном виде.

Данный факт является значимым для настоящего исследования, т. к. методы

идентификации, основанные на формализованных принципах, предполагают

оперирование компьютерными программами.

3) Список словаря под ред. Л. Н. Засориной соответствует частоте

использования слов с 20-х до 60-х годов: «в результате корпус включает большое

число идеологических источников, например, произведения Ленина и Калинина,

Материалы 22 и 23 съездов КПСС, советские газеты. Слова советский и товарищ

входят в первую сотню русских слов, наряду со служебными словами (они

встречаются чаще слов где, здесь, ваш), слова партия, революция,

коммунистический встречаются чаще, чем назад, около, лучше и т.д.».

Действительно, анализ частотного словаря под ред. Л. Н. Засориной [Частотный

словарь 1977] показал, что в состав наиболее частотных слов входят такие слова,

1 «Национальный корпус русского языка (http://www.ruscorpora.ru) является

результатом проекта РАН (Шаров 2003, Плунгян 2005, НКРЯ 2006–2008 и др.),

начатого в 2001 году» [Шаров: 2].

Page 170: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

170

как товарищ (R=92), советский (R=96), страна (R=101), мир (R=105), народ

(R=112), рабочий (R=118), война (R=133), американский (R=178), армия (R=188),

партия (R=209), солдат (R=279), революция (R=288), коммунистический (R=310).

Для подтверждения важности содержания корпуса, на основе которого

создается частотный словарь, приведем таблицу № 15 сравнения ранга частоты

некоторых слов в частотном словаре русского языка под ред. Л. Н. Засориной

[Частотный словарь 1977] и в частотном словаре современного русского языка

[Ляшевская 2009].

Таблица № 15.

Сравнение уровня ранга ряда слов в

частотных словарях [Частотный словарь 1977] и [Ляшевская 2009]

Слово R в частотном

словаре

русского языка

под ред.

Л.Н. Засориной

(1977 г.)

R в частотном

словаре [Ляшевская

2009]

товарищ 92 210

советский 96 249

страна 101 204

мир 105 171

народ 112 240

рабочий 118 686

война 133 188

американский 178 901

армия 188 469

партия 209 540

солдат 279 353

революция 288 810

коммунистичес

кий

310 2362

Page 171: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

171

Таблица № 15 показывает, что слова, характерные для эпохи создания словаря

[Частотный словарь 1977], в современном частотном словаре «теряют» свой

сравнительно высокий ранг частоты по экстралингвистическим причинам, не

описываемым в настоящем исследовании, однако, не позволяющим использовать

данный словарь для идентификационного моделирования.

Относительно распределения слов в Частотном словаре современного русского

языка [Ляшевская 2009] исходно допускается «нормальное Гауссово

распределение частоты слов, в соответствии с которым каждое слово встречается

с одинаковой частотой во всех текстах» [Шаров: 7]. О. Н. Ляшевская и

С. А. Шаров описывая характер распределение частоты слов, отмечают, что «если

слово встретилось в тексте один раз, то при нормальном распределении это не

влияет на вероятность его употребления там во второй раз. Но в реальности это не

так. Каждый текст имеет некоторую собственную тему, слова которой в этом

тексте будут употребляться намного чаще среднего»1 [Ляшевская 2008: 346].

В Частотном словаре современного русского языка очерчивается проблема

размера и содержания корпуса, на основе которого создается частотный словарь:

«относительно длинный текст может содержать большое количество вхождений

некоторого редкого слова, что существенно увеличит его частоту в итоговом

списке» [Ляшевская 2009: 7]. Такое частотностное вхождение определенного

слова в тексте характеризуется его тематикой. Так, «в тексте про хоббитов слово

хоббит будет употребляться так же часто, как многие служебные слова, что

существенно повысит его частоту в корпусе, который будет включать хотя бы

один подобный текст» [Ляшевская 2008: 346]. В качестве доказательства

авторами современного частотного словаря приводится «корпус, использованный

1 Именно по данной причине в специально-ориентированном методе для

идентификационного моделирования текстов используются незнаменательные

части речи, несвязанные с темой текста.

Page 172: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

172

для составления списка, содержащий вариацию на тему «Повелителя Колец» Дж.

Р.Р. Толкина» [Шаров]. Длина романа составляет 250 тысяч слов, что

представляет собой менее одного процента всего корпуса, однако, «частота

использования слова хоббит в этом романе ставит его в первую тысячу русских

слов, если частоту считать по всем текстам без ограничений на их длину»

[Шаров]. Подобная проблема составителями частотного словаря решается

следующим образом: «частотные списки были составлены при условии, что

выборка из больших текстов ограничена 10 тысяч слов, и выборка из текстов

одного автора составляет менее 100 тысяч слов» [Шаров]. В результате

подмножество целого корпуса составляет около 16 миллионов слов. Таким

образом, очевидно, что частотный список, «построенный на основе корпуса,

отражает специфику тех текстов, которые попали в него при его составлении»

[Шаров].

Проблема частотности слова и равномерности его распределения поднимается

в монографии «Статистико-комбинаторные методы в теоретическом и

прикладном языковедении» Н.Д. Андреева [Андреев 1967]: «слова бригада и

почти, которые, по данным словаря Э. А. Штейнфельдт, имеют одинаковую

частоту употребления, измеряемую в относительных единицах числом 0.0005

(соответственно 204 и 201 словоупотребление из 4000 000)» [Андреев 1967: 85].

При этом слово бригада зарегистрировано в 47 текстах из 350 обследованных, а

слово почти – в 125, т. е. бригада встречается реже, чем в каждой седьмой

выборке, в то время как почти – чаще, в каждом третьем из текстов. Другими

словами, слово почти более равномерно распределено по тестам, чем слово

бригада, хотя их частотность одинакова. Приводятся также и другие пары

сравниваемых слов – во всех приведенных парах слово более общего значения

(почти, задача, начать, главный) обнаруживает меньшую меру концентрации.

Таким образом, характеристики частотность и распределение частотности

являются самостоятельными единицами. Зная одну из величин, не возможно

предсказать другую: «стандартная выборка может быть посвящена сугубо

специальному вопросу, тогда наверняка какое-то слово будет многократно

Page 173: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

173

повторено в ней, хотя потребуется очень много случайных выборок, чтобы это

слово опять встретилось с такой же насыщенностью» [Андреев 1967: 87]. В

настоящей работе исследуется исключительно величина частотности;

распределение частотности не актуально в связи с тем, что объем выборки для

создания словников по исследуемым текстам значительно мал, а также – в

жанровом аспекте – однороден (исследуются исключительно интернет-дневники).

Материалом данного исследования явились интернет-дневники с

неограниченным кругом тем – в текстах могут использоваться любые слова на

темы, волнующие авторов этих дневников. Безусловно, один автор может

использовать определенное слово («любимое слово») чаще, чем какое-либо

другое. Однако именно в этом заключается наша задача – определить, насколько

одинаково или различно используют авторы слова в текстах, что отражает

лингвоперсонологические особенности авторских предпочтений. Настоящий этап

исследования предполагает еще и сопоставление данных

лингвоперсонологических особенностей выбора языковой личности с данными

Частотного словаря русского языка, осуществляется сопоставление

индивидуального выбора с показаниями объективными, представленными в

частотном словаре. В связи с этим поднимается вопрос: возможно ли, что

высокий ранг частоты какого-либо слова, употребляемого в тексте,

противоречит невысокой частотности слова, свойственной русскому языку

вообще.

Важным этапом составления частотного словаря является процесс

лемматизации1 словоформ, полученных с помощью компьютерных программ.

1 Частотный словарь современного русского языка имеет структуру списков,

принципы лемматизации которой и состав частей речи списков «определяются

морфологическим стандартом корпуса (НКРЯ 2005), который в общем и целом

соответствует принципам Грамматического словаря русского языка (Зализняк

1977)» [Ляшевская 2008: 349]. Вторая версия частотного списка содержит разные

виды списков: леммы, отсортированные в алфавитном порядке, леммы,

Page 174: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

174

Используется вариант с автоматическим разрешением морфологической

омонимии вслед за принципом лемматизации в частотном словаре С. А. Шарова:

«поскольку многие словоформы неоднозначны (например, дорогой, были, стали,

для, три, уже), частота некоторых слов не вполне достоверна, например,

для рассматривалось как глагол, если за ним не следует существительное,

прилагательное или местоимение, стали всегда рассматривалось как

существительное, для супруги всегда выбиралось супруга при возможных супруг и

супруги (мн.ч)» [Шаров: 9]. Во Второй версии частотного списка частотного

словаря русского языка [Шаров] критериями для выбора соответствующей

словоформы послужили:

1) «частота соответствующей леммы (забрал, стану, подать в качестве

существительного крайне маловероятно, поэтому в этих случаях выбирается

глагол)» [Шаров];

отсортированные по частоте, словоформы, отсортированные по частоте [Шаров].

Так, единицей счета в частотном словаре является лемма как неизмененная,

первоначальная форма слова: существительные приводятся к форме

именительного падежа, единственного числа; глаголы - к инфинитивной форме;

прилагательные – к форме единственного числа, именительного падежа,

мужского рода. Под лемматизацией понимается «метод морфологического

анализа, который сводится к приведению словоформы к ее первоначальной

словарной форме (лемме)» [Лемматизация]. В частотном словаре современного

русского языка «учитывается только пословная разметка: устойчивые обороты,

составные предлоги и другие неоднословные лексические единицы (ср. Новый

год, в течение, тем не менее, друг друга) не включаются в словарь» [Ляшевская

2008: 349]. В частотном словаре современного русского языка «учитывается

только пословная разметка: устойчивые обороты, составные предлоги и другие

неоднословные лексические единицы (ср. Новый год, в течение, тем не менее,

друг друга) не включаются в словарь» [Ляшевская 2008: 349].

Page 175: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

175

2) «сравнительная частота конкретной формы (обе леммы для стали

достаточно частотны, но существительное в отличие от глагола очень часто

употребляется именно в этой форме; форму пора приходится считать в

предикативном употреблении, в то время как существительное выступает во всех

своих остальных формах)» [Шаров].

В процессе лемматизации словоформ словников по текстам в настоящем

идентификационном моделировании также использовалось подобное

автоматическое разрешение морфологической омонимии и многозначности слов.

Это можно наблюдать в некоторых следующих примерах: слово может

суммируется с лексемой мочь; словоформа дне (омоним в формах лексем дно и

день) суммируется с лексемой день; словоформа его суммируется с лексемой он,

как и в частотном словаре [Ляшевская 2009], в то время как в словаре под ред.

Л. Н. Засориной [Частотный словарь 1977] словоформа его ранжируется отдельно

и занимает R=50; все многозначные слова (встречающиеся в тексте) суммируются

в одну форму.

Подобно Частотному словарю русского языка под ред. Л. Н. Засориной в

словаре О. Н. Ляшевской и С. А. Шарова, а также в словниках по текстам

соответственно фамилии, имена и отчества были отфильтрованы из

лемматизированных списков, но географические названия оставлены, т. к.

«сложно оправдать почему в словаре Л. Н. Засориной оставлены московский или

американский, но не Москва и Америка» [Шаров: 9].

В отличие от частотного словаря под ред. Л. Н. Засориной [Частотный словарь

1977], где слова с одинаковой частотой имели одинаковый ранг, в частотном

словаре современного русского языка [Ляшевская 2009] и в словниках по текстам

идентифицируемых объектов данного исследования у каждого последующего

слова ранг увеличивается на единицу, то есть ранг лексем одинаковой

частотности определяется с помощью простой нумерации общего частотного

списка по алфавитному порядку. Выбор способа ранжирования, сходного с

существующим в частотном словаре современного русского языка [Ляшевская

Page 176: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

176

2009], связан с тем, что именно данный словарь является объектом сопоставления

в качестве «абсолютного» показателя, а потому структуры частотного словаря и

словников должны быть составлены на общих основаниях.

В связи с вышеизложенным, в настоящем исследовании в качестве

«абсолютного» показателя распределения слов по частотности используется

Частотный словарь современного русского языка [Ляшевская 2009] и

непосредственно его электронная версия «Новый частотный словарь русской

лексики» [Ляшевская] и «Вторая версия частотного списка» [Шаров], содержащая

списки наиболее частотных слов русского языка.

3.2.2. Идентификационное сопоставление словников по текстам с

частотным словарем современного русского языка

Задача сопоставления словников по текстам с частотным словарем

современного русского языка [Ляшевская 2009] заключается в установлении

соответствия или не соответствия распределения лексем словников частотному

словарю как «абсолютному» показателю распределения слов по частотности.

Словники по текстам представляются показателями «относительной» частотности

слов; частотный словарь русского языка – показателем «абсолютной»

частотности1.

1 Более подробно о показателях «относительной» и «абсолютной» частотности

словников и частотного словаря сказано в п. 3.1.2.

Page 177: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

177

Сопоставление словников по текстам с частотным словарем русского языка

включает два этапа анализа:

1. Анализ наличия высокочастотных слов в словниках и частотном словаре

русского языка и лексико-ранговое сопоставление словников и частотного

словаря русского языка.

2. Методика «любимых» слов.

Выдвинем предположение об общем лексическом устройстве словников, не

влияющем на лингвоперсонологический выбор употребления автором

определенных слов в тексте. В связи с тем, что «наиболее частотные единицы

русского языка содержатся в любом тексте» [Напреенко 2014: 19] в качестве

высокочастотных (они представлены в частотном словаре русского языка),

выпадение большей части из них в словнике «конкретного текста из этого статуса

или, напротив, появление в списке высокочастотных единиц» [Напреенко 2014:

19] иных слов, позволяет утверждать, что этот текст «индивидуализированный»,

выражающий сильное персонное начало. Если такая индивидуальность в

распределении слова повторяется в разных текстах, то это также дает основания

для их идентификации.

Для подтверждения данной гипотезы составлена сопоставительная таблица

самых частотных слов словников всех исследуемых текстов (приложение 15).

Сопоставительная таблица позволяет установить, какие слова находятся на

первых позициях ранга в частотном словаре русского языка, и соответствует ли

ранжирование самых частотных слов во всех четырех словниках данным словаря.

Самыми частотными словами по частеречной принадлежности явились

предлоги и местоимения, как в частотном словаре русского языка, так и в

словниках, составленных по фрагментам интернет-дневников. Основной

лексический состав (местоимения, предлоги, существительные) тождественен во

всех словниках, например, наличествуют такие лексемы, как рука, дело, два,

жизнь и т.п.

Приведем ряд частотных слов, встречающихся во всех словниках и частотном

словаре русского языка в пределах ста самых частотных слов: и, в, не, он, на, я,

Page 178: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

178

что, тот, быть, а, это, как, она, по, но, они, к, у, ты, из, мы, за, вы, же, от,

этот, который, мочь, человек, о, один, бы, какой, когда, уже, для, вот, кто, да,

знать, мой, до, или, если, время, нет, ни, даже, ну, где, раз, чтобы, там, жизнь,

день, во, ничто, очень, со, без, такой, теперь.

Ряд слов, встречающихся в сотне частотных слов словника, однако,

отсутствующих в частотном словаре русского языка: то, все, любить, вс1, ещ,

больше, т, делать, ничего, нравиться, м, просто, любовь, потому, можно,

сейчас, нужно, думать, вообще, лишь, жить, е, сегодня, хорошо, мама, хотя,

почему, ч, совсем, после, всегда, много, мир, музыка, ведь, тогда, п, тут, всего,

дождь, равно, работа.

Ряд слов, наличествующих в частотном словаре русского языка, однако,

отсутствующих в каком-либо из словников: с, весь, так, сказать, еще, только,

себя, свое, говорить, год, рука, самый, стать, большой, другой, наш, свой, под,

дело, есть, сам, два, чем, глаз, первый, тута, потом, хотеть, ли, при, голова,

надо, видеть, идти, тоже, стоять, друг, дом.

Анализ сопоставительной таблицы самых частотных слов в каждом словнике и

частотном словаре русского языка (см. приложение С) показал, что содержится

ряд слов, располагающийся на уровне одного ранга частоты группы слов (Rг):

1 группа: он, я, быть; 2 группа: она; 3 группа: мы; 4 группа: только. Слово как

(Rг=1) есть в четырех словниках по текстам и находится на одном, первом, ранге

1 В словники по текстам включены также «слова», которые получены путем

автоматизированного перевода текста в формат словников: вс, ещ, т, м, е, ч, п.

Как уже было сказано в главе 2, под «набором букв» [Ахманова 1961: 37] мы

считаем как сами лексемы, так и «недописанные» слова, сокращения и любые

элементы, вычленяемые при переводе текстов в формат словников. Данные

«слова» явились одними из самых частотных в словниках, а потому занимают

одни из высоких рангов, вследствие чего они не были лемматизированны нами –

и исследуются в качестве элемента структуры текстов предлагаемыми формулами

для изучения ранжирования.

Page 179: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

179

группы № 1. В частотном словаре [Ляшевская 2009] слово как располагается на

уровне Rг=2. Бо льшая часть слов находится в приближенных группах (ΔRг<2 и

ΔR<10).

Таким образом, подтверждено предположение о том, что наиболее частотные

единицы русского языка содержатся в конкретных текстах также в качестве

высокочастотных. Всего анализируемых слов (в том числе «слов», полученных

путем автоматизированного вычленения) – 142. Процентное соотношение самых

частотных слов ко всем словам, встречающимся в каждом словнике и частотном

словаре русского языка, – 42, 9 % (61 слово); процентное соотношение самых

частотных слов к одному словнику, содержащему сто слов – 61 % (61 слово).

Таким образом, любой из представленных словников, в том числе, частотный

словарь русского языка в размере ста самых частотных слов, содержит больше

половины одинаковых слов (61 %), что подтверждает гипотезу о содержании

наиболее частотных единиц русского языка в любом тексте в качестве

высокочастотных. Однако в идентификационном аспекте актуальным становится

не только, изучение количества «выпадающих» из этой закономерности слов, но и

ранжирование общих и различных слов (по предлагаемым формулам). Не

исключается, что ранжирование общих слов может также обладать

идентификационным потенциалом. Дальнейшее сопоставление рангов частоты

всех слов словников и распределения, представленного в частотном словаре

русского языка, подтвердит данное предположение.

Для непосредственного идентификационного сопоставления лексико-ранговых

данных составлены частотно-сопоставительные таблицы, включающие словник

по тексту и частотный словарь русского языка (приложения Д, Е): словники и

частотный словарь включены в таблицу согласно закону Ципфа в порядке от

самого частотного слова (R=1) до наименее частотного (R=100). На данном этапе

словники анализируются на предмет того, какой из них наиболее приближен к

«абсолютным» характеристикам и, как следствие, является более «типовым» и

какой отличается. Так, описательной характеристикой являются определения

Page 180: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

180

«типовой» (то есть приближенный к «абсолютному» показателю) и

«индивидуализированный» (отличающийся от «абсолютного» показателя,

выражающий персонное начало). Установление «типовых» и

«индивидуализированных» словников осуществляется путем подсчета лексем

следующих типов: 1) слова типа а, подтверждающие что текст «типовой», т.к. в

словниках встречаются одинаковые слова, приближенные по ранговому

расположению; 2) слова типа б, подтверждающие, что текст

«индивидуализированный», т.к. в словниках встречаются одинаковые слова,

отдаленные по ранговой принадлежности; 3) слова типа б, подтверждающие, что

текст «индивидуализированный», т. к. они встречаются в сотне самых частотных

слов одного словника и отсутствуют в сотне самых частотных слов другого

словника.

Первым способом идентификации языковой личности (ΔRг= R1г–R2г)

смоделированы следующие словники1: словник [Ляшевская 2009] и словник А

(приложение Т); словник [Ляшевская 2009] и словник Б (приложение У).

Пример идентификационного моделирования лексико-ранговых показателей

частотного словаря современного русского языка [Ляшевская 2009] и словника

А2:

1 Согласно выводу, сделанному в результате первого этапа универсального

идентификационного моделирования, индивидуально-конкретное тождество

установилось следующим образом: А и В – тексты, принадлежащие одной

языковой личности; Б и Г – тексты, принадлежащие одной (другой) языковой

личности; тексты А и Б принадлежат разным языковым личностям. В связи с этим

сопоставлению с частотным словарем русского языка подверглись словники А и Б

как тексты, принадлежащие разным языковым личностям, чтобы установить их

качество относительно Частотного словаря современного русского языка и

подтвердить вывод по идентификации.

2 Полный анализ слов по предлагаемым способам приведен в приложении Т.

Page 181: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

181

он 1: ΔRг=1-1=0 <2→ типовой;

я: ΔRг=1-1=0<2 → типовой;

как: ΔRг=2-1=1<2 → типовой;

но: ΔRг=2-1=1<2 → типовой;

ты: ΔRг=3-2=1<2 → типовой;

еще: ΔRг=4-7=3≥2 → индивидуализированный;

такой: ΔRг=4-3=1<2 → типовой;

только: ΔRг=4-4=0<2 → типовой;

какой: ΔRг=5-5=0<2 → типовой;

когда: ΔRг=5-5=0<2 → типовой;

уже: ΔRг=5-4=1<2 → типовой;

или: ΔRг=6-5=1<2 → типовой;

если: ΔRг=6-3=3≥2 → индивидуализированный;

время: ΔRг=6-7=1<2 → типовой;

рука: ΔRг=6-нет=Х → индивидуализированный;

даже: ΔRг=7-5=2≥2 → индивидуализированный;

другой: ΔRг=7-7=0<2 → типовой;

дело: ΔRг=7-9=2≥2 → индивидуализированный;

ничто: ΔRг=9-нет=Х → индивидуализированный;

очень: ΔRг=9-8=1<2 → типовой.

Количество лексем в тексте2, указывающих на то, что словник «типовой», – 53;

количество лексем в тексте, указывающих на то, что словник наиболее

«индивидуализированный» словников – 65.

1 В формуле первое значение – ранг частоты слова в частотном словаре, второе – в

словнике. Например, разница в рангах частоты слова «как» рассчитывается таким

образом: ΔRг=2-1=1<1, где Rг=2 в частотном словаре; Rг=1 в словнике по

конкретному тексту.

2 Всего проанализировано 118 слов.

Page 182: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

182

Пример идентификационного моделирования лексико-ранговых показателей

частотного словаря современного русского языка [Ляшевская 2009] и словника Б1:

он: ΔRг=1-1=0<2 → типовой;

я: ΔRг=1-1=0<2 → типовой;

как: ΔRг=2-1=1<2 → типовой;

но: ΔRг=2-2=0<2 → типовой;

ты: ΔRг=3-1=2=2 → индивидуализированный;

еще: ΔRг=4-2=2=2 → индивидуализированный;

такой: ΔRг=4-2=2=2 → индивидуализированный;

только: ΔRг=4-4=0<2 → типовой;

какой: ΔRг=5-4=1<2 → типовой;

когда: ΔRг=5-3=2=2 → индивидуализированный;

уже: ΔRг=5-5=0<2 → типовой;

или: ΔRг=6-5=1 <2 → типовой;

если: ΔRг=6-2=4>2 → индивидуализированный;

время: ΔRг=6-6=0 <2→ типовой;

рука: ΔRг=6-нет=Х → индивидуализированный;

даже: ΔRг=7-3=4>2 → индивидуализированный;

другой: ΔRг=7-нет=Х → индивидуализированный;

дело: ΔRг=7-нет=Х → индивидуализированный;

ничто: ΔRг=9-нет=Х → индивидуализированный;

очень: ΔRг=9-5=4>2 → индивидуализированный.

Количество лексем в тексте2, указывающих на то, что словник «типовой», – 33;

количество лексем в тексте, указывающих на то, что словник наиболее

«индивидуализированный» словников – 67.

1 Полный анализ слов по предлагаемым способам приведен в приложении У.

2 Всего проанализировано 100 слов.

Page 183: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

183

Диаграмма 3, смоделированная по первому способу (Rг), составлена по

суммарному количеству слов каждого типа и отражает результаты сопоставления

словников А и Б с Частотным словарем современного русского языка [Ляшевская

2009].

Диаграмма 3.

Сопоставление результатов идентификации, полученных способом № 1 (ΔRг= R1г –R2г)

Количественное выражение диаграммы1:

Частотно-сопоставительная таблица Д.1 ([Ляшевская 2009] – А): 53– 65;

Частотно-сопоставительная таблица Е.1 ([Ляшевская 2009] – Б): 33 – 67.

Количественная составляющая лексем двух типов при анализе полученных

данных частотного словаря и словника А близка к 50 % нахождения слов каждого

типа в тексте. В двух словниках оказывается близким количество употреблений

а) одинаковых слов, приближенных по ранговому расположению, а также

1 Первое значение – количество лексем типа а, указывающих на то, что текст

типовой; второе значение – количество лексем типа б, указывающих на то, что

текст индивидуализированный.

0

10

20

30

40

50

60

70

80

Частотный словарь - словник А Частотный словарь - словник Б

Текст "типовой"

Текст

"индивидуализированный"

Page 184: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

184

б) одинаковых слов, отдаленных по ранговой принадлежности, или слов, которые

встречаются в сотне самых частотных слов одного словника и отсутствуют в

сотне самых частотных слов другого словника. Словник А, таким образом, более

«типовой».

При анализе данных частотного словаря и словника Б обнаруживается, что

количество лексем, указывающих на не типичность словника и текста по нему,

очевидно больше, чем лексем другого типа: словник Б построен в рангово-

количественном отношении иначе, чем частотный словарь русского языка – либо

в словниках значатся одинаковые слова, отдаленные по ранговой

принадлежности, либо ряд слов, встречающихся в сотне самых частотных слов

одного словника, отсутствует в сотне самых частотных слов другого словника.

Словник Б, таким образом, отклоняется от «абсолютного» показателя и является

наиболее индивидуализированным, персонным.

Таким образом, этап сопоставления Частотного словаря современного русского

языка со словниками, принадлежащими разным языковым личностям (согласно

результатам универсальной методики идентификации), подтвердил

идентификационный вывод благодаря установлению типичности или

индивидуализированности (проявлению наиболее сильного персонного начала в

тексте) словников и текстов по ним: текст А является наиболее «типовым», текст

Б – наиболее «индивидуализированным», а значит, между ними нельзя установить

идентификационное тождество: очевидна наибольшая вероятность того, что они

принадлежат разным языковым личностям.

Методика «любимых» слов1 заключается в установлении наличия ряда лексем в

одних словниках, в то время как он отсутствует в других. Данная методика также

отражает, насколько каждый из текстов является «стандартным».

1 «Любимые» слова – слова, которые одна языковая личность употребляет

сравнительно чаще, чем другая языковая личность согласно ранжированию.

Page 185: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

185

Сопоставительный лексико-ранговый анализ позволил выявить 14 лексем

словника А, не представленных в частотном словаре [Ляшевская 2009] в качестве

высокочастотных. К таковым, например, относятся: просто в словнике R=54, в

частотном словаре R=123; вообще в словнике R=65, в частотном словаре R=222;

мама в словнике R=80, в частотном словаре R=296; сегодня в словнике R=91, в

частотном словаре R=243; любить в словнике R=92, в частотном словаре R=179;

тут в словнике R=94, в частотном словаре отсутствует (присутствует слово

тута); после в словнике R=97, в частотном словаре R=103; хотя в словнике R=98,

в частотном словаре R=156; работа, в словнике R=99, в частотном словаре

R=140.

Лексемы словника Б, не представленные в частотном словаре [Ляшевская 2009]

в качестве высокочастотных (в количестве 27). К таковым, например, относятся:

делать в словнике R=49, в частотном словаре R=129; любовь в словнике R=57, в

частотном словаре R=352; ничего в словнике R=59, в частотном словаре

отсутствует; сейчас в словнике R=60, в частотном словаре R=101; потому в

словнике R=61, в частотном словаре R=121; вообще в словнике R=67, в

частотном словаре R=222; жить в словнике R=69, в частотном словаре R=117;

нужно в словнике R=70, в частотном словаре отсутствует; можно в словнике

R=74, в частотном словаре R=102; сегодня в словнике R=75, в частотном словаре

R=243; хорошо в словнике R=76, в частотном словаре R=152; хотя в словнике

R=80, в частотном словаре R=156; думать в словнике R=83, в частотном словаре

R=106; всегда в словнике R=85, в частотном словаре R=157; много в словнике

R=86, в частотном словаре R=187; музыка в словнике R=87, в частотном словаре

R=842; лишь в словнике R=88, в частотном словаре R=198; тогда в словнике

R=89, в частотном словаре R=112; всего в словнике R=95, в частотном словаре

отсутствует; совсем в словнике R=96, в частотном словаре R=172; равно в

словнике R=98, в частотном словаре R=382.

Параметр «любимых» слов подтвердил вывод о большей «стандартности»

текста А и большего отклонения в показателях ранга частоты лексем в тексте Б.

Так называемую «индивидуализированность» словника Б показали лексемы

Page 186: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

186

словников, которых нет в сотне самых частотных слов русского языка. Подобные

слова можно назвать «любимыми» словами, т. к. автор их использует настолько

часто, что они входят в первую сотню высокочастотных слов. Отметим, что

количество подобных слов, которые отсутствующих на одном уровне ранга

группы в частотном словаре современного русского языка [Ляшевская 2009]

увеличивается с возрастанием ранга. Начиная с Rг=6, отклонения в

ранжировании увеличиваются. На основании этого можно выдвинуть

предположение о том, что каждая последующая сотня анализируемых слов

отразит большие отклонения как в аспекте анализа «любимых» слов, так и во всех

других видах анализа, предложенных в данной главе.

Таким образом, идентификационное моделирование по универсальному методу

показало, что тексты А и Б, В и Г принадлежат разным языковым личностям;

тексты А и В – одной языковой личности, Б и Г – одной, другой, языковой

личности. Сопоставление с частотным словарем русского языка, анализ по

предложенной методике «любимых» слов на основании сопоставления с

частотным словарем показали, что текст А является наиболее «типовым», текст Б

характеризуется наибольшей выраженностью персонного начала, что

подтверждает идентификационный вывод об их дифференциации.

Далее будет представлен алгоритм хода универсального метода идентификации

текстов и описаны выводы по предлагаемому универсальному методу

идентификации текстов и языковой личности и по двум способам идентификации

в рамках универсального метода.

Page 187: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

187

3.2.3. Алгоритм универсального метода идентификации текстов

Алгоритм хода универсального метода идентификации текстов определяется

следующими этапами:

1. Лексический уровень текстов автоматизированным путем1 перевести в

формат словников. Название (условное обозначение) словника должно

соответствовать названию (условному обозначению) текста.

2. Словоформы словника подвергнуть процессу лемматизации2.

3. Составить частотно-сопоставительные таблицы3. В каждую частотно-

сопоставительную таблицу включить два разных словника в минимальном объеме

сто слов и указать ранг каждого слова.

4. В частотно-сопоставительной таблице каждый словник разделить на группы,

состоящие из десяти слов. Пример частотно-сопоставительной таблицы (таблица

№ 16):

1Например, с помощью компьютерной программы SimWordSorter

[SimWordSorter].

2 Процесс лемматизации осуществляется согласно порядку, предложенному

авторами частотного словаря современного русского языка [Ляшевская 2009],

описанному частично в главе 3. На данный момент процесс лемматизации

осуществляется «ручным» способом. Для автоматизации процесса необходимы

дальнейшие исследования и разработки.

3 Если для идентификационного анализа предложено три текста, то составляется

три частотно-сопоставительные таблицы (словники А-Б, Б-В, А-В). Если

предложено четыре текста, то составляется 6 частотно-сопоставительных таблиц

(слоники А-Б, В-Г, А-В, Б-Г, А-Г, Б-В).

Page 188: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

188

Таблица № 16.

Пример частотно-сопоставительной таблицы

для универсального метода

Rг R Словник

А

Словник

Б

1

1 слово Слово

2 -//- -//-

3 -//- -//-

4 -//- -//-

5 -//- -//-

6 -//- -//-

7 -//- -//-

8 -//- -//-

9 -//- -//-

10 -//- -//-

2 11 -//- -//-

5. Применить следующие формулы для установления тождества и различия в

ранжировании словников.

5.1. Рабочая формула для 1 способа (Rг – ранг группы их десяти слов):

ΔRг= R1г –R2г, где ΔRг – разность рангов групп лексем в 1м и 2м текстах

частотно-сопоставительной таблицы,

R1г – ранг частоты лексемы первого текста в частотно-

сопоставительной таблице,

R2г – ранг частоты лексемы второго текста.

Согласно следующим условиям определить а) лексемы, подтверждающие

написание текстов одной языковой личностью, и б) лексемы, подтверждающие

написание текстов разными языковыми личностями.

Если ΔRг = 0, <2, т.е. слова находится в одной группе, или в соседних группах,

то тексты принадлежат одной языковой личности.

Если ΔRг ≥ 2, т.е. слова находятся в разных десятках, то – разным языковым

личностям.

5.1.1. Посчитать количество слов, которые а) указывают на принадлежность

текстов одной языковой личности, б) указывают на принадлежность текстов

разным языковым личностям, и отразить результаты в диаграмме.

Page 189: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

189

5.1.2. Установить тождество объектов идентификации на основе количества

слов двух типов (п. 5.1.1.).

5.2. Рабочая формула для 2 способа (R – ранг каждого слова):

ΔR= R1 – R2, где ΔR – разность рангов частот лексем 1го и 2го текстов,

R1 – ранг частоты лексемы первого текста в частотно-

сопоставительной таблице,

R2 – ранг частоты лексемы второго текста.

Согласно следующим условиям определить а) лексемы, подтверждающие

написание текстов одной языковой личностью, и б) лексемы, подтверждающие

написание текстов разными языковыми личностями.

Если ΔR = 0; ≤ 10, т.е. слова находится на одном ранге, либо разность ранга

лексемы в разных текстах не более 10, то тексты принадлежат одной языковой

личности.

Если ΔR> 10, разницу между рангами можно считать контрастной и,

следовательно, разграничить тексты по принадлежности их разным языковым

личностям1.

5.2.1. Посчитать количество слов, которые а) указывают на принадлежность

текстов одной языковой личности, б) указывают на принадлежность текстов

разным языковым личностям, и отразить результаты в диаграмме.

5.2.2. Установить тождество объектов идентификации на основе количества

слов двух типов (п. 5.2.1.)2.

1 Знак «–», получаемый при подсчете разницы ΔR, не актуален: важна

исключительно количественная наполненность, которую описывают полученные

данные.

2 Этапы моделирования 1) лексико-ранговое сопоставление словников по текстам

и частотного словаря современного русского языка и 2) методика «любимых»

слов являются верификационными. Ход их реализации приведен в главе 3.

Page 190: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

190

Выводы по 3 главе

Результатом главы 3стала разработка универсального метода идентификации

текстов и языковой личности на материале русскоязычных интернет-дневников.

Интернет-дневники представлены четырьмя фрагментами, средний объем

каждого составляет 27 тысяч словоупотреблений. Задача универсального метода

идентификации текстов – установить тождество объектов идентификации по их

принадлежности одному автору и соответственно идентифицировать языковые

личности по текстам на основе универсального параметра – ранжирования

структуры текстов, общие и особенные проявления которого выявляются путем

лексико-рангового анализа высокочастотных единиц словника. В универсальном

подходе индивидуально-конкретное тождество обнаруживается при

сопоставлении ранга частоты каждого слова в каждом словнике.

С точки зрения анализируемого лексического уровня данный подход

обозначается как общелексический, т. к. предполагает анализ каждого слова в

словнике без спецификации. Формализация и универсализм метода

идентификации реализуются в представлении слова как знака (без обращения к

его значению и смыслу) – исключается дифференциации синонимов, омонимов,

многозначных слов.

В основе данного подхода лежит представление о том, что языковая личность

проявляется в предпочтении использования ряда слов (разных частей речи) в

большей степени, чем других. Индивидуальный выбор характеризуется с

некоторой постоянностью в текстах, которая способствует идентификации или

дифференциации анализируемых текстов. Таким образом, универсальный подход

реализуется путем формально-количественного анализа индивидуальных

авторских предпочтений в употреблении высокочастотных слов, которые

отражаются в ранжировании каждого словника по текстам.

Page 191: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

191

В настоящем исследовании для идентификационного моделирования текста

предложено два способа, основанных на различном понимании ранга частоты:

ранг группы из десяти слов (Rг), либо ранг каждого слова (R). Формулы для

моделирования текстов: ΔRг= R1г –R2г (для первого способа идентификации) и

ΔR= R1 – R2 (для второго способа идентификации). Оба способа доказали

правомерность своего использования, т. е. доказали принадлежность одних

текстов разным авторам и определили тождественность других текстов по

написанию их одним автором. Так, тексты А и В написаны одним автором; тексты

Б и Г написаны одним, другим автором; тексты А и Б принадлежат разным

авторам; тексты В и Г – разным авторам.

Сопоставление словников по текстам с Частотным словарем современного

русского языка как «абсолютным» данным показало, что существуют а) тексты,

которые являются более стандартными, «типовыми», т. е. – построены в лексико-

ранговом отношении более приближено к частотному словарю русского языка, и

б) тексты, показатели которых отличаются от «абсолютных» параметров, т. е.

менее стандартны, «индивидуализированы» – в них наиболее сильно проявляется

персонное начало. Подтверждено предположение о том, что наиболее частотные

единицы русского языка содержатся в конкретных текстах также в качестве

высокочастотных (процентное соотношение общих слов к одному словнику,

содержащему сто слов – 61 % (61 слово). В идентификационном аспекте

актуальным явился также лексико-ранговый анализ структуры словников,

который позволил определить, типовой или индивидуализированный каждый

текст, и подтвердить идентификационный вывод, сделанный в ходе

универсального моделирования текстов по частотно-сопоставительным таблицам

(см. приложения Ж –Р): текст А является наиболее типовым, текст Б – наиболее

индивидуализированным. Параметр «любимых» слов подтвердил вывод о бо льшей

стандартности текста А и бо льшего отклонения в показателях ранга частоты

лексем в тексте Б – его индивидуализированности.

Page 192: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

192

Заключение

Настоящее исследование показало, что конкретная языковая личность,

воплощенная в тексте, представляет собой набор индивидуальных лексико-

квантитативных и лексико-ранговых закономерностей. Выявление лексико-

квантитативных проявлений индивидуальной языковой способности в тексте

осуществляется путем применения разработанных на этой основе двух вариантов

методики их обнаружения.

Формально-количественное моделирование текстов (персонотекстов)

осуществляется в данной работе в идентификационном формате, под которым

понимается соотнесение текста с языковой личностью его автора как

индивидуального варианта носителя языковой способности. Лексико-

квантитативные параметры текста, выявленные по формализованным алгоритмам,

позволяют решать задачу идентификации – установить индивидуально-

конкретное тождество объектов идентификации.

Настоящая работа позволила разграничить существующие методы описания

языковой личности и идентификации текстов и представить их в оппозиции

специально-ориентированных и универсальных методов идентификации текстов.

Нами предложено два варианта выявления лексико-квантитативных

закономерностей в идентификационном аспекте в рамках оппозиции: специально-

ориентированный (представлен в главе 2) и универсальный (представлен в главе

3) методы идентификации текстов. Проведенное исследование подтвердило

гипотезу о том, что языковая личность, воплощенная в русскоязычном тексте,

представляется набором индивидуальных лексико-квантитативных

закономерностей, выявление и описание которых по формализованным

алгоритмам позволяет идентифицировать анализируемые тексты и установить

авторство текстов.

Page 193: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

193

Апробация предлагаемых вариантов идентификации текстов и языковой

личности осуществляется на материале фрагментов русскоязычных интернет-

дневников. «Возможности судебно-автороведческого исследования письменной

речи в целях установления характеристик автора документа» [Напреенко 2011]

базируются на том, что «текст документа может рассматриваться как проекция

индивидуальной языковой системы, или шире – психоречевой организации

личности» [Теоретические и методические вопросы… 1977: 12]. «Интернет-

дневник как текст в аспекте проявления в нем свойств языковой личности

выступает единством формально-языковых и содержательно-смысловых

параметров» [Напреенко 2011], предстает репрезентацией языкового потенциала

личности.

Вариант специально-ориентированного подхода к выявлению лексико-

квантитативных закономерностей текста базируется на анализе слов, связанных

синонимическими отношениями. Различное ранжирование (частотность

словоупотребления) синонимов в тексте отражает качество языковой способности

и обладает специфирующим и идентификационным потенциалом. Исследование

показало, что языковая личность преимущественно осуществляет выбор одного

слова из синонимического ряда, представленного в словаре синонимов русского

языка. Выделение в тексте специфических параметров и интерпретация их путем

формально-количественного моделирования способствуют идентификации

воплощенной в тексте языковой личности.

Вариант универсального подхода к выявлению лексико-квантитативных

закономерностей текста в настоящем исследовании основан на анализе ранга

частоты самых частотных слов в тексте. Формализованный подход реализуется в

сопоставительно-количественном анализе слова без обращения к его значению и

смыслу, нейтрализации омонимов и многозначных слов в слово как знак-

идентификатор. Исследование показало, что языковая личность проявляется в

употреблении ряда слов в большей степени, чем других. Данные предпочтения

языковой личности отражаются в ранжировании текстов.

Page 194: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

194

Сопоставление словников с частотным словарем русского языка позволило

подтвердить положение о том, что «наиболее частотные единицы русского языка

содержатся в любом тексте и являются высокочастотными для любого текста»

[Напреенко 2014: 19]. Выпадение наиболее частотных единиц в словнике

конкретного текста из этого статуса или появление в списке высокочастотных

единиц других слов дает основания для утверждения о том, что данный текст

нетиповой. Сопоставление словников по текстам с частотным словарем русского

языка как с «абсолютным» показателем распределения слов по частотности в

русском языке показало, что одни тексты являются более «типовым», то есть

имеют схожую лексико-ранговую структуру с частотным словарем русского

языка, другие тексты наиболее «индивидуализированы» (в них сильнее

проявляется персонное начало). Подобная специфичность (отличие от

«абсолютных» лексико-ранговых показателей) в случае аналогии в разных

текстах дает основания для их идентификации.

Настоящее исследование имеет прямой эмпирический выход: идентификация

текстов вписывается в задачи судебной лингвистической идентификационной

экспертологии. Формализованный подход к решению задачи идентификации

текстов позволяет проводить анализ независимо от эксперта – он направлен на

достижение объективизации исследования. Конструктивная сторона исследования

призвана дополнять методы науки, когда обращение к семантике затруднено или

исключено (например, при большом объеме текстов). Представленная работа

позволила выявить некоторые закономерности лексико-квантитативной и

лексико-ранговой структур русскоязычных текстов, принадлежащих одному или

разным авторам. Этот фактор дает возможность использовать названную

методику идентификации текстов в судебной автороведческой экспертизе.

Нам представляется, что наиболее продуктивным в вопросах установления

тождества объектов является комплексный подход: на первом этапе – проведение

формализованного (в перспективе – автоматизированного) анализа,

позволяющего диагностировать весь текст и отражать объективные данные

Page 195: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

195

ранжирования; на втором – «ручная» верифицирующая работа исследователя,

позволяющая увидеть особенности текста, не зримые машиной. Каждый из

представленных методов обладает рядом преимуществ. Однако именно

формализованный метод, названный нами универсальным или общелексическим,

должен проводиться в качестве первого этапа идентификации, т. к. способен

повысить достоверность результатов исследования. Во-первых, универсальный

метод идентификации текстов и языковой личности обнаруживает

количественную составляющую лексической наполненности текста, во-вторых,

отражает бессознательный выбор автором текста определённой лексики, в-

третьих, даёт возможность проанализировать используемые автором слова

независимо от их принадлежности к той или иной части речи. Данные параметры

подчинены требованию объективности результатов исследования

идентификационного характера. Применение методов квантитативного типа в

совокупности с традиционными методами (в нашей терминологии –

интуитивными, специально-ориентированными) позволяет учитывать

взаимодействие между содержанием и выражением речевого произведения, в

связи с чем необходимо считать, что методы обоих типов не конкурируют друг с

другом – они работают в совокупности. Значимым является то обстоятельство,

что представленные нами методы идентификации текстов и языковой личности

по ним, безусловно, способствуют объективизации исследования: «даже когда

результаты статистико-комбинаторного моделирования приводят к уже

известным данным, принципиальная новизна состоит в достигнутой, наконец,

алгоритмической объективности операций для их получения» [Андреев 1967: 9].

Исследование показало необходимость продолжения работы по

совершенствованию предложенных методов. В частности, желательным при

постановке задачи идентификации текстов приведенными методами является учет

их жанра, а также количества словоупотреблений (на данный момент методы

апробировались на текстах, средний объем которых – 27 тысяч

словоупотреблений). Апробация методов идентификации текстов разных жанров,

Page 196: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

196

стилей, а также меньшего объема словоупотребления является перспективой

исследования.

В части разработки специально-ориентированного метода идентификации

текстов перспектива исследования заключается в необходимости разграничения

разницы между средними значениями относительных частот слов в текстах по

шкале: высокая, средняя, нулевая степень доказательности идентификационного

вывода.

В части разработки универсального метода идентификации текстов,

ориентированного на автоматизацию процедуры идентификации, перспектива

исследования – создание автоматизированной программы по установлению

индивидуально-конкретного тождества объектов (текстов). Проблематика

разрабатываемой программы – идентификация одного текста относительно

другого по принадлежности одному автору. Подобная автоматизированная

программа, тем самым, будет отличаться от существующих автоматизированных

продуктов, цель которых заключается в установлении тождества анализируемого

объекта тексту, заложенному в базе программы.

Page 197: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

197

Библиография

1. Аверьянова 2003 – Аверьянова, Т. В. Язык в судебно-экспертной

деятельности / Т. В. Аверьянова // Воронежские криминалистические чтения. –

Воронеж: Изд-во Воронежского госуд. университета, 2003. – С.53-57.

2. Андреев 1959 – Андреев, Н. Д. Моделирование языка на базе его

статистической и теоретико-множественной структуры / Н. Д. Андреев // Тезисы

совещания по математической лингвистике 15-21 апреля 1958-1959 г. – Л.: Наука,

1959. – С. 15-22.

3. Андреев 1965 ‒ Андреев, Н. Д. Статистико-комбинаторное моделирование

языков / Н. Д. Андреев. ‒ М. ‒Л.: Наука, 1965. ‒ 501 с.

4. Андреев 1967 – Андреев, Н. Д. Статистико-комбинаторные методы в

теоретическом и прикладном языковедении / Н. Д. Андреев. – М.: Наука, 1967. –

403 с.

5. Аниськина 2001 ‒ Аниськина, Н. В. Языковая личность современного

старшеклассника: автореф. дис. … канд. филол. наук / Н.В. Аниськина. –

Ярославль, 2001. ‒ 28 с.

6. Антропотекст-2 2006 – Антропотекст-2: сб. науч. тр. / Отв. ред.

Т. В. Чернышова. – Барнаул: Издательство Алт. университета, 2006. – 178 с.

7. Апресян 1966 – Апресян, Ю. Д. Идеи и методы современной структурной

лингвистики. – М: Наука, 1966. — 305 с.

8. Араева 2014 ‒ Араева, Л. А. Языковая личность экстремиста (о специфике

автороведческой экспертизы по криминальным проявлениям экстремизма) /

Л. А. Араева, М. А. Осадчий // Языковая личность: моделирование, типология,

портретирование (сибирская лингвоперсонология): коллективная монография /

Под ред. Н. Д. Голева и Н. Н. Шпильной. ‒ М.: ЛЕНАНД, 2014. ‒ С. 533‒543.

Page 198: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

198

9. Ароцкер 1961 ‒ Ароцкер, Л. Е. Об использовании лингвистической

статистики для установления автора анонимного текста / Л. Е. Ароцкер,

В. К. Войнов // Криминалистика и судебная экспертиза. ‒ Киев, 1966. ‒ Вып. 3. ‒

С. 141‒151.

10. Асмус 2005 – Асмус, Н. Г. Лингвистические особенности виртуального

коммуникативного пространства: дис. … канд. филол. наук / Н. Г. Асмус. –

Челябинск, 2005. – 265 с.

11. Ахманова 1961 − Ахманова, О. С. О точных методах исследование языка (о

так называемой «математической лингвистике») / О. С. Ахманова, И. А. Мельчук,

Е. В. Падучева, Р. М. Фрумкина. – М.: Изд-во Моск. ун-та, 1961. – 162 с.

12. Баранов 2001 – Баранов, А. Н. Авторизация текста: пример экспертизы /

А. Н. Баранов // Введение в прикладную лингвистику: учеб. пособие. – М.:

Эдиториал УРСС, 2001. – С. 43-51.

13. Баранов 2001а – Баранов, А. Н. Введение в прикладную лингвистику /

А. Н. Баранов. – М.: УРСС Эдиториал, 2001. – 360 с.

14. Баранов 2007 – Баранов, А. Н. Лингвистическая экспертиза текста /

А. Н. Баранов. – М.: Флинта, 2007. – 592 с.

15. Батов 1974 – Батов, В. И. Идентификация личности по речи: автореф. дис.

… канд. юрид. наук / В. И. Батов. – М.: МГУ, 1974. – 24 с.

16. Батов 1975 – Батов, В. И. Атрибуция текста на основе объективных

характеристик: Итоги эксперимента / В. И. Батов, Ю. А. Сорокин // Изв. АНСССР.

– М.: Наука, 1975. – т. XXXIV. – № 1. – С. 76-78.

17. Батов 1977 –Батов, В. И. Опыт построения методики для установления

авторства текстов / В. И. Батов, Ю. А. Сорокин // Изв. АНСССР. Серия

литературы и языка. М.: Наука, 1977. – т. XXXVI. – № 4. – С.345-347.

18. Батов 1980 –Батов, В. И. Субъективная модель текста и вопросы атрибуции

/ В. И. Батов, Ю. А. Сорокин // Изв. АНСССР. Серия литературы и языка. М.:

Наука, 1980. – т. XXXIX. – № 2. – С.170-173.

Page 199: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

199

19. Башкова 2010 – Башкова, И. В. Изучение языковой личности в современной

российской лингвистике: монография / И. В. Башкова. – Красноярск: Сибирский

федеральный университет, 2010. – 451 с.

20. Башкова 2011 – Башкова, И. В. Изучение языковой личности в современной

российской лингвистике / И. В. Башкова. ‒ Красноярск: Сибирский федеральный

университет, 2011. ‒ 472 с.

21. Башкова 2012 – Башкова, И. В. Как изучают языковую личность в Саратове

/ И. В. Башкова // Язык и социальная действительность. ‒ Красноярск: Сибирский

федеральный университет, 2012. ‒ С. 62-73.

22. Башкова 2014 – Башкова, И. В. Лингвоперсонологические школы Сибири /

И. В. Башкова // Языковая личность: моделирование, типология, портретирование

(сибирская лингвоперсонология): коллективная монография / Под ред. Н. Д.

Голева и Н. Н. Шпильной. ‒ М.: ЛЕНАНД, 2014. ‒ С. 569‒591.

23. Башкова 2014а ‒ Башкова, И. В. Региональный компонент авторской

картины мира В.П. Астафьева в семантике слов, обозначающих человека /

И. В. Башкова // Гуманитарные, социально-экономические и общественные науки.

‒ 2014. ‒ № 7. ‒ С. 291–294.

24. Башкова 2015 ‒ Башкова, И. В. Творческая языковая личность и

вариативность русской языковой картины мира / И. В. Башкова // Вестник

Томского государственного педагогического университета. ‒ Томск, 2015. ‒

№ 4 (157). ‒ С. 112-116.

25. Беляева 2000 ‒ Беляева, Л. Современные возможности судебных экспертиз /

Л. Беляева, А. Ю. Бутырин, Ю. Воронков. ‒ М.: Триада, 2000. ‒ 261с.

26. Бельская 2014 – Бельская, Н. С. Применение аналитико-описательных

методов в решении сравнительных задач судебного лингвистического

исследования речевых произведений / Н. С. Бельская // Вестник Томского

государственного университета. – Томск, 2014. – № 381. – С. 5-10.

27. Богин 1998 ‒ Богин, Г. И. Языковая личность школьника как формат для

определения успешности его филологической подготовки (книга для методиста и

учителя) / Г. И. Богин. ‒ Тверь: Просвещение, 1998. – Вып. 1. – 164 с.

Page 200: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

200

28. Борисова 2006 – Борисова, И. А. Исследование письменного дискурса в

автороведческой экспертизе / И. А. Борисова // Современные гуманистические

исследования. – М., 2006. – №1. – С.169-175.

29. Бринев 2008 – Бринев, К. И. Лингвистическая экспертиза: типы экспертных

задач и методические презумпции / К. И. Бринев // Юрислингвистика-9: Истина в

языке и праве: межвузовский сборник научных трудов / Под ред. Н. Д. Голева. –

Кемерово, Барнаул: Изд-во Алт. Ун-та, 2008. – С.232–249.

30. Бринев 2009 – Бринев, К. И. Теоретическая лингвистика и судебная

лингвистическая экспертиза / К. И. Бринев. – Барнаул: Алтайская гос. пед. акад.,

2009. – 251с.

31. Бутакова 2011 ‒ Бутакова, Л. О. Динамика развития языковой способности и

речевой компетенции носителей русского языка: Региональное

экспериментальное исследование / Л.О. Бутакова. ‒ Москва: Флинта, 2011. ‒

160 с.

32. Бутакова 2011а ‒ Бутакова, Л. О. Лингвистическое моделирование

этнических фрагментов регионального языкового сознания / Л.О. Бутакова

//Филология и человек. ‒ Барнаул: Издательство Алтайского государственного ун-

та, 2011. ‒ С. 26-45.

33. Бутакова 2011б ‒ Бутакова, Л. О. Терминологически ориентированные

языковые знаки в языковом сознании жителей региона / Л.О. Бутакова // Вестник

Челябинского государственного университета. ‒ Челябинск, 2011. ‒ № 24. ‒ С. 60-

64.

34. Бутакова 2013 ‒ Бутакова, Л. О. Ассоциативно-семантический словарь как

основа для моделирования ценностных фрагментов языкового сознания

носителей языка / Л.О. Бутакова, Е. Н. Гуц // Вопросы психолингвистики. ‒

Москва, 2013. ‒ № 18. ‒ С. 158-173.

35. Бутакова 2014 ‒ Бутакова, Л. О. Психолингвистическое моделирование

процессов восприятия и понимания официально-деловых текстов

профессионалами / Л.О. Бутакова // Вестник Омского университета. ‒ Омск,

2014. ‒ № 4 (74). ‒ С. 169-174.

Page 201: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

201

36. Васильев 2007 – Васильев, А. Д. Современное российское языковое

законодательство: юрислингвистический анализ и комментарии / А. Д. Васильев.

− Красноярск: СиБЮИ МВД России, 2007. – 152 с.

37. Верхозин 2013 – Верхозин, С. С. К вопросу о лингвотеоретических основах

методик авторизации текста / С. С. Верхозин // Вестник Иркутского

государственного лингвистического университета. – Иркутск, 2013. − № 1 (22). −

С. 22- 27.

38. Верхозин 2013а ‒ Верхозин, С. С. Количественные критерии авторизации

текста как проблема теоретической лингвистики: автореф. дис. … канд. филол.

наук / С. С. Верхозин. – Иркутск, 2013. ‒ 20с.

39. Верхозин 2013б ‒ Верхозин, С. С. О статусе количественных методов в

лингвистике / С. С. Верхозин // Вестник Иркутского государственного

лингвистического университета. − Иркутск, 2013. − № 3 (24). − С. 145-150.

40. Виницкий 1972 − Виницкий, Л. В. К вопросу идентификации исполнителя

машинописного текста / Л. В. Виницкий // Труды Высшей школы МВД СССР. −

М.: НИиРИО МВД СССР, 1972. − Вып. 34. − С. 179-188.

41. Виноградов 1961 − Виноградов, В. В. Проблема авторства и теория стилей /

В. В. Виноградов. − М.: Гослитиздат, 1961. − 616 с.

42. Вопросы лингвоперсонологии 2007 − Вопросы лингвоперсонологии:

Межвузовский сборник научных трудов. − Барнаул: Изд-во АлтГТУ, 2007. − Ч. 1.

– 223 с.

43. Вопросы… − Вопросы судебно-авторовеческой экспертизы / под ред.

С. М. Вула. – Киев: РИО МВД УССР, 1984. − 132с.

44. Воркачев 2001 − Воркачев, С. Г. Лингвокультурология, языковая личность,

концепт: становление антропоцентрической парадигмы в языкознании /

С. Г. Воркачев // Филологические науки. − 2001. − № 1. − С. 64-72.

45. Ворончак 2007 ‒ Ворончак, Е. Методы вычисления показателей

лексического богатства текстов / Е. Ворончак // Семиотика и искусствометрия:

Сб. переводов под ред. Ю. М. Лотмана и В. М. Петрова. – М.: Мир, 1972. – С. 232-

240.

Page 202: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

202

46. Вул 1979 − Вул, С. Судебно-автороведческая экспертиза / С. Вул //

Социалистическая законность. − 1979. − №12. − С. 34.

47. Галактионова 2004 − Галактионова, И. В. Судебная лингвистическая

экспертиза / И. В. Галактионова, И. М. Кобозева, Т. В. Коломийцева,

О. В. Кукушкина [и др.] // Бюллетень Министерства юстиции Российской

Федерации. – М., 2004. − № 9. − С.63-70.

48. Галяшина 2003 − Галяшина, Е. И. Основы судебного речеведения:

Монография / Е. И. Галяшина / Под ред. проф. М. В. Горбаневского. – М.:

СТЭНСИ, 2003. – 236 с.

49. Галяшина 2006 − Галяшина, Е. И. Автороведческая экспертиза в

российском судопроизводстве / Е. И. Галяшина, Е. В. Приводнова // Lex Russica. −

2006. − № 4. − С. 755-761.

50. Галяшина 2006а − Галяшина, Е. И. Возможности судебно-речеведческих

экспертиз в защите объектов интеллектуальной собственности / Е.И. Галяшина //

Юрислингвистика − 7: Язык как феномен правовой коммуникации:

Межвузовский сборник научных статей. − Барнаул: Изд-во Алт. ун-та, 2006. − С.

154-167.

51. Гарбовский 2004 ‒ Гарбовский, Н. К. Теория перевода / Н. К. Гарбовский. ‒

М.: Издательство Московского университета, 2004. ‒ С. 278-283.

52. Гарганеева 2009 – Гарганеева, К. В. Функции метаязыковой рефлексии в

речи ребенка младшего возраста (метаязыковой портрет Светы Гарганеевой) /

К. В. Гарганеева // Обыденное метаязыковое сознание онтологические и

гносеологические аспекты. Ч.1: Коллективная монография / Отв. ред. Н. Д. Голев.

– Кемерово, Барнаул: Изд-во Алт. Ун-та, 2009. – С. 357-370.

53. Гиро 1980 − Гиро, П. Разделы и направления стилистики и их проблематика

/ П. Гиро // Новое в зарубежной лингвистике: Вып. IX. Лингвостилистика. − М.:

Прогресс, 1980. − С. 35-68.

54. Голев 1997 – Голев, Н. Д. Некоторые проблемы лексической и

словообразовательной мотивации (к построению теории квантитативной

мотивологии) / Н. Д. Голев // Человек – коммуникации – текст. − Вып. 1. Человек

Page 203: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

203

в свете его коммуникативного самосуществования / Под ред. А. А. Чувакина. −

Барнаул: Изд-во АГУ, 1997. − С. 90-97.

55. Голев 1999 – Голев, Н. Д. Постановка проблем на стыке языка и права /

Н. Д. Голев // Юрислингвистика - 1: Проблемы и перспективы. − Барнаул: изд-во

Алтайского университета, 1999. − С. 4-11.

56. Голев 2000 − Голев, Н. Д. Еще раз о глубине лингвистической экспертизы

текстов, вовлеченных в юридическую сферу (на материале одного судебного

разбирательства) / Н. Д. Голев, Л. А. Пищальникова // Юрислингвистика-2:

русский язык в его естественном юридическом бытии: межвуз. сб. науч. трудов. −

Барнаул: Изд-во Алт. ун-та, 2000. − С.253-262.

57. Голев 2001 − Голев, Н. Д. О специализации "Юрислингвистика" на

филологических факультетах (специальная ориентация) // Высшая школа в

современной социокультурной ситуации: Материалы межвузовской научно-

методической конференции / под ред. А. Н. Мельникова. − Барнаул: Изд-во АГУ,

2001. − С. 34-36.

58. Голев 2002 − Голев, Н. Д.Значение лингвистической экспертизы для

юриспруденции и лингвистики / Н. Д. Голев, О. Н. Матвеева // Цена слова: Из

практики лингвистических экспертиз текстов СМИ в судебных процессах по

искам о защите чести, достоинства и деловой репутации. − М: Галерея, 2002. − С.

257-266.

59. Голев 2002а – Голев, Н. Д. От редактора: Актуальные проблемы

юрислингвистической экспертизы / Н. Д. Голев // Юрислингвистика-3: Проблемы

юрислингвистической экспертизы: Межвуз. сборник научных трудов / под ред.

Н. Д. Голева. − Барнаул: Изд-во Алт. унта, 2002. − С. 5-14.

60. Голев 2003 – Голев, Н. Д. Тексты рассказов В.М. Шукшина как воплощение

энергии конфликта (опыт типологии антропотекстов и языковых личностей) /

Н. Д. Голев // Сибирский филологический журнал. − Новосибирск: НГУ, 2003. −

№ 3−4. − С. 57-63.

Page 204: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

204

61. Голев 2003а ‒ Голев, Н. Д. Юрислингвистическая экспертиза: на стыке

языка и права / Н. Д. Голев, О. Н Матвеева //Сибирский филологический журнал.

‒ Новосибирск: НГУ, 2003. ‒ № 1. ‒ С.146-157.

62. Голев 2004 – Голев, Н. Д. Лингвоперсонологическая вариативность языка /

Н. Д. Голев // Известия Алтайского государственного университета. Серия

«История, филология, философия и педагогика». − Барнаул, 2004. − № 4. − С. 41-

46.

63. Голев 2006 – Голев, Н. Д. Лингвотеоретические основания типологии

языковой личности / Н. Д. Голев // Лингвоперснология: типы языковых личностей

и личностно-ориентированное обучение / под ред. Н. Д. Голева, Н. В. Сайковой,

Э. П. Хомич. – Барнаул, Кемерово: БГПУ, 2006. − С. 7-19.

64. Голев 2007 – Голев, Н. Д. Лингвоперсонология: проблемы и перспективы /

Н. Д. Голев, Н. Д. Голев, Н. В. Сайкова (Мельник Н. В.) // Вопросы

лингвоперсонологии: Межвуз. сборник научных трудов. – Барнаул: Изд-во

АлтГТУ, 2007. − Ч.1. − С.7-11.

65. Голев 2009 − Голев, Н. Д. Лингвоперсонологические основания личностно-

ориентированного обучения / Н. Д. Голев // Лингвоперсонология и личностно-

ориентированное обучение языку: учеб. пособие / Н. Д. Голев [и др.]; Под ред.

Н. В. Мельник. − Кемерово: ГОУ ВПО «КемГУ», 2009. − С. 8-16.

66. Голев 2009а − Голев, Н. Д. Лингвосоционическое моделирование

экстравертного и интровертного типов языковой личности / Н. Д. Голев,

А. В. Кузнецова // Вестник КемГУ. Филология. − Кемерово: КемГУ, 2009. −

Выпуск № 3. − С. 95-98.

67. Голев 2009б − Голев, Н. Д. Типология языковой личности и

лингводидактика / Н. Д. Голев // Лингвоперсонология и личностно-

ориентированное обучение языку: учеб. пособие / Н. Д. Голев [и др.]; Под ред.

Н. В. Мельник. − Кемерово: ГОУ ВПО «КемГУ», 2009. − С. 17-28.

68. Голев 2010 – Голев, Н. Д. Лингвистическое сравнительное и

автороведческое исследование трех текстов / Н.Д. Голев // Юрислингвистика-10.

Page 205: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

205

Лингвоконфликтология и юриспруденция. − Кемерово, Барнаул: Изд-во Алт. ун-

та, 2010. − С. 422–431.

69. Голев 2014 – Голев, Н. Д. Ментально-психологические аспекты типологии

языковой личности (к проблеме взаимоотношения языкового и персонного

пространства) / Н. Д. Голев // Языковая личность: моделирование, типология,

портретирование (сибирская лингвоперсонология): коллективная монография /

Под ред. Н. Д. Голева и Н. Н. Шпильной. ‒ М.: ЛЕНАНД, 2014. ‒ С. 10 ‒32.

70. Голев 2014а – Голев, Н. Д. Сравнительное лингвистическое и

автороведческое исследование трех текстов / Н. Д. Голев // Языковая личность:

моделирование, типология, портретирование (сибирская лингвоперсонология):

коллективная монография / Под ред. Н. Д. Голева и Н. Н. Шпильной. ‒ М.:

ЛЕНАНД, 2014. ‒ С. 515‒523.

71. Головин 1971 − Головин, Б. Н. Язык и статистика / Б. Н. Головин. − М.:

Просвещение, 1971. − 189 с.

72. Головина 2005 − Головина, Т. А. Части речи в лингвоперсонологическом

пространстве / Т. А. Головина // Университетская филология образованию:

человек в мире коммуникаций. − Барнаул: Изд-во Алт. ун-та, 2005. − С. 86-87.

73. Головина 2006 − Головина, Т. А. Квантитативный анализ

лингвоперсонологического функционирования частей речи (на материале

художественных произведений: тип текста – описание) / Т. А. Головина // Вестник

Томского государственного университета. Бюллетень оперативной научной

информации «Функционирование русского на современном этапе». − 2006. −

№ 120. − С. 94-105.

74. Головина 2007 − Головина, Т. А. Квантитативный анализ

лингвоперсонологического функционирования частей речи в произведениях

русской классической и современной художественной литературы /

Т. А. Головина // Вопросы персонологии: Межвузовский сборник научных

трудов. − Баранул: Изд-во АлтГТУ, 2007. − Ч. 1. − С. 145-157.

75. Головина 2008 − Головина, Т. А. Лингвоперсонологическое

функционирование частей речи: статистический аспект: на материале

Page 206: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

206

художественных текстов: дис. ... канд. филол. наук / Т. А. Головина. − Барнаул,

2008. − 203 с.

76. Гончарова 2009 − Гончарова, Е. А. Динамические процессы в лексиконе

языковой личности: дис. … канд. филол. Наук / Е. А. Гончарова. − Новосибирск,

2009. − 225с.

77. Городецкая 2007 − Городецкая, Л. А. Лингвокультурная компетентность

личности / Л. А. Городецкая. − М.: МАКС-Пресс, 2007. − 224 с.

78. Городецкий 1989 − Городецкий, Б. Ю. Компьютерная лингвистика:

моделирование языкового общения / Б. Ю. Городецкий // Новое в зарубежной

лингвистике. Вып. XXIV. Компьютерная лингвистика. − М., 1989. − С.5-31.

79. Горошко 2006 − Горошко, Е. И. Судебная лингвистика: становление

теоретической парадигмы / Е. И. Горошко // Юрислингвистика-7: язык как

феномен правовой коммуникации / под. ред. Н. Д. Голева. ‒ Барнаул: изд-во

Алтайского государственного университета, 2006. ‒ С.191-198.

80. Горошко 2009 − Горошко, Е. И. Интернет-жанр и функционирование языка

в Интернете: попытка рефлексии / Е. И. Горошко // Жанры речи. − Саратов:

Издательский центр «Наука», 2009. − Выпуск 6 «Жанр и язык». – С. 11-127.

81. Грачев 2011 − Грачев, М. А. Некоторые теоретические аспекты

автороведческих лингвистических исследований при подготовке языковедов-

экспертов / М. А. Грачев // Вестник Нижегородского университета

Н. И. Лобачевского. − Н. Новгород, 2011. − № 6 (2). − С. 140−144.

82. Губаева 2006 − Губаева, Т. Определяет ли автороведческая экспертиза

автора? / Т. Губаева, Р. Ситдикова // Интелектуальная собственность. Авторское

право и смежные права. − 2006. − № 8. − С.24-31.

83. Гынгазова 2009 – Гынгазова, Л. Г. «Полный словарь диалектной языковой

личности» как отражение индивидуальной картины мира / Л. Г. Гынгазова //

Дискретность и континуальность в языке и тексте. – Новосибирск: Изд-во НГПУ,

2009. – С. 309-317.

Page 207: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

207

84. Дедова 2006 – Дедова, О. В. Лингвосемиотический анализ электронного

гипертекста (на материале русскоязычного Интернета): автореф. дисс. … докт.

филол. наук / О. В. Дедова. – М. МГУ, 2006. – 525с.

85. Демьянков 1992 − Демьянков, В. З. Личность, индивидуальность и

субъективность в языке и речи / В. З. Демьянков // «Я», «субъект», «индивид» в

парадигмах современного языкознания. − М.: ИНИОН РАН, 1992. − С.9-34.

86. Дударева 2012 − Дударева, Я. А. Номинативные единицы с близким

значением как компоненты ассоцитативно-вербальной сети носителей русского

языка: автореф. дис…. канд. филол.наук / Я. А. Дударева. − Кемерово, 2012. − 23

с.

87. Ермолова 2008 – Ермолова, Е. И. Проблема определения пола и возраста

автора анонимного документа по признакам письменной речи / Е. И. Ермолова //

Эксперт-криминалист. – М.: ИГ Юрист, 2008. −№ 4 − С. 16-18.

88. Ефременко 1960 – Ефременко, Э. Л. Раскрытие авторства на основе анализа

идейного содержания произведения / Э. Л. Ефременко // Вопросы текстологии:

сб. ст. – М.: Изд-во АН СССР, 1960. – Вып. 2. – С. 52–100.

89. Закономерности… – Закономерности структурной организации научно-

реферативного текста / под ред. В.И. Перебейнос. – Киев: Наукова думка, 1982. –

322 с.

90. Замилова 2011 − Замилова, А. В. Лингвосоционическое портретирование

языковой личности (на материале блога) / А. В. Замилова // Актуальные проблемы

литературоведения и лингвистики. Материалы конф. молодых ученых 1 апреля

2011 г. Вып. 12. Т. 1. Лингвистика. − Томск, 2011. − С. 122-127.

91. Захаров 2007 − Захаров, М. П. Автоматизация автороведческих

исследований / М. П. Захаров // Судебная экспертиза. −№ 4. −2007. − С. 63-69.

92. Звегинцев 2009 − Звегинцев, В. А. Очерки по общему языкознанию /

В. А. Звегинцев. − М.: Книжный дом «Либроком», 2009. − 384с.

93. Зубкова 2009 − Зубкова, Л. Г. Метаязыковой портрет Георгия Георгиевича

Зубкова / Л. Г. Зубкова, Н. Г. Зубкова // Обыденное метаязыковое сознание

Page 208: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

208

онтологические и гносеологические аспекты. Ч.1: Коллективная монография /

Отв. ред. Н. Д. Голев. – Кемерово, Барнаул: Изд-во Алт. Ун-та, 2009. – С. 267-298.

94. Зубов 2007 − Зубов, А. В. Основы искусственного интеллекта для

лингвистов: учеб. пособие для вузов / А. В. Зубов, И. И. Зубова. − М.:

Университетская книга, 2007. − 320 с.

95. Иванова 1971 − Иванова, Н. С. Дистрибутивно-статистическое описание

американских патентных текстов / Н. С. Иванова, А. Я. Шайкевич // Труды

ЦНИИПИ, серия 3. «Вопросы лингвостатистики и автоматизации

лингвистических работ». − М., 1971. − Вып. 4. − С. 74-79.

96. Иванцова 2002 − Иванцова, Е. В. Феномен диалектной языковой личности /

Е. В. Иванцова. − Томск: Изд-во Том. ун-та, 2002. − 312 с.

97. Иванцова 2008 − Иванцова, Е. В. Проблемы формирования

методологических основ лингвоперсонологии / Е. В. Иванцова // Вестник

Томского государственного университета. − Томск, 2008. − № 3(4). − С.27-43.

98. Иванцова 2009 − Иванцова, Е. В. Метаязыковое сознание диалектной

языковой личности / Е. В. Иванцова // Обыденное метаязыковое сознание

онтологические и гносеологические аспекты. Ч.1: Коллективная монография /

Отв. ред. Н. Д. Голев. – Кемерово, Барнаул: Изд-во Алт. Ун-та, 2009. – С. 321-356.

99. Иванцова 2010 − Иванцова, Е. В. Лингвоперсонология: Основы теории

языковой личности / Е. В. Иванцова. − Томск: Изд-во Томского ун-та, 2010. − 160

с.

100. Ищенко 2010 − Ищенко, Е. П. Криминалистика: учебник. 2-е изд.,

испр., доп. и перераб / Е. П. Ищенко, А. А. Топорков. − М.: Контракт, ИНФРА-М,

2010. − 784 с.

101. Каджазнуни 1969 – Каджазнуни, Л. К. Статистический анализ

индивидуального стиля: дисс. … канд. филол. наук / Л. К. Каджазнуни. − М.,

1969. – 28 с.

102. Каптеров 2004 − Каптеров, А. И. Информатизация социокультурного

пространства / А. И. Каптеров. − М.: ФАИР-ПРЕСС, 2004. − 512 с.

Page 209: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

209

103. Карасик 2004 − Карасик, В. И. Языковая личность: перспективы

лингвистической персонологии / В. И. Карасик // Языковая личность как предмет

теоретической и прикладной лингвистики. − Тула: Изд-о ТулГУ, 2004. − С. 92-99.

104. Караулов 1989 − Караулов, Ю. Н. Предисловие. Русская языковая

личность и задачи ее изучения / Ю. Н. Караулов // Язык и личность. − М.: Наука,

1989. − С.3-8.

105. Караулов 2002 − Караулов, Ю. Н. Русский язык и языковая личность /

Ю. Н. Караулов. − М.: Едиториал УРСС, 2002. − 264 с.

106. Караулов 2004 − Караулов, Ю. Н. Концептография языковой картины

мира / Ю. Н. Караулов // Scripta linuisticae aplicatae. Проблемы прикладной

лингвистики. Вып. 2. / отв. ред. Н. В. Васильева. – М.: Азбуковник, 2004. – С. 9-

42.

107. Катышев 2009 – Катышев, П. А. Метаязыковые рефлексии

непрофессионального историка Ю. Н. Фадеенкова / П. А. Катышев, С. В. Оленев

// Обыденное метаязыковое сознание онтологические и гносеологические

аспекты. Ч.1: Коллективная монография / Отв. ред. Н. Д. Голев. – Кемерово,

Барнаул: Изд-во Алт. Ун-та, 2009. – С. 299- 312.

108. Ким 1999 – Ким, И. Е. Русский этнограмматический тип / И. Е. Ким //

Отражение русской языковой картины мира в лексике и грамматике: Сборник

научных трудов / под ред. Т. И. Стексовой. – Новосибирск: НГПУ, 1999. –С. 141-

153.

109. Ким 2009 – Ким, Л. Г. Вариативно-интерпретационное

функционирование текста / Л. Г. Ким. − Томск: Изд-во Томского гос. пед. ун-та,

2009. – 312 с.

110. Ким 2014 – Ким, Л. Г. Кто автор жалобы? / Л. Г. Ким //

Юрислингвистика – 14. − Кемерово: КемГУ, 2014. (сдано в печать).

111. Колдин 2000 – Колдин, В. Я. Экспертиза как инструмент права /

В. Я. Колдин // Проблемы юридической техники: Сборник статей / под ред.

В. М. Баранова. − Нижний Новгород: Нижполиграф, 2000. – С. 669-692.

Page 210: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

210

112. Колесов 2006 − Колесов, В. В. Русская ментальность в языке и тексте /

В. В. Колесов. − Спб.: Петербургское востоковедение, 2006. − 624 c.

113. Комиссарова 2002 − Комиссарова, Л. М. Лингвосоционическая

методология изучения языковой личности в русском языке (на материале

произведений М. Цветаевой, О. Мандельштама, А. Ахматовой, Л. Гумилева, Б.

Пастернака): автореф. дис…. канд. филол.наук / Л. М. Комиссарова. − Барнаул,

2002. − 23 с.

114. Комплексная методика − Комплексная методика производства

автороведческих экспертиз: методические рекомендации / И. И.Рубцова [и др]. −

М-во внутр-х дел Российской Федерации, Экспертно-криминалистический центр.

− М.: ЭКЦ МВД России, 2007. − С. 188.

115. Котелова 1975 − Котелова, Н. З. Значение слова и его сочетаемость (к

формализации в языкознании) / Н. З. Котелова. − Л.: Наука, 1975. – 164 с.

116. Кречетова 2001 – Кречетова, И. Ю. Языковая личность переводчика

как интерпретатора текста / И. Ю. Кречетова // Новосибирск: Изд-во НГПУ, 2001.

– С. 57 – 58.

117. Криминалистика 1993 − Криминалистика: Учебник / Под ред.

И. Ф. Пантелеева, Н. А. Селиванова. − М.: Юрид. лит., 1993. − 592 с.

118. Кубиц 2005 – Кубиц, Г. В. Профессионализация языковой личности: на

примере юридичсекого дискурса: дис. … канд. филол. наук / Г. В. Кубиц. –

Челябинск, 2005. − 258 с.

119. Кузниченко 2005 − Кузниченко, Л. В. Проблемы теории и практики

судебно-автороведческой классификации экспертизы / Л. В. Кузниченко. //

Вестник криминалистики. − 2005. − Вып. 3 (15). − С. 45-49.

120. Кузьмина 2007 − Кузьмина, Н. А. Дело о шантаже и идентификации

личности шантажиста / Н. А. Кузьмина // Юрислингвистика – 8: Русский язык и

современное российское право. Межвузовский сборник научных статей. –

Кемерово, Барнаул: Изд-во Алт. ун-та, 2007. – С. 424-440.

121. Кушерян 1988 – Кушерян, С. А. Об одном эксперименте по

идентификации авторов текстов / С. А. Кушерян, Д. О. Аветисян //

Page 211: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

211

Математические модели в лингвистике / Отв. ред. Григорян В. М. [и др.]. –

Ереван: Изд-во АН Арм.ССР, 1988. − С.162-166.

122. Лебедева 2001 – Лебедева Н. Б. Естественная письменная русская речь

как объект лингвистического исследования / Н. Б. Лебедева // Вестник БГПУ:

Гуманитарные науки. – Изд-во БГПУ, 2001. – № 1. – С. 4-10.

123. Лебедева 2006 – Лебедева, Н. Б. Типология и портретирование

персонажей художественных произведений / Н. Б. Лебедева //

Лингвоперсонология: типы языковых личностей и личностно-ориентированное

обучение: монография / Под редакцией Н. Д. Голева, Н. Б. Лебедевой,

Н. В. Сайковой, Э. П. Хомич. – Барнаул, Кемерово: Изд-во БГПУ, 2006. – С. 197-

214.

124. Лебедева 2006а – Лебедева, Н. Б. Языковая личность в жанровом

измерении: проблемы типологии / Н. Б. Лебедева // Лингвоперсонология: типы

языковых личностей и личностно-ориентированное обучение: монография / Под

редакцией Н. Д. Голева, Н. Б. Лебедевой, Н. В. Сайковой, Э. П. Хомич. – Барнаул,

Кемерово: Изд-во БГПУ, 2006. – С. 137-141.

125. Лебедева 2009 – Лебедева, Н. Б. Особенности метаязыкового сознания

профессиональных юристов (опыт группового портрета) / Н. Б. Лебедева //

Обыденное метаязыковое сознание онтологические и гносеологические аспекты.

Ч.1: Коллективная монография / Отв. ред. Н. Д. Голев. – Кемерово, Барнаул: Изд-

во Алт. Ун-та, 2009. – С. 313-320.

126. Левицкий 2007 − Левицкий, В. В. Квантитативные методы в

лингвистике / В. В. Левицкий. − Винница: Нова книга, 2007. – 264 с.

127. Леонтьев 1977 – Леонтьев, А. А. Речь в криминалистике и судебной

психологии / А. А. Леонтьев, А. М. Шахнарович, В. И. Батов. − М.: Главная

редакция восточной литературы издательства «Наука», 1977. − 62с.

128. Леорда 2006 − Леорда, С. В. Речевой портрет современного студента:

автореф. дис. … канд. филол. наук / С. В. Леорда. − Саратов, 2006. − 20 с.

Page 212: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

212

129. Лесохин 1982 − Лесохин, М. М. Введение в математическую

лингвистику: Лингвистическое применение основ математики / М. М. Лесохин,

К. Ф. Лукьяненков, Р. Г. Пиотровский. − М.: Наука и техника, 1982. − 263с.

130. Лингвоперсонология… 2009 – Лингвоперсонология и личностно-

ориентированное обучение языку: учеб. пособие / Н. Д. Голев [и др.]; Под ред.

Н. В. Мельник. − Кемерово: ГОУ ВПО «КемГУ», 2009. − С. 384.

131. Лингвоперсонология… 2006 – Лингвоперсонология: типы языковых

личностей и личностно-ориентированное обучение: монография / Под редакцией

Н.Д. Голева, Н. Б. Лебедевой, Н. В. Сайковой, Э. П. Хомич. – Барнаул, Кемерово:

Изд-во БГПУ, 2006. – 435 с.

132. Лосев 1983 − Лосев, А. Ф. Языковая структура: учеб. пособие / А. Ф.

Лосев. − М.: МГПИ им. В.И. Ленина, 1983. – 373 с.

133. Ляшевская 2007 — Ляшевская, О. Н. Автоматизация построения

словаря на материале массива несловарных словоформ / О. Н. Ляшевская,

Д. В. Сичинава, Б. П. Кобрицов // Интернет-математика 2007: сб. работ

участников конкурса науч. проектов по информ. поиску / под ред.

П. И. Браславского. — Екатеринбург: Изд-во Урал. ун-та, 2007. — С. 118–125.

134. Макавчик 2006 − Макавчик, В. О. Грамматическая категория вида как

лингвоперсонологическая категория / В. О. Макавчик // Лингвоперсонология:

типы языковых личностей и личностно-ориентированное обучение: монография /

Под редакцией Н.Д. Голева, Н. Б. Лебедевой, Н. В. Сайковой, Э. П. Хомич. –

Барнаул, Кемерово: Изд-во БГПУ, 2006. – С. 215-226.

135. Марков 1916 − Марков, А. В. Обзор трудов В.Ф.Миллера по народной

словесности / А. В. Марков. − Пг., 1916.

136. Маркова 1956 − Маркова, Г. Д. Идентификационные признаки письма

в советской криминалистической экспертизе: автореферат … канд. дисс. Харьков,

1956. − С. 7.

137. Марусенко 1996 − Марусенко, М. А. Атрибуция анонимных и

псевдонимных текстов методами прикладной лингвистики / М. А. Марусенко //

Прикладное языкознание. − СПб., 1996. − С. 469–473.

Page 213: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

213

138. Махракова 2014 – Махракова, М. И. Портретирование языковой

личности экономиста (на материале интернет-форумов) / М. И. Махракова //

Филологические науки. Вопросы теории и практики. − Тамбов: Грамота, 2014. −

№1 (31). Ч. 1. – С. 89-93.

139. Мельник 2011 − Мельник, Н. В. Языковая личность и текст как

предмет лингвоперсонологии русского языка / Н. В. Мельник // Сибирский

филологический журнал. − Новосибирск: НГУ, 2011. − № 1. − С. 200-207.

140. Мельник 2014 − Мельник, Н. В. Текстовое моделирование языковой

личности / Н. В. Мельник // Языковая личность: моделирование, типология,

портретирование (сибирская лингвоперсонология): коллективная монография /

Под ред. Н. Д. Голева и Н. Н. Шпильной. ‒ М.: ЛЕНАНД, 2014. ‒ С. 33‒80.

141. Месропян 2012 ‒ Месропян, Л. М. О доминантных признаках в

автороведческой экспертизе: речевая агрессия как стилевая характеристика

говорящего / Л. М. Месропян, Т. Л. Павленко // Язык и право: актуальные

проблемы взаимодействия. Материалы II-ой Международной научно-

практической Интернет-конференции / Отв. ред. В.Ю. Меликян. ‒ Ростов н/Д:

Дониздат, 2012. ‒ Вып. 2. ‒ С. 112 ‒ 130.

142. Михайлов 2004 ‒ Михайлов, В. А. Особенности развития

информационно-коммуникативной среды современного общества /

В. А. Михайлов, С. В. Михайлов // Сборник научных трудов "Актуальные

проблемы теории коммуникации". СПб.: Изд-во СПбГПУ, 2004. − С. 34-52.

143. Морозов 1915 − Морозов, Н. А. Лингвистические спектры /

Н. А. Морозов // Изв. императорской АН, отд. яз. и словесности ХХ. – 1915. – КН.

4. − С. 93-134.

144. Морозов 2004 − Морозов, А. В. Автороведческая экспертиза текста

договора / А. В. Морозов // Юрислингвистика-5. Юридические аспекты языка и

лингвистические аспекты права. − Барнаул: Изд-во Алт. ун-та, 2004. − С. 290‒297.

145. Москович 1969 − Москович, В. А. Статистика и семантика: опыт

статистического анализа семантического поля / В. А. Москович. − М.: Наука,

1969. − 304 с.

Page 214: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

214

146. Напреенко 2011 − Напреенко, Г. В. Интернет-дневники и проблема

идентификации личности / Г. В. Напреенко // Юрислингвистика – 11: Право как

дискурс, текст и слово: межвузовский сборник научных трудов / Под ред.

Н. Д. Голева, К. И. Бринева. − Кемерово: Издательство Кемеровского

государственного университета, 2011. − С. 480-492.

147. Напреенко 2014 − Напреенко, Г. В. Идентификация текста по его

авторской принадлежности на лексическом уровне (формально-количественная

модель) / Г. В. Напреенко // Вестник Томского государственного университета. −

Томск, 2014. − № 379. − C. 17-23.

148. Напреенко 2014а − Напреенко, Г. В. Интернет-дневники и проблема

идентификации личности / Г. В. Напреенко // Языковая личность: моделирование,

типология, портретирование (сибирская лингвоперсонология): коллективная

монография / Под ред. Н. Д. Голева и Н. Н. Шпильной. – М.: ЛЕНАНД, 2014. − С.

544-558.

149. Напреенко 2015 − Напреенко, Г. В. Идентификационная лингвистика

как аспект лингвоперсонологии / Г. В. Напреенко // Вестник Кемеровского

государственного университета. − Кемерово, 2015. − № 2(62). − Т. 4. − С. 157-162.

150. Напреенко 2015а − Напреенко, Г. В. Формально-количественное

моделирование языковой личности: идентификационный аспект / Н. Д. Голев,

Г. В. Напреенко // Языковая личность: моделирование, типология,

портретирование. Сибирская лингвоперсонология. Ч. 2: коллективная монография

/ под ред. Н. Д. Голева, Н. В. Мельник и С. В. Оленева. — М.: ЛЕНАНД, 2015. —

С. 76-92.

151. Напреенко 2015б − Напреенко, Г. В. О двух подходах к

идентификационному моделированию текста / Г.В. Напреенко // Филология и

человек : науч. журн. − Барнаул: АлтГУ, 2015. − № 2. − С. 142-151.

152. Наумов 2006 − Наумов, В. В. Лингвистическая идентификация

личности / В. В. Наумов. − М.: КомКнига, 2006. − 240с.

153. Нерознак 1996 − Нерознак, В. П. Лингвистическая персонология: к

определению статуса дисциплины / В. П. Нерознак // Язык. Поэтика. Перевод:

Page 215: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

215

Сборник научных трудов. − М.: Изд-во Московского гос. лингвистического ун-та,

1996. − С. 112-116.

154. Николаева 2007 − Николаева, Ю. А. К спорам о месте судебной

автороведческой экспертизы в классификации криминалистических экспертиз:

Русский язык и современное российское право / Ю. А. Николаева //

Юрислингвистика - 8: Русский язык и современное российское право.

Межвузовский сборник научных статей. −Кемерово, Барнаул: Изд-во Алт. ун-та,

2007. − С. 378-382.

155. Новиков 1983 − Новиков, А. И. Семантика текста и ее формализация /

А. И. Новиков. − М.: Наука, 1983. − 216 с.

156. Обыденное метаязыковое сознание онтологические и

гносеологические аспекты. Ч.1: Коллективная монография / отв. ред. Н. Д. Голев.

– Кемерово, Барнаул: Изд-во Алт. Ун-та, 2009. – 400 с.

157. Оглезнева 2004 ‒ Оглезнева, Е. А. Социально-речевой портрет

современного диалектоносителея (на материале речи М.В. Хлыстова, жителя с.

Черновка Свободненского района Амурской области) / Е. А. Оглезнева //

Народное слово Приамурья. ‒ Благовещенск, 2004. ‒ С. 85-95.

158. Ощепкова 2003 − Ощепкова, Е. С. Идентификация пола автора по

письменному тексту (лексико-грамматический аспект): дис. … канд. филол. наук /

Е. С. Ощепкова. − М., 2003. − 192 с.

159. Павлов 2011 − Павлов, Ю. Н. Оценка устойчивости во времени

частотных словарей авторов в задачах идентификации текстов / Ю. Н. Павлов,

Е. А. Тихомирова // Наука и образование: электронное научно-техническое

издание. − 2011. − № 12 − С. 40-40.

160. Панова 2005 − Панова, М. Н. Языковая личность государственного

служащего: Опыт лингвометодического исследования / М. Н. Панова // Русская

речь. − 2005. − № 2. − С. 124-125.

161. Потапов 1940 − Потапов, С. М. Принципы криминалистической

идентификации / С. М. Потапов // Советское государство и право. − 1940. − № 1.

Page 216: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

216

162. Потапова 2006 − Потапова, Р. К. Язык, речь, личность /

Р. К. Потапова, В. В. Потапов. − М.: Языки славянской культуры, 2006. − С. 384-

409.

163. Резанова 2013 − Резанова, З. И. Задачи авторской атрибуции текста в

аспекте гендерной принадлежности (к проблеме междисциплинарного

взаимодействия лингвистики и информатики) / З. И. Резанова, А. С. Романов,

Р. В. Мещеряков // Вестник Томского гос. ун-та. Филология. − Томск, 2013. −

№ 370. − С. 24-28.

164. Резанова 2013а − Резанова, З. И. О выборе признаков текста,

релевантных в автороведческой экспертной деятельности / З. И. Резанова,

А. С. Романов, Р. В. Мещеряков // Вестник Томского гос. ун-та. Филология. −

Томск, 2013. − № 6 (26). − С. 38-52.

165. Родионова 2008 − Родионова, Е. С. Лингвистические методы

атрибуции и датировки литературных произведений (к проблеме «Корнель –

Мольер»): автореф. дис. … канд. филол. наук / Е. С. Родионова. − СПб., 2008. −

190 с.

166. Родионова 2008а − Родионова, Е. С. Методы атрибуции

художественных текстов / Е. С. Родионова // Структурная и прикладная

лингвистика. Вып. 7: Межвуз. сб. / Под ред. А. С. Герда. − СПб.: Изд-во С.-

Петерб. Ун-та, 2008. − С.118-127.

167. Романов 2006 − Романов, А. Идентификация авторства текста:

Материалы конф. / Научная сессия ТУСУР-2006 / А. Романов. − В-Спектр, 2006. −

С. 115-116.

168. Романов 2008 − Романов, А. Обзор программного обеспечения для

идентификации авторства текста: Материалы конф. / Научная сессия ТУСУР-2007

/ А. Романов. − В-Спектр, 2008. − С. 182-184.

169. Романов 2008а ‒ Романов, А. С. Структура программного комплекса

для исследования подходов к идентификации авторства текстов / А. С. Романов

//Доклады Томского государственного университета систем управления и

радиоэлектроники. ‒ Т. 2. ‒ 2008. ‒ № 1. ‒ С. 106-109.

Page 217: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

217

170. Романов 2009 ‒ Романов, А. С. Методика идентификации автора

текста на основе аппарата опорных векторов / А. С. Романов // Доклады Томского

государственного университета систем управления и радиоэлектроники. ‒ Т. 1. ‒

№ 2. ‒ 2009. ‒ С. 36-42.

171. Романов 2010 − Романов, А. С. Обобщенная методика идентификации

автора неизвестного текста / А. С. Романов, А. Шелупанов, С. Бондарчук //

Доклады Томского государственного университета систем управления и

радиоэлектроники: журнал. − 2010. − № 1 (21). − С. 108-112.

172. Савицкая 2009 ‒ Савицкая, Л. С. О приёме зачёркивания как средстве

метакатегориальной организации модусной перспективы высказывания (на

материале интернет-дневников) / Л. С. Савицкая // Вестник Нижегородского

университета им. Н.И. Лобачевского. ‒ 2009. ‒ № 6 (2). ‒ С. 346–349.

173. Сайкова (Мельник) 2006 ‒ Сайкова, Н. В. Повтор в переводном тексте

как лингвоперсонологическая категория / Н. В. Сайкова (Мельник) //

Лингвоперсонология: типы языковых личностей и личностно-ориентированное

обучение: монография / Под редакцией Н.Д. Голева, Н. Б. Лебедевой, Н. В.

Сайковой, Э. П. Хомич. – Барнаул, Кемерово: Изд-во БГПУ, 2006. – С. 264-273.

174. Седов 1999 – Седов, К. Ф. Портреты языковых личностей в аспекте их

становления (принципы классификации и условия формирования) / К. Ф. Седов //

Вопросы стилистики: межвуз. сб. науч. тр. Вып. 28. Антропоцентрические

исследования. ‒ Саратов, 1999.

175. Седов 2004 – Седов, К. Ф. Дискурс и личность: эволюция

коммуникативной компетенции / К. Ф. Седов. – М.: Лабиринт, 2004. ‒ 320 с.

176. Седов 2006 – Седов, К. Ф. Типология и портретирование наших

современников / К. Ф. Седов // Лингвоперсонология: типы языковых личностей и

личностно-ориентированное обучение: монография / Под ред. Н. Д. Голева,

Н. Б. Лебедевой, Н. В. Сайковой, Э. П. Хомич. – Барнаул, Кемерово: Изд-во

БГПУ, 2006. – С. 143-196.

177. Седов 2007 – Седов, К. Ф. К основаниям лингвистики

индивидуальных различий (о принципах речевого портретирования) / К. Ф. Седов

Page 218: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

218

// Проблемы речевой коммуникации: Межвуз. Сб. науч. тр. / под ред. М. А.

Кормилицыной, О. Б. Сиротининой. ‒ Саратов: Изд-во Сарат. ун-та, 2007. ‒ Вып.

7. ‒ С. 6-29.

178. Седов 2008 ‒ Седов, К. Ф. Онтопсихолингвистика: становление

коммуникативной компетенции человека / К. Ф. Седов. ‒ М.: Лабиринт, 2008. ‒

318 с.

179. Сеземан 1918 ‒ Сеземан, В. Э. «Лингвистические спектры» г.

Морозова и Платоновский вопрос // Изв. Отд. Русского языка и словесности Имп.

Акад. Наук. ‒ Т. XXII. ‒ Кн. 2. ‒ 1918.

180. Силантьева 2012 ‒ Силантьева, М. С. Элитарная языковая личность в

профессиональном дискурсе: автореф. дис…. канд. филол. Наук /

М. С. Силантьева. ‒ Пермь, 2012. ‒ 21 с.

181. Соболева 2006 ‒ Соболева, Е. Г. Лингвистическая экспертиза:

методики, ограничения в применении / Е. Г. Соболева // Экспертиза в

современном мире: от знания к деятельности / под ред. Г. В. Иванченко,

Д. А. Леонтьева. ‒ М.: Смысл, 2006. ‒ С.203-214.

182. Соколовский 1969 ‒ Соколовский, З. М. Понятие специальных знаний.

(К вопросу об основаниях назначения экспертизы) / З. М. Соколовский //

Криминалистика и судебная экспертиза. Республиканский межведомственный

сборник научных и научно-методических работ. ‒ Киев: РИО МВД УССР, 1969. ‒

Вып.6. ‒ С. 199-205.

183. Соколовский 1978 ‒ Соколовский, З. М. Совершенствование

структуры экспертных заключений / З. М. Соколовский // Некоторые

теоретические проблемы судебной экспертизы. Сборник научных трудов. ‒ М.:

Изд-во ВНИИСЭ, 1978. ‒ № 32. ‒ С.3-47.

184. Соснина 2012 ‒ Соснина, Е. П. Введение в прикладную лингвистику:

учебное пособие. 2-е изд., испр. и доп / Е. П. Соснина. – льяновск: УлГТУ, 2012.

‒ 110 с.

185. Становление... 2006 ‒ Становление гуманитарной культуры личности

в системе образования. ‒ Барнаул, 2006.

Page 219: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

219

186. Судебная экспертиза 2007 ‒ Судебная экспертиза в арбитражном

процессе / под ред. Д. В. Гончарова, И. В. Решетниковой. ‒ М.: Волтерс Клувер,

2007. ‒ 256с.

187. Супрун 2003 ‒ Супрун, В. И. Пределы и преграды лингвистической

экспертизы / В. И. Супрун // Теория и практика лингвистического анализа текстов

СМИ в судебных экспертизах и информационных спорах: Сборник материалов

научно-практического семинара / под ред. М. В. Горбаневского. ‒ М.: Галерия,

2003. – С. 209-212.

188. Суркова 2004 ‒ Суркова, А. С. Проблема идентификации автора

текста в юрислингвистике / А. С. Суркова // Материалы 3-ей молодежной научно-

практической конференции «Будущее технической науки». ‒ Н. Новгород, 2004. ‒

С.51-52.

189. Суркова 2004а ‒ Суркова, А. С. Разработка структурно-

статистических методов и алгоритмов идентификации текста: автореф. дис. …

канд. техн. наук / А. С. Суркова. ‒ Н. Новгород, 2004. ‒ 19 c.

190. Сухотин 1963 ‒ Сухотин, Б. В. Алгоритм лингвистической

дешифровки / Б. В. Сухотин // Проблемы структурной лингвистики.-М.: Изд-во

АН СССР, 1963. ‒Т.6. ‒ С.75-101.

191. Сухотин 1962 ‒ Сухотин, Б. В. Экспериментальное выделение классов

букв с помощью электронной вычислительной машины / Б. В. Сухотин //

Проблемы структурной лингвистики. ‒ М.: Изд-во АН СССР, 1962. – Т 4. – 198-

206.

192. Сыпченко 1999 ‒ Сыпченко, С. В. Из опыта судебной

лингвистической экспертизы публицистических произведений (о проблемах

лингвистической экспертизы как прикладного направления юрислингвистики) /

С. В. Сыпченко // Юрислингвистика-1: проблемы и перспективы. ‒ Барнаул: АГУ,

1999. ‒ С. 144-152.

193. Тамбовцев 2008 ‒ Тамбовцев, Ю. А. Типология распределения

некоторых лингвистических единиц в тексте как показатель авторства текста /

Page 220: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

220

Ю. А. Тамбовцев, А. Ю. Тамбовцева, Л. А. Тамбовцева // Вестник Омского

университета. ‒ Омск, 2008. ‒ № 2. ‒ С. 88-96.

194. Тамбовцев 2011 ‒ Тамбовцев, Ю. А. Кто написал тексты Бахтина,

Волошинова и Медведева? / Ю. А. Тамбовцев // Вестник Омского университета. ‒

Омск, 2011. ‒ № 4. ‒ С. 238-243.

195. Теоретические и методические вопросы… 1977 ‒ Теоретические и

методические вопросы криминалистического исследования письменной речи:

Метод. пособие / отв. ред. Л. Е. Ароцкер. ‒ М., 1977. ‒ С. 12.

196. Теория и практика… 2003 ‒ Теория и практика лингвистического

анализа текстов СМИ в судебных экспертизах и информационных спорах. Часть 2

/ под ред. М. В. Горбаневского. ‒ М.: Галерия, 2003. ‒ 328 с.

197. Тимофеева 2007 ‒ Тимофеева, М. К. Язык с позиции философии,

психологии, математики: учеб. Пособие / М. К. Тимофеева. ‒ Новосибирск: НГУ,

2007. ‒ С. 82-139.

198. Трубецкой 1995 – Трубецкой, Н. С. История. Культура. Язык /

Н. С. Трубецкой. – М.: Прогресс, 1995. – 798 с.

199. Фаворин 1953 ‒ Фаворин, В. К. Синонимы в русском языке /

В. К. Фаворин. ‒ Свердловск: Свердловское книжное изд-во, 1953. ‒ С. 20.

200. Фокина 2009 ‒ Фокина, К. В. Самоидентификация как основа

моделирования аксиологической картины мира / К. В. Фокина // Известия

Российского государственного педагогического университета им. А. И. Герцена. ‒

Санкт-Петербург, 2009. ‒ № 117. ‒ С. 224-228.

201. Фукс 1975 ‒ Фукс, В. По всем правилам искусства: Точные методы в

исследовании литературы, музыки и изобразительного искусства / В. Фукс //

Искусство и ЭВМ / под ред. Р. Х. Зарипова. – М.: Мир, 1975. – С. 134–356.

202. Хмелев 2000 ‒ Хмелев, Д. Распознавание автора текста с использованием

цепей А. А. Маркова / Д. Хмелев // Вестник МГУ, сер.9: филология. – М.: МГУ,

2000 – № 2. – С. 115-126.

203. Хоменко 2014 − Хоменко, А. Ю. Алгоритм автоматизации

идентификации автора письменного речевого произведения для судебного

Page 221: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

221

автороведения / А. Ю. Хоменко // Юрислингвистика – 14. − Кемерово: КемГУ,

2014. (сдано в печать).

204. Чернышова 2011 ‒ Чернышова, Т. В. Описание дискурсивных

признаков спорных текстов как основа установления их авторства /

Т. В. Чернышова // Юрислингвистика – 11: Право как дискурс, текст и слово:

межвузовский сборник научных трудов / под ред. Н. Д. Голева, К. И. Бринева. −

Кемерово: Издательство Кемеровского государственного университета, 2011. −

С. 410-418.

205. Чернышова 2014 ‒ Чернышова, Т. В. Описание дискурсивных

признаков спорных текстов как основа установления их авторства /

Т. В. Чернышова // Языковая личность 2014 — Языковая личность:

моделирование, типология, портретирование. Сибирская лингвоперсонология.

Ч. 1: коллективная монография / под ред. Н. Д. Голева, Н. Н. Шпильной. — М.:

ЛЕНАНД, 2014. — С. 524-533.

206. Шайкевич 1968 ‒ Шайкевич, А. Я. Опыт статистического выделения

функциональных стилей / А. Я. Шайкевич // Вопросы языкознания. ‒ 1968. ‒ № 1.

‒ С. 64-76.

207. Шайкевич 1976 ‒ Шайкевич, А. Я. Дистрибутивно-статистический

анализ в семантике / А. Я. Шайкевич // Принципы и методы семантических

исследований. ‒ М., 1976. ‒ С.353-377.

208. Шестак 2003 ‒ Шестак, Л. А. Русская языковая личность: коды

образной вербализации: монография. ‒ Волгоград: Перемена, 2003. ‒ 312 с.

209. Штокмар 1960 ‒ Штокмар, М. П. Анализ языка и стиля как средство

атрибуции / М. П. Штокмар // Вопросы текстологии. ‒ М., 1960. ‒ Вып. 2. ‒

С. 100–145.

210. Щербаков 1998 ‒ Щербаков, М. А. 7 путешествий в структуру

сознания: Теория и практика развития личности: Психология. Психотерапия.

Религия. Духовность. Ресурсы сознания. Технологии просветления

/М. А. Щербаков. ‒ М.: Институт развития личности, 1998. ‒ 288 с.

Page 222: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

222

211. Языковая личность 2014 — Языковая личность: моделирование,

типология, портретирование. Сибирская лингвоперсонология. Ч. 1: коллективная

монография / под ред. Н. Д. Голева, Н. Н. Шпильной. — М.: ЛЕНАНД, 2014. —

645 с.

212. Языковая личность 2015 — Языковая личность: моделирование,

типология, портретирование. Сибирская лингвоперсонология. Ч. 2: коллективная

монография / под ред. Н. Д. Голева, Н. В. Мельник и С. В. Оленева. — М.:

ЛЕНАНД, 2015. — 424 с.

213. Якобсон 1985 ‒ Якобсон, Р. О. О лингвистических аспектах перевода /

Р. О. Якобсон // Избранные работы. ‒ М.: Прогресс, 1985. ‒ 455с.

Список Интернет-источников

1. Абушенко – Абушенко, В. Л.. Идентичность [Электронный ресурс] /

В. Л. Абушенко // История философии: Энциклопедия. – Режим доступа:

http://velikanov.ru/philosophy/identichnost'.asp

2. Александров ‒ Александров, В. В. Феномен идентификации [Электронный

ресурс] / В. В. Александров, С. В. Кулешов, Б. Шаннаг. ‒ Режим доступа:

http://www.mathnet.ru/links/437aff514c9ee706123058279e2b18cf/trspy46.pdf

3. Алтухова ‒ Алтухова Т. В. К построению модели описания естественных

письменных текстов в Рунете [Электронный ресурс] / Т. В. Алтухова. ‒ Режим

доступа: http://www.philol.msu.ru/~slavmir2012/pdfs/slavmir2012abst_09.pdf

4. Арапов ‒ Арапов, М. В. О смысле ранговых распределений [Электронный

ресурс] / М. В. Арапов, Е. Н. Ефимова, Ю. А. Шрейдер. – Режим доступа:

http://kudrinbi.ru/public/442/

Page 223: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

223

5. Атрибутор – Атрибутор [Электронный ресурс] – Режим доступа:

http://www.textology.ru/Default.aspx

6. Беседин ‒ Беседин, А. Н. Психология общения и конфликта [Электронный

ресурс] / А. Н. Беседин. – Режим доступа: http://buklib.net/books/36824/

7. Батура – Батура, Т. В. Формальные методы установления авторства текстов

и их реализация в программных продуктах [Электронный ресурс] / Т. В. Батура. –

Режим доступа: http://www.swsys.ru/index.php?page=article&id=3703

8. Богословская – Богословская, И. В. Текст как объект формализации / И. В.

Богословская. – Вестник ВЭГУ. – Уфа, 2010. – № 3 (47) – С. 57–62.

9. Большакова – Большакова, Е. И. Формализация лексико-синтаксической

информации для распознавания регулярных конструкций естественного языка

[Электронный ресурс] / Е. И. Большакова, Н. Э. Васильева. – Режим доступа:

http://www.lspl.ru/articles/Paper_5_LSPL.pdf

10. Вязигина − Вязигина, Н. В. Диагностика пола автора как задача

автороведческой экспертизы [Электронный ресурс] / Н. В. Вязигина. − Режим

доступа: http://siberia-

expert.com/publ/konferencii/konferencija_2012/diagnostika_pola_avtora_kak_zadacha_

avtorovedcheskoj_ehkspertizy_vjazigina_n_v/10-1-0-282

11. Галяшина ‒ Галяшина, Е. И. Лингвистическая безопасность речевой

коммуникации [Электронный ресурс] / Е. И. Галяшина. ‒ Режим доступа:

http://www.rusexpert.ru/index.php?id=147&idp=content

12. Гейтинг − Гейтинг, Α. Интуиционизм [Электронный ресурс] / А. Гейтинг. −

М., 1965. – Режим доступа: informatika.sch880.ru/p26aa1.html

13. Горошко − Горошко, Е. И. Судебно-автороведческая классификационная

экспертиза: проблема установления пола автора документа [Электронный ресурс]

/ Е. И. Горошко. − Режим доступа: http://www.textology.ru/public/gorsh4

14. Зализняк − Зализняк, А. Дневник: к определению жанра [Электронный

ресурс] / А. Зализняк. – Режим доступа:

http://magazines.russ.ru/nlo/2010/106/za14.html

Page 224: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

224

15. Идентичность ‒ Идентичность [Электронный ресурс] // Философия:

Энциклопедический словарь / под ред. А. А.Ивина. ‒ Режим доступа:

http://ariom.ru/wiki/Identichnost'

16. Идентичность 2003 − Идентичность [Электронный ресурс] // Новейший

философский словарь: 3-е изд., исправл. − Мн.: Книжный Дом, 2003. – Режим

доступа: http://www.gumer.info/bogoslov_Buks/Philos/fil_dict/276.php

17. Идентификация − Новейший философский словарь [Электронный ресурс] –

Режим доступа:

http://dic.academic.ru/dic.nsf/dic_new_philosophy/492/%D0%98%D0%94%D0%95%

D0%9D%D0%A2%D0%98%D0%A4%D0%98%D0%9A%D0%90%D0%A6%D0%98

%D0%AF

18. Интернет-дневники − Интернет-дневники [Электронный ресурс] – Режим

доступа:www.diary.ru

19. История философии: Энциклопедия [Электронный ресурс]. – Режим

доступа: http://velikanov.ru/philosophy

20. Канке − Канке, В. Философия [Электронный ресурс] / В. Канке. – Режим

доступа: http://eurasialand.ru/txt/kanke/menu.htm

21. Каталог… − Каталог лингвистических программ и ресурсов в Сети

[Электронный ресурс] – Режим доступа:

http://www.rvb.ru/soft/catalogue/catalogue.html

22. Кожина − Кожина, Н. Г. Аксиологический подход к исследованию

идентификации современной личности [Электронный ресурс] / Н. Г. Кожина. –

Режим доступа: http://cyberleninka.ru/article/n/aksiologicheskaya-identifikatsiya-

lichnosti.

23. Кравцова – Кравцова, А. С. Развитие системы автоматического анализа

текстов «СтилеАнализатор» [Электронный ресурс] / А. С. Кравцова,

О. В. Кукушкина, В. В. Поддубный, А. А. Поликарпов, О. Г. Шевелев,

А. А. Фатыхов. – Режим доступа: http://scipeople.ru/publication/69643/

Page 225: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

225

24. Лебедева − Лебедева Н. Б. Жанровая модель естественной письменной речи

(коммуникативно-семиотический аспект) [Электронный ресурс] / Н. Б. Лебедева.

– Режим доступа: http://www.studfiles.ru/preview/3302207/

25. Лейчик − Лейчик, В. М. Идентификация личности по речевому стилю

[Электронный ресурс] / В. М. Лейчик. – Режим доступа: www.psycho.ru.

26. Лемматизация − Лемматизация [Электронный ресурс]. – Режим доступа:

https://seopult.ru/library/%D0%9B%D0%B5%D0%BC%D0%BC%D0%B0%D1%82%

D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F

27. Лингвоанализатор – Лингвоанализатор [Электронный ресурс] – Режим

доступа: http://rusf.ru/books/analysis/

28. Ляшевская – Ляшевская, О. Н.Частотный словарь национального корпуса

русского языка: концепция и технология создания [Электронный ресурс] / О. Н.

Ляшевская, С. А. Шаров. – Режим доступа: http://www.dialog-

21.ru/digests/dialog2008/materials/html/53.htm

29. Макаров – Макаров, М. Л. Лингвистические и семиотические аспекты

конструирования идентичности в электронной коммуникации [Электронный

ресурс] / М. Л. Макаров, М. С. Школовая. – Режим доступа: http://www.dialog-

21.ru/digests/dialog2006/materials/html/makarov.htm

30. Малышева − Малышева, Н. В. Квантитативная лингвистика в современной

научной парадигме [Электронный ресурс] / Н.В. Малышева. – Режим доступа:

http://e-koncept.ru/2014/54373.html

31. Мамаев – Мамаев, Н. Ю. Методические презумпции лингвистической

экспертизы [Электронный ресурс] / Н. Ю. Мамаев. – Режим доступа: http://siberia-

expert.com/publ/satti/stati/metodicheskie_prezumpcii_lingvisticheskoj_ehkspertizy_n_j

u_mamaev/4-1-0-170

32. Матвеева – Матвеева, Г. Г. Скрытые грамматические значения и

идентификация социального лица («портрета») говорящего [Электронный ресурс]

/ Г. Г. Матвеева. – Режим доступа: http://pi.sfedu.ru/projects/deutch/dis_3_11.html

33. Мощенкова – Мощенкова, Д. С. Обзор программных продуктов,

разработанных для атрибуции художественных текстов [Электронный ресурс] /

Page 226: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

226

Д. С. Мощенкова, Д. А. Кривицкая, Н. С. Амосова – Режим доступа:

https://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CB0QF

jAA&url=http%3A%2F%2Fconf.sfu-

kras.ru%2Fsites%2Fmn2014%2Fpdf%2Fd01%2Fs43%2Fs43_010.pdf&ei=fIpZVcbqG

8LQswHapYCAAw&usg=AFQjCNFdmTGolnR_Ryulx1Q1jlsaYhIsbw&bvm=bv.9356

4037,d.bGg&cad=rjt

34. Перфильева – Перфильева, Н. П. Метатекст: текстоцентрический и

лексикографический аспекты: автореф. дис…д-ра филол. Наук [Электронный

ресурс] / Н. П. Перфильева. – Режим доступа: nspu.net/files/filperfi/.doc

35. Полещук – Полещук, О. В. Использование специальных знаний при

расследовании преступлений, связанных с незаконным оборотом алкогольной

продукции [Электронный ресурс] / О. В. Полещук. – Режим доступа:

http://www.sworld.com.ua/konfer28/169.pdf

36. Рогов ‒ Рогов, А. А. «СМАЛТ» - от построения корпуса текстов к способам

их обработки статистическими и эвристическими методами [Электронный ресурс]

/ А. А. Рогов, Ю. В. Сидоров, А. В. Король. – Режим доступа:

http://smalt.karelia.ru/books.html

37. Романов ‒ Романов, А. С. Идентификация автора текста с помощью

аппарата опорных векторов в случае двух возможных альтернатив [Электронный

ресурс] / А. С. Романов. ‒ Режим доступа: http://www.dialog-

21.ru/digests/dialog2009/materials/html/67.htm

38. Романов ‒ Романов, А. С. Состояние проблемы распознавания и

идентификации автора текста [Электронный ресурс] / А. С. Романов. ‒ Режим

доступа: URL:http://inf-bez.ru/?p=813

39. Романов ‒ Романов, А.С. Методика и программный комплекс для

идентификации автора неизвестного текста [Электронный ресурс] /

А. С. Романов. ‒ Режим доступа:

http://www.tusur.ru/export/sites/ru.tusur.new/ru/science/education/diss/2010/08/02.pdf

40. Романова ‒ Романова, Т. В. Языковая личность Д. С. Лихачева как

элитарная языковая личность русского интеллигента [Электронный ресурс] /

Page 227: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

227

Т. В. Романова. – Режим доступа:

http://www.hse.ru/pubs/lib/data/access/ram/ticket/71/1433766028a2f6f622f4669cde8a1

925010cfb6cf6/%D0%AF%D0%9B%20%D0%9B%D0%B8%D1%85%D0%B0%D1%

87%D0%B5%D0%B2%D0%B0.pdf

41. СМАЛТ – СМАЛТ [Электронный ресурс] – Режим доступа:

http://smalt.karelia.ru/

42. Смирнов – Смирнов, А. А. Заметки о лингвистической экспертизе

(менталитет юристов и лингвистическая ментальность) [Электронный ресурс] /

А. А. Смирнов. – Режим доступа: www.textology.ru/article.aspx?ald=154(21.12.09).

43. Солодянкина – Солодянкина, Н. В. Речевой портрет студента-филолога

[Электронный ресурс] / Н. В. Солодянкина, А. В. Хвостова. – Режим доступа:

http://www2.bigpi.biysk.ru/ff/doc/ff_RYAL.pdf.

44. Статья 25 Федерального закона ‒ Статья 25 Федерального закона от

31.05.2001 г. «О государственной судебно-экспертной деятельности в Российской

Федерации» // Консунтальнт [Электронный ресурс] ‒ Режим доступа:

http://www.consultant.ru/document/cons_doc_LAW_31871/

45. СтилеАнализатор-2 ‒ СтилеАнализатор-2[Электронный ресурс] ‒ Режим

доступа:

http://www.philol.msu.ru/~lex/pdfs/polikarpov_poddubny_kukushkina_etc_stileanalizat

or_rffi2011-2013.pdf

46. Судебная лингвистика ‒ Судебная лингвистика [Электронный ресурс] ‒

Режим доступа: http://www.forensicsciences.ru

47. Формализация ‒ Формализация [Электронный ресурс] // Философская

энциклопедия. В 5-х т. / под ред. Ф. В. Константинова. ‒ Режим доступа:

http://dic.academic.ru/dic.nsf/enc_philosophy/1309/%D0%A4%D0%9E%D0%A0%D0

%9C%D0%90%D0%9B%D0%98%D0%97%D0%90%D0%A6%D0%98%D0%AF

48. Черкасова ‒ Черкасова, М. Н. О некоторых спорных вопросах при

установлении авторства текста (из опыта лингвистических экспертиз)

[Электронный ресурс] / М. Н. Черкасова. – Режим доступа: http://siberia-

expert.com/publ/konferencii/konferencija_2012/o_nekotorykh_spornykh_voprosakh_pr

Page 228: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

228

i_ustanovlenii_avtorstva_teksta_iz_opyta_lingvisticheskikh_ehkspertiz_m_n_cherkasov

a/10-1-0-254

49. Шаров – Шаров, С. А. Введение к частотному словарю современного

русского языка [Электронный ресурс] / О. Н. Ляшевская, С. А. Шаров. – Режим

доступа: http://dict.ruslang.ru/freq.pdf

50. Шаров – Шаров, С. А. Частотный словарь русского языка. Вторая версия

частотного списка [Электронный ресурс] / С. А. Шаров. – Режим доступа:

http://www.artint.ru/projects/frqlist.php

51. Ширшова ‒ Ширшова, К. П. Модуль анализа профессии для системы

автоматического определения личностных характеристик автора текста

[Электронный ресурс] / К. П. Ширшова, М. Г. Мальковский. – Режим доступа:

http://www.sworld.com.ua/index.php/ru/technical-sciences/informatics-computer-

science-and-automation/3253-shirshov-kp-malkovsky-mg

52. Штампомер – Штампомер [Электронный ресурс] – Режим доступа:

http://www.shtampomer.narod.ru/index.html

53. Яновская – Яновская, С. А. Методологии, проблемы науки [Электронный

ресурс] / С. А. Яновская. – Режим доступа:

http://dic.academic.ru/dic.nsf/enc_philosophy/1309/%D0%A4%D0%9E%D0%A0%D0

%9C%D0%90%D0%9B%D0%98%D0%97%D0%90%D0%A6%D0%98%D0%AF

54. JStylo – JStylo [Электронный ресурс] – Режим доступа:

http://lenta.ru/news/2013/01/10/deanon/

55. JStylo – JStylo [Электронный ресурс] – Режим доступа:

http://news.open.by/it/97173

56. SimWordSorter – SimWordSorter [Электронный ресурс] – Режим доступа:

http://simplesite.narod.ru/programs.html#

Список использованных словарей

1. Александрова 2005 – Александрова, З. Е. Словарь синонимов русского языка

/ З. Е. Александрова. – М.: Русский язык – Медиа, 2005. – 568 с.

Page 229: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

229

2. Ахманова 1969 – Словарь лингвистических терминов / О. С. Ахманова. – М.:

Советская энциклопедия, 1969. – С. 317.

3. Ахманова 2004 – Ахманова, О. С. Словарь лингвистических терминов /

О. С. Ахманова. – М: УРСС: Едиториал УРСС, 2004. – 571 с.

4. БЭС – Большой энциклопедический словарь [Электронный ресурс] / ред.

А. М. Прохоров. – Режим доступа:

http://dic.academic.ru/dic.nsf/enc3p/310294/%D0%A4%D0%9E%D0%A0%D0%9C%

D0%90%D0%9B%D0%98%D0%97%D0%90%D0%A6%D0%98%D0%AF

5. Ляшевская 2009 – Ляшевская, О. Н. Частотный словарь современного

русского языка (на материалах Национального корпуса русского языка) (М.:

Азбуковник, 2009) [Электронный ресурс] / О. Н. Ляшевская, С. А. Шаров. −

Режим доступа: http://dict.ruslang.ru/freq.php.

6. Нелюбин 2011 − Нелюбин, Л. Л. Толковый переводческий словарь. 5-е изд.,

стереотип / Л. Л. Нелюбин. − М.: Флинта: Наука, 2011. − С. 76.

7. Новейший философский словарь 1999 − Новейший философский словарь. −

Минск: Книжный Дом, 1999.

8. Ожегов 1996 − Ожегов, С. И. Словарь русского языка / С. И. Ожегов,

Н. Ю. Шведова − М.: Аз, 1996. − 928 с.

9. Полный словарь − Полный словарь диалектной языковой личности / Под ред.

Е. В. Иванцовой. − Томск: Изд-во Том. ун-та, 2006−2012. − Т. 1-4.

10. Словарь синонимов – Словарь синонимов. Справочное пособие

[Электронный ресурс] / Под ред. А. П. Евгеньевой. – Режим доступа:

http://cfrl.ruslang.ru/synonyms/00-c.htm

11. Философия: Энциклопедический словарь 2004 ‒ Философия:

Энциклопедический словарь / Под редакцией А. А. Ивина. ‒ М.: Гардарики, 2004.

12. Философский энциклопедический словарь. ‒ М.: Советская энциклопедия,

1983. ‒ 836 с.

Page 230: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

230

13. Частотный словарь 1977 ‒ Частотный словарь русского языка / под

ред. Л. Н. Засориной. ‒ М.: Русский язык, 1977. ‒ 936с.

14. Штейнфельдт 1963 ‒ Штейнфельдт, Э. А. Частотный словарь современного

русского литературного языка. 1-е изд / Э. А. Штейнфельдт. ‒ М.: Прогресс,

1963.

Page 231: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«КЕМЕРОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

На правах рукописи

Напреенко Галина Викторовна

ЛЕКСИКО-КВАНТИТАТИВНОЕ МОДЕЛИРОВАНИЕ ЯЗЫКОВОЙ

ЛИЧНОСТИ В ИДЕНТИФИКАЦИОННОМ АСПЕКТЕ (НА МАТЕРИАЛЕ

РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ДНЕВНИКОВ)

Специальность 10.02.01 – Русский язык

Том 2

Приложения

Научный руководитель –

д. ф. н., профессор Голев Н. Д.

Кемерово 2015

Page 232: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

2

ОГЛАВЛЕНИЕ

Приложение А. Таблица А.1 – Частотно-сопоставительная таблица по

словникам А – Б………………………………………………………………… 3

Приложение Б. Таблица Б.1 – Частотно-сопоставительная таблица по

словникам В – Г...................................................................................................... 7

Приложение В. Таблица В.1 – Частотно-сопоставительная таблица по

словникам А– В...................................................................................................... 11

Приложение Г. Таблица Г.1 – Частотно-сопоставительная таблица по

словникам Б – Г………………………………………………………………… 15

Приложение Д. Таблица Д.1 – Сопоставление слов частотного словаря

современного русского языка [Ляшевская] и словника А…………………. 19

Приложение Е. Таблица Е.1 – Сопоставление слов частотного словаря

современного русского языка [Ляшевская] и словника Б………………….. 23

Приложение Ж. Таблица Ж.1 – Идентификационное моделирование по

таблице А.1 (словники А – Б) первым способом: ΔRг= R1г –R2г………….. 27

Приложение И. Таблица И.1 – Идентификационное моделирование по

таблице Б.1 (словники В – Г) первым способом: ΔRг= R1г –R2г…………… 31

Приложение К. Таблица К.1 – Идентификационное моделирование по В.1

(словники А – В) первым способом: ΔRг= R1г –R2г………………………… 36

Приложение Л. Таблица Л.1 – Идентификационное моделирование по

таблице Г.1 (словники Б – Г) первым способом: ΔRг= R1г –R2г…………… 40

Приложение М. Таблица М.1 – Идентификационное моделирование по

таблице А.1 (словники А – Б) вторым способом: ΔR= R1 –R2…………….. 44

Приложение Н. Таблица Н.1 – Идентификационное моделирование по

таблице Б.1 (словники В – Г) вторым способом: ΔR= R1 –R2……………… 48

Приложение П. Таблица П.1 – Идентификационное моделирование по

таблице В.1 (словники А – В) вторым способом: ΔR= R1 –R2…………….. 53

Приложение Р. Таблица Р.1 – Идентификационное моделирование по

таблице Г.1 (словники Б – Г) вторым способом: ΔR= R1 –R2……………… 57

Приложение С. Таблица С.1 – Сопоставительная таблица самых

частотных слов всех исследуемых текстов…………………………………. 61

Приложение Т. Таблица Т.1 – Сопоставление словника Частотного

словаря современного русского языка [Ляшевская] и словника А (по

таблице Д.1)……………………………………………………………………… 65

Приложение У. Таблица У.1 – Сопоставление словника Частотного

словаря современного русского языка [Ляшевская 2009]и словника Б (по

таблице Е.1)…………………………………………………………………….. 69

Page 233: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

3

Приложение А

Таблица А.1 – Частотно-сопоставительная таблица по словникам А – Б

Rг R А Б

1

1 я есть

2 это ты

3 то я

4 он как

5 есть он

6 как себя

7 но же

8 у мочь

9 по бы

10 тот хотеть

2

11 вы тот

12 так но

13 к такой

14 она сам

15 все знать

16 за что

17 из она

18 же еще

19 который у

20 ты если

3

21 что мой

22 мы к

23 если кто

24 они это

25 от по

26 мой мы

27 такой когда

Page 234: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

4

28 мочь даже

29 о о

30 бы человек

4

31 только нет

32 кто любить

33 и они

34 уже день

35 вс какой

36 свой не

37 до чтобы

38 один вот

39 в за

40 вот только

5

41 ну один

42 для все

43 даже от

44 какой да

45 когда из

46 не или

47 себя и

48 нет уже

49 да делать

50 или очень

6

51 т время

52 знать нравиться

53 м этот

54 просто вы

55 самый ну

56 ещ который

57 этот любовь

Page 235: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

5

58 человек без

59 там ничего

60 чтобы сейчас

7

61 день потому

62 время до

63 ни больше

64 на для

65 вообще жизнь

66 ли в

67 раз вообще

68 сам глаз

69 еще жить

70 другой нужно

8

71 под просто

72 очень там

73 при тоже

74 жизнь можно

75 можно сегодня

76 потому хорошо

77 со ни

78 первый самый

79 без где

80 мама хотя

9

81 во ли

82 е раз

83 где думать

84 год надо

85 дело всегда

86 дом много

87 потом музыка

88 тоже лишь

Page 236: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

6

89 надо тогда

90 а со

10

91 сегодня а

92 любить потом

93 два почему

94 тут с

95 с всего

96 ч совсем

97 после во

98 хотя равно

99 работа теперь

100 теперь на

Page 237: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

7

Приложение Б

Таблица Б.1 – Частотно-сопоставительная таблица по словникам В – Г

Rг R В Г

1

1 это есть

2 а я

3 есть это

4 он ты

5 я как

6 как хотеть

7 то он

8 но бы

9 по себя

10 у мочь

2

11 тот они

12 она по

13 к что

14 из кто

15 который мой

16 весь сам

17 все у

18 они когда

19 так еще

20 от она

3

21 за же

22 что такой

23 мы за

24 если но

25 свой чтобы

26 же от

27 вы тот

28 мочь мы

Page 238: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

8

29 и нет

30 такой к

4

31 в не

32 мой какой

33 о этот

34 бы только

35 ты знать

36 для и

37 год уже

38 вс если

39 только даже

40 уже из

5

41 человек человек

42 вот о

43 до вы

44 ещ больше

45 т да

46 себя вот

47 или все

48 не до

49 кто день

50 какой жизнь

6

51 самый ничего

52 нет любить

53 время для

54 м или

55 когда просто

56 один который

57 да потому

58 даже можно

59 ну один

Page 239: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

9

60 первый нужно

7

61 этот ну

62 другой в

63 при думать

64 знать там

65 ни время

66 просто ни

67 раз вообще

68 на лишь

69 е без

70 там нравиться

8

71 вообще очень

72 очень глаз

73 жизнь делать

74 день хотя

75 чтобы где

76 мама ли

77 под друг

78 любить сегодня

79 дело раз

80 дом почему

9

81 ч сейчас

82 потому совсем

83 без жить

84 после год

85 со теперь

86 тоже мир

87 где ведь

88 надо хорошо

89 можно всегда

90 с на

Page 240: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

10

10

91 во любовь

92 два а

93 п то

94 больше стать

95 всего во

96 потом дождь

97 тут тогда

98 сегодня много

99 теперь равно

100 сейчас со

Page 241: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

11

Приложение В

Таблица В.1 – Частотно-сопоставительная таблица по словникам А– В

Rг R А В

1

1 я это

2 это а

3 то есть

4 он он

5 есть я

6 как как

7 но то

8 у но

9 по по

10 тот у

2

11 вы тот

12 так она

13 к к

14 она из

15 все который

16 за весь

17 из все

18 же они

19 который так

20 ты от

3

21 что за

22 мы что

23 если мы

24 они если

25 от свой

26 мой же

27 такой вы

28 мочь мочь

Page 242: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

12

29 о и

30 бы такой

4

31 только в

32 кто мой

33 и о

34 уже бы

35 вс ты

36 свой для

37 до год

38 один вс

39 в только

40 вот уже

5

41 ну человек

42 для вот

43 даже до

44 какой ещ

45 когда т

46 не себя

47 себя или

48 нет не

49 да кто

50 или какой

6

51 т самый

52 знать нет

53 м время

54 просто м

55 самый когда

56 ещ один

57 этот да

58 человек даже

59 там ну

Page 243: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

13

60 чтобы первый

7

61 день этот

62 время другой

63 ни при

64 на знать

65 вообще ни

66 ли просто

67 раз раз

68 сам на

69 еще е

70 другой там

8

71 под вообще

72 очень очень

73 при жизнь

74 жизнь день

75 можно чтобы

76 потому мама

77 со под

78 первый любить

79 без дело

80 мама дом

9

81 во ч

82 е потому

83 где без

84 год после

85 дело со

86 дом тоже

87 потом где

88 тоже надо

89 надо можно

90 а с

Page 244: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

14

10

91 сегодня во

92 любить два

93 два п

94 тут больше

95 с всего

96 ч потом

97 после тут

98 хотя сегодня

99 работа теперь

100 теперь сейчас

Page 245: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

15

Приложение Г

Таблица Г.1 – Частотно-сопоставительная таблица по словникам Б – Г

Rг R Б Г

1

1 есть есть

2 ты я

3 я это

4 как ты

5 он как

6 себя хотеть

7 же он

8 мочь бы

9 бы себя

10 хотеть мочь

2

11 тот они

12 но по

13 такой что

14 сам кто

15 знать мой

16 что сам

17 она у

18 еще когда

19 у еще

20 если она

3

21 мой же

22 к такой

23 кто за

24 это но

25 по чтобы

26 мы от

27 когда тот

28 даже мы

Page 246: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

16

29 о нет

30 человек к

4

31 нет не

32 любить какой

33 они этот

34 день только

35 какой знать

36 не и

37 чтобы уже

38 вот если

39 за даже

40 только из

5

41 один человек

42 все о

43 от вы

44 да больше

45 из да

46 или вот

47 и все

48 уже до

49 делать день

50 очень жизнь

6

51 время ничего

52 нравиться любить

53 этот для

54 вы или

55 ну просто

56 который который

57 любовь потому

58 без можно

59 ничего один

Page 247: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

17

60 сейчас нужно

7

61 потому ну

62 до в

63 больше думать

64 для там

65 жизнь время

66 в ни

67 вообще вообще

68 глаз лишь

69 жить без

70 нужно нравиться

8

71 просто очень

72 там глаз

73 тоже делать

74 можно хотя

75 сегодня где

76 хорошо ли

77 ни друг

78 самый сегодня

79 где раз

80 хотя почему

9

81 ли сейчас

82 раз совсем

83 думать жить

84 надо год

85 всегда теперь

86 много мир

87 музыка ведь

88 лишь хорошо

89 тогда всегда

90 со на

Page 248: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

18

10

91 а любовь

92 потом а

93 почему то

94 с стать

95 всего во

96 совсем дождь

97 во тогда

98 равно много

99 теперь равно

100 на со

Page 249: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

19

Приложение Д

Таблица Д.1 – Сопоставление слов частотного словаря современного русского

языка [Ляшевская] и словника А

Rг R

Частотный

словарь

современного

русского языка

А

1

1 и я

2 в это

3 не то

4 он он

5 на быть

6 я как

7 что но

8 тот у

9 быть по

10 с тот

2

11 а вы

12 весь так

13 это к

14 как она

15 она все

16 по за

17 но из

18 они же

19 к который

20 у ты

3

21 ты что

22 из мы

23 мы если

24 за они

25 вы от

Page 250: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

20

26 так мой

27 же такой

28 от мочь

29 сказать о

30 этот бы

4

31 который только

32 мочь кто

33 человек и

34 о уже

35 один вс

36 еще свой

37 бы до

38 такой один

39 только в

40 себя вот

5

41 свое ну

42 какой для

43 когда даже

44 уже какой

45 для когда

46 вот не

47 кто себя

48 да нет

49 говорить да

50 год или

6

51 знать т

52 мой знать

53 до м

54 или просто

55 если самый

56 время ещ

Page 251: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

21

57 рука этот

58 нет человек

59 самый там

60 ни чтобы

7

61 стать день

62 большой время

63 даже ни

64 другой на

65 наш вообще

66 свой ли

67 ну раз

68 под сам

69 где еще

70 дело другой

8

71 есть под

72 сам очень

73 раз при

74 чтобы жизнь

75 два можно

76 там потому

77 чем со

78 глаз первый

79 жизнь без

80 первый мама

9

81 день во

82 тута е

83 вот где

84 ничто год

85 потом дело

86 очень дом

87 со потом

Page 252: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

22

88 хотеть тоже

89 ли надо

90 при а

10

91 голова сегодня

92 надо любить

93 без два

94 видеть тут

95 идти с

96 теперь ч

97 тоже после

98 стоять хотя

99 друг работа

100 дом теперь

Page 253: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

23

Приложение Е

Таблица Е.1 – Сопоставление слов частотного словаря современного русского

языка [Ляшевская] и словника Б

Rг R

Частотный

словарь

современного

русского языка

Б

1

1 и быть

2 в ты

3 не я

4 он как

5 на он

6 я себя

7 что же

8 тот мочь

9 быть бы

10 с хотеть

2

11 а тот

12 весь но

13 это такой

14 как сам

15 она знать

16 по что

17 но она

18 они еще

19 к у

20 у если

21 ты мой

22 из к

23 мы кто

24 за это

Page 254: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

24

3 25 вы по

26 так мы

27 же когда

28 от даже

29 сказать о

30 этот человек

4

31 который нет

32 мочь любить

33 человек они

34 о день

35 один какой

36 еще не

37 бы чтобы

38 такой вот

39 только за

40 себя только

5

41 свое один

42 какой все

43 когда от

44 уже да

45 для из

46 вот или

47 кто и

48 да уже

49 говорить делать

50 год очень

6

51 знать время

52 мой нравиться

53 до этот

54 или вы

55 если ну

Page 255: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

25

56 время который

57 рука любовь

58 нет без

59 самый ничего

60 ни сейчас

7

61 стать потому

62 большой до

63 даже больше

64 другой для

65 наш жизнь

66 свой в

67 ну вообще

68 под глаз

69 где жить

70 дело нужно

8

71 есть просто

72 сам там

73 раз тоже

74 чтобы можно

75 два сегодня

76 там хорошо

77 чем ни

78 глаз самый

79 жизнь где

80 первый хотя

81 день ли

82 тута раз

83 вот думать

84 ничто надо

85 потом всегда

Page 256: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

26

9

86 очень много

87 со музыка

88 хотеть лишь

89 ли тогда

90 при со

10

91 голова а

92 надо потом

93 без почему

94 видеть с

95 идти всего

96 теперь совсем

97 тоже во

98 стоять равно

99 друг теперь

100 дом на

Page 257: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

27

Приложение Ж

Таблица Ж.1 – Идентификационное моделирование по таблице А.1 (словники А

– Б) первым способом: ΔRг= R1г –R2г

Слово Расчеты → Результат

я ΔRг= 1-1=0<2 → одна ЯЛ;

это ΔRг=1-3=2≥2 → разные ЯЛ;

то ΔRг= 1-Х =Х → разные ЯЛ;

есть ΔRг= 1-1=0<2 → одна ЯЛ;

он ΔRг= 1-1=0<2 → одна ЯЛ;

как ΔRг= 1-1=0<2 → одна ЯЛ;

но ΔRг= 1-2=1<2 → одна ЯЛ;

у ΔRг= 1-2=1<2 → одна ЯЛ;

по ΔRг= 1-3=2≥2 → разные ЯЛ;

тот ΔRг= 1-2=1<2 → одна ЯЛ;

вы ΔRг= 2-6=4≥2 → разные ЯЛ;

так ΔRг=2-X=Х → разные ЯЛ;

к ΔRг= 2-3=1<2 → одна ЯЛ;

она ΔRг= 2-2=0<2 → одна ЯЛ;

все ΔRг= 2-5=3≥2 → разные ЯЛ;

за ΔRг= 2-4=2≥2 → разные ЯЛ;

из ΔRг= 2-5=3≥2 → разные ЯЛ;

же ΔRг= 2-1=1<2 → одна ЯЛ;

который ΔRг= 2-6=4≥2 → разные ЯЛ;

ты ΔRг= 2-1=1<2 → одна ЯЛ;

что ΔRг= 3-2=1<2 → одна ЯЛ;

мы ΔRг= 3-3=0<2 → одна ЯЛ;

если ΔRг= 3-2=1<2 → одна ЯЛ;

они ΔRг= 3-4=1<2 → одна ЯЛ;

от ΔRг= 3-5=2≥2 → разные ЯЛ;

мой ΔRг=3-3=0<2 → одна ЯЛ;

Page 258: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

28

такой ΔRг=3-2=1<2 → одна ЯЛ;

мочь ΔRг=3-1=2≥2 → разные ЯЛ;

о ΔRг=3-3=0<2 → одна ЯЛ;

бы ΔRг=3-1=2≥2 → разные ЯЛ;

только ΔRг=4-4=0<2 → одна ЯЛ;

кто ΔRг= 2-6=4≥2 → разные ЯЛ;

и ΔRг=4-5=1<2 → одна ЯЛ;

уже ΔRг=4-5=1<2 → одна ЯЛ;

вс ΔRг=4-X=Х → разные ЯЛ;

свой ΔRг=4-X=Х → разные ЯЛ;

до ΔRг=4-7=3≥2 → разные ЯЛ;

один ΔRг=4-5=1<2 → одна ЯЛ;

в ΔRг=4-7=3>2 → разные ЯЛ;

вот ΔRг=4-4=0<2 → одна ЯЛ;

ну ΔRг=5-6=1<2 → одна ЯЛ;

для ΔRг=5-7=2≥2 → разные ЯЛ;

даже ΔRг=5-3=2≥2 → разные ЯЛ;

какой ΔRг=5-4=1<2 → одна ЯЛ;

когда ΔRг=5-3=2≥2 → разные ЯЛ;

не ΔRг=5-4=1<2 → одна ЯЛ;

себя ΔRг=5-1=4≥2 → разные ЯЛ;

нет ΔRг=5-4=1<2 → одна ЯЛ;

да ΔRг=5-5=0<2 → одна ЯЛ;

или ΔRг=5-5=0<2 → одна ЯЛ;

т ΔRг=6-X=Х → разные ЯЛ;

знать ΔRг=6-2=4≥2 → разные ЯЛ;

м ΔRг=6-X=Х → разные ЯЛ;

просто ΔRг=6-8=2≥2 → разные ЯЛ;

самый ΔRг=6-8=2≥2 → разные ЯЛ;

ещ ΔRг=6-X=Х → разные ЯЛ;

этот ΔRг=6-6=0<2 → одна ЯЛ;

Page 259: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

29

человек ΔRг=6-3=3≥2 → разные ЯЛ;

там ΔRг=6-8=2 → разные ЯЛ;

чтобы ΔRг=6-4=2 → разные ЯЛ;

день ΔRг=7-4=3≥2 → разные ЯЛ;

ни ΔRг=7-6=1<2 → одна ЯЛ;

на ΔRг=7-8=1<2 → одна ЯЛ;

вообще ΔRг=7-7=0<2 → одна ЯЛ;

ли ΔRг=7-9=2≥2 → разные ЯЛ;

раз ΔRг=7-9=2≥2 → разные ЯЛ;

еще ΔRг=7-2=5≥2 → разные ЯЛ;

другой ΔRг=7-X=Х → разные ЯЛ;

под ΔRг=8-X=Х → разные ЯЛ;

очень ΔRг=8-5=3≥2 → разные ЯЛ;

при ΔRг=8-X=Х → разные ЯЛ;

жизнь ΔRг=8-7=1<2 → одна ЯЛ;

можно ΔRг=8-8=0<2 → одна ЯЛ;

потому ΔRг=8-7=1<2 → одна ЯЛ;

со ΔRг=8-9=1<2 → одна ЯЛ;

без ΔRг=8-6=2≥2 → разные ЯЛ;

мама ΔRг=8-X=Х → разные ЯЛ;

во ΔRг=9-10=1<2 → одна ЯЛ;

е ΔRг=9-X=Х → разные ЯЛ;

где ΔRг=9-8=1<2 → одна ЯЛ;

год ΔRг=9-X=Х → разные ЯЛ;

дело ΔRг=9-X=Х → разные ЯЛ;

дом ΔRг=9-X=Х → разные ЯЛ;

потом ΔRг=9-10=1<2 → одна ЯЛ;

тоже ΔRг=9-8=1<2 → одна ЯЛ;

надо ΔRг=9-9=0<2 → одна ЯЛ;

а ΔRг=10-9=1<2 → одна ЯЛ;

сегодня ΔRг=10-8=2≥2 → разные ЯЛ;

Page 260: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

30

любить ΔRг=10-4=6≥2 → разные ЯЛ;

два ΔRг=10-X=Х → разные ЯЛ;

тут ΔRг=10-X=Х → разные ЯЛ;

с ΔRг=10-10=0<2 → одна ЯЛ;

ч ΔRг=10-X=Х → разные ЯЛ;

после ΔRг=10-11=1<2 → одна ЯЛ;

хотя ΔRг=10-8=2≥2 → разные ЯЛ;

работа ΔRг=10-X=Х → разные ЯЛ;

теперь ΔRг=10-10=0<2 → одна ЯЛ;

хотеть ΔRг=X-1=Х → разные ЯЛ;

делать ΔRг=X-5=Х → разные ЯЛ;

нравиться ΔRг=X-6=Х → разные ЯЛ;

любовь ΔRг=X-6=Х → разные ЯЛ;

ничего ΔRг=X-6=Х → разные ЯЛ;

сейчас ΔRг=X-6=Х → разные ЯЛ;

больше ΔRг=X-7=Х → разные ЯЛ;

глаз ΔRг=X-7=Х → разные ЯЛ;

жить ΔRг=X-7=Х → разные ЯЛ;

нужно ΔRг=X-7=Х → разные ЯЛ;

просто ΔRг=X-8=Х → разные ЯЛ;

хорошо ΔRг=X-8=Х → разные ЯЛ;

думать ΔRг=X-9=Х → разные ЯЛ;

всегда ΔRг=X-9=Х → разные ЯЛ;

много ΔRг=X-9=Х → разные ЯЛ;

музыка ΔRг=X-9=Х → разные ЯЛ;

лишь ΔRг=X-9=Х → разные ЯЛ;

тогда ΔRг=X-9=Х → разные ЯЛ;

почему ΔRг=X-10=Х → разные ЯЛ;

всего ΔRг=X-10=Х → разные ЯЛ;

совсем ΔRг=X-10=Х → разные ЯЛ;

равно ΔRг=X-10=Х → разные ЯЛ.

Page 261: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

31

Приложение И

Таблица И.1 – Идентификационное моделирование по таблице Б.1 (словники В

– Г) первым способом: ΔRг= R1г –R2г

Слово Расчеты → Результат

это ΔRг=1-1=0<2 → одна ЯЛ;

а ΔRг=1-10=9≥2 → разные ЯЛ;

есть ΔRг=1-1=0<2 → одна ЯЛ;

он ΔRг=1-1=0<2 → одна ЯЛ;

я ΔRг=1-1=0<2 → одна ЯЛ;

как ΔRг=1-1=0<2 → одна ЯЛ;

то ΔRг=1-10=9≥2 → разные ЯЛ;

но ΔRг=1-3=2≥2 → разные ЯЛ;

по ΔRг=1-2=1<2 → одна ЯЛ;

у ΔRг=1-2=1<2 → одна ЯЛ;

тот ΔRг=2-3=1<2 → одна ЯЛ;

она ΔRг=1-2=1<2 → одна ЯЛ;

к ΔRг=2-3=1<2 → одна ЯЛ;

из ΔRг=2-4=2≥2 → разные ЯЛ;

который ΔRг=2-6=4≥2 → разные ЯЛ;

весь ΔRг=2-X=Х → разные ЯЛ;

все ΔRг=2-5=3≥2 → разные ЯЛ;

они ΔRг=2-2=0<2 → одна ЯЛ;

так ΔRг=2-X=Х → разные ЯЛ;

от ΔRг=2-3=1<2 → одна ЯЛ;

за ΔRг=3-3=0<2 → одна ЯЛ;

что ΔRг=3-2=1<2 → одна ЯЛ;

мы ΔRг=3-3=0<2 → одна ЯЛ;

если ΔRг=3-4=1<2 → одна ЯЛ;

свой ΔRг=3-X=Х → разные ЯЛ;

же ΔRг=3-3=0<2 → одна ЯЛ;

вы ΔRг=3-5=2≥2 → разные ЯЛ;

Page 262: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

32

мочь ΔRг=3-1=2≥2 → разные ЯЛ;

и ΔRг=3-4=1<2 → одна ЯЛ;

такой ΔRг=3-3=0<2 → одна ЯЛ;

в ΔRг=4-7=3≥2 → разные ЯЛ;

мой ΔRг=4-2=2≥2 → разные ЯЛ;

о ΔRг=4-5=1<2 → одна ЯЛ;

ты ΔRг=4-1=3≥2 → разные ЯЛ;

бы ΔRг=2-5=3≥2 → разные ЯЛ;

для ΔRг=4-6=2≥2 → разные ЯЛ;

год ΔRг=4-9=5≥2 → разные ЯЛ;

вс ΔRг=4-X=Х → разные ЯЛ;

только ΔRг=4-4=0<2 → одна ЯЛ;

уже ΔRг=4-4=0<2 → одна ЯЛ;

человек ΔRг=5-5=0<2 → одна ЯЛ;

вот ΔRг=5-5=0<2 → одна ЯЛ;

до ΔRг=5-5=0<2 → одна ЯЛ;

ещ ΔRг=5-X=Х → разные ЯЛ;

т ΔRг=5-X=Х → разные ЯЛ;

себя ΔRг=5-1=4≥2 → разные ЯЛ;

или ΔRг=5-6=1<2 → одна ЯЛ;

не ΔRг=5-4=1<2 → одна ЯЛ;

кто ΔRг=5-2=3≥2 → разные ЯЛ;

какой ΔRг=5-4=1<2 → одна ЯЛ;

самый ΔRг=6-X=Х → разные ЯЛ;

нет ΔRг=6-3=3≥2 → разные ЯЛ;

время ΔRг=6-7=1<2 → одна ЯЛ;

м ΔRг=6-X=Х → разные ЯЛ;

когда ΔRг=6-2=4≥2 → разные ЯЛ;

один ΔRг=6-6=0<2 → одна ЯЛ;

да ΔRг=6-5=1<2 → одна ЯЛ;

даже ΔRг=6-4=2≥2 → разные ЯЛ;

Page 263: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

33

ну ΔRг=6-6=0<2 → одна ЯЛ;

первый ΔRг=7-4=3≥2 → разные ЯЛ;

этот ΔRг=7-4=3≥2 → разные ЯЛ;

другой ΔRг=7-X=Х → разные ЯЛ;

при ΔRг=7-X=Х → разные ЯЛ;

знать ΔRг=7-4=3≥2 → разные ЯЛ;

ни ΔRг=7-7=0<2 → одна ЯЛ;

просто ΔRг=7-6=1<2 → одна ЯЛ;

раз ΔRг=7-8=1<2 → одна ЯЛ;

на ΔRг=7-9=2≥2 → разные ЯЛ;

е ΔRг=7-X=Х → разные ЯЛ;

там ΔRг=7-7=0<2 → одна ЯЛ;

вообще ΔRг=8-7=1<2 → одна ЯЛ;

очень ΔRг=8-8=0<2 → одна ЯЛ;

жизнь ΔRг=8-5=3≥2 → разные ЯЛ;

день ΔRг=8-5=3≥2 → разные ЯЛ;

чтобы ΔRг=8-5=3≥2 → разные ЯЛ;

мама ΔRг=8-X=Х → разные ЯЛ;

под ΔRг=8-X=Х → разные ЯЛ;

любить ΔRг=8-6=2≥2 → разные ЯЛ;

дело ΔRг=8-X=Х → разные ЯЛ;

дом ΔRг=8-X=Х → разные ЯЛ;

ч ΔRг=9-X=Х → разные ЯЛ;

потому ΔRг=9-6=3≥2 → разные ЯЛ;

без ΔRг=9-7=2≥2 → разные ЯЛ;

после ΔRг=9-X =2≥2 → разные ЯЛ;

со ΔRг=9-10=1<2 → одна ЯЛ;

тоже ΔRг=9-X=Х → разные ЯЛ;

где ΔRг=9-8=1<2 → одна ЯЛ;

надо ΔRг=9-X=Х → разные ЯЛ;

можно ΔRг=9-6=3≥2 → разные ЯЛ;

Page 264: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

34

с ΔRг=9-X=Х → разные ЯЛ;

во ΔRг=10-10=0<2 → одна ЯЛ;

два ΔRг=10-X=Х → разные ЯЛ;

п ΔRг=10-X=Х → разные ЯЛ;

больше ΔRг=10-5=5≥2 → разные ЯЛ;

всего ΔRг=10-X=Х → разные ЯЛ;

потом ΔRг=10-X=Х → разные ЯЛ;

тут ΔRг=10-X=Х → разные ЯЛ;

сегодня ΔRг=10-8=2≥2 → разные ЯЛ;

теперь ΔRг=10-9=1<2 → одна ЯЛ;

сейчас ΔRг=10-9=1<2 → одна ЯЛ;

дождь ΔRг=Х-10=Х → разные ЯЛ;

тогда ΔRг=Х-10=Х → разные ЯЛ;

много ΔRг=Х-10=Х → разные ЯЛ;

равно ΔRг=Х-10=Х → разные ЯЛ;

хотеть ΔRг=Х-1=Х → разные ЯЛ;

сам ΔRг=Х-2=Х → разные ЯЛ;

еще ΔRг=Х-2=Х → разные ЯЛ;

нужно ΔRг=Х-6=Х → разные ЯЛ;

ничего ΔRг=Х-6=Х → разные ЯЛ;

лишь ΔRг=Х-7=Х → разные ЯЛ;

думать ΔRг=Х-7=Х → разные ЯЛ;

глаз ΔRг=Х-8=Х → разные ЯЛ;

нравиться ΔRг=Х-7=Х → разные ЯЛ;

делать ΔRг=Х-8=Х → разные ЯЛ;

хотя ΔRг=Х-8=Х → разные ЯЛ;

ли ΔRг=Х-8=Х → разные ЯЛ;

друг ΔRг=Х-8=Х → разные ЯЛ;

почему ΔRг=Х-8=Х → разные ЯЛ;

совсем ΔRг=Х-9=Х → разные ЯЛ;

жить ΔRг=Х-9=Х → разные ЯЛ;

Page 265: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

35

мир ΔRг=Х-9=Х → разные ЯЛ;

ведь ΔRг=Х-9=Х → разные ЯЛ;

хорошо ΔRг=Х-9=Х → разные ЯЛ;

всегда ΔRг=Х-9=Х → разные ЯЛ;

любовь ΔRг=Х-10=Х → разные ЯЛ;

стать ΔRг=Х-10=Х → разные ЯЛ.

Page 266: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

36

Приложение К

Таблица К.1 – Идентификационное моделирование по В.1 (словники А – В)

первым способом: ΔRг= R1г –R2г

Слово Расчеты → Результат

я ΔRг=1-1=0<2 → одна ЯЛ;

это ΔRг=1-1=0<2 → одна ЯЛ;

то ΔRг=1-1=0<2 → одна ЯЛ;

он ΔRг=1-1=0<2 → одна ЯЛ;

есть ΔRг=1-1=0<2 → одна ЯЛ;

как ΔRг=1-1=0<2 → одна ЯЛ;

но ΔRг=1-1=0<2 → одна ЯЛ;

у ΔRг=1-1=0<2 → одна ЯЛ;

по ΔRг=1-1=0<2 → одна ЯЛ;

тот ΔRг=1-2=1<2 → одна ЯЛ;

вы ΔRг=2-3=1<2 → одна ЯЛ;

так ΔRг=2-2=0<2 → одна ЯЛ;

к ΔRг=2-2=0<2 → одна ЯЛ;

она ΔRг=2-2=0<2 → одна ЯЛ;

все ΔRг=2-2=0<2 → одна ЯЛ;

за ΔRг=2-3=1<2 → одна ЯЛ;

из ΔRг=2-2=0<2 → одна ЯЛ;

же ΔRг=2-3=1<2 → одна ЯЛ;

который ΔRг=2-2=0<2 → одна ЯЛ;

ты ΔRг=2-4=2≥2 → разные ЯЛ;

что ΔRг=3-3=0<2 → одна ЯЛ;

мы ΔRг=3-3=0<2 → одна ЯЛ;

если ΔRг=3-3=0<2 → одна ЯЛ;

они ΔRг=3-2=1<2 → одна ЯЛ;

от ΔRг=3-2=1<2 → одна ЯЛ;

мой ΔRг=3-4=1<2 → одна ЯЛ;

такой ΔRг=3-3=0<2 → одна ЯЛ;

Page 267: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

37

мочь ΔRг=3-3=0<2 → одна ЯЛ;

о ΔRг=3-4=1<2 → одна ЯЛ;

бы ΔRг=3-4=1<2 → одна ЯЛ;

только ΔRг=4-4=0<2 → одна ЯЛ;

кто ΔRг=4-5=1<2 → одна ЯЛ;

и ΔRг=4-3=1<2 → одна ЯЛ;

уже ΔRг=4-4=1<2 → одна ЯЛ;

вс ΔRг=4-4=1<2 → одна ЯЛ;

свой ΔRг=4-3=1<2 → одна ЯЛ;

до ΔRг=4-5=1<2 → одна ЯЛ;

один ΔRг=4-6=2≥2 → разные ЯЛ;

в ΔRг=4-4=0<2 → одна ЯЛ;

вот ΔRг=4-5=1<2 → одна ЯЛ;

ну ΔRг=5-6=1<2 → одна ЯЛ;

для ΔRг=5-4=1<2 → одна ЯЛ;

даже ΔRг=5-6=1<2 → одна ЯЛ;

какой ΔRг=5-5=0<2 → одна ЯЛ;

когда ΔRг=5-6=1<2 → одна ЯЛ;

не ΔRг=5-5=0<2 → одна ЯЛ;

себя ΔRг=5-5=0<2 → одна ЯЛ;

нет ΔRг=5-6=1<2 → одна ЯЛ;

да ΔRг=5-6=1<2 → одна ЯЛ;

или ΔRг=5-5=0<2 → одна ЯЛ;

т ΔRг=6-5=1<2 → одна ЯЛ;

знать ΔRг=6-7=1<2 → одна ЯЛ;

м ΔRг=6-6=0<2 → одна ЯЛ;

просто ΔRг=6-7=1<2 → одна ЯЛ;

самый ΔRг=6-6=0<2 → одна ЯЛ;

ещ ΔRг=6-5=1<2 → одна ЯЛ;

этот ΔRг=6-7=1<2 → одна ЯЛ;

человек ΔRг=6-5=1<2 → одна ЯЛ;

Page 268: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

38

там ΔRг=6-8=2≥2 → разные ЯЛ;

чтобы ΔRг=6-8=2≥2 → разные ЯЛ;

день ΔRг=7-8=1<2 → одна ЯЛ;

время ΔRг=7-6=1<2 → одна ЯЛ;

ни ΔRг=7-7=0<2 → одна ЯЛ;

на ΔRг=7-7=0<2 → одна ЯЛ;

вообще ΔRг=7-8=1<2 → одна ЯЛ;

ли ΔRг=7-X=Х → разные ЯЛ;

раз ΔRг=7-7=0<2 → одна ЯЛ;

еще ΔRг=7-X=Х → разные ЯЛ;

сам ΔRг =7-X=Х → разные ЯЛ;

другой ΔRг=7-7=0<2 → одна ЯЛ;

под ΔRг=8-8=0<2 → одна ЯЛ;

очень ΔRг=8-8=0<2 → одна ЯЛ;

при ΔRг=8-7=1<2 → одна ЯЛ;

жизнь ΔRг=8-8=0<2 → одна ЯЛ;

можно ΔRг= 8-9=1<2 → одна ЯЛ;

потому ΔRг=8-9=1<2 → одна ЯЛ;

со ΔRг=8-9=1<2 → одна ЯЛ;

первый ΔRг=8-6=2≥2 → разные ЯЛ;

без ΔRг=8-9=1<2 → одна ЯЛ;

мама ΔRг=8-8=0<2 → одна ЯЛ;

во ΔRг=9-10=1<2 → одна ЯЛ;

е ΔRг=9-7=2≥2 → разные ЯЛ;

где ΔRг=9-9=0<2 → одна ЯЛ;

год ΔRг=9-4=5≥2 → разные ЯЛ;

дело ΔRг=9-8=1<2 → одна ЯЛ;

дом ΔRг=9-9=0<2 → одна ЯЛ;

потом ΔRг=9-10=1<2 → одна ЯЛ;

тоже ΔRг=9-9=0<2 → одна ЯЛ;

надо ΔRг=9-9=0<2 → одна ЯЛ;

Page 269: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

39

а ΔRг=9-1=8≥2 → разные ЯЛ;

сегодня ΔRг=10-10=0<2 → одна ЯЛ;

любить ΔRг=10-8=2≥2 → разные ЯЛ;

два ΔRг=10-10=0<2 → одна ЯЛ;

тут ΔRг=10-10=0<2 → одна ЯЛ;

с ΔRг=10-10=0<2 → одна ЯЛ;

ч ΔRг=10-9=1<2 → одна ЯЛ;

после ΔRг=10-9=1<2 → одна ЯЛ;

хотя ΔRг=10-X=Х → разные ЯЛ;

работа ΔRг=10–X=Х → разные ЯЛ;

теперь ΔRг=10-10=0<2 → одна ЯЛ;

всего ΔRг =10-X=Х → разные ЯЛ;

п ΔRг=10-X=Х → разные ЯЛ;

весь ΔRг=X-2=Х → разные ЯЛ;

больше ΔRг=Х-10=Х → разные ЯЛ;

сейчас ΔRг=Х-10=Х → разные ЯЛ;

Page 270: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

40

Приложение Л

Таблица Л.1 – Идентификационное моделирование по таблице Г.1 (словники Б

– Г) первым способом: ΔRг= R1г –R2г

Слово Расчеты → Результат

есть ΔRг=1-1=0<2 → одна ЯЛ;

ты ΔRг=1-1=0<2 → одна ЯЛ;

я ΔRг=1-1=0<2 → одна ЯЛ;

как ΔRг=1-1=0<2 → одна ЯЛ;

сам ΔRг=2-2=0<2 → одна ЯЛ;

он ΔRг=1-1=0<2 → одна ЯЛ;

себя ΔRг=1-1=0<2 → одна ЯЛ;

же ΔRг=1-3=2≥2 → разные ЯЛ;

мочь ΔRг=1-1=0<2 → одна ЯЛ;

бы ΔRг=1-1=0<2 → одна ЯЛ;

хотеть ΔRг=1-1=0<2 → одна ЯЛ;

но ΔRг=2-3=1<2 → одна ЯЛ;

такой ΔRг=2-3=1<2 → одна ЯЛ;

знать ΔRг=2-4=2≥2 → разные ЯЛ;

что ΔRг=2-2=0<2 → одна ЯЛ;

тот ΔRг=2-3=1<2 → одна ЯЛ;

она ΔRг=2-2=0<2 → одна ЯЛ;

еще ΔRг=2-2=0<2 → одна ЯЛ;

у ΔRг=2-2=0<2 → одна ЯЛ;

если ΔRг=2-4=2≥2 → разные ЯЛ;

мой ΔRг=2-2=0<2 → одна ЯЛ;

к ΔRг=3-3=0<2 → одна ЯЛ;

кто ΔRг=3-2=1<2 → одна ЯЛ;

это ΔRг=3-1=2≥2 → разные ЯЛ;

по ΔRг=3-2=1<2 → одна ЯЛ;

мы ΔRг=3-3=0<2 → одна ЯЛ;

когда ΔRг=3-2=1<2 → одна ЯЛ;

Page 271: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

41

даже ΔRг=3-4=1<2 → одна ЯЛ;

о ΔRг=3-5=2≥2 → разные ЯЛ;

человек ΔRг=3-5=2≥2 → разные ЯЛ;

нет ΔRг=3-3=0<2 → одна ЯЛ;

любить ΔRг=4-6=2≥2 → разные ЯЛ;

они ΔRг=4-2=2≥2 → разные ЯЛ;

день ΔRг=4-5=1<2 → одна ЯЛ;

какой ΔRг=4-4=0<2 → одна ЯЛ;

не ΔRг=4-4=0<2 → одна ЯЛ;

чтобы ΔRг=4-3=1<2 → одна ЯЛ;

вот ΔRг=4-5=1<2 → одна ЯЛ;

за ΔRг=4-3=1<2 → одна ЯЛ;

только ΔRг=4-4=0<2 → одна ЯЛ;

один ΔRг=4-6=2≥2 → разные ЯЛ;

все ΔRг=5-5=0<2 → одна ЯЛ;

от ΔRг=5-3=0<2 → разные ЯЛ;

да ΔRг=5-5=0<2 → одна ЯЛ;

из ΔRг=5-4=1<2 → одна ЯЛ;

или ΔRг=5-5=0<2 → одна ЯЛ;

и ΔRг=5-4=1<2 → одна ЯЛ;

уже ΔRг=5-4=1<2 → одна ЯЛ;

делать ΔRг=5-8=3≥2 → разные ЯЛ;

очень ΔRг=5-8=1<2 → одна ЯЛ;

время ΔRг=6-7=1<2 → одна ЯЛ;

нравиться ΔRг=6-8=2≥2 → разные ЯЛ;

этот ΔRг=6-4=2≥2 → разные ЯЛ;

вы ΔRг=6-5=1<2 → одна ЯЛ;

ну ΔRг=6-7=0<2 → одна ЯЛ;

любовь ΔRг=6-10=4≥2 → разные ЯЛ;

без ΔRг=6-7=0<2 → одна ЯЛ;

ничего ΔRг=6-6=0<2 → одна ЯЛ;

Page 272: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

42

сейчас ΔRг=6-9=3≥2 → разные ЯЛ;

потому ΔRг=7-6=1<2 → одна ЯЛ;

до ΔRг=6-5=1<2 → одна ЯЛ;

больше ΔRг=7-5=2≥2 → разные ЯЛ;

для ΔRг=7-6=1<2 → одна ЯЛ;

жизнь ΔRг=7-6=1<2 → одна ЯЛ;

в ΔRг=7-7=0<2 → одна ЯЛ;

вообще ΔRг=7-7=0<2 → одна ЯЛ;

глаз ΔRг=7-8=1<2 → одна ЯЛ;

жить ΔRг=7-9=2≥2 → разные ЯЛ;

нужно ΔRг=7-7=0<2 → одна ЯЛ;

просто ΔRг=7-6=1<2 → одна ЯЛ;

там ΔRг=7-7=0<2 → одна ЯЛ;

тоже ΔRг=8-X=Х → разные ЯЛ;

можно ΔRг=8-6=2≥2 → разные ЯЛ;

сегодня ΔRг=8-8=0<2 → одна ЯЛ;

хорошо ΔRг=8-9=1<2 → одна ЯЛ;

ни ΔRг=8-7=1<2 → одна ЯЛ;

самый ΔRг=8-X=Х → разные ЯЛ;

где ΔRг=8-8=0<2 → одна ЯЛ;

хотя ΔRг=8-8=0<2 → одна ЯЛ;

ли ΔRг=7-7=0<2 → одна ЯЛ;

раз ΔRг=8-8=0<2 → одна ЯЛ;

надо ΔRг=9-X=Х → разные ЯЛ;

всегда ΔRг=9-9=0<2 → одна ЯЛ;

много ΔRг=9-10=1<2 → одна ЯЛ;

музыка ΔRг=9-X=Х → разные ЯЛ;

лишь ΔRг=9-7=2≥2 → разные ЯЛ;

тогда ΔRг=9-10=1<2 → одна ЯЛ;

со ΔRг=9-10=1<2 → одна ЯЛ;

а ΔRг=9-10=1<2 → одна ЯЛ;

Page 273: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

43

потом ΔRг=9-X=Х → разные ЯЛ;

почему ΔRг=9-9=0<2 → одна ЯЛ;

с ΔRг=9-X=Х → разные ЯЛ;

всего ΔRг=9-X=Х → разные ЯЛ;

совсем ΔRг=10-9=1<2 → одна ЯЛ;

так ΔRг=10-X=Х → разные ЯЛ;

равно ΔRг=10-10=0<2 → одна ЯЛ;

теперь ΔRг=10-9=1<2 → одна ЯЛ;

на ΔRг=10-10 =0<2 → одна ЯЛ;

во ΔRг=10-10 =0<2 → одна ЯЛ;

который ΔRг=6- 6=0<2 → одна ЯЛ;

год ΔRг=X-9=Х → разные ЯЛ;

дождь ΔRг=X-10=Х → разные ЯЛ;

то ΔRг=Х-10=Х → разные ЯЛ;

стать ΔRг=Х-10=Х → разные ЯЛ;

мир ΔRг=Х-9=Х → разные ЯЛ;

ведь ΔRг=Х-9=Х → разные ЯЛ.

Page 274: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

44

Приложение М

Таблица М.1 – Идентификационное моделирование по таблице А.1 (словники А

– Б) вторым способом: ΔR= R1 –R2

Слово Расчеты → Результат

я ΔR= 1-3=2≤10 → одна ЯЛ;

это ΔR= 2-24=22>10 → разные ЯЛ;

то ΔR=3-X=Х → разные ЯЛ;

есть ΔR= 5-1=4≤10 → одна ЯЛ;

он ΔR= 4-5=1≤10 → одна ЯЛ;

как ΔR= 6-4=2≤10 → одна ЯЛ;

но ΔR= 7-13=6>10 → разные ЯЛ;

у ΔR= 8-13=5≤10 → одна ЯЛ;

по ΔR= 9-25=16>10 → разные ЯЛ;

тот ΔR= 10-12=2≤10 → одна ЯЛ;

вы ΔR= 11-54=43>10 → разные ЯЛ;

так ΔR=12-X=Х → разные ЯЛ;

к ΔR= 13-22=9≤10 → одна ЯЛ;

она ΔR= 14-17=3≤10 → одна ЯЛ;

все ΔR= 15-42=27>10 → разные ЯЛ;

за ΔR= 16-39=23>10 → разные ЯЛ;

из ΔR= 17-45=28>10 → разные ЯЛ;

же ΔR= 18-7=11>10 → разные ЯЛ;

который ΔR= 19-56=37>10 → разные ЯЛ;

ты ΔR= 20-2=18>10 → разные ЯЛ;

что ΔR= 21-16=5≤10 → одна ЯЛ;

«мы» ΔR= 22-26=4≤10 → одна ЯЛ;

если ΔR= 23-20=3≤10 → одна ЯЛ;

они ΔR= 24-33=9≤10 → одна ЯЛ;

от ΔR= 25-43=18>10 → разные ЯЛ;

мой ΔR=26-21=5≤10 → одна ЯЛ;

такой ΔR=27-13=14>10 → разные ЯЛ;

Page 275: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

45

мочь ΔR=28-8=20>10 → разные ЯЛ;

о ΔR=29-29=0≤10 → одна ЯЛ;

бы ΔR=30-9=21>10 → разные ЯЛ;

только ΔR=31-40=9≤10 → одна ЯЛ;

кто ΔR= 32-23=9≤10 → одна ЯЛ;

и ΔR=33-47=14>10 → разные ЯЛ;

уже ΔR=34-48=14>10 → разные ЯЛ;

вс ΔR=35-X=Х → разные ЯЛ;

свой ΔR=36-X=X → разные ЯЛ;

до ΔR=37-62=25>10 → разные ЯЛ;

один ΔR=38-41=3≤10 → одна ЯЛ;

в ΔR=39-66=27>10 → разные ЯЛ;

вот ΔR=40-38=2≤10 → одна ЯЛ;

ну ΔR=41-55=14>10 → разные ЯЛ;

для ΔR=42-64=22>10 → разные ЯЛ;

даже ΔR=43-28=15>10 → разные ЯЛ;

какой ΔR=44-35=9≤10 → одна ЯЛ;

когда ΔR=45-27=18>10 → разные ЯЛ;

не ΔR=46-36=10≤10 → одна ЯЛ;

себя ΔR=47-6=41>10 → разные ЯЛ;

нет ΔR=48-31=17>10 → разные ЯЛ;

да ΔR=49-44=5≤10 → одна ЯЛ;

или ΔR=50-46=4≤10 → одна ЯЛ;

т ΔR=51-X=Х → разные ЯЛ;

знать ΔR=52-15=37>10 → разные ЯЛ;

м ΔR=53-X=Х → разные ЯЛ;

просто ΔR=54-71=17>10 → разные ЯЛ

самый ΔR=55-78=23>10 → разные ЯЛ;

ещ ΔR=56-X=Х → разные ЯЛ;

этот ΔR=57-53=4≤10 → одна ЯЛ;

человек ΔR=58-30=28>10 → разные ЯЛ;

Page 276: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

46

там ΔR=59-72=13>10 → разные ЯЛ;

чтобы ΔR=60-37=23>10 → разные ЯЛ;

день ΔR=61-34=27>10 → разные ЯЛ;

ни ΔR=63-77=14>10 → разные ЯЛ;

на ΔR=64-100=36>10 → разные ЯЛ;

вообще ΔR=65-67=2≤10 → одна ЯЛ;

ли ΔR=66-81=17>10 → разные ЯЛ;

раз ΔR=67-82=16>10 → разные ЯЛ;

еще ΔR=69-18=51>10 → разные ЯЛ;

другой ΔR=70-X=Х → разные ЯЛ;

под ΔR=71-X=Х → разные ЯЛ;

очень ΔR=72-50=22>10 → разные ЯЛ;

при ΔR=73-X=Х → разные ЯЛ;

жизнь ΔR=74-65=9≤10 → одна ЯЛ;

можно ΔR=75-74=1≤10 → одна ЯЛ;

потому ΔR=76-61=15>10 → разные ЯЛ;

со ΔR=77-90=13>10 → разные ЯЛ;

без ΔR=79-58=21>10 → разные ЯЛ;

мама ΔR=80-X=Х → разные ЯЛ;

во ΔR=81-97=16>10 → разные ЯЛ;

е ΔR=82-X=Х → разные ЯЛ;

где ΔR=83-79=4≤10 → одна ЯЛ;

год ΔR=84-X=Х → разные ЯЛ;

дело ΔR=85-X=Х → разные ЯЛ;

дом ΔR=86-X=Х → разные ЯЛ;

потом ΔR=87-92=5 → одна ЯЛ;

тоже ΔR=88-73=15>10 → разные ЯЛ;

надо ΔR=89-84=5≤10 → одна ЯЛ;

а ΔR=90-91=1≤10 → одна ЯЛ;

сегодня ΔR=91-75=16>10 → разные ЯЛ;

любить ΔR=92-32=60>10 → разные ЯЛ;

Page 277: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

47

два ΔR=93-X=Х → разные ЯЛ;

тут ΔR=94-X=Х → разные ЯЛ;

с ΔR=95-94=1≤10 → одна ЯЛ;

ч ΔR=96-X=Х → разные ЯЛ;

после ΔR=97-101=4≤10 → разные ЯЛ;

хотя ΔR=98-50=18>10 → разные ЯЛ;

работа ΔR=99-X=Х → разные ЯЛ;

теперь ΔR=100-99=1≤10 → одна ЯЛ;

хотеть ΔR=X-10=Х → разные ЯЛ;

делать ΔR=X-49=Х → разные ЯЛ;

нравиться ΔR=X-52=Х → разные ЯЛ;

любовь ΔR=X-57=Х → разные ЯЛ;

ничего ΔR=X-59=Х → разные ЯЛ;

сейчас ΔR=X-60=Х → разные ЯЛ;

больше ΔR=X-63=Х → разные ЯЛ;

глаз ΔR=X-68=Х → разные ЯЛ;

жить ΔR=X-69=Х → разные ЯЛ;

нужно ΔR=X-70=Х → разные ЯЛ;

просто ΔR=X-71=Х → разные ЯЛ;

хорошо ΔR=X-76=Х → разные ЯЛ;

думать ΔR=X-83=Х → разные ЯЛ;

всегда ΔR=X-85=Х → разные ЯЛ;

много ΔR=X-86=Х → разные ЯЛ;

музыка ΔR=X-87=Х → разные ЯЛ;

лишь ΔR=X-88=Х → разные ЯЛ;

тогда ΔR=X-89=Х → разные ЯЛ;

почему ΔR=X-93=Х → разные ЯЛ;

всего ΔR=X-95=Х → разные ЯЛ;

совсем ΔR=X-96=Х → разные ЯЛ;

равно ΔR=X-98=Х → разные ЯЛ;

Page 278: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

48

Приложение Н

Таблица Н.1 – Идентификационное моделирование по таблице Б.1 (словники

В – Г) вторым способом: ΔR= R1 –R2

Слово Расчеты → Результат

это ΔR=1-3=2≤10 → одна ЯЛ;

а ΔR=2-92=90>10 → разные ЯЛ;

есть ΔR=3-1=2≤10 → одна ЯЛ;

он ΔR=4-7=3≤10 → одна ЯЛ;

я ΔR=5-2=3≤10 → одна ЯЛ;

как ΔR=6-5=1≤10 → одна ЯЛ;

то ΔR=7-93=86>10 → разные ЯЛ;

но ΔR=8-24=16>10 → разные ЯЛ;

по ΔR=9-21=3≤10 → одна ЯЛ;

у ΔR=10-17=7≤10 → одна ЯЛ;

тот ΔR=11-27=16>10 → разные ЯЛ;

она ΔR=12-20=8≤10 → одна ЯЛ;

к ΔR=13-30=17>10 → разные ЯЛ;

из ΔR=14-40=26>10 → разные ЯЛ;

который ΔR=15-56=41>10 → разные ЯЛ;

весь ΔR=16-X=Х → разные ЯЛ;

все ΔR=17-47=30>10 → разные ЯЛ;

они ΔR=18-11=7≤10 → одна ЯЛ;

так ΔR=19-X=Х → разные ЯЛ;

от ΔR=20-26=6≤10 → одна ЯЛ;

за ΔR=21-23=2≤10 → одна ЯЛ;

что ΔR=22-13=9≤10 → одна ЯЛ;

мы ΔR=23-28=5≤10 → одна ЯЛ;

если ΔR=24-38=14>10 → разные ЯЛ;

свой ΔR=25-X=Х → разные ЯЛ;

же ΔR=26-21=5≤10 → одна ЯЛ;

вы ΔR=27-43=16>10 → разные ЯЛ;

Page 279: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

49

мочь ΔR=28-10=18>10 → разные ЯЛ;

и ΔR=29-36=7≤10 → одна ЯЛ;

такой ΔR=30-22=8≤10 → одна ЯЛ;

в ΔR=31-62=31>10 → разные ЯЛ;

мой ΔR=32-15=17>10 → разные ЯЛ;

о ΔR=33-42=9≤10 → одна ЯЛ;

ты ΔR=34-4=30>10 → разные ЯЛ;

бы ΔR=35-8=27>10 → разные ЯЛ;

для ΔR=36-53=17>10 → разные ЯЛ;

год ΔR=37-84=47>10 → разные ЯЛ;

вс ΔR=38-X=Х → разные ЯЛ;

только ΔR=39-34=5≤10 → одна ЯЛ;

уже ΔR=40-37=3≤10 → одна ЯЛ;

человек ΔR=41-41=0≤10 → одна ЯЛ;

вот ΔR=42-46=4≤10 → одна ЯЛ;

до ΔR=43-48=5≤10 → одна ЯЛ;

ещ ΔR=44-X=Х → разные ЯЛ;

т ΔR=45-X=Х → разные ЯЛ;

себя ΔR=46-9=37>10 → разные ЯЛ;

или ΔR=47-54=7≤10 → одна ЯЛ;

не ΔR=48-31=17>10 → разные ЯЛ;

кто ΔR=49-14=35>10 → разные ЯЛ;

какой ΔR=50-32=18>10 → разные ЯЛ;

самый ΔR=51-X=Х → разные ЯЛ;

нет ΔR=52-29=23>10 → разные ЯЛ;

время ΔR=53-65=12>10 → разные ЯЛ;

м ΔR=54-X=Х → разные ЯЛ;

когда ΔR=55-18=37>10 → разные ЯЛ;

один ΔR=57-59=2≤10 → одна ЯЛ;

да ΔR=6-5=1≤10 → одна ЯЛ;

даже ΔR=58-39=19>10 → разные ЯЛ;

Page 280: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

50

ну ΔR=59-60=1≤10 → одна ЯЛ;

первый ΔR=60-X=Х → разные ЯЛ;

этот ΔR=61-33=28>10 → разные ЯЛ;

другой ΔR=62-X=Х → разные ЯЛ;

при ΔR=63-X=Х → разные ЯЛ;

знать ΔR=64-35=9≤10 → одна ЯЛ;

ни ΔR=65-66=1≤10 → одна ЯЛ;

просто ΔR=66-55=10≤10 → одна ЯЛ;

раз ΔR=67-79=12>10 → разные ЯЛ;

на ΔR=68-90=22>10 → разные ЯЛ;

е ΔR=69-X=Х → разные ЯЛ;

там ΔR=70-64=6≤10 → одна ЯЛ;

вообще ΔR=71-67=4≤10 → одна ЯЛ;

очень ΔR=72-71=2≤10 → одна ЯЛ;

жизнь ΔR=73-50=23>10 → разные ЯЛ;

день ΔR=74-49=25>10 → разные ЯЛ;

чтобы ΔR=75-25=50>10 → разные ЯЛ;

мама ΔR=76-X=Х → разные ЯЛ;

под ΔR=77-X=Х → разные ЯЛ;

любить ΔR=78-52=25>10 → разные ЯЛ;

дело ΔR=79-X=Х → разные ЯЛ;

дом ΔR=80-X=Х → разные ЯЛ;

ч ΔR=81-X=Х → разные ЯЛ;

потому ΔR=82-57=25>10 → разные ЯЛ;

без ΔR=83-69=14>10 → разные ЯЛ;

после ΔR=84-X=2≤10 → одна ЯЛ;

со ΔR=85-100=15>10 → разные ЯЛ;

тоже ΔR=86-X=Х → разные ЯЛ;

где ΔR=87-75=13>10 → разные ЯЛ;

надо ΔR=88-X=Х → разные ЯЛ;

можно ΔR=89-58=33>10 → разные ЯЛ;

Page 281: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

51

с ΔR=90-X=Х → разные ЯЛ;

во ΔR=91-95=4≤10 → одна ЯЛ;

два ΔR=92-X=Х → разные ЯЛ;

п ΔR=93-X=Х → разные ЯЛ;

больше ΔR=94-44=50>10 → разные ЯЛ;

всего ΔR=95-X=Х → разные ЯЛ;

потом ΔR=96-X=Х → разные ЯЛ;

тут ΔR=97-X=Х → разные ЯЛ;

сегодня ΔR=98-78=20>10 → разные ЯЛ;

теперь ΔR=99-85=14>10 → разные ЯЛ;

сейчас ΔR=100-81=9≤10 → одна ЯЛ;

дождь ΔR=Х-96=Х → разные ЯЛ;

тогда ΔR=Х-97=Х → разные ЯЛ;

много ΔR=Х-98=Х → разные ЯЛ;

равно ΔR=Х-99=Х → разные ЯЛ;

хотеть ΔR=Х-6=Х → разные ЯЛ;

сам ΔR=Х-16=Х → разные ЯЛ;

еще ΔR=Х-19=Х → разные ЯЛ;

нужно ΔR=Х-60=Х → разные ЯЛ;

ничего ΔR=Х-51=Х → разные ЯЛ;

лишь ΔR=Х-68=Х → разные ЯЛ;

думать ΔR=Х-63=Х → разные ЯЛ;

глаз ΔR=Х-72=Х → разные ЯЛ;

нравиться ΔR=Х-70=Х → разные ЯЛ;

делать ΔR=Х-73=Х → разные ЯЛ;

хотя ΔRг=Х-74=Х → разные ЯЛ;

ли ΔR=Х-76=Х → разные ЯЛ;

друг ΔR=Х-77=Х → разные ЯЛ;

почему ΔR=Х-80=Х → разные ЯЛ;

совсем ΔR=Х-82=Х → разные ЯЛ;

жить ΔR=Х-83=Х → разные ЯЛ;

Page 282: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

52

мир ΔR=Х-86=Х → разные ЯЛ;

ведь ΔR=Х-87=Х → разные ЯЛ;

хорошо ΔR=Х-88=Х → разные ЯЛ;

всегда ΔR=Х-89=Х → разные ЯЛ;

любовь ΔR=Х-91=Х → разные ЯЛ;

стать ΔR=Х-94=Х → разные ЯЛ.

Page 283: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

53

Приложение П

Таблица П.1 – Идентификационное моделирование по таблице В.1 (словники

А – В) вторым способом: ΔR= R1 –R2

Слово Расчеты → Результат

я ΔR= 1-5 = 4≤10 → одна ЯЛ;

это ΔR=2-1=1≤10 → одна ЯЛ;

то ΔR=3-7=4≤10 → одна ЯЛ;

он ΔR=4-4=0≤10 → одна ЯЛ;

есть ΔR=5-3=2≤10 → одна ЯЛ;

как ΔR=6-6=0≤10 → одна ЯЛ;

но ΔR=7-8=1≤10 → одна ЯЛ;

у ΔR=8-10=2≤10 → одна ЯЛ;

по ΔR=9-9=0≤10 → одна ЯЛ;

тот ΔR=10-11=1≤10 → одна ЯЛ;

вы ΔR=11-27=16>10 → разные ЯЛ;

так ΔR=12-19=7≤10 → одна ЯЛ;

к ΔR=13-13=0≤10 → одна ЯЛ;

она ΔR=14-12=2≤10 → одна ЯЛ;

все ΔR=15-17=2≤10 → одна ЯЛ;

за ΔR=16-21=5≤10 → одна ЯЛ;

из ΔR=17-14=3≤10 → одна ЯЛ;

же ΔR=18-26=8≤10 → одна ЯЛ;

который ΔR=19-15=4≤10 → одна ЯЛ;

ты ΔR=20-34=14>10 → разные ЯЛ;

что ΔR=21-22=1≤10 → одна ЯЛ;

мы ΔR=22-23=1≤10 → одна ЯЛ;

если ΔR=23-24=1≤10 → одна ЯЛ;

они ΔR=24-18=6≤10 → одна ЯЛ;

от ΔR=25-20=5≤10 → одна ЯЛ;

мой ΔR=26-32=6≤10 → одна ЯЛ;

такой ΔR=27-30=3≤10 → одна ЯЛ;

Page 284: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

54

мочь ΔR=28-28=0≤10 → одна ЯЛ;

о ΔR=29-33=4≤10 → одна ЯЛ;

бы ΔR=30-35=5≤10 → одна ЯЛ;

только ΔR=31-39=8≤10 → одна ЯЛ;

кто ΔR=32-49=17>10 → разные ЯЛ;

и ΔR=33-29=4≤10 → одна ЯЛ;

уже ΔR=34-40=6≤10 → одна ЯЛ;

вс ΔR=35-38=3≤10 → одна ЯЛ;

свой ΔR=36-25=11>10 → разные ЯЛ;

до ΔR=37-43=6≤10 → одна ЯЛ;

один ΔR=38-56=18>10 → разные ЯЛ;

в ΔR=39-31=8≤10 → одна ЯЛ;

вот ΔR=40-42=2≤10 → одна ЯЛ;

ну ΔR=41-60=19>10 → разные ЯЛ;

для ΔR=42-36=6≤10 → одна ЯЛ;

даже ΔR=43-59=16>10 → разные ЯЛ;

какой ΔR=44-50=6≤10 → одна ЯЛ;

когда ΔR=45-55=10≤10 → одна ЯЛ;

не ΔR=46-48=2≤10 → одна ЯЛ;

себя ΔR=47-46=1≤10 → одна ЯЛ;

нет ΔR=48=52=4≤10 → одна ЯЛ;

да ΔR=49-58=9≤10 → одна ЯЛ;

или ΔR=50-47=3≤10 → одна ЯЛ;

т ΔR=51-45=6≤10 → одна ЯЛ;

знать ΔR=52-65=13>10 → разные ЯЛ;

м ΔR=53-54=1≤10 → одна ЯЛ;

просто ΔR=54-67=13>10 → разные ЯЛ;

самый ΔR=55-51=4≤10 → одна ЯЛ;

ещ ΔR=56-44=12>10 → разные ЯЛ;

этот ΔR = 57-62=5≤10 → одна ЯЛ;

человек ΔR=58-41=17>10 → разные ЯЛ;

Page 285: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

55

там ΔR=59-70=12>10 → разные ЯЛ;

чтобы ΔR=60-76=16>10 → разные ЯЛ;

день ΔR=61-75=14>10 → разные ЯЛ;

время ΔR=62-53=9≤10 → одна ЯЛ;

ни ΔR=63-66=3≤10 → одна ЯЛ;

на ΔRг=64-69=5≤10 → одна ЯЛ;

вообще ΔR=65-71=6≤10 → одна ЯЛ;

ли ΔR=66-X=Х → разные ЯЛ;

раз ΔR=67-68=1≤10 → одна ЯЛ;

еще ΔR=69-X=Х → разные ЯЛ;

сам ΔR=68-X=Х → разные ЯЛ;

другой ΔR=70-63=7≤10 → одна ЯЛ;

под ΔR=71-78=7≤10 → одна ЯЛ;

очень ΔR=72-73=1≤10 → одна ЯЛ;

при ΔR=73-64=1≤10 → одна ЯЛ;

жизнь ΔR=74-74=0≤10 → одна ЯЛ;

можно ΔR=75-90=15>10 → разные ЯЛ;

потому ΔR=76-82=6≤10 → одна ЯЛ;

со ΔR=77-86=9≤10 → одна ЯЛ;

первый ΔR=78-61=17>10 → разные ЯЛ;

без ΔR=79-84=5≤10 → одна ЯЛ;

мама ΔR=80-77=3≤10 → одна ЯЛ;

во ΔR=81-92=11>10 → разные ЯЛ;

е ΔR=82-70=12>10 → разные ЯЛ;

где ΔR=83-88=5≤10 → одна ЯЛ;

год ΔR=84-37=47>10 → разные ЯЛ;

дело ΔR=85-80=5≤10 → одна ЯЛ;

дом ΔR=86-81=5≤10 → одна ЯЛ;

потом ΔR=87-97=10≤10 → одна ЯЛ;

тоже ΔR=88-87=1≤10 → одна ЯЛ;

надо ΔR=89-89=0≤10 → одна ЯЛ;

Page 286: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

56

а ΔR=90-2=88>10 → разные ЯЛ;

сегодня ΔR=91-99=8≤10 → одна ЯЛ;

любить ΔR=92-79=2≤10 → одна ЯЛ;

два ΔR=93-93=0≤10 → одна ЯЛ;

тут ΔR=94-98=4≤10 → одна ЯЛ;

с ΔR=95-91=4≤10 → одна ЯЛ;

ч ΔR=96-82=14>10 → разные ЯЛ;

после ΔR=97-85=12>10 → разные ЯЛ;

хотя ΔR=98-X=Х → разные ЯЛ;

работа ΔR=99–X=Х → разные ЯЛ;

теперь ΔR=100-100=0≤10 → одна ЯЛ;

всего ΔR=96-X=Х → разные ЯЛ;

п ΔR=94-X=Х → разные ЯЛ;

весь ΔR=X–16=Х → разные ЯЛ;

ч ΔR=Х-81=Х → разные ЯЛ;

больше ΔR=Х-94=Х → разные ЯЛ;

сейчас ΔR=Х-100=Х → разные ЯЛ.

Page 287: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

57

Приложение Р

Таблица Р.1 – Идентификационное моделирование по таблице Г.1 (словники

Б – Г) вторым способом: ΔR= R1 –R2

Слово Расчет → Результат

есть ΔR=1-1=0≤10 → одна ЯЛ;

ты ΔR= ΔR=2-4=2≤10 → одна ЯЛ;

я ΔR=3-2=1≤10 → одна ЯЛ;

как ΔR=4-5=1≤10 → одна ЯЛ;

сам ΔR=14-16=2≤10 → одна ЯЛ;

он ΔR=5-7=2≤10 → одна ЯЛ;

себя ΔR=6-9=3≤10 → одна ЯЛ;

же ΔR=7-21=14>10 → разные ЯЛ;

мочь ΔR=8-10=2≤10 → одна ЯЛ;

бы ΔR=9-8=1≤10 → одна ЯЛ;

хотеть ΔR=10-6=4≤10 → одна ЯЛ;

но ΔR=12-24=12>10 → разные ЯЛ;

такой ΔR=13-22=9≤10 → одна ЯЛ;

знать ΔR=15-35=20>10 → разные ЯЛ;

что ΔR=16-13=3≤10 → одна ЯЛ;

тот ΔR=11-27=16>10 → разные ЯЛ;

она ΔR=17-20=3≤10 → одна ЯЛ;

еще ΔR=18-19=1≤10 → одна ЯЛ;

у ΔR=19-17=2≤10 → одна ЯЛ;

если ΔR=20-38=18>10 → разные ЯЛ;

мой ΔR=21-15=6≤10 → одна ЯЛ;

к ΔR=22-30=8≤10 → одна ЯЛ;

кто ΔR=23-14=9≤10 → одна ЯЛ;

это ΔR=24-3=21>10 → разные ЯЛ;

по ΔR=25-12=13>10 → разные ЯЛ;

мы ΔR=26-28=2≤10 → одна ЯЛ;

когда ΔR=27-18=9≤10 → одна ЯЛ;

Page 288: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

58

даже ΔR=28-39=11>10 → разные ЯЛ;

о ΔR=29-42=13>10 → разные ЯЛ;

человек ΔR=30-41=11>10 → разные ЯЛ;

нет ΔR=31-29=2≤10 → одна ЯЛ;

любить ΔR=32-52=20>10 → разные ЯЛ;

они ΔR=33-11=22>10 → разные ЯЛ;

день ΔR=34-49=15>10 → разные ЯЛ;

какой ΔRг=35-32=3≤10 → одна ЯЛ;

не ΔR=36-31=5≤10 → одна ЯЛ;

чтобы ΔR=37-25=12>10 → разные ЯЛ;

вот ΔR=38-46=8≤10 → одна ЯЛ;

за ΔR=39-23=16>10 → разные ЯЛ;

только ΔR=40-34=6≤10 → одна ЯЛ;

один ΔR=41-59=18>10 → разные ЯЛ;

все ΔR=42-47=5≤10 → одна ЯЛ;

от ΔR=43-26=17>10 → разные ЯЛ;

да ΔR=44-45=1≤10 → одна ЯЛ;

из ΔR=45-40=1≤10 → разные ЯЛ;

или ΔR=46-54=8≤10 → одна ЯЛ;

и ΔR=47-36=11>10 → разные ЯЛ;

уже ΔR=48-37=11>10 → разные ЯЛ;

делать ΔR=49-73=24>10 → разные ЯЛ;

очень ΔR=50-71=21>10 → разные ЯЛ;

время ΔR=51-65=14>10 → разные ЯЛ;

нравиться ΔR=52-70=18>10 → разные ЯЛ;

этот ΔR=53-33=20>10 → разные ЯЛ;

вы ΔR=54-43=11>10 → разные ЯЛ;

ну ΔR=55-61=6≤10 → одна ЯЛ;

любовь ΔR=57-91=34>10 → разные ЯЛ;

без ΔR=58-69=11>10 → разные ЯЛ;

ничего ΔR=59-51=8≤10 → одна ЯЛ;

Page 289: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

59

сейчас ΔR=60-81=21>10 → разные ЯЛ;

потому ΔR=61-57=4≤10 → одна ЯЛ;

до ΔR=62-48=14>10 → разные ЯЛ;

больше ΔR=63-44=19>10 → разные ЯЛ;

для ΔR=64-53=11>10 → разные ЯЛ;

жизнь ΔR=65-50=15>10 → разные ЯЛ;

в ΔR=66-62=4≤10 → одна ЯЛ;

вообще ΔR=67-67=0≤10 → одна ЯЛ;

глаз ΔR=68-72=4≤10 → одна ЯЛ;

жить ΔR=69-83=14>10 → разные ЯЛ;

нужно ΔR=69-83=14>10 → разные ЯЛ;

просто ΔR=71-55=16>10 → разные ЯЛ;

там ΔR=72-64=8≤10 → одна ЯЛ;

тоже ΔR=73-=Х → разные ЯЛ;

можно ΔR=74-58=16>10 → разные ЯЛ;

сегодня ΔR=75-78=3≤10 → одна ЯЛ;

хорошо ΔR=76-88=12>10 → разные ЯЛ;

ни ΔR=77-66=10≤10 → одна ЯЛ;

самый ΔR=78-X=Х → разные ЯЛ;

где ΔR=79-75=4≤10 → одна ЯЛ;

хотя ΔR=80-74=6≤10 → одна ЯЛ;

ли ΔR=81-76=5≤10 → одна ЯЛ;

раз ΔR=82-79=3≤10 → одна ЯЛ;

надо ΔR=84- Х=Х → разные ЯЛ;

всегда ΔR=85-89=4≤10 → одна ЯЛ;

много ΔR=86-98=12>10 → разные ЯЛ;

музыка ΔR=87-X=Х → разные ЯЛ;

лишь ΔR=88-68=20>10 → разные ЯЛ;

тогда ΔR=89-97=8≤10 → одна ЯЛ;

со ΔR=90-100=10≤10 → одна ЯЛ;

а ΔR=91-92=1≤10 → одна ЯЛ;

Page 290: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

60

потом ΔR=92-X=Х → разные ЯЛ;

почему ΔR=93-80=13>10 → разные ЯЛ;

с ΔR=94-X=Х → разные ЯЛ;

всего ΔR=95-X=Х → разные ЯЛ;

совсем ΔR=96-82=14>10 → разные ЯЛ;

равно ΔR=98-99=1≤10 → одна ЯЛ;

теперь ΔR=99-85=14>10 → разные ЯЛ;

на ΔR=100-90=10≤10 → одна ЯЛ;

во ΔR=97-95=2<10 → одна ЯЛ;

который ΔR=56-56=0≤10 → одна ЯЛ;

год ΔR=X-84=Х → разные ЯЛ;

дождь ΔR=X-96=Х → разные ЯЛ;

то ΔR=Х-93=Х → разные ЯЛ;

стать ΔRг=Х-94=Х → разные ЯЛ;

мир ΔRг=Х-86=Х → разные ЯЛ;

ведь ΔRг=Х-87=Х → разные ЯЛ.

Page 291: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

61

Приложение С

Таблица С.1 – Сопоставительная таблица самых частотных слов всех

исследуемых текстов

R

Частотный

словарь

современного

русского языка

А Б В Г

1

1 и я быть это быть

2 в это ты а я

3 не то я быть это

4 он он как он ты

5 на быть он я как

6 я как себя как хотеть

7 что но же то он

8 тот у мочь но бы

9 быть по бы по себя

10 с тот хотеть у мочь

2

11 а вы тот тот они

12 весь так но она по

13 это к такой к что

14 как она сам из кто

15 она все знать который мой

16 по за что весь сам

17 но из она все у

18 они же еще они когда

19 к который у так еще

20 у ты если от она

21 ты что мой за же

22 из мы к что такой

23 мы если кто мы за

Page 292: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

62

3

24 за они это если но

25 вы от по свой чтобы

26 так мой мы же от

27 же такой когда вы тот

28 от мочь даже мочь мы

29 сказать о о и нет

30 этот бы человек такой к

4

31 который только нет в не

32 мочь кто любить мой какой

33 человек и они о этот

34 о уже день бы только

35 один вс какой ты знать

36 еще свой не для и

37 бы до чтобы год уже

38 такой один вот вс если

39 только в за только даже

40 себя вот только уже из

5

41 свое ну один человек человек

42 какой для все вот о

43 когда даже от до вы

44 уже какой да ещ больше

45 для когда из т да

46 вот не или себя вот

47 кто себя и или все

48 да нет уже не до

49 говорить да делать кто день

50 год или очень какой жизнь

51 знать т время самый ничего

52 мой знать нравиться нет любить

53 до м этот время для

54 или просто вы м или

Page 293: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

63

6 55 если самый ну когда просто

56 время ещ который один который

57 рука этот любовь да потому

58 нет человек без даже можно

59 самый там ничего ну один

60 ни чтобы сейчас первый нужно

7

61 стать день потому этот ну

62 большой время до другой в

63 даже ни больше при думать

64 другой на для знать там

65 наш вообще жизнь ни время

66 свой ли в просто ни

67 ну раз вообще раз вообще

68 под сам глаз на лишь

69 где еще жить е без

70 дело другой нужно там нравиться

8

71 есть под просто вообще очень

72 сам очень там очень глаз

73 раз при тоже жизнь делать

74 чтобы жизнь можно день хотя

75 два можно сегодня чтобы где

76 там потому хорошо мама ли

77 чем со ни под друг

78 глаз первый самый любить сегодня

79 жизнь без где дело раз

80 первый мама хотя дом почему

9

81 день во ли ч сейчас

82 тута е раз потому совсем

83 во где думать без жить

84 ничто год надо после год

85 потом дело всегда со теперь

Page 294: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

64

86 очень дом много тоже мир

87 со потом музыка где ведь

88 хотеть тоже лишь надо хорошо

89 ли надо тогда можно всегда

90 при а со с на

10

91 голова сегодня а во любовь

92 надо любить потом два а

93 без два почему п то

94 видеть тут с больше стать

95 идти с всего всего во

96 теперь ч совсем потом дождь

97 тоже после во тут тогда

98 стоять хотя равно сегодня много

99 друг работа теперь теперь равно

100 дом теперь на сейчас со

Page 295: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

65

Приложение Т

Таблица Т.1 – Сопоставление словника Частотного словаря современного

русского языка [Ляшевская] и словника А (по таблице Д.1)

Слово Расчеты → Результат

и ΔRг=1-4=3≥2 → индивидуализированный;

в ΔRг=1-4=3≥2 → индивидуализированный;

не ΔRг=1-5=4≥2 → индивидуализированный;

он ΔRг=1-1=0<2 → типовой;

на ΔRг=1-7=6≥2 → индивидуализированный;

я ΔRг=1-1=0<2 → типовой;

что ΔRг=1-3=2≥2 → индивидуализированный;

тот ΔRг=1-1=0<2 → типовой;

быть ΔRг=1-1=0<2 → типовой;

с ΔRг=1-10=9≥2 → индивидуализированный;

а ΔRг=2-9=7≥2 → индивидуализированный;

весь ΔRг=2-X=Х → индивидуализированный;

это ΔRг=2-1=1<2 → типовой;

как ΔRг=2-1=1<2 → типовой;

она ΔRг=2-2=0<2 → типовой;

по ΔRг=2-1=1<2 → типовой;

но ΔRг=2-1=1<2 → типовой;

они ΔRг=2-3=1<2 → типовой;

к ΔRг=2-2=0<2 → типовой;

у ΔRг=2-1=1<2 → типовой;

ты ΔRг=3-2=1<2 → типовой;

из ΔRг=3-2=1<2 → типовой;

мы ΔRг=3-3=0<2 → типовой;

за ΔRг=3-2=1<2 → типовой;

вы ΔRг=3-1=2≥2 → индивидуализированный;

так ΔRг=3-2=1<2 → типовой;

же ΔRг=3-2=1<2 → типовой;

от ΔRг=3-3=0<2 → типовой;

Page 296: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

66

сказать ΔRг=3-X=Х → индивидуализированный;

этот ΔRг=3-6=3≥2 → индивидуализированный;

который ΔRг=4-2=2≥2 → индивидуализированный;

мочь ΔRг=4-3=1<2 → типовой;

человек ΔRг=4-6=2≥2 → индивидуализированный;

о ΔRг=4-3=1<2 → типовой;

один ΔRг=4-4=0<2 → типовой;

еще ΔRг=4-7=3≥2 → индивидуализированный;

бы ΔRг=4-3=1<2 → типовой;

такой ΔRг=4-3=1<2 → типовой;

только ΔRг=4-4=0<2 → типовой;

себя ΔRг=4-5=1<2 → типовой;

свое ΔRг=5-X=Х → индивидуализированный;

какой ΔRг=5-5=0<2 → типовой;

когда ΔRг=5-5=0<2 → типовой;

уже ΔRг=5-4=1<2 → типовой;

для ΔRг=5-5=0<2 → типовой;

вот ΔRг=5-4=1<2 → типовой;

кто ΔRг=5-4=1<2 → типовой;

да ΔRг=5-5=0<2 → типовой;

говорить ΔRг=5-X=Х → индивидуализированный;

год ΔRг=5-9=4≥2 → индивидуализированный;

знать ΔRг=6-6=0<2 → типовой;

мой ΔRг=6-3=3≥2 → индивидуализированный;

до ΔRг=6-4=2≥2 → индивидуализированный;

или ΔRг=6-5=1<2 → типовой;

если ΔRг=6-3=3≥2 → индивидуализированный;

время ΔRг=6-7=1<2 → типовой;

рука ΔRг=6-X=Х → индивидуализированный;

нет ΔRг=6-5=1<2 → типовой;

самый ΔRг=6-6=0<2 → типовой;

ни ΔRг=6-7=1<2 → типовой;

стать ΔRг=7-X=Х → индивидуализированный;

большой ΔRг=7-X=Х → индивидуализированный;

Page 297: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

67

даже ΔRг=7-5=2≥2 → индивидуализированный;

другой ΔRг=7-7=0<2 → типовой;

наш ΔRг=7-X=Х → индивидуализированный;

свой ΔRг=7-4=3≥2 → индивидуализированный;

ну ΔRг=7-5=2≥2 → индивидуализированный;

под ΔRг=7-8=1<2 → типовой;

где ΔRг=7-9=2≥2 → индивидуализированный;

дело ΔRг=7-9=2≥2 → индивидуализированный;

сам ΔRг=8-7=1<2 → типовой;

раз ΔRг=8-7=1<2 → типовой;

чтобы ΔRг=8-6=2≥2 → индивидуализированный;

два ΔRг=8-10=2≥2 → индивидуализированный;

там ΔRг=8-6=2≥2 → индивидуализированный;

чем ΔRг=8-X=Х → индивидуализированный;

глаз ΔRг=8-X=Х → индивидуализированный;

жизнь ΔRг=8-8=0<2 → типовой;

первый ΔRг=8-8=0<2 → типовой;

день ΔRг=8-7=1<2 → типовой;

тута ΔRг=9-X=Х → индивидуализированный;

вот ΔRг=9-X=Х → индивидуализированный;

ничто ΔRг=9-X=Х → индивидуализированный;

потом ΔRг=9-9=0<2 → типовой;

очень ΔRг=9-8=1<2 → типовой;

со ΔRг=9-8=1<2 → типовой;

хотеть ΔRг=9-X=Х → индивидуализированный;

ли ΔRг=9-7=2≥2 → индивидуализированный;

при ΔRг=9-8=1<2 → типовой;

голова ΔRг=10-X=Х → индивидуализированный;

надо ΔRг=10-9=1<2 → типовой;

без ΔRг=10-X=Х → индивидуализированный;

видеть ΔRг=10-X=Х → индивидуализированный;

идти ΔRг=10-X=Х → индивидуализированный;

теперь ΔRг=10-10=0<2 → типовой;

тоже ΔRг=10-10=0<2 → типовой;

Page 298: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

68

стоять ΔRг=10-X=Х → индивидуализированный;

друг ΔRг=10-X=Х → индивидуализированный;

дом ΔRг=10-8=2≥2 → индивидуализированный;

то ΔRг=X-1=Х → индивидуализированный;

все ΔRг=2-X=Х → индивидуализированный;

вс ΔRг=X-4=Х → индивидуализированный;

т ΔRг=6-X=Х → индивидуализированный;

м ΔRг=6-X=Х → индивидуализированный;

просто ΔRг=6-X=Х → индивидуализированный;

ещ ΔRг=6-X=Х → индивидуализированный;

вообще ΔRг=6-X=Х → индивидуализированный;

можно ΔRг=8-X=Х → индивидуализированный;

потому ΔRг=8-X=Х → индивидуализированный;

без ΔRг=8-X=Х → индивидуализированный;

мама ΔRг=8-X=Х → индивидуализированный;

во ΔRг=8-X=Х → индивидуализированный;

сегодня ΔRг=10-X=Х → индивидуализированный;

любить ΔRг=10-X=Х → индивидуализированный;

тут ΔRг=10-X=Х → индивидуализированный;

после ΔRг=106-X=Х → индивидуализированный;

хотя ΔRг=10-X=Х → индивидуализированный;

работа ΔRг=10-X=Х → индивидуализированный.

Page 299: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

69

Приложение У

Таблица У.1 – Сопоставление словника Частотного словаря современного

русского языка [Ляшевская ] и словника Б (по таблице Е.1)

Слово Расчеты → Результат

и ΔRг=1-5=4≥2 → индивидуализированный;

в ΔRг=1-7=6≥2 → индивидуализированный;

не ΔRг=1-4=3≥2 → индивидуализированный;

он ΔRг=1-1=0<2 → типовой;

на ΔRг=1-10=9≥2 → индивидуализированный;

я ΔRг=1-1=0<2 → типовой;

что ΔRг=1-2=1<2 → типовой;

тот ΔRг=1-2=1<2 → типовой;

быть ΔRг=1-X=Х → индивидуализированный;

с ΔRг=1-10=9≥2 → индивидуализированный;

а ΔRг=2-10=8≥2 → индивидуализированный;

весь ΔRг=2-X=Х → индивидуализированный;

это ΔRг=2-3=1<2 → типовой;

как ΔRг=2-1=1<2 → типовой;

она ΔRг=2-2=0<2 → типовой;

по ΔRг=2-3=1<2 → типовой;

но ΔRг=2-2=0<2 → типовой;

они ΔRг=2-4=2≥2 → индивидуализированный;

к ΔRг=2-3=1<2 → типовой;

у ΔRг=2-2=0<2 → типовой;

ты ΔRг=3-1=2≥2 → индивидуализированный;

из ΔRг=3-5=2≥2 → индивидуализированный;

мы ΔRг=3-3=0<2 → типовой;

за ΔRг=3-4=1<2 → типовой;

вы ΔRг=3-6=3≥2 → индивидуализированный;

так ΔRг=3-X=Х → индивидуализированный;

же ΔRг=3-1=2≥2 → индивидуализированный;

Page 300: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

70

от ΔRг=3-5=2≥2 → индивидуализированный;

сказать ΔRг=3-X=Х → индивидуализированный;

этот ΔRг=3-6=3≥2 → индивидуализированный;

который ΔRг=4-6=2≥2 → индивидуализированный;

мочь ΔRг=4-1=3≥2 → индивидуализированный;

человек ΔRг=4-3=1<2 → типовой;

о ΔRг=4-3=1<2 → типовой;

один ΔRг=4-5=1<2 → типовой;

еще ΔRг=4-2=2≥2 → индивидуализированный;

бы ΔRг=4-1=3≥2 → индивидуализированный;

такой ΔRг=4-2=2≥2 → индивидуализированный;

только ΔRг=4-4=0<2 → типовой;

себя ΔRг=4-1=3≥2 → индивидуализированный;

свое ΔRг=5-X=Х → индивидуализированный;

какой ΔRг=5-4=1<2 → типовой;

когда ΔRг=5-3=2≥2 → индивидуализированный;

уже ΔRг=5-5=0<2 → типовой;

для ΔRг=5-7=2≥2 → индивидуализированный;

вот ΔRг=5-4=1<2 → типовой;

кто ΔRг=5-3=2≥2 → индивидуализированный;

да ΔRг=5-3=2≥2 → индивидуализированный;

говорить ΔRг=5-X=Х → индивидуализированный;

год ΔRг=5-X=Х → индивидуализированный;

знать ΔRг=6-4=2≥2 → индивидуализированный;

мой ΔRг=6-3=3≥2 → индивидуализированный;

до ΔRг=6-7=1<2 → типовой;

или ΔRг=6-5=1<2 → типовой;

если ΔRг=6-2=4≥2 → индивидуализированный;

время ΔRг=6-6=0<2 → типовой;

рука ΔRг=6-X=Х → индивидуализированный;

нет ΔRг=6-4=2≥2 → индивидуализированный;

Page 301: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

71

самый ΔRг=6-8=2≥2 → индивидуализированный;

ни ΔRг=6-8=2≥2 → индивидуализированный;

стать ΔRг=7-X=Х → индивидуализированный;

большой ΔRг=7-X=Х → индивидуализированный;

даже ΔRг=7-3=4≥2 → индивидуализированный;

другой ΔRг=7-X=Х → индивидуализированный;

наш ΔRг=7-X=Х → индивидуализированный;

свой ΔRг=7-X=Х → индивидуализированный;

ну ΔRг=7-6=1<2 → типовой;

под ΔRг=7-X=Х → индивидуализированный;

где ΔRг=7-X=Х → индивидуализированный;

дело ΔRг=7-X=Х → индивидуализированный;

есть ΔRг=8-1=7≥2 → индивидуализированный;

сам ΔRг=8-2=6≥2 → индивидуализированный;

раз ΔRг=8-9=1<2 → типовой;

чтобы ΔRг=8-4=4≥2 → индивидуализированный;

два ΔRг=8-X=Х → индивидуализированный;

там ΔRг=8-8=0<2 → типовой;

чем ΔRг=8-X=Х → индивидуализированный;

глаз ΔRг=8-7=1<2 → типовой;

жизнь ΔRг=8-7=1<2 → типовой;

первый ΔRг=8-X=Х → индивидуализированный;

день ΔRг=8-4=4≥2 → индивидуализированный;

тута ΔRг=9-X=Х → индивидуализированный;

вот ΔRг=9-4=5≥2 → индивидуализированный;

ничто ΔRг=9-X=Х → индивидуализированный;

потом ΔRг=9-10=1<2 → типовой;

очень ΔRг=9-5=4≥2 → индивидуализированный;

со ΔRг=9-9=0<2 → типовой;

хотеть ΔRг=9-1=8≥2 → индивидуализированный;

ли ΔRг=9-8=1<2 → типовой;

Page 302: на соискание ученой степени кандидата ...d01.kemsu.ru/Content/AdvertAttachedFiles/7918a61a79c34f... · 2015-10-01 · Идентификация,

72

при ΔRг=9-X=Х → индивидуализированный;

голова ΔRг=10-X=Х → индивидуализированный;

надо ΔRг=10-9=1<2 → типовой;

без ΔRг=10-6=4≥2 → индивидуализированный;

видеть ΔRг=10-X=Х → индивидуализированный;

идти ΔRг=10-X=Х → индивидуализированный;

теперь ΔRг=10-10=0<2 → типовой;

тоже ΔRг=10-8=2<2 → индивидуализированный;

стоять ΔRг=10-X=Х → индивидуализированный;

друг ΔRг=10-X=Х → индивидуализированный;

дом ΔRг=10-X=Х → индивидуализированный.