· УДК 519 ББК 32.81 C 33 Сетевые модели в управлении /...

443
РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт проблем управления СЕТЕВЫЕ МОДЕЛИ В УПРАВЛЕНИИ СБОРНИК СТАТЕЙ Общая редакция Д. А. Новиков, О. П. Кузнецов, М. В. Губко Москва – 2011

Transcript of  · УДК 519 ББК 32.81 C 33 Сетевые модели в управлении /...

  • РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт проблем управления

    СЕТЕВЫЕ МОДЕЛИ В УПРАВЛЕНИИ

    СБОРНИК СТАТЕЙ

    Общая редакция – Д. А. Новиков, О. П. Кузнецов, М. В. Губко

    Москва – 2011

  • УДК 519 ББК 32.81 C 33

    Сетевые модели в управлении / Сборник статей (под

    ред. Д.А. Новикова, О.П. Кузнецова, М.В. Губко). – М.: Эгвес, 2011. – 443 с. ISBN 978-5-91450-067-9

    Настоящий сборник статей «Сетевые модели в управлении» сформи-рован на основе материалов специального выпуска электронного Сборника трудов «Управление большими системами» (ubs.mtas.ru) и посвящен зада-чам управления, в которых объект управления (и/или система управления) имеет сетевую структуру.

    Статьи разбиты на рубрики, отражающие скорее неформальную груп-пировку по актуальным научным направлениям, чем строгую претендую-щую на полноту классификацию:

    – сетецентрическое управление и многоагентные системы; – управление технологическими сетями; – сетевые модели в принятии решений; – когнитивные карты в управлении; – сетевые организации и социальные сети. Можно надеяться, что настоящий Сборник, демонстрируя единство

    возможных подходов к задачам сетевого управления объектами самой разной природы, не только будет интересен для ученых и практиков, но и сможет дать почву для интеграции усилий специалистов в разных разделах теории управления.

    ISBN 978-5-91450-067-9

    ИПУ РАН, 2011

  • 3

    СОДЕРЖАНИЕ

    Предисловие ............................................................................ 6

    СЕТЕЦЕНТРИЧЕСКОЕ УПРАВЛЕНИЕ И МНОГОАГЕНТНЫЕ СИСТЕМЫ

    Агаев Р. П., Чеботарев П. Ю. Сходимость и устойчивость в задачах согласования характеристик (обзор базовых результатов) .................... 8

    Бабак Л. Н., Щербатюк А. Ф. Об одном алгоритме поиска источника подводного шлейфа, основанном на использовании группы АНПА ....... 44

    Каляев И. А., Капустян С. Г., Гайдук А. Р. Самоорганизующиеся распределенные системы управления группами интеллектуальных роботов, построенные на основе сетевой модели.............................. 57

    Кузнецов О. П., Жилякова Л. Ю. Полные двусторонние ресурсные сети с произвольными пропускными способностями.................. 90

    Петрикевич Я. И. Линейные алгоритмы управления геометрическим расположением объектов в многоагентной системе.......... 114

    Щербаков П. С. Управление формациями: схема Ван Лоуна и другие алгоритмы.................................. 129

    УПРАВЛЕНИЕ ТЕХНОЛОГИЧЕСКИМИ СЕТЯМИ

    Ахметзянов А. В., Гребенник О. С. Выбор допустимых режимов отбора газа из скважин газовых месторождений .................................. 145

  • 4

    Бандурин И. И. Управление структурой оперативного обслуживания электрических сетей ...................................... 156

    Епифанов С. П., Зоркальцев В. И., Медвежонков Д. С. Модель гидравлической сети с регуляторами расхода....... 177

    Зоркальцев В. И., Пержабинский С. М. Модель оптимизации дефицита мощности электроэнергетической системы........................................... 191

    Стецюра Г. Г. Механизмы взаимодействия объектов сетевых цифровых систем....................................................... 209

    СЕТЕВЫЕ МОДЕЛИ В ПРИНЯТИИ РЕШЕНИЙ

    Бурков В. Н., Буркова И. В. Метод сетевого программирования в задачах управления проектами .......................................... 223

    Кононенко А. Ф., Шевченко В. В. О возможностях конструктивно-логического и сетевого представления операционных игр....................... 245

    Мазалов В. В., Печников А. А., Чирков А. В., Чуйко Ю. В. Задача дележа затрат на создание веб-коммуникатора как кооперативная игра....................... 254

    Харитонов В. А., Алексеев А. О. Сетевые механизмы анализа многофакторных рисков............................................ 264

  • 5

    КОГНИТИВНЫЕ КАРТЫ В УПРАВЛЕНИИ

    Абрамова Н. А., Воронина Т. А., Порцев Р. Ю. О методах поддержки построения и верификации когнитивных карт с применением идей когнитивной графики.......................... 285

    Горелова Г. В., Макарова Е. Л. Моделирование взаимосвязи проблем системы высшего образования и социально-экономической системы средствами когнитивного подхода ...................................... 304

    Кулинич А. А. Верификация когнитивных карт на основе объяснения прогнозов ........................................... 325

    СЕТЕВЫЕ ОРГАНИЗАЦИИ И СОЦИАЛЬНЫЕ СЕТИ

    Байбакова Е. Ю., Клочков В. В. Экономические аспекты формирования сетевых организационных структур в российской наукоемкой промышленности............................................... 342

    Губанов Д. А., Новиков Д. А. Модели унифицированного информационного управления в однородных социальных сетях........................................... 366

    Просвиркин Н. Ю. Экономико-математическая многокритериальная модель управления материальными потоками в сетевых интегрированных структурах............................ 387

    Райков А. Н. Сетевая экспертная поддержка решений .......................... 402

    Ратнер С. В. Сценарии стратификации научно-инновационной сети.................................................. 418

  • 6

    ПРЕДИСЛОВИЕ

    Настоящий сборник, носящий название «Сетевые модели в управлении» и содержащий ряд статей, опубликованных в специ-альном выпуске электронного Сборника трудов «Управление большими системами» (ubs.mtas.ru), посвящен задачам управле-ния, в которых объект управления (и/или система управления) имеет сетевую структуру.

    Согласно одному из определений, система – это совокупность элементов и связей между ними. Граф, по определению, задается множеством вершин (элементов) и множеством ребер (связей) между ними. Поэтому теория графов является естественным язы-ком моделирования структуры систем различной природы. Благо-даря своей «графичности» этот язык интуитивен и легко воспри-нимается даже людьми, далекими от математики. Возможно, теория графов сделала больше других формальных концепций для популяризации математики и внедрения математических моделей в практику. Более того, многие ученые называют теорию графов универсальным языком науки, позволяющим специалистам из различных областей легко понимать друг друга.

    Исследование сложных систем невозможно без их декомпо-зиции на более простые части. В рамках системного подхода неотъемлемым этапом постановки и решения задачи управления является описание пространственной, функциональной или логи-ческой структуры сложных объектов управления.

    Граф (сеть) описывает структуру, а интерпретация вершин и ребер зависит от природы объекта. Он может быть не только технологической (например, электрической) сетью, но, скажем, социальной сетью – совокупностью контактов, влияний и интере-сов группы людей, или сетью работ в управлении проектами, и т.д.

    Крупномасштабные (распределенные и др.) системы управле-ния также зачастую имеют сложную структуру, описываемую в терминах теории графов (традиция теории управления противо-поставляет сетевые структуры систем и/или объектов управления иерархическим). И именно сетевые структуры в последнее десяти-летие стали одним из объектов, привлекающих внимание многих специалистов по теории и практике управления (свидетельством тому является, в том числе, география авторов статей, вошедших в

  • 7

    настоящий сборник: Владивосток, Иркутск, Москва, Пермь, Пет-розаводск, Псков, Ростов-на-Дону, Таганрог).

    Статьи разбиты на рубрики, отражающие скорее неформаль-ную группировку по актуальным научным направлениям, чем строгую классификацию, претендующую на полноту.

    Обширный раздел «Сетецентрическое управление и много-агентные системы» посвящен актуальным и быстроразвивающим-ся направлениям теории управления, занимающимся проблемами децентрализованного группового управления, в основном, в тех-нических и информационных системах.

    Раздел с условным названием «Управление технологическими сетями» включает в себя статьи, посвященные управлению сетями различной природы – гидравлическими, электрическими, тепло-выми, сетями газо/нефтепроводов, сетями связи (в частности, компьютерными сетями) и др.

    Раздел «Сетевые модели в принятии решений» описывает за-дачи, использующие в той или иной степени интеграцию теорети-ко-графовых и теоретико-игровых моделей, а также моделей при-нятия решений.

    Раздел «Когнитивные карты в управлении» включает описа-ние инструментов для качественного сетевого моделирования динамики сложных экономических, социальных и других систем.

    Еще два перспективных направления теории управления, свя-занных уже с социально-экономическими системами, – это управ-ление сетевыми организациями и управление в социальных сетях. Раздел «Сетевые организации и социальные сети» отражает неко-торые новые результаты, полученные в рамках этих направлений.

    Можно надеяться, что настоящий Сборник, демонстрируя единство возможных подходов к задачам сетевого управления объектами самой разной природы, не только будет интересен для ученых и практиков, но и сможет дать почву для интеграции уси-лий специалистов в разных разделах теории управления.

    чл.-корр. РАН Д. А. Новиков, д.т.н., проф. О. П. Кузнецов,

    к.т.н. М. В. Губко

  • Сетецентрическое управление и многоагентные системы

    УДК 519.177+519.217.2+517.977.1ББК 22.18

    СХОДИМОСТЬ И УСТОЙЧИВОСТЬ В ЗАДАЧАХСОГЛАСОВАНИЯ ХАРАКТЕРИСТИК (ОБЗОР

    БАЗОВЫХ РЕЗУЛЬТАТОВ) 1

    Агаев Р. П.2 , Чеботарев П. Ю.3

    (Учреждение Российской академии наук Институт проблемуправления им. В. А. Трапезникова РАН, Москва)

    Статья представляет собой обзор базовых работ по проблемесогласования характеристик (consensus problem) в многоагент-ных системах и по устойчивости соответствующих процедур.Ее первая часть посвящена задаче согласования мнений агентовв дискретном времени. Во второй части рассмотрены более об-щие задачи согласования и предполагается, что каждый агентхарактеризуется 2d параметрами в d-мерном евклидовом про-странстве: координатами и проекциями скорости. Изучаютсяпроцедуры построения траекторий, согласованных с заданнымкурсом и выстраивающих (поддерживающих) предписанную кон-фигурацию группы объектов. При корректировке скорости каж-дый агент в качестве нового ее значения выбирает определен-ную функцию от значений характеристик своих «соседей» и соб-ственных характеристик. Информационные связи задаются ор-графом коммуникаций агентов. Для стабилизации используетсялинейная обратная связь. Устойчивость движения исследуетсяв терминах, характеризующих связность орграфа коммуникаций.

    Ключевые слова: многоагентные системы, децентрализован-ное управление, граф коммуникаций, консенсус, лапласовскийспектр, модель Де Гроота, устойчивость, управление.

    1 Работа выполнена при поддержке РФФИ (грант № 09-07-00371a)и Программы Президиума РАН «Математическая теория управления».

    2 Рафиг Пашаевич Агаев, к.т.н., с.н.с., доцент ([email protected]).3 Павел Юрьевич Чеботарев, д.ф.-м.н., в.н.с. ([email protected],

    Москва, ул. Профсоюзная, д. 65, тел. (495) 334-88-69).

    8

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    1. Введение

    Лишь за последние 7 лет опубликовано несколько тысяч ра-бот по теоретико-графовым моделям децентрализованного управ-ления в многоагентных системах. Для адекватного обзора всегоэтого направления подходит только формат книги. Наша задачаскромнее: обсудить базовые результаты анализа двух классов мо-делей. Первый из них включает модели последовательного усред-нения мнений агентов в дискретном времени. Исследования этихмоделей базируются на результатах теории однородных и неодно-родных цепей Маркова. Второй класс объединяет модели согла-сованного движения группы объектов в евклидовом пространствес поддержанием (выстраиванием) заданной геометрической кон-фигурации в непрерывном времени. Эти модели представляют-ся системами линейных дифференциальных уравнений. В моде-лях каждого из классов структура информационных связей междуагентами задается взвешенным ориентированным графом, а свой-ства траекторий процессов согласования характеристик опреде-ляются спектральными свойствами лапласовской матрицы этогоорграфа. Нашим приоритетом в настоящем обзоре является неширота охвата работ, а детальное рассмотрение и прослеживаниегенезиса базовых результатов.

    2. Основные определения

    Решение многих задач управления многоагентными систе-мами связано с исследованием спектров графов (орграфов) ком-муникаций и их древесной структуры. В литературе использу-ются различные матрицы соответствующих графов (см., напри-мер, [13, 22]). Пусть G – взвешенный орграф. Обозначим черезwij > 0 вес дуги орграфаG, направленной из вершины i в верши-ну j. Лапласовская матрица (или строчная лапласовская матри-ца) L = L(G) = (`ij) порядка N×N для взвешенного орграфаG определяется следующим образом: `ij = −wij , если j 6= i, и`ii = −

    ∑k 6=i `ik, i, j = 1, . . . , N . Нередко вместо лапласовской

    матрицы строится матрица Кирхгофа, которую обычно также обо-

    9

  • Сетецентрическое управление и многоагентные системы

    значают L = (`ij). Она определяется соотношениями `ij = −wji,если j 6= i, и `ii = −

    ∑k 6=i `ik, i, j = 1, . . . , N . Некоторые авторы

    [40] именно ее называют ориентированным лапласианом оргра-фа. Классы матриц Кирхгофа и лапласовских матриц совпадают.Если граф коммуникаций – неориентированный, то соответству-ющую матрицу всегда называют лапласовской и обозначают че-рез L.

    Для орграфов коммуникаций, в которых направления дугсоответствуют направлениям информационных потоков, удобноиспользовать матрицы Кирхгофа. В то же время, в теории це-пей Маркова для описания переходов между состояниями удобнопользоваться лапласовскими матрицами.

    Неотрицательная матрица P называется примитивной4, ес-ли она неразложима и имеет лишь одно собственное значение смаксимальным модулем. Стохастическая матрица – это неот-рицательная матрица с единичными строчными суммами. ЦепьМаркова называют ациклической, если ее матрица переходов при-митивна. Стохастическую матрицу P и соответствующую ей од-нородную цепь Маркова называют правильными, если у матрицыP нет собственных значений, отличных от единицы и равных помодулю единице. Если P – правильная и единица является ееоднократным собственным значением, то P и соответствующуюцепь называют регулярными.5 Для регулярной цепи при k → ∞пределы элементов p(k)ij матриц P

    k существуют и не зависят отi, но, вообще говоря, зависят от6 j. Регулярность эквивалентнапонятию SIA (Stochastic, Indecomposable, Aperiodic)7 , часто ис-пользуемому в англоязычной литературе. Говорят, что две мат-рицы являются однотипными, если все их ненулевые элементы

    4 Далее в терминологии в основном следуем [6].5 А. Н. Колмогоров, рассмотрев эргодический принцип, показал [8,

    условие (22b)], что эргодичность цепи эквивалентна ее регулярности.6 В [11] введено понятие положительно регулярной цепи, т.е. цепи,

    для которой дополнительно пределы p(k)ij при k →∞ все больше нуля.7 Стохастическая матрицы P является SIA, если limm→∞ Pm = Q

    и все строки Q одинаковы.

    10

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    находятся в одинаковых позициях.Если у стохастической матрицы хотя бы один столбец це-

    ликом положителен, то ее называют матрицей Маркова (см., на-пример, [12, 20]). Класс таких матриц обозначим через M. Сто-хастическая матрица P регулярна тогда и только тогда, когда длянекоторого натурального r P r является матрицей Маркова.

    3. Дискретные модели достижения консенсуса

    3.1. Модель Де ГроотаОдна из первых моделей достижения консенсуса была пред-

    ложена и изучена М. Де Гроотом. В [23] он рассмотрел задачусогласования субъективных оценок неизвестного параметра. Этиоценки сопоставлены членам группы, действующей как единаякоманда. В основе согласования мнений, т.е. получения единойоценки для всей группы, лежат итерации, последовательно сбли-жающие мнения агентов. Если s(0) = (s10, . . . , s

    N0 )

    T – вектор на-чальных мнений членов группы, а s(1) = (s11, . . . , s

    N1 )

    T – вектормнений на следующем шаге, то s(1) = Ps(0), где P – стоха-стическая матрица, элемент которой pij задает степень влияниямнения j-го агента на мнение i-го. На k-ом шаге получаем вектормнений s(k) = P ks(0). Согласие достижимо, если при некоторомs̄ ∈ R для всех i имеет место limk→∞ sik = s̄. Согласие дости-жимо при любых начальных мнениях в том и только том случае,если существует предельная матрица limk→∞ P k и все ее строкисовпадают, иными словами, если матрица P регулярна. Таким об-разом, в модели Де Гроота достижение консенсуса определяетсясходимостью степеней стохастической матрицы влияний.

    В [23] приведены некоторые достаточные условия сходимо-сти степеней P k: одно из них – наличие положительного столбцав матрице P k при некотором k, т. е. принадлежность P k классуMматриц Маркова (теорема 1 в [23]); другое – взаимная достижи-мость всех состояний цепи Маркова, соответствующей матрицеP, и ее апериодичность (в этом случае P примитивна) – теорема 2в [23].

    11

  • Сетецентрическое управление и многоагентные системы

    Вероятностный вектор8 π называют стационарным для сто-хастической матрицы P, если имеет место πTP = πT. Стацио-нарный вектор – левый собственный вектор P, соответствующийсобственному значению 1.

    Как отмечено в [23], согласие достигается тогда и толькотогда, когда существует вектор π = (π1, . . . , πN )T, такой, что длявсех i, j имеет место limk→∞ p

    (k)ij = πj . Общее мнение в этом

    случае определяется формулой∑N

    i=1 πisi0.

    Если согласие достижимо при любых начальных мнениях исогласованное мнение равно πTs(0) =

    ∑Ni=1 πis

    i0, то (см. тео-

    рему 3 в [23]) вектор π – единственный9 стационарный вектордля P .

    Если согласие достижимо и состояние i в цепи Маркова,определяемой P, невозвратно, то, как показано в [23], πi = 0 имнение i-го агента не влияет на согласованное мнение. Например,если матрица P имеет вид

    P =

    12 12 014

    34 0

    13

    13

    13

    ,то πT = (13 ,

    23 , 0) и консенсус определяется формулой

    13s

    10 +

    23s

    20.

    Поскольку состояние, соответствующее третьему агенту, – невоз-вратное, при определении консенсуса его мнение не учитывается.Для матрицы

    P =

    12

    12 0 0

    12

    12 0 0

    0 0 1212

    0 0 1212

    8 Вектор называется вероятностным, если все его компоненты

    неотрицательны и их сумма равна единице.9 В действительности, еще в [6] (§ 7 главы 13) отмечалось, что

    если P регулярна, то из уравнения π = PTπ вектор π определяетсяоднозначно и каждая строка матрицы предельных вероятностей естьрезультат его транспонирования.

    12

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    согласие, вообще говоря, не достигается. Но оно достижимо, вчастности, при s10 + s

    20 = s

    30 + s

    40. Существенный вопрос о том,

    при каких начальных векторах s(0) согласие достижимо в случаенерегулярной матрицы, в [23] не изучается. Мы обсудим его водной из следующих работ. Отметим, что здесь могут быть ис-пользованы, в частности, результаты [4]. Одним из важных при-менений модели Де Гроота является информационное управлениев социальных сетях [3].

    3.2. Обобщения модели Де ГроотаМодель Де Гроота была обобщена в работе Чаттерджи и Се-

    неты [20], где матрица коммуникаций меняется на каждом шаге,и итеративный процесс задается произведением матриц:(1) s(k) = PkPk−1 · · ·P1s(0).

    Решение задачи согласования мнений в такой постановкесводится к исследованию сходимости неоднородных цепей Мар-кова. Базовые результаты в этой области принадлежат Дж. Хадж-налу [26, 27]. Так, теорема 2 из [20] аналогична приводимой нижетеореме 3, полученной в [27]. Прежде чем перейти к результа-там [26, 27], приведем более раннюю теорему [12].

    Рассмотрим неоднородную цепь Маркова, характеризующу-юся последовательностью стохастических матриц P1, P2, . . . , ивведем обозначение

    (2) Hk =k∏

    i=1

    Pi, k = 1, 2, . . .

    Заметим, что порядок умножения матриц Pi в (2) отличаетсяот порядка умножения в (1).

    Отметим также, что как для неоднородных цепей Маркова,так и в задачах достижения согласия не представляет интересатривиальный случай Pi = 1vT, где vT – вероятностный вектор(см. стр. 91 в [20]). В этом случае для любой стохастическойматрицы S верно SPi = Pi, причем произведение PiS – такжематрица с одинаковыми строками. Таким образом, если в моде-ли (1) хотя бы один сомножитель имеет одинаковые строки, то

    13

  • Сетецентрическое управление и многоагентные системы

    согласие уже достигнуто, и матрицы-множители, стоящие слеваот матрицы с одинаковыми строками, не играют никакой роли.

    Пусть K1 – множество всех примитивных матриц. В [12]отмечается, что это множество не замкнуто относительно умно-жения. В K1 выделим подмножество K2 следующим образом:P ∈ K2 тогда и только тогда, когда произведение P на любуюматрицу из K1 – примитивная матрица. Нетрудно видеть, чтоесли у примитивной матрицы все элементы главной диагоналиположительны, то она принадлежит классу K2. Класс M такжевходит в K2.

    Теорема 1 [12]. 1) Если все матрицы последовательностиHk принадлежат классу K2 и наименьший элемент каждой мат-рицы не меньше некоторого фиксированного числа δ > 0,то цепьМаркова, определяемая этой последовательностью, является эр-годической.

    2) Если выполняется только второе условие, то для эрго-дичности цепи необходимо и достаточно, чтобы существова-ла бесконечная последовательность марковских стохастическихматриц вида Mni, ni−1 = Pni−1+1Pni−1+2 · · ·Pni , где i = 1, 2, . . .и n0 = 1.

    Данная теорема весьма полезна при исследовании эргодич-ности неоднородных цепей Маркова.

    Рассмотрим теперь результаты Хаджнала [26, 27], также при-менимые при решении задач согласования мнений в случае изме-няющейся матрицы влияний.

    В работе [26] рассматривается неоднородная цепь, матри-ца переходных вероятностей которой на каждом шаге регулярна.Автор вводит два специальных класса цепей Маркова и получаетдостаточные условия сходимости для каждого из них.

    Пусть Ui = limk→∞ P ki , i = 1, 2, . . .Цепь Маркова с матрицами Hk =

    (h

    (k)is

    )(см. (2)) называется

    слабо эргодической, если для всех i, j, s = 1, . . . , N имеет место(h

    (k)is −h

    (k)js

    )→ 0. Слабая эргодичность предполагает стремление

    к нулю разности между строками, но не предполагает существо-вания предела матрицHk. Цепь с матрицамиHk называют сильно

    14

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    эргодической, если для некоторого вероятностного вектора π(3) lim

    k→∞Hk = 1πT,

    где 1 – вектор из единиц. Из результатов [26] вытекаетСледствие 1. Если для неоднородной цепи1) последовательность U1, U2, . . . имеет предел U,2) ряд

    ∑(UjPj+1 − Uj) абсолютно сходится и

    3) limk→∞∏k

    j=1(1 − p(j)min) = 0, где p

    (j)min – наименьший эле-

    мент матрицы Pj ,то цепь с матрицами Hk сильно эргодична.

    Если выполняется только условие 3) следствия 1, то цепь –слабо эргодическая (теорема 2 в [26]).

    Еще одно условие сильной эргодичности дает теорема 2.Теорема 2 (теорема 3 в [26]). Если в неоднородной цепи

    Маркова все матрицы переходных вероятностей образуют ко-нечное коммутативное семейство регулярных матриц, то такаяцепь – сильно эргодическая.

    Для неоднородной цепи Маркова, заданной последовательно-стью стохастических матриц P1, P2, . . . , слабая эргодичность невлечет сильную. Но в модели согласования мнений Чаттерджи иСенеты стохастические матрицы умножаются в обратном поряд-ке, и можно показать, что аналоги слабой и сильной эргодичностиэквивалентны. Несколько иначе обстоит дело, когда вместо по-следовательности P1, P2, . . . используется Pr, Pr+1, . . . , где дляданной цепи r может принимать любое натуральное значение. Вэтом случае для «обратного» порядка умножения стохастическихматриц, как и для «прямого», сильная эргодичность не вытекаетиз слабой.

    Пусть Hr,k = (h(r,k)ij ) – стохастические матрицы, определяе-

    мые следующим образом [27]:

    (4) Hr,k =k∏

    i=1

    Pr+i,

    где Pi – исходные стохастические матрицы.В [27] изучается сходимость последовательностей Hr,k при

    k → ∞. Как и ранее, для цепи, характеризующейся матрицами

    15

  • Сетецентрическое управление и многоагентные системы

    Hr,k, могут быть введены понятия слабой эргодичности, когда для

    всех i, j, s = 1, . . . , N и r > 0 имеет место (h(r,k)is − h(r,k)js ) → 0, и

    сильной эргодичности, когда для всех r > 0 верно(5) lim

    k→∞Hr,k = 1πTr ,

    где πr – некоторый вероятностный вектор, зависящий от r. Присильной эргодичности (из которой следует слабая эргодичность)мнения агентов не только сближаются, но и стабилизируются.

    Даже если разности между строками матрицы Hr,k не стре-мятся к нулю при k → ∞, такое стремление при определенныхусловиях может быть обеспечено умножением Hr,k слева на однуили несколько матриц, не являющихся эргодическими.

    Известно, что произведение двух разложимых матриц можетбыть регулярной матрицей. И наоборот, произведение регуляр-ных матриц может быть разложимой матрицей. Практическийинтерес представляет класс регулярных матриц со следующимисвойствами:

    1) если две матрицы принадлежат данному классу, то их про-изведение также ему принадлежит;

    2) наличие у цепи, удовлетворяющей определенному есте-ственному условию, бесконечного числа матриц из этого классаобеспечивает ее эргодичность.

    Как следует из достаточных условий сходимости степенейP k [23], в качестве такого класса может быть рассмотрено мно-жество матриц, содержащих хотя бы один столбец из ненулевыхэлементов.

    Матрицу P называют матрицей сцеплений, или скрембли-рующей матрицей (scrambling matrix), если для любых двух еестрок i и j существует хотя бы один столбец k такой, что pik > 0и pjk > 0.

    В [27] введена мера эргодичности λ(P ) для стохастическойматрицы:

    (6) λ(P ) = mini, j

    ∑k

    min(pik, pjk).

    Легко убедиться, что P – скремблирующая матрица тогда итолько тогда, когда λ(P ) > 0.

    16

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    Размахом m(P ) матрицы P называется величина(7) m(P ) = max

    kmax

    i,j|pik − pjk|.

    Дж. Хаджнал показал, что размах матрицы Hk =∏k

    i=1 Piсвязан с мерами эргодичности λ(Pi) следующим неравенством(теореме 2 в [27]):

    (8) m(Hk) 6k∏

    j=1

    (1− λ(Pi)).

    Следует отметить, что m(Hk) = 0 тогда и только тогда, когдавсе строки Hk равны. Это утверждение вместе с неравенством(8) позволяет доказать следующее необходимое и достаточноеусловие эргодичности неоднородной цепи Маркова.

    Теорема 3 [27]. Неоднородная цепь Маркова эргодична то-гда и только тогда, когда существует разбиение последова-тельности шагов (испытаний) на блоки, начинающиеся с ша-гов i1 = 0, i2, i3, . . . и такие, что

    ∏∞j=1(1− λ(Hij ,kj )) = 0, где

    kj = ij+1 − ij , j ∈ N.Из теории рядов известно, что если λ(Hijkj ) 6= 1, i =

    1, 2, . . . , то∏∞

    j=1(1 − λ(Hijkj )) = 0 тогда и только тогда, когда∑∞j=1 λ(Hijkj ) расходится. С использованием этого факта дока-

    зываетсяСледствие 2 (из теоремы 3). Если

    ∑∞j=1 λ(Pj) расходится,

    то цепь Маркова – эргодическая.Кроме того, в [27] доказана следующаяЛемма 1 [27]. Неоднородная цепь Маркова является

    эргодической, если все переходные матрицы регулярны иоднотипны.

    В задачах децентрализованного управления также часто ис-пользуется следующий важный результат.

    Теорема 4 [43]. Пусть P1, . . . , Pk – стохастические матри-цы одного порядка. Словом длины t назовем произведение t мат-риц (не обязательно различных) из этого набора. Пусть все слова– регулярные матрицы. Тогда для любого ε > 0 существует та-кое натуральное ν(ε), что для любого слова H длины t > ν(ε)выполняется m(H) < ε.

    17

  • Сетецентрическое управление и многоагентные системы

    Таким образом, если каждая матрица Pi, i = 1, . . . , k, явля-ется регулярной, то при росте w разница между строками матрицHw сходит на нет. В [43] отмечается, что одного лишь условиярегулярности (SIA) матриц Pi для получения этого вывода недо-статочно. Так, в следующем примере (где ∗ обозначает ненулевыеэлементы): ∗ 0 ∗1 0 0

    0 1 0

    0 1 00 0 1∗ 0 ∗

    =∗ ∗ ∗0 1 0

    0 0 1

    ,приведенном в [12], произведение двух регулярных матриц неявляется примитивной матрицей.

    Перейдем теперь к более сложным моделям согласованияхарактеристик.

    3.3. Дискретная модель согласованного движения по плоскостиВ [41] была предложена следующая модель движения N ав-

    тономных агентов по плоскости в разных направлениях. Направ-ление движения (курс) каждого агента в дискретные моментывремени t усредняется им с направлениями движения ni(t) егососедей, находящихся на расстоянии не более r от него и состав-ляющих множество Ni(t). В момент t = 0 положения агентовна плоскости произвольны; агенты имеют одинаковые по модулюи случайные по направлению скорости. Закон движения агентовимеет вид(9) xi(t+ 1) = xi(t) + vi(t)∆t.

    Скорость агента vi(t) имеет абсолютное значение v и на-правление, задаваемое углом s(t). Закон изменения направленийдвижения сводится к усреднению:

    (10) si(t+ 1) =1

    1 + ni(t)

    (si(t) +

    ∑j∈Ni(t)

    sj(t)),

    где ni(t) = |Ni(t)| .В [28] были получены условия сходимости для различных

    конфигураций группы агентов.

    18

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    Занумеруем все простые графы (неориентированные, без пе-тель, невзвешенные) на N вершинах. Пусть P – множество ихиндексов. Эти графы будем обозначать Gp, p ∈ P . Обозначимчерез Ap и Dp матрицу смежности и диагональную матрицу ва-лентностей (степеней вершин) графа Gp, где p ∈ P . Тогда модель(10) в матричной форме имеет вид(11) s(t+ 1) = Fσ(t)s(t),где s(t) = [s1t , . . . , s

    Nt ] – вектор направлений движения агентов,

    (12) Fσ(t) = (I +Dσ(t))−1(I +Aσ(t))

    и σ(t) : N → P – функция, моменту t сопоставляющая ин-декс неориентированного графа коммуникаций в этот момент.В [28] функция σ(t) названа переключающим сигналом. Сходи-мость каждого состояния si(t) к s̄ равносильна сходимости s(t)к s̄1. Однако процесс может и не сходиться, если, например, длянекоторого агента i при любом t ∈ N множество Ni(t) пусто.В другом крайнем случае, если каждый агент взаимодействуетсо всеми остальными при всех t, то граф Gσ(t) полон, и прилюбом начальном состоянии процесс сходится. Представляет ин-терес промежуточный случай, когда не для всех t графы Gσ(t)полны. Исследованию этого случая и посвящена работа [28].

    Пусть Q ⊂ P – множество индексов всех связных графов.Из определения (12) матрицы Fp следует, что она стохастическаяи ее диагональные элементы отличны от нуля.

    Теорема 5 [28]. Если для всех t ∈ N σ(t) ∈ Q, то при любомs(0) верно

    limt→∞

    s(t) = s̄1,

    где число s̄ зависит только от s(0) и σ(t).Поскольку в [28] рассматриваются простые (т. е. неориен-

    тированные, невзвешенные, без петель) графы, в силу условиятеоремы 5 каждая матрица Fp является примитивной, более то-го, принадлежит классу K2, и ее минимальный положительныйэлемент не меньше 1N+1 . Поэтому теорема 5 есть частный случайпункта 1 теоремы 1, из которой следует, что аналог теоремы 5верен также и для ориентированного графа.

    19

  • Сетецентрическое управление и многоагентные системы

    Условие теоремы 5 может быть ослаблено. Для этого вводит-ся понятие совместной связности совокупности графов. Графы(G1, . . . , Gm) совместно связны, если их объединение – связныйграф. О связности группы N агентов на временном отрезке [t, τ ]говорят, если графы (Gσ(t), Gσ(t+1), . . . , Gσ(τ)) совместно связ-ны.

    Теорема 6 [28]. Пусть начальное состояние s(0) фиксиро-вано и для функции σ(t) имеется бесконечная совокупность по-следовательных непустых ограниченных интервалов [ti, ti+1),i > 0, такая, что на каждом из этих интервалов группа Nагентов связна. Тогда

    limt→∞

    s(t) = s̄1,

    где число s̄ зависит только от s(0) и σ(t).Доказательство этой теоремы основано на теореме Вольфо-

    вица (теорема 4 выше) и на результате (см. лемму 1 в [28]), соглас-но которому для любого множества индексов {p1, . . . , pm} ⊂ P,если Gp1 , . . . , Gpm – совместно связные графы, то произведениесоответствующих стохастических матриц есть примитивная мат-рица.

    Пусть P есть (N−1)×N матрица рангаN−1 с ядром, натяну-тым на вектор 1. Нетрудно доказать10 , что матричное уравнение(13) PFp = F̃pP, p ∈ Pимеет единственное решение F̃p с таким спектром Sp(F̃p), чтоSp(F̃p) ∪ {1} = Sp(Fp), из чего следует(14) PFpiFpi−1 · · ·Fp0 = F̃piF̃pi−1 · · · F̃p0P, p ∈ P.

    Сходимость произведения FpiFpi−1 · · ·Fp0 к 1cT равносильнасходимости F̃piF̃pi−1 · · · F̃p0 к нулевой матрице. Например, если

    10 Для этого, например, в соотношении (13) матрицу P можно заме-нить на квадратную, добавив к ней строку [1 . . . 1], а F̃p – на блочно-диагональную матрицу из двух блоков, один из которых равен F̃p, адругой – единичный.

    20

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    p0, p1, . . . – бесконечная последовательность индексов, принадле-жащих Q, то11 в силу теоремы 4 выполняется(15) lim

    i→∞F̃piF̃pi−1 . . . F̃p0 = 0.

    Отметим, что (15) имеет место, если существует единствен-ная положительно определенная матрица M (общая матрица Ля-пунова), для которой все матрицы F̃Tp MF̃p −M, p ∈ Q являютсяотрицательно определенными (см., например, лемму П.19 в [10]для случая симметричных матриц).

    Однако, как отмечается в [28, с. 992], все матрицы F̃p, p ∈ Qмогут быть стабильными (т. е. иметь спектральный радиус, мень-ший единицы), но при этом может не существовать общей матри-цы Ляпунова M . Поэтому подход авторов статьи, основанный наиспользовании метода Ляпунова для сходящейся последователь-ности, не является универсальным.

    Преобразуем формулу (12):

    Fσ(t) = (I +Dσ(t))−1(I +Aσ(t)) =(16)

    = (I +Dσ(t))−1(I +Dσ(t) − (Dσ(t) −Aσ(t))) =

    = I − (I +Dσ(t))−1(Dσ(t) −Aσ(t)) == I − (I +Dσ(t))−1Lσ(t).

    Согласно (16) модель (11) представима в виде(17) s(t+ 1) = s(t)− (I +Dσ(t))−1Lσ(t)s(t) = s(t) + u(t).В [28] величина u(t) = −(I + Dσ(t))−1Lσ(t)s(t) трактуется какдецентрализованное управление.

    Таким образом, здесь используется общая идея децентрали-зованного управления: для достижения выбранной цели (в дан-ном случае – согласия) состояние каждого агента на каждом шагекорректируется с использованием «невязок» – разностей междухарактеристиками данного агента и его «соседей». Тем самым,управляющие воздействия формируются не централизованно, акаждым агентом отдельно – на основании его текущего состоя-ния и информации, полученной от «соседей».

    11 В силу конечности N некоторые матрицы Fp повторяются.

    21

  • Сетецентрическое управление и многоагентные системы

    Теорема 6 остается верна, если в (11)–(12) заменить матрицуI+Dσ(t) на диагональную матрицу gI, где g > N . Очевидно, чтои в этом случае симметричная матрица (см. (16)) Fp = I − 1gLp,p ∈ P остается стохастической.

    Лидером называют агента i, для которого Ni = ∅. Сле-дуя [28], рассмотрим группу агентов {0, 1, . . . , N} с одним лиде-ром; пусть, без ограничения общности, это агент 0. Предположим,как и ранее, что все агенты движутся с одинаковыми и постоян-ными по модулю скоростями, причем, в отличие от курсов другихагентов, курс s̄ лидера остается постоянным. Граф коммуникацийагентов обозначим через Gp (и множество индексов таких графов– через P), а граф, полученный из Gp удалением вершины 0 ивсех инцидентных ей ребер, обозначим Gp. Для каждого агентаi ∈ {1, . . . , N} закон изменения курса имеет вид

    (18) si(t+ 1) =1

    1 + ni(t) + bi(t)

    (si(t) +

    ∑j∈Ni(t)

    sj(t) + bi(t)s̄),

    где bi(t) = 1, если агент i связан ребром с лидером; в противномслучае bi(t) = 0.

    Пусть Bp – диагональная матрица порядка N, у которой i-ыйдиагональный элемент равен 1, если в графе Gp вершины i и 0связаны ребром. В противном случае i-ый диагональный элементравен 0. Как и ранее, Ap – матрица смежности графа Gp.

    Перепишем (18) в матричной форме:(19) s(t+1)=(I+Dσ(t)+Bσ(t))

    −1((I+Aσ(t))s(t)+Bσ(t)1s̄), t∈N∪{0}.Теорема об условиях сходимости курсов движения всех N

    агентов к курсу s̄ лидера (теорема 4 в [28]) аналогична теореме 6.При этом если графы Gσ(t), Gσ(t+1), . . . , Gσ(τ), относящиеся кинтервалу [t, τ ], совместно связны, то говорят, что на этом интер-вале все N агентов связаны с лидером.

    В моделях с одним лидером и непрерывным изменени-ем графа коммуникаций часто наблюдается эффект «вибрации»(chattering) положения агентов. Чтобы ее избежать, предполага-ют, что агенты обмениваются информацией и корректируют своипараметры не постоянно, а через фиксированные интервалы вре-мени τd > 0. Тем самым задача сводится к дискретной, и для нее22

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    имеет место следующий результат: пусть τd, s(0) и s̄ фиксирова-ны, σ : [0,∞) → Pp – кусочно-постоянная функция с моментами«переключений» ti, отстоящими не менее, чем на τd, и существу-ет бесконечная последовательность ограниченных непересекаю-щихся интервалов [ti, ti+1], в пределах каждого из которых все Nагентов связаны с лидером. Тогда

    limt→∞

    s(t) = s̄1.

    Следует отметить, что некоторые из перечисленных выше ре-зультатов [28] являются частными случаями теорем, полученныхдругими авторами задолго до этой работы. Так, модель, обобщаю-щая (10), была изучена в работах Тситсиклиса и Бертсекаса (см.,например, [39, 17]), что отмечено в их заметке [18].

    Замечание 1. Теорема 6 доказана в [28] довольно рутин-ным методом. Но в этом доказательстве нет необходимости, таккак в силу симметричности матриц Fp требуемое утверждениеможет быть выведено из пункта 1 теоремы 1. Действительно,нетрудно доказать, что если Fσ(ti), Fσ(ti+1), . . . , Fσ(ti+1) – сим-метричные матрицы, соответствующие совместно связным гра-фам Gσ(ti), Gσ(ti+1), . . . , Gσ(ti+1), то Ti =

    ∏ti+1k=ti

    Fσ(k) – неразло-жимая матрица с положительными диагональными элементами иTi ∈ K. Поэтому согласно пункту 1 теоремы 1 соответствующаянеоднородная цепь регулярна.

    Модель, рассмотренная в данном подразделе, является связу-ющим звеном между первой и второй частями настоящего обзо-ра. Это «еще» дискретная модель, но «уже» модель физическогодвижения. Во второй части обзора будут рассмотрены модели, вкоторых агенты, совершая групповое движение в евклидовом про-странстве, динамически корректируют свои координаты и скоро-сти в непрерывном времени с целью поддержания определеннойгеометрической конфигурации.

    23

  • Сетецентрическое управление и многоагентные системы

    4. Непрерывные модели согласованияхарактеристик

    4.1. Модель с коррекцией скоростейВ этом разделе мы обсудим основные результаты из [40, 30,

    29, 19, 42], касающиеся процедур построения траекторий, согла-сованных с заданным курсом и выстраивающих (поддерживаю-щих) предписанную конфигурацию группы объектов.

    Предположим теперь, что каждый агент (объект) i из группыN объектов движется в d-мерном пространстве Rd и характери-зуется 2d-мерным вектором координат и проекций скорости. Вреальных приложениях d равно 2 или 3.

    Пусть X = {1, . . . , N} ×R2d. Каждый элемент z ∈ X харак-теризуется 2dN действительными координатами. При этом пер-вые 2d компонент задают положение и скорость первого агента,следующие 2d компонент – положение и скорость второго аген-та и т.д. Каждой нечетной компоненте соответствует координатаагента, а четной – проекция его скорости на ту же ось. С помощьюкронекерова произведения каждый элемент z ∈ X представляетсяв виде

    (20) z =N∑

    i=1

    ei ⊗ zi,

    где ei – N -мерный вектор с единицей в i-ой позиции и нулямив остальных позициях; zi – вектор координат и проекций скоро-сти i-го агента, имеющий 2d компонент. Если si = (si1, . . . , s

    id)

    T

    – положение, а vi = (vi1, . . . , vid)

    T – скорость i-го агента, то zможно записать в виде

    (21) z =N∑

    i=1

    ei ⊗(si ⊗

    (10

    )+ vi ⊗

    (01

    )).

    Каждому i-му агенту в группе ставится в соответствие своепредписанное положение (место) в группе, задаваемое в виде hi =(hi1, . . . , h

    id) ∈ Rd.

    Пусть

    z=(z1, . . . , zN )T, zi =(si1, vi1, . . . , s

    id, v

    id)

    T, hs =(h1, . . . , hN )T,24

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    где верхний индекс задает номер агента.Определение 1. 1. Вектором конфигурации группы

    агентов называют вектор h ∈ X, определяемый следующимобразом [40, 30]:

    (22) h =N∑

    i=1

    ei ⊗ hi ⊗(

    10

    ).

    2. Орбита φ : R → X группы поддерживает конфигурацию(formation), если для некоторого

    α = p⊗(

    10

    )+ q ⊗

    (01

    ), где q =

    dp

    dt,

    она представляется в виде

    φ(t) = h+N∑

    i=1

    ei ⊗ α = h+ 1N ⊗ α.

    3. Группа сходится к заданной конфигурации, если существу-ют вектор-функции q(·), w(·) : R → Rd, для которых имеет ме-сто si(t)− hi − q(t) → 0 и vi(t)− w(t) → 0 при t→∞ для всехi = 1, . . . , N .

    Каждый агент следит за характеристиками своих «соседей»;отношение соседства не меняется. Он непрерывно усредняет(с весами) значения координат соседей, сравнивает результатыусреднения с собственными координатами и полученные разно-сти сравнивает с предписанными значениями. Например, еслисоседями агента i являются агенты j и k, и веса, с которыми учи-тываются координаты j и k, равны, то агент i вычисляет d-мерныйвектор (si − hi) − 1/2((sj − hj) + (sk − hk)) и d-мерный векторvi − 1/2(vj + vk). На основании полученных результатов произ-водится коррекция движения агента посредством «тяги», усилия(thrust).

    В общем случае для i-го агента с множеством соседей Ni

    25

  • Сетецентрическое управление и многоагентные системы

    закон движения имеет вид

    (23)

    ṡi1 =vi1

    v̇i1 =avi1+f

    ∑j∈Ni

    ((si1−hi1)−(s

    j1−h

    j1)

    )+g

    ∑j∈Ni

    (vi1−v

    j1

    ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .ṡid =v

    id

    v̇id =avid+f

    ∑j∈Ni

    ((sid−hid)−(s

    jd−h

    jd)

    )+ g

    ∑j∈Ni

    (vid−v

    jd

    )или в матричной форме(24) ż = (IN ⊗A)z + (IN ⊗K)(LN ⊗ I2d)(z − h),где LN – матрица Кирхгофа орграфа коммуникаций на N верши-нах. Элемент `ij < 0 тогда и только тогда, когда i-ый агент полу-чает информацию непосредственно от j-го агента, т. е. последнийявляется его соседом. В этом случае орграф коммуникаций, со-ответствующий данной матрице, содержит дугу (j, i). Посколькудля квадратных матриц A и B соответственно порядкаm и n име-ет место тождество (Im ⊗ B)(A ⊗ In) = A ⊗ B, (24) определяетболее компактное выражение(25) ż = (IN ⊗A)z + (LN ⊗K)(z − h).

    В работе [42] разности между параметрами i-го агента и егососедей задаются матрицей (LN ⊗ I2d)(z − h), а матрица IN ⊗K рассматривается как линейный фильтр, с помощью которогоможет быть обеспечена сходимость к заданной конфигурации.

    В данной модели матрица A имеет вид

    (26) A = diag((

    0 10 a

    ), . . . ,

    (0 10 a

    )),

    а в более общем случае

    (27) A = diag((

    0 1a121 a

    122

    ), . . . ,

    (0 1ad21 a

    d22

    ))и

    (28) K = diag((

    0 0f1 g1

    ), . . . ,

    (0 0fd gd

    )).

    В случае f1 = . . . = fd и g1 = . . . = gd эти величиныобозначаем f и g.

    26

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    Определение 2. Достижимым множеством R(v) для верши-ны v орграфа называют множество, полученное объединениемv со всеми вершинами, достижимыми из v. Охват12 R – макси-мальное достижимое множество.

    Очевидно, если орграф сильно связен, то он имеет лишь одинохват R.

    Далее будем использовать следующую декомпозицию мат-риц A и K порядка 2d:

    (29) A =4∑

    i=1

    Ai ⊗ Ji, K =4∑

    i=1

    Ki ⊗ Ji,

    где J1 =(

    1 00 0

    ), J2 =

    (0 10 0

    ), J3 =

    (0 01 0

    ), J4 =(

    0 00 1

    ), причем компоненты A1 и K1 задают связи позицион-

    ных элементов с позиционными, A2 и K2 – связи позиционныхэлементов с компонентами скорости и т.д. При этом из физиче-ских соображений можно заключить, что A1 = 0 и A2 = Id.

    Введем новую переменную y:

    (30) y = z − h− 1N ⊗(p⊗

    (10

    )+ q ⊗

    (01

    )).

    Пусть

    h =N∑

    i=1

    ei ⊗(ξi

    (10

    )+ ηi ⊗

    (01

    )),

    т. е., в отличие от (22), задаются не только положения, но и ско-рости.

    Предложение 1 (предложение 4.2 в [40]). Пусть орграфкоммуникаций группы из N агентов фиксирован. Тогда:

    1) система, описываемая уравнением (25), поддерживает за-данную конфигурацию тогда и только тогда, когда в (29)A3 = 0;при этом можно положить ηk = 0 для всех k;

    2) при заданных конфигурации и скоростях группы имеетместо ṗ = q и q̇ = A4q.

    12 Не путать с обхватом в теории графов.

    27

  • Сетецентрическое управление и многоагентные системы

    4.2. Задача устойчивостиСледующее определение основано на классической связи

    между устойчивостью системы (сходимостью ее траекторий) иотрицательностью действительных частей собственных значенийматрицы, соответствующей закону ее движения.

    Определение 3 [42]. Система, заданная уравнением (25),называется устойчивой, если при некоторой матрице K длякаждого ненулевого λ из спектра LN все собственные значе-ния матрицы A + λK имеют отрицательные действительныечасти.

    Теорема 7 [42]. Пусть система (25) устойчива при неко-торой матрице управления K. Тогда каждая орбита асимп-тотически сходится к некоторой орбите в h + V, где V –подпространство, порождаемое линейными комбинациями век-торов {γi ⊗ ρj} при всех i ∈ {1, . . . , k} и j ∈ {1, . . . , 2d}, γi –векторы, образующие базис ядра LN , ρj – независимые решенияуравнения ρ̇i = Aρi.

    Определение 4. Непустое подмножество вершин K ⊆V (G) орграфа G называют его базовой бикомпонентой, есливсе вершины, принадлежащие K, взаимно достижимы и нет дуг(wj , wi), где wi ∈ K, wj ∈ V (G)\K.

    В качестве примера рассмотрим группу из 5 агентов, ор-граф коммуникаций G которой имеет множество дуг E(G) ={(1, 2), (1, 3), (3, 4), (4, 3), (5, 4)}. В G две базовых бикомпо-ненты: {1} и {5}. Предположим, что A4 = aI4 и h =

    (0, 1, 2, 3, 4)T⊗(

    10

    ). В качестве базиса ядра матрицы LN возьмем

    γ1 = (1, 1, 23 ,13 , 0) и γ2 = (0, 0,

    13 ,

    23 , 1).

    Поскольку A =(

    0 10 a

    ), общее решение уравнения ρ′ = Aρ

    при a 6= 0 имеет вид

    ρ =(

    1 1aeat

    0 eat

    ) (c1c2

    ).

    28

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    При начальных условиях ρ(0) = (p0, q0) подпространствоV порождается кронекеровыми произведениями указанных вышевекторов γ1 и γ2 на систему независимых частных решений изполного множества решений

    (31)

    {(p0 −

    q0a

    ) (10

    )+q0a

    (1a

    )eat

    }уравнения ρ′ = Aρ.

    Поскольку порядок матрицы A равен двум, число линейнонезависимых решений вида (31) равно двум. Поэтому размер-ность пространства устойчивых решений задачи равна четырем.

    4.3. Условия устойчивостиСогласно предложению 1, приведенному выше, для управле-

    ния движением группы агентов может быть использована подхо-дящая матрицаA в (25). Покажем, как с помощью матрицK3 иK4система может быть стабилизирована (т. е. сделана устойчивой)при заданной матрице A.

    Пустьε = min

    λ∈Sp(L)\{0}Re(λ) > 0.

    Предположим, что A не меняется со временем. Диагональныеэлементы матриц A4, K3 и K4 обозначим соответственно черезam, fm и gm, где 1 6 m 6 d.

    Предложение 2 (предложение 5.1 в [40]). Для заданнойматрицы A4 система всегда может быть стабилизирова-на; для этого достаточно выбрать (gk, fk) такими, чтобывыполнялось fk < 0, gk < 0, fk > −gk(εgk + ak) для всехk ∈ {1, . . . , d}

    (эквивалентное условие: fk < 0, gk < 0 и

    ε > max{−(fk + akgk)/g2k, 0

    }).

    Критерий устойчивости системы (25) имеет более сложныйвид [30]; см. подраздел 4.5.

    В силу приведенных выше результатов для коррекции скоро-стей агентов может быть использована матрица A4. Так, средниескорости системы q0 и q1 в моменты t = 0 и t = 1 связаны соот-ношением q1 = eA4q0. Отметим, что для диагональной матрицы

    29

  • Сетецентрическое управление и многоагентные системы

    A4 отдельные проекции скорости не могут при данном подхо-де менять знак. Кроме того, использование (31) ограничиваетсятем фактом, что физические характеристики лишь краткосрочномогут расти экспоненциально.

    В заключение этого подраздела приведем пример, в которомсистема с заданной конфигурацией может менять направлениедвижения. Предположим, что d = 2, K3 = fId, K4 = gId, исистема движется по окружности на плоскости.

    Теорема 8 (теорема 5.2 в [40]). Пусть a0 > 0 фиксировано,

    fk < 0, gk < 0 и fk > −gk(εgk + a0). Если A4 =(

    0 −mm 0

    )и |m| 6 2

    √|εf + ε2g2k| 6= 0, то группа устойчиво движется

    по окружности кривизны κ = m/v0 с постоянной скоростьюv0 6= 0.

    4.4. Оценивание скорости сходимости к заданной конфигурацииСогласно определению 3 система, заданная уравнением (25),

    может не быть устойчивой даже при чисто действительном спек-тре матрицы LN . Это происходит, если собственные значениянекоторых диагональных (2×2)-блоков матрицы A + λiK придействительных λi, принадлежащих спектру LN , имеют неотри-цательные действительные части.

    Среди собственных значений матрицы системы (25) могутбыть комплексные. Характеристический многочлен системы ра-вен произведению квадратных трехчленов(32) x2 − (a22 + λg)x− λf,где f, g – элементы матрицы управления K. Дискриминант урав-нения x2 − (a22 + λg)x− λf = 0 есть(33) D = (a22 + λg)2 + 4λf.Чтобы не допустить приближения13 к 0 действительной частисобственного значения соответствующего диагонального блока, f

    13 Это приближение привело бы к замедлению (за счет корня (32),в запись которого дискриминант входит со знаком +) сходимости кзаданной конфигурации.

    30

  • Сходимость и устойчивость в задачах согласованияхарактеристик (обзор базовых результатов)

    при фиксированном g подбирают так, чтобы дискриминант (33)был отрицателен и соотношение

    (34)(a22 + λg)2

    4λ< −f

    выполнялось для всех λ из спектра LN .Таким образом (см. утверждение 6.1 в [30]) действительные

    части корней (32) равны (a22 + λg)/2, и показателем качествасходимости может служить величина (a22 +λ1g)/2, где λ1 – наи-меньшее собственное значение матрицы LN с действительнымспектром.

    Спектр матрицы LN для симметричного орграфа коммуни-каций всегда действителен. Но изложенный подход применим нетолько к симметричным орграфам, но и ко всем другим орграфамкоммуникаций, имеющим действительный спектр соответствую-щей матрицы. Отметим, что известный прием, состоящий в уве-личении скорости сходимости за счет колебаний, в этой задаче невсегда применим.

    4.5. Необходимое и достаточное условие устойчивостиВ этом подразделе мы рассмотрим критерий устойчивости

    системы с ориентированным графом коммуникаций между аген-тами.

    В [29] показано, что если при некоторой матрице управленияK для любой заданной конфигурации h каждое решение системыуравнений (25) сходится к h, то для матрицы A верно ai21 = 0,i = 1, . . . , d.

    Как было отмечено в [30] (замечание 4.3), если нуль – соб-ственное значение LN с алгебраической кратностью 1, то агентыподдерживают заданную конфигурацию h тогда и только тогда,когда (LN ⊗ I2d)(x − h) = 0. Действительно, ядро матрицы LNнатянуто на вектор 1 ∈ RN , а ядро LN ⊗ I2d – на векторы 1⊗ ei,где {ei} – стандартный базис в R2d.

    Если нуль – простое собственное значение матрицы LN ор-графа коммуникаций (или, эквивалентно, если орграф коммуни-каций содержит входящее корневое дерево для случая, когда дугипроводятся от лидеров и строится лапласовская матрица или же

    31

  • Сетецентрическое управление и многоагентные системы

    содержит исходящее корневое дерево, если дуги проводятся к ли-деру и строится матрица Кирхгофа [1, 22, 13]), то, как показано в[30] (теорема 4.4), устойчивость матрицыA+λK для всех ненуле-вых λ эквивалентна14 сходимости процесса, описываемого (25),к вектору заданной конфигурации h.

    Матрица A+ λK блочно-диагональна и каждый ее блок, по-вторяющийся d раз, имеет размерность 2. Заметим, что опре-делитель каждого такого блока выражается трехчленом ϕ(x) =x2 − (a22 + λg)x − λf, �