Metody identyfikacji układów ciągłych z wykorzystaniem...
Transcript of Metody identyfikacji układów ciągłych z wykorzystaniem...
PRACA DOKTORSKA
Metody identyfikacji układów ciągłychz wykorzystaniem funkcji modulujących
i sklejanych i ich zastosowaniew regulatorze adaptacyjnym
mgr inż. Marcin W. Nowak
Akademia Górniczo-Hutnicza
im. Stanisława Staszica
w Krakowie
Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
Katedra Automatyki
Promotor: dr hab. inż. Witold Byrski, profesor nadzw. AGH
Kraków, lipiec 2007
Pragnę podziękować Promotorowi za
poświęcony czas, okazaną wyrozumia-
łość i cenne uwagi.
Spis treści
1. Wstęp 1
2. Wprowadzenie 4
2.1. Współczesne systemy automatyki przemysłowej . . . . . . . . . . . . . . . . . . 4
2.1.1. Warstwa zarządzania produkcją . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.2. Warstwa optymalizacji statycznej . . . . . . . . . . . . . . . . . . . . . . 10
2.1.3. Warstwa nadzoru i koordynacji . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.4. Warstwa sterowania adaptacyjnego . . . . . . . . . . . . . . . . . . . . . 11
2.1.5. Warstwa sterowania bezpośredniego i zabezpieczeń . . . . . . . . . . . . 11
2.1.6. Implementacja komputerowych systemów sterowania . . . . . . . . . . . 13
2.2. Modele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3. Automat skończenie stanowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4. Regulacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1. Algorytmy regulacji klasycznej (nieadaptacyjne) . . . . . . . . . . . . . . 19
2.4.2. Regulacja adaptacyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5. Diagnostyka procesów przemysłowych . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6. Obserwatory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.7. Identyfikacja dynamiczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.8. Nowe badania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3. Splotowa metoda identyfikacji systemów ciągłych 32
3.1. Identyfikacja z użyciem funkcji modulującej . . . . . . . . . . . . . . . . . . . . 32
3.2. Omówienie zasad identyfikacji dla obiektów SISO . . . . . . . . . . . . . . . . . 33
3.3. Splotowa estymacja pochodnych sygnału . . . . . . . . . . . . . . . . . . . . . . 34
3.4. Dobór kształtu funkcji modulującej . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.5. Optymalna identyfikacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.5.1. Ograniczenie liniowe na wartość parametrów . . . . . . . . . . . . . . . . 38
3.5.2. Ograniczenie kwadratowe na wartości parametrów . . . . . . . . . . . . . 39
3.5.3. Wyliczenie wektorów własnych . . . . . . . . . . . . . . . . . . . . . . . 39
ii
3.6. Rozszerzane i ruchome okno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4. Optymalizacja kształtu funkcji modulujących 42
4.1. Przegląd funkcji modulujących . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2. Bazowe funkcje sklejane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.1. Krzywe B-sklejane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.2. Wybrane właściwości wielomianów bazowych . . . . . . . . . . . . . . . . 48
4.3. Optymalizacja kształtu funkcji φ(t) . . . . . . . . . . . . . . . . . . . . . . . . . 49
5. Funkcje sklejane w identyfikacji parametrów systemu dynamicznego 50
5.1. Metoda najmniejszych kwadratów . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2. Uogólniona metoda najmniejszych kwadratów . . . . . . . . . . . . . . . . . . . 53
5.3. Identyfikacja z wykorzystaniem funkcji sklejanych . . . . . . . . . . . . . . . . . 56
6. Regulator adaptacyjny 57
6.1. Obserwator bazujący na macierzy Toeplitza . . . . . . . . . . . . . . . . . . . . 57
6.2. Algorytm obserwacji stanu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.3. Adaptacyjny regulator liniowo-kwadratowy . . . . . . . . . . . . . . . . . . . . . 59
7. Rezultaty implementacji algorytmów identyfikacji i sterowania 61
7.1. Filtracja sygnału pomiarowego . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
7.1.1. Metody numeryczne filtracji splotowej . . . . . . . . . . . . . . . . . . . 61
7.1.2. Splotowa filtracja nieadaptacyjna . . . . . . . . . . . . . . . . . . . . . . 63
7.1.3. Splotowa filtracja adaptacyjna . . . . . . . . . . . . . . . . . . . . . . . . 64
7.1.4. Aproksymacja w całym horyzoncie czasowym . . . . . . . . . . . . . . . 66
7.1.5. Aproksymacja w ruchomym oknie . . . . . . . . . . . . . . . . . . . . . . 66
7.2. Identyfikacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7.3. Obserwacja stanu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.4. Regulacja LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.5. Identyfikacja w zamkniętej pętli . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.6. Fizyczny model wymiennika ciepła . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.7. Opracowanie wyników eksperymentów . . . . . . . . . . . . . . . . . . . . . . . 75
7.7.1. Neuralny model statyczny wymiennika . . . . . . . . . . . . . . . . . . . 76
7.7.2. Dobór parametrów modelu wymiennika . . . . . . . . . . . . . . . . . . . 77
8. Wnioski 88
Dodatek – stanowisko laboratoryjne 90
Bibliografia 91
iii
Streszczenie
W pracy przedstawiono zastosowanie bazowych funkcji sklejanych w zagadnieniu identyfika-
cji parametrów i estymacji stanu systemu ciągłego. Funkcje te użyto w zadaniu aproksymacji
niemierzonych pochodnych sygnału pomiarowego dla wejść/wyjść systemu.
Przedstawiono również ich zastosowanie do konstrukcji funkcji modulujących w splotowej
metodzie estymacji parametrów systemu ciągłego. Optymalne parametry systemu są wyliczane
wtedy jako wektor własny skojarzony z najmniejszą wartością własną odpowiedniej macierzy
Grama. Metoda ta dodatkowo rekonstruuje niemierzony stan systemu, który może zostać wyko-
rzystany w stabilizującym regulatorze adaptacyjnym LQR.
Abstract
The PhD thesis presents the application of the basis spline function in the parameter iden-
tification method and state reconstruction of linear continuous system for adaptive self-tuning
control. For the approximation of the unmeasured derivative of the measured input/output sys-
tem’s signal, B-spline functions were used.
Additionally, basis spline function was applied to construction of the modulating function by
convolution method used for parameters estimation of the continuous-time system. The optimal
parameters of the system are calculated as eigenvector associated with the minimal eigenvalue
of the Gram matrix. This method simultaneously reconstructs unmeasured state of the system
witch will be used for adaptive stabilizing controller.
Rozdział 1
Wstęp
Pomimo znaczącego postępu w dziedzinie projektowania adaptacyjnych algorytmów regulacji
on-line, obecnie w przemyśle dominują klasyczne regulatory PID przestrajane okresowo. Panuje
powszechna opinia o niezawodności tych regulatorów i znanych jest wiele metod ich przestrajania.
Jednak ze względu na stabilność układu zamkniętego, dla wielowymiarowych systemów MIMO
wysokiego rzędu, metodologia regulatora LQR jest bardziej nowoczesna, wydajniejsza i pewniej-
sza. Standaryzacja tych algorytmów wymaga opracowania dodatkowych metod identyfikacji dla
układów ciągłych, które mogą współpracować z LQR on-line. Fakt ten stwarza potrzebę budowy
odpowiednich algorytmów identyfikacji parametrycznej oraz właściwych algorytmów obserwacji
stanu. W tym celu układ automatyki procesów ciągłych wymaga dostępu do sygnałów stanu
lub sygnałów wyjścia oraz do ich pochodnych. Przede wszystkim wierne odtwarzanie kolejnych
pochodnych sygnału pomiarowego (zakłóconego) jest podstawowym zadaniem badawczym dla
metodologii filtracji. Ta tematyka jest przedmiotem niniejszej pracy doktorskiej.
W wielu dziedzinach wiedzy (technicznych i przyrodniczych) pojawia się konieczność iden-
tyfikowania parametrów systemów dynamicznych, co umożliwia opis i zrozumienie zachowania
rzeczywistych zjawisk. Zdecydowana większość zjawisk fizycznych ma charakter ciągły. Dlate-
go, w porównaniu z modelami dyskretnymi, większy sens fizyczny mają zidentyfikowane modele
ciągłe. Parametry modeli ciągłych i dyskretnych są wykorzystywane między innymi w procesie
syntezy regulatorów, obserwatorów stanu i w systemach detekcji uszkodzeń.
Powszechnie stosuje się identyfikację pośrednią parametrów modelu ciągłego, która polega
na zamianie modelu ciągłego na dyskretny, następnie identyfikacji parametrów modelu dyskret-
nego znanymi metodami i powrocie do modelu ciągłego. Podejście takie nie zawsze przynosi
zadawalające efekty, a bywa, że jest zawodne.
Celem pracy jest dostarczenie nowych oraz udoskonalenie istniejących już bezpośrednich me-
tod identyfikacji parametrów ciągłego liniowego modelu. Metody te będą stosowane do budowy
regulatora stabilizującego z adaptacją pośrednią. Rozprawa składa się z ośmiu rozdziałów.
W rozdziale drugim przedstawiono strukturę wielopoziomowych i wielowarstwowych syste-
1
mów sterowania oraz nadzoru. Zaprezentowano ogólną koncepcję takiego systemu, opisano jego
poszczególne składowe oraz relacje zachodzące między nimi. Opisano przebieg zdecentralizowa-
nego procesu decyzyjnego. W skład takiego systemu będą wchodzić układy: regulacji bezpo-
średniej, identyfikacji modeli dynamicznych i statycznych, optymalizacji tych modeli, obserwacji
stanu oraz detekcji stanów ustalonych. Zamieszczono również przegląd metod identyfikacji ukła-
dów ciągłych i dyskretnych, które mogą być stosowane w zagadnieniu sterowania adaptacyjnego.
Następnie uzasadniona została potrzeba zastosowania metody bezpośredniej identyfikacji para-
metrów modelu ciągłego w zadaniu regulacji adaptacyjnej.
Rozdział trzeci dotyczy opisu metody splotowej identyfikacji ciągłych systemów liniowych
wysokiego rzędu SISO. Metoda ta została przedstawiona z użyciem funkcji modulujących okre-
ślonych na zbiorach zwartych. Dodatkowo pokazano jej ulepszenia zaproponowane przez autora.
Wśród różnych funkcji modulujących wykorzystywane były funkcje wykładnicze zapropo-
nowane przez Loeba i Cahena (1965) lub funkcje sklejane zaproponowane przez Maletyńskiego
(1979). Funkcje Loeba i Cahena charakteryzują się tylko dwoma stopniami swobody (parame-
trami), co w znacznym stopniu ogranicza możliwość doboru ich kształtu. Z tego powodu autor
pracy, w rozdziale czwartym, zaproponował złożenie kilku takich funkcji z parametrami skalują-
cymi w zależności od wzajemnego przesunięcia w czasie. Parametry skalujące można wykorzystać
w procesie optymalizacji kształtu funkcji modulującej. W rozdziale zawarto również przegląd
funkcji modulujących, znajdujących zastosowanie w zagadnieniu identyfikacji układów ciągłych.
Dodatkowo została zaproponowana metoda doboru parametrów funkcji filtrującej dla regulacji
i obserwacji stanu.
W omawianym rozdziale skoncentrowano się wokół zagadnienia użycia bazowych funkcji skle-
janych (ang. basis spline, b-spline) jako funkcji modulujących o nośniku zwartym. Stanowi to
rozwinięcie pomysłu zastosowania wielu funkcji Loeba i Cahena oraz funkcji sklejanych. Funkcje
te będące uogólnionymi krzywymi Beziera, mogą zostać wykorzystane do optymalizacji funk-
cji filtrujących o nośniku zwartym. Są one tak konstruowane, by spełnić wymagania stawiane
funkcjom modulującym o nośniku zwartym. Przedstawiono bazowe funkcje sklejane stosowa-
ne dotychczas w zagadnieniu modelowania krzywych i powierzchni. Wykorzystuje się je także
w aproksymacji modeli statycznych i zlinearyzowanych niestacjonarnych modeli dynamicznych.
Rozdział piąty prezentuje oryginalne zastosowanie bazowych funkcji sklejanych do bezpośred-
niej aproksymacji kolejnych pochodnych sygnałów wejścia i wyjścia. Podobnie jak w metodzie
splotowej, informację o pochodnych sygnału można wykorzystać w algorytmach identyfikacji,
obserwacji oraz regulacji. Dodatkową zaletą metody z funkcjami sklejanymi jest możliwość wy-
prowadzenia gotowych wzorów analitycznych dla identyfikowanego obiektu na podstawie otrzy-
manych współczynników funkcji sklejanych.
W rozdziale szóstym przedstawiono propozycję adaptacyjnego regulatora wykorzystującego
metody identyfikacji i obserwacji. Ciągłe regulatory LQR, wykorzystujące adaptację pośred-
2
nią gwarantują wysoką jakość stabilizacji układów o nieznanych lub zmiennych parametrach.
Wymagają one jednak dostępu do zmiennych stanu, które mogą być niemierzalne. W takich
przypadkach konieczne jest zastosowanie algorytmów obserwacji stanu systemu ciągłego z wy-
korzystaniem: klasycznych obserwatorów asymptotycznych (filtr Kalmana i obserwator Luen-
bergera), całkowych obserwatorów określonych na skończonym oknie obserwacji lub specjalnych
obserwatorów, omawianych w niniejszej pracy.
Podsumowanie osiągniętych wyników w zastosowaniu do obiektów rzeczywistych i symu-
lowanych numerycznie opracowano i zebrano w rozdziale siódmym. W celu przeprowadzenia
eksperymentów wybrano dwa rodzaje obiektów. Pierwszym z nich jest rzeczywisty obiekt wy-
miennika ciepła1, natomiast drugim odpowiadający mu symulowany model wymiennika ciepła
o parametrach rozproszonych.
Pracę kończy rozdział ósmy, w którym przedstawiono wnioski z przeprowadzonych badań
i wskazano zagadnienia, stanowiące przedmiot przyszłych prac autora. Zasadnicze wyniki badań
zostały ujęte w rozdziałach czwartym, piątym, szóstym i siódmym.
W pracy postawiono trzy zasadnicze tezy naukowe:
� Minimalno-kwadratowa wersja bezpośredniej metody identyfikacji układów liniowych, cią-
głych wykorzystująca splotowy filtr z nośnikiem zwartym dla arbitralnie przyjętej funkcji
modulującej gwarantuje optymalną jakość identyfikacji parametrów.
� Funkcje sklejane mogą być wykorzystane do dwóch różnych zadań:
– budowy optymalnych modulujących funkcji filtrujących o nośniku zwartym,
– bezpośredniej aproksymacji pochodnych sygnałów wejścia i wyjścia dla bezsplotowej
metody optymalnej identyfikacji.
� Ciągłe adaptacyjne regulatory LQR wykorzystujące jednoczesną obserwację stanu i identy-
fikację parametrów obiektu (w oparciu o funkcje modulujące i sklejane) gwarantują wysoką
jakość stabilizacji układów o nieznanych lub zmiennych parametrach.
1Laboratorium Sterowania Procesami, Katedry Automatyki, Akademii Górniczo-Hutniczej.
3
Rozdział 2
Wprowadzenie
W rozdziale zostaną przedstawione współczesne wielowarstwowe i wielopoziomowe systemy ste-
rowania. Zostaną umiejscowione w nich metody identyfikacji systemów ciągłych będące tematem
niniejszej pracy. Dodatkowo zostały przedstawione metody identyfikacji parametrów modeli cią-
głych, obserwacji stanu i regulacji adaptacyjnej.
2.1. Współczesne systemy automatyki przemysłowej
Opisowa definicja systemu charakteryzuje go jako wyodrębniony z otoczenia obiekt, którego gra-
nice zależą od zasięgu oddziaływania podmiotu decyzyjnego. Otoczenie może mieć wpływ na
system, natomiast system nie ma wpływu na otoczenie. Gdyby taki wpływ istniał, należało-
by zwiększyć granice systemu. Niemierzalne oddziaływanie otoczenia na system nazywane jest
zakłóceniem [33].
Współczesne systemy automatyki przemysłowej są częścią rozbudowanych wielopoziomowych
hierarchicznych systemów decyzyjnych przedsiębiorstwa przedstawionych na rys. 2.1. W hierar-
chii służbowej rozróżnia się struktury liniowe, sztabowo-liniowe i macierzowe. Jednostka decyzyj-
na będąca na szczycie obejmuje swym zasięgiem cały system. Natomiast jednostki niższych po-
ziomów obejmują zasięgiem kompetencji coraz to mniejsze fragmenty systemu (posiadają mniej-
szy zasięg przestrzenny). W strukturach takich mamy do czynienia z wieloetapowym procesem
decyzyjnym. Dzięki temu na poszczególnych etapach procesu decyzyjnego można uwzględnić
niepewności wynikające z obserwacji (pomiaru) i modelu. W przemyśle decyzje jednoetapowe
podejmowane są w trakcie projektowania instalacji przemysłowej, doborze praw sterujących itp.
Decyzje wieloetapowe to np. cykliczne wyliczenie wartości sterującej.
Decyzje podstawowe dotyczące umiejscowienia i wpływu budowy zakładów przemysłowych
na lokalny region oraz środowisko naturalne muszą wykorzystywać narzędzia analizy systemowej
[32]. Zanim zostaną podjęte decyzje o budowie, typie i wielkości instalacji przemysłowej, dokony-
wany jest szereg analiz jej potencjalnego wpływu na zmianę warunków społeczno-ekonomicznych
4
oraz środowisko naturalne. Bywa, że z uwagi na długi horyzont czasowy przeprowadzanej ana-
lizy, dodatkowo korzysta się z wiedzy ekspertów. Metodologia analizy systemowej składa się
z następujących zagadnień: formułowanie problemu, analiza kosztów, wykorzystanie wiedzy eks-
pertów, budowa modeli, planowanie dodatkowych eksperymentów, estymacji i weryfikacji. Na-
stępnie sprawdza się modele poprzez symulację, optymalizację, prognozowanie, ocenę ryzyka.
W ostatnim etapie przeprowadzana jest ocena dostarczonych wariantów oraz podejmowane są
decyzje.
Przedsiębiorstwo osadzone jest w konkurencyjnych realiach rynkowo-ekonomicznych. Ekono-
miczne przesłanki zarządzania przedsiębiorstwem, struktura organizacyjna procesu zarządzania,
marketing oraz zarządzanie personelem zostało przedstawione w [97]. Zagadnieniem całościowego
opisu modelu przedsiębiorstwa wraz z jego dekompozycją, sterowaniem i optymalizacją zajmuje
się teoria wielkich systemów rozwijana od wczesnych lat sześćdziesiątych [10, 66].
Opis wielopoziomowych systemów sterowania wraz z zadaniami i strukturami układów stero-
wania, warstwy układów sterowania, metody optymalizacji, sterowania i koordynacji w złożonych
systemach przedstawiono w [31, 33].
Rys. 2.1. Wielopoziomowa struktura hierarchiczna przedsiębiorstwa.
Na świecie obserwowany jest ciągły proces ewolucji instalacji przemysłowych, przejawiający
się we wzroście stopnia ich skomplikowania i zaawansowania. Wzrost jest spowodowany zwięk-
szeniem wymogów bezpieczeństwa, rosnącymi cenami surowców naturalnych oraz koniecznością
dostarczenia lepszego produktu i jednocześnie bardziej konkurencyjnego. Ponadto, coraz waż-
5
niejszym czynnikiem stymulującym rozwój procesów technologicznych, a wraz z nimi systemów
sterowania, jest konieczność ochrony środowiska naturalnego. Organizacje rządowe ogranicza-
ją maksymalną wielkość emisji szkodliwych substancji do środowiska poprzez nakładanie kar
i sankcji. Próby zastąpienia energii pozyskiwanej ze źródeł kopalnianych poprzez wykorzystanie
źródeł odnawialnych mają na celu zmniejszenie efektu cieplarnianego, dzięki zmniejszeniu emisji
dwutlenku węgla do atmosfery. Opłacalność stosowanie energii odnawialnej jest silnie skorelowa-
na z jakością sterowania procesu biotechnologicznego lub innego. Wzrost opłacalności produkcji
osiągany jest poprzez udoskonalanie i unowocześnianie procesu produkcji, jak również poprzez
wprowadzanie nowych, bardziej wydajnych algorytmów sterowania i nadzoru. Ważnym czynni-
kiem jest przewidywanie zwiększenia emisji szkodliwych substancji do środowiska naturalnego
i odpowiednio wczesne reagowanie na mogące nastąpić przekroczenie przyjętych norm [108].
Przekroczenie to powoduje wzrost liczby zachorowań osób, a przez to zwiększenie nakładu na
leczenie. W przemyśle zwiększenie wydajności chemicznych procesów technologicznych uzyskuje
się dzięki zwiększeniu gabarytów reaktorów. Od wczesnych lat dziewięćdziesiątych rozwija się też
dziedzina nauki zajmująca się budową i prowadzeniem procesów chemicznych w skali mikro (ang.
micro process), dzięki której uzyskuje się większą sprawność procesu, co zmienia trend rozwoju
wielkich instalacji przemysłowych. Mikroreaktory stanowią pomost między skalą laboratoryjną
a przemysłową, łącząc najlepsze cechy obu rozwiązań [48]. Dodatkowo w swych rozwiązaniach
łączą najnowsze osiągnięcia z dziedziny elektroniki i mechaniki (ang. Micro-Electro-Mechanical-
Systems, MEMS). Kompletne rozwiązanie laboratoryjne dostarczane jest w jednym układzie
scalonym tzw. ”laboratorium na chipie” (ang. Lab on a Chip, LoC) [43] pracującym w skali
nano1.
Z postępem technologicznym związana jest z automatyzacja i zastępowanie pracy ludzkiej
przez maszyny. Nowe, bardziej skomplikowane technologie wymagają dobrze wyszkolonej ka-
dry obsługującej. Konieczne jest ciągłe szkolenie kadry pracowniczej w celu poprawnej obsługi
skomplikowanych instalacji, w szczególności w sytuacjach alarmowych. Tego typu działania szko-
leniowe są niemożliwe do przeprowadzenia w systemie produkcyjnym. Pojawiła się konieczność
przygotowania specjalnych, dedykowanych systemów testowych, na których pracownicy mogliby
ćwiczyć podejmowanie decyzji w przypadkach krytycznych np. awarii poszczególnych członów
instalacji. Do realizowania takich scenariuszy dobrze nadają się rzeczywiste i symulowane labora-
toria. Rzeczywiste laboratoria często znajdują się w innych ośrodkach (np. naukowo-badawczych)
i są oddalone o wiele kilometrów. Z tego powodu można wykorzystać zdalny dostęp do specjali-
stycznego laboratorium bez konieczności okresowego oddelegowywania pracownika na szkolenie.
Systemy takie nazywamy systemami zarządzającymi nauczaniem (ang. Learning Management
Systems, LMS) [94, 36, 107].
Wzrostem stopnia zaawansowania składowych systemu sterowania wiąże się z wprowadza-
1Przedrostki nano i mikro pochodzą od wielkości przepływu części litra na sekundę, a nie od części metrazwiązanego z rozmiarem reaktora.
6
niem nowych algorytmów sterowania. Jak wspomniano realizacja obsługi różnych scenariuszy
zdarzeń, strategii sterowania i szkoleń na rzeczywistej instalacji produkcyjnej jest nieuzasadnio-
na. Wprowadza to konieczność budowy wirtualnych symulowanych środowisk – laboratoriów,
w których przeprowadzanie szkoleń jest bezpieczne i nie powoduje dodatkowych kosztów związa-
nych z przestojami instalacji produkcyjnej. Zalety to niskie koszty i łatwość powielania rozwiązań.
Wadami może być zbyt duże uproszczenie zachodzących rzeczywistych zjawisk [36]. Jak wspo-
mniano, cennym jest możliwość dostępu zdalnego do takiego laboratorium poprzez sieć globalną
Internet [94].
Rys. 2.2. Proces zarządzania realizowany w poziomach struktury organizacyjnej [126].
Procesy technologiczne dzielimy na jednorazowe (np. wsad do reaktora), cykliczne (wielo-
krotnie powtarzane procesy jednorazowe) oraz ciągłe. Obiekty przemysłowe charakteryzują się
wieloma wejściami i wyjściami. Ważny problem stanowi dobór wielkości sterujących dla zagad-
nienia stabilizacji i optymalizacji, tak by wpływ zakłóceń na proces był jak najmniejszy [33].
Współczesne systemy sterowania instalacjami przemysłowymi są realizowane jako wbudowa-
ne i rozproszone komputerowe systemy sterowania (ang. Distributed Real-time and Embedded,
DRE) [95]. Parametry potrzebne do opisu konfiguracji takiego rozproszonego systemu są przecho-
wywane w ujednoliconych strukturach hierarchicznych, zdefiniowanych jako rozszerzalny język
znaczników (ang. Extensible Markup Language, XML) [93], w obiektowych [68] albo relacyjnych
bazach danych [52, 24].
Przede wszystkim, w systemach sterowania najważniejsze jest bezpieczeństwo, niezawodność
i odporność na błędy zastosowanego rozwiązania. Dział nauki badający niezawodność elemen-
7
tów i urządzeń technicznych nazywa się teorią niezawodności. W ramach teorii rozważana jest
niezawodność pojedynczych elementów np. elektronicznych (rezystory, tranzystory), elementów
pomiarowych (czujniki), wykonawczych (grzejniki, zawory) oraz wielu innych. Ponadto, podda-
wane analizie niezawodnościowej są różne struktury całościowe, jak połączenia szeregowe, równo-
ległe oraz mieszane, a także wpływ elementów i struktur na niezawodność, koszty oraz zależność
między kosztami a niezawodnością. Badane są fizyko-chemiczne przyczyny i skutki uszkodzeń
zarówno w kontekście oddziaływania na sąsiednie elementy systemu, jak i jego całość. Rozwijane
są metody obliczania niezawodności, analizowane są wyniki przeprowadzonych badań i testów
obiektów w procesie produkcyjnym i okresie eksploatacji. Niezawodność określana jest także na
podstawie wyników odpowiednich pomiarów dokonanych w trakcie eksploatacji. Analizę i bu-
dowę modeli uszkodzeń przeprowadza się z wykorzystaniem metod statystycznych i rachunku
prawdopodobieństwa. Powyższe zagadnienia opisane są w [118].
W dalszej kolejności rozważana jest optymalność prowadzenia procesu produkcyjnego. Zasto-
sowanie adaptacyjnych regulatorów wpływa w znaczny sposób na podniesienie bezpieczeństwa
instalacji, szczególnie w obszarach bliskich ograniczeniom technologicznym.
Rys. 2.3. Wielowarstwowy model systemu sterowania.
Rysunek 2.3 przedstawia wielowarstwowy model współczesnego komputerowego systemu ste-
rowania. Ze względu na wydzielone cele sterowania i częstotliwość interwencji, w zintegrowanych
systemach sterowania możemy wyodrębnić warstwy: zarządzania produkcją, optymalizacji sta-
8
tycznej, nadzoru i koordynacji, sterowania adaptacyjnego oraz sterowania bezpośredniego i za-
bezpieczeń. Struktura wielopoziomowa charakteryzuje się podziałem równoległym i koordynacją
realizowaną na wyższym poziomie. Natomiast warstwy nakładają się na siebie. Struktury złożo-
ne są realizowane przez równoczesne połączenie struktur wielopoziomowych i wielowarstwowych.
Praktycznie struktura mieszana okazuje się najwłaściwsza do zastosowania w zagadnieniu rozpro-
szonego sterowania dużą liczbą obiektów w długim decyzyjnym horyzoncie czasowym. Obiekty są
rozumiane jako elementy systemu nie podlegające dalszemu podziałowi. W warstwie sterowania
bezpośredniego i zabezpieczeń czas podejmowania interwencji sterujących oraz prognozowany
horyzont czasowy sterowania (czas podtrzymania sterowania) jest najkrótszy. Czas ten ulegają
wydłużeniu w wyższych warstwach, równocześnie rosną też koszty związane z ryzykiem podjęcia
błędnych decyzji. Sumaryczny efekt częstych błędnych decyzji w warstwie sterowania bezpo-
średniego może powodować straty porównywalne z błędnymi decyzjami w warstwach wyższych.
W skrajnym przypadku błędne zadziałanie systemu zabezpieczeń, skutkujące natychmiastowym
wyłączeniem instalacji, przyczyni się do znacznego wzrostu kosztów. Obserwuje się tendencję
do automatyzacji działania poszczególnych warstw sterowania. Praktycznie w warstwie sterowa-
nia bezpośredniego praca ludzka została zredukowana do czynności projektowych, nadzorowania
i serwisowych.
2.1.1. Warstwa zarządzania produkcją
Instalacja przemysłowa, a wraz z nią systemy sterowania i wspomagania podejmowania decyzji,
należą do grupy silnie rozproszonej. Mają do nich dostęp osoby różnych szczebli. Taki system
powinien pozwolić na dostęp i reprezentację zgromadzonych danych w sposób właściwy dla ope-
ratorów z różnych działów (poziomów). Obecnie jest już normą, że systemy sterowania sprzężone
są z systemami śledzenia i zarządzania produkcją oraz systemami kontrolującymi wydajność pro-
dukcji (ang. Manufacturing Execution Systems, MES). Standard ISA S95 ”Enterprise-Control
System Integration” definiuje warstwy integracji i współpracy z systemami planowania i zarzą-
dzania produkcją, finansowo-księgowymi, sprzedażą, gospodarką materiałową, zarządzaniem ja-
kością oraz logistycznymi (ang. Enterprise Resources Planning, ERP) [54], planowanie zasobami
produkcyjnymi (ang. Manufacturing Resource Planning, MRP). Z tych to systemów informacja
jest przekazywana do systemów sterowania. Obecnie klient (odbiorca gotowego produktu) ma
możliwość złożenia zamówienia za pośrednictwem sieci INTERNET. Z tego powodu szczególne
ważne staje się bezpieczeństwo informatyczne i technologiczne, niezawodność oraz zabezpieczenie
interfejsu systemu sterowania z innymi programami. W niższych warstwach wzrasta częstotliwość
zakłóceń, co powoduje konieczność zmniejszenia czasu podejmowania decyzji.
9
2.1.2. Warstwa optymalizacji statycznej
W warstwie optymalizacji statycznej zwykle ma się do czynienia ze strategiami maksymaliza-
cji przychodów lub minimalizacji kosztów, przy zadanych ograniczeniach produkcyjnych. Innym
kryterium jest maksymalizacja ilości produktu końcowego – przychodu – przy stałym poziomie
kosztów i spełnionych więzach ograniczających. Warstwa optymalizacji statycznej charakteryzuje
się częstotliwością interwencji wynoszącą nawet 1 dzień, nie jest ona stała i silnie zależy od wła-
ściwości dynamicznych sterowanego obiektu. Podjęte decyzje sterujące rozciągają się następnie
na długi horyzont czasowy.
W warstwie optymalizacji statycznej wykorzystuje się algorytmy selekcji, grupowania danych,
detekcji stanów ustalonych, identyfikacji modeli statycznych oraz optymalizacji, które to algoryt-
my charakteryzują się największym zapotrzebowaniem na moc obliczeniową. Z tych względów
obliczenia prowadzi się na maszynach równoległych z wykorzystaniem technologii wieloproce-
sorowych, rozproszonych systemów klastrowych i gridowych opartych o stacje robocze. Proces
decyzyjny w tej warstwie został praktycznie sformalizowany.
Dla sygnałów sterowania nadrzędnego konieczne jest konstruowanie algorytmów przetwa-
rzania sygnałów mających na celu detekcję stanów ustalonych. Dostęp do zmiennych stanu
umożliwia konstruowanie algorytmów detekcji stanu ustalonego [61]. Zebrane stany ustalone
umożliwiają budowę modeli statycznych dla procesu. Modele takie konstruuje się z wykorzysta-
niem metod regresji i wielomianów zadanego stopnia. Bardziej ogólne wydaje się zastosowanie
wielomianów sklejanych. Informację zawartą w modelach statycznych można wykorzystać do
optymalizacji procesu w stanie ustalonym przy zadanym wskaźniku jakości. Bywa, że na skutek
błędów pomiarowych i modelowych osiągnięty na podstawie modelu statycznego stan jest dla
rzeczywistego procesu nieoptymalny. Należy wtedy uaktualnić model statyczny oraz zastoso-
wać metodę bezpośredniego iteracyjnego poszukiwania optymalnego punktu pracy na obiekcie
rzeczywistym.
2.1.3. Warstwa nadzoru i koordynacji
Poszczególne warstwy sterowania nadrzędnego realizowane są na stacjach operatorskich. Infor-
macje na temat implementacji tego typu rozwiązań można znaleźć w [29, 30, 11]. Stacje i panele
operatorskie stosowane są w warstwie nadzoru i koordynacji. Systemy automatycznego rozruchu
są budowane w oparciu o wiedzę eksperta. Systemy eksperckie bazują na informacji dostarczonej
z algorytmów przetwarzania danych np. klasyfikacji przebiegów sygnału pomiarowego.
Trzon warstwy stanowią automaty skończenie stanowe w połączeniu z interfejsami człowiek-
maszyna (ang. Humman Machine Interface, HIM).
10
2.1.4. Warstwa sterowania adaptacyjnego
Warstwa sterowania adaptacyjnego najczęściej realizowana jest w oparciu o dedykowane kom-
putery przemysłowe oraz dysponujące coraz większą mocą obliczeniową PLC.
W tej warstwie wykorzystywane są algorytmy identyfikacji, automatów skończenie stanowych,
optymalizacji parametrów regulatorów i obserwatorów. Proces decyzyjny zachodzący w warstwie
został w pełni sformalizowany i obecnie trwają prace nad jego dalszym rozwojem.
2.1.5. Warstwa sterowania bezpośredniego i zabezpieczeń
Współczesne realia wolnego rynku przemysłowego i konsumenckiego zmuszające przedsiębior-
stwo do bycia konkurencyjnym wymagają od niego adaptacji do nieustannie zmieniających się
warunków, np. poprzez zmianę strategii sterowania. Powoduje to konieczność prowadzenia pro-
cesu produkcyjnego w pobliżu aktywnych ograniczeń technologicznych lub nawet fizycznych.
Niedopuszczalność przekroczenia tych ograniczeń wymaga zastosowania lepszych algorytmów
sterowania i predykcji zachowania obiektu, np. ze względu na skażenie. Te algorytmy wymagają
dokładniejszych modeli obsługiwanego procesu.
W warstwie sterowania bezpośredniego proces podejmowania decyzji został w pełni sforma-
lizowany najwcześniej, co umożliwiło konstruowanie i stosowanie sterowania automatycznego.
W wyższych warstwach proces podejmowania decyzji jest mniej formalny i sformalizowana część
procesu stanowi komputerowe wspomaganie podejmowania decyzji. Dalszy postęp formalizacji
wymaga opracowania lepszych, dostatecznie wiarygodnych modeli matematycznych. Identyfi-
kacja struktury i parametrów modelu (na podstawie trendów historycznych) służy pozyskaniu
wiedzy, która będzie mogła być zastosowana w przyszłości. Ogólnie pozyskiwaniem wiedzy z rze-
czywistych systemów zajmuje się eksploracja danych (ang. Data Mining). Ograniczenie rozwoju
formalizowania procesu decyzyjnego jest spowodowane koniecznością dużego nakładu wiedzy
i wysiłku w prowadzenie badań i doświadczeń potrzebnych do budowy adekwatnych modeli.
Moc obliczeniowa współczesnych zestawów komputerowych nie stanowi bariery ograniczającej
rozwój tej dziedziny.
Z uwagi na wymogi czasowe oraz konieczność bezpośredniego dostępu do obiektu warstwa bez-
pośredniego sterowania cyfrowego (ang. Direct Digital Control, DDC) wraz z zabezpieczeniami
jest realizowana w oparciu o dedykowane programowalne sterowniki logiczne (ang. Programmable
Logic Controler, PLC), procesory sygnałowe (ang. Digital Signal Processor, DSP), macierze bra-
mek programowane polem (ang. Field Programmable Gate Array, FPGA) [101, 88, 70], macierze
analogowe programowane polem (ang. Field Programmable Analog Array, FPAA) [99], lub jest
aplikowana w systemach czasu rzeczywistego (ang.Real Time Operating Systems, RTOS) inaczej
softPLC [46].
W tej warstwie wykorzystuje się algorytmy regulacji, obserwacji stanu oraz automaty skoń-
11
czenie stanowe (ang. Finite State Machine, FSM).
W różnych warstwach mogą być realizowane dowolne wskaźniki jakości i strategie sterowa-
nia. Przykładowo w warstwie sterowania bezpośredniego mamy do czynienia ze wskaźnikami
całkowymi, min-maxowymi oraz strategią sterowania czasooptymalnego [66, 27].
Równolegle do systemów sterowania, budowane są niezależne, redundantne i wyizolowa-
ne z systemów sterowania systemy bezpieczeństwa (ang. Emergency Shutdown System, ESD)
[112, 76, 28]. Zdarzenie polegające na przekroczeniu ograniczenia technologicznego wartości
zmiennej procesowej powoduje powiadomienie operatora systemu i oczekiwane jest potwierdzenie
zaistniałego alarmu. W przypadku braku stosownej reakcji ze strony obsługi i zbliżeniu wartości
zmiennej procesowej do ograniczenia fizycznego, system nadzorujący zaprogramowany jest tak,
by przejąć kontrolę nad procesem i przeprowadzić procedurę awaryjnego bezpiecznego wyłącze-
nia instalacji (ang. soft shutdown). Wykorzystują one w swym działaniu automaty skończenie
stanowe.
Rozwinięciem systemów ESD są systemy przewidujące możliwość zaistnienia sytuacji krytycz-
nej jeszcze przed jej wystąpieniem. W swym działaniu wykorzystują one modele matematyczne
nadzorowanego procesu wspólnie z zaawansowanym przetwarzaniem sygnałów pochodzących ze
zmiennych procesowych. Modele matematyczne mogą być otrzymane z wykorzystaniem sploto-
wych i sklejanych metod identyfikacji układów ciągłych.
Przykładem kompleksowego systemu sterowania i nadzoru w zastosowaniu do instalacji wy-
twarzania etanolu ze źródeł odnawialnych jest system Pavilion [124]. Łączy on optymalizację
statyczną z regulacją predykcyjną opartą o nieliniowe modele procesu zbudowane na sieciach
neuronowych.
Rys. 2.4. Wykorzystany schemat blokowy przetwarzania cyfrowego w układzie regulacji.
W przypadku przetwarzania cyfrowego (rys. 2.4) ważne jest spełnienie twierdzenia Kotiel-
nikowa-Shanona o podwójnej częstotliwości próbkowania [131]. Drugim ważnym czynnikiem
ograniczającym dokładność przetwarzania jest efekt kwantyzacji wywołany obecnością w to-
12
rze pomiarowym przetwornika analogowo-cyfrowego i w torze sterowania przetwornika cyfrowo-
analogowego. Obliczenia numeryczne charakteryzują się skończoną dokładnością numeryczną,
która jest przyczyną dodatkowej propagacji błędów i niepewności. Z tych przyczyn w najbardziej
zaawansowanych systemach przetwarzania cyfrowego stosuje się osiągnięcia arytmetyki interwa-
łowej [51].
2.1.6. Implementacja komputerowych systemów sterowania
Implementacja systemów sterowania i zarządzania w rozproszonych wielozadaniowych systemach
napotyka na wiele trudności natury synchronizacyjnej i komunikacyjnej. Mechanizmy komunika-
cji międzyprocesowej (ang. Inter Proccess Communication, IPC) wykorzystywane w systemach
sterowania rozproszonego – sieciowego opisano w [120, 37] wraz z przykładowymi kodami źródło-
wymi implementacji. Ponadto przedstawiono model warstw ISO OSI, komunikację typu klient–
serwer, zdalne wywoływanie procedur (ang. Remote Procedure Call, RPC), opisano rozwiązania
szczególnie ważnego problemu synchronizacji czasu w systemach sieciowych. Dodatkowo opisano
sposoby dostępu do wspólnych zasobów (arbitraż) oraz wzajemne wykluczanie sekcji krytycznej.
Omówione zostały zagrożenia bezpieczeństwa systemów rozproszonych. Przykłady programowa-
nia współbieżnego i rozproszonego wraz z problemami zarządzania zasobami komputerowymi
w przykładach i zadaniach przedstawiono w [128]. Przedstawiono tam mechanizmy nisko- i wy-
sokopoziomowe komunikacji i synchronizacji, mechanizmy powstawania niekorzystnych blokad
i zakleszczenia (ang. deadlock) dla wątków i procesów w wielozadaniowych systemach operacyj-
nych, w których jednocześnie wiele zadań konkuruje o dostęp do wspólnych zasobów. Przedsta-
wiono sposoby implementacji mechanizmów komunikacji międzyprocesowej z wykorzystaniem
mechanizmów niskopoziomowych jak przerwania, arbitrażu pamięci oraz instrukcji specjalnych
wykonywanych w jednym niepodzielnym (atomowym) cyklu maszynowym mikroprocesora typu
odczyt-modyfikacja-zapis (ang. read-modify-write). Opisano mechanizmy wysokopoziomowe
dostępne w systemach operacyjnych: semafory i monitory, oraz w językach programowania: sy-
metryczne i asymetryczne spotkania w ADA oraz przestrzeń krotek. Dobre praktyki programi-
styczne konieczne do implementacji bezpiecznego, stabilnego oraz wydajnego systemu sterowania
opisano w [75]. Natomiast zaawansowane techniki tworzenia oprogramowania czasu rzeczywiste-
go przedstawiono w [121].
2.2. Modele
Modelem nazywamy pewne odwzorowanie rzeczywistego systemu poprzez przedstawienie w nim
interesujących istotnych cech. Model powinien zewnętrznie zachowywać się jak system, nie jest
wymagana zgodność struktury wewnętrznej. Model cechuje się niepełną zgodnością z rzeczy-
wistością na skutek powstałych uproszczeń przy jego budowie i działaniem odbiegającym od
13
rzeczywistych warunków. Modelem określane jest narzędzie opisujące wzajemne procesy zacho-
dzące w systemie. Rozróżnia się modele systemu:
� koncepcyjne i jakościowe,
� fizyczne, analogowe, komputerowe i matematyczne.
Cele tworzenia modeli:
� badanie, czyli analiza właściwości procesu (np. stabilności),
� prognozowanie wyjścia procesu dla znanego sterowania,
� projektowanie, czyli synteza sterowania dla założonego wyjścia.
Dla rozpatrywanych systemów sterowania ze względów ekonomicznych i praktycznych pre-
ferowane jest tworzenie sformalizowanych modeli matematycznych symulowanych jako modele
komputerowe.
W monografii [33] wyróżnia się następujący podział modeli:
� Sformalizowane i intuicyjne. Modele zdeterminowane w działaniu, które opisano wyra-
żeniami matematycznymi i logicznymi, nazywane są modelami sformalizowanymi. Modele
zawarte w umyśle eksperta, zawierające niejednoznaczności, nazywane są modelami intu-
icyjnymi.
� Przyczynowe i korelacyjne. Modele przyczynowe odzwierciedlają wpływ jednej wielko-
ści na drugą. Natomiast modele korelacyjne wskazują na istnienie pewnych zależności np.
pomiędzy dwoma skutkami tej samej przyczyny. Tworzenie modeli przyczynowych wymaga
przeprowadzenia czynnego eksperymentu identyfikacyjnego. Natomiast w pracy z modela-
mi korelacyjnymi wystarczy tylko bierne obserwowanie poddane obróbce statystycznej.
� Statyczne i dynamiczne. Zachowanie obiektu w stanach równowagi statycznej z pomi-
nięciem jego dynamiki opisują modele statyczne. Natomiast modele dynamiczne opisują
trajektorię wpływu jednej wielkości na drugą, zarówno w czasie jak i statycznie. Zwykle
modele dynamiczne nie oddają w pełni poprawnie zachowania statycznego obiektu.
� Deterministyczne i probabilistyczne. Zwykle modele probabilistyczne są badane po-
przez przeprowadzenie symulacji stochastycznej lub analizę odpowiedniej formuły matema-
tycznej. Symulacja stochastyczna może dotyczyć niepewności wewnętrznej, zakłóceń oraz
symulowanych przebiegów losowych. W przypadku tych modeli operuje się na wielkościach
statystycznych tj. wartość oczekiwana i wariancja.
14
� Dyskretne procesów ciągłych. Te modele posiadają zarówno dyskretne równanie stanu,
jak i ciągłe równanie stanu. Błędy dyskretyzacji maleją przy zmniejszeniu czasu dyskrety-
zacji.
� Zjawisk ziarnistych i procesów dyskretnych.
Ponadto w literaturze [127, 122, 63] można spotkać omówienie modeli rozmytych i neuronowych.
W oparciu o różnego typu modele jednostki decyzyjne w warstwach i poziomach generu-
ją decyzje sterujące. Dodatkowo jako modele rozumiane będą różne części widzianego w niż-
szych szczeblach struktury hierarchicznej podsystemu. Przykładowo dla warstwy sterowania
nadrzędnego modelem będzie odzwierciedlenie wewnętrznych mechanizmów zachowania stero-
wanego obiektu fizycznego wraz z jednostką decyzyjną zrealizowaną w warstwie sterowania bez-
pośredniego. Szczegółowe informacje na temat różnych typów modeli wraz z opisem interakcji
i wzajemnego ich przenikania się dla wewnętrznych modeli systemu i modeli otoczenia można
znaleźć w [32, 33].
Budując modele dążymy do uzyskania z nich informacji o charakterze jakościowym. Zwykle
w przypadku systemów automatyki taka informacja jest niewystarczająca i dążymy do uzyskania
wniosków ilościowych. Jedynie modele sformalizowane rozpatrywanego systemu gwarantują nam
uzyskanie informacji o charakterze ilościowym.
Modele można dowolnie komplikować i rozbudowywać. Bardziej złożone modele lepiej opisują
rzeczywisty system, ale wymagają większego nakładu na ich budowę i późniejszą analizę. Zbytnie
uproszczenie może spowodować, że model będzie nieadekwatny. Weryfikacją modelu nazywamy
proces polegający na sprawdzeniu adekwatności modelu.
2.3. Automat skończenie stanowy
Automat skończenie stanowy (ang. Finite State Machine, FSM) jest to abstrakcyjne pojęcie
matematyczne wytworzone na bazie maszyn cyfrowych, którego zadaniem jest obsługa zadań
napływających asynchronicznie do systemu. Na podstawie zdarzeń oraz wewnętrznego stanu ge-
nerowane są zaprogramowane decyzje sterujące. Wewnętrzne stany układu sekwencyjnego zależą
zarówno od wejść jak i poprzedniego stanu, czyli układ posiada pamięć wewnętrzną. Z kolei sta-
nom przyporządkowane są wartość wyjść. Automaty te znajdują zastosowanie w zagadnieniu
modelowania, sterowania i przetwarzania informacji (telekomunikacja, teletransmisja, protokoły
komunikacyjne, kompilatory). Ponadto są wykorzystane do analizy różnego rodzaju gramatyk.
Sygnałami wejściowymi i wyjściowymi z automatu są sygnały binarne.
Rozróżniamy automaty asynchroniczne i synchroniczne. W automatach synchronicznych, tak-
towanych zewnętrznym zegarem, nie występują wyścigi przełączeń (ang. hazard). Automat asyn-
chroniczny działa niezależnie od zegara. Inny podział to automaty Moore’a, w których stan wyjść
15
zależy od pośredniego wewnętrznego stanu i automaty Mealy’ego, w którym stan wyjść zależy
od pośredniego wewnętrznego stanu oraz od stanu wejść [125]. Powyższe automaty nazywamy
deterministycznymi. Odrębną grupę stanowią automaty, w których nowy stan zależy nie tylko
od stanu poprzedniego i sygnału wejściowego, ale również od pewnego prawdopodobieństwa.
Syntetyczne ujęcie teorii automatów cyfrowych przedstawione jest w [47]. Opis zintegrowane-
go środowiska wspomagającego rozwój i testowanie automatów ujęty jest w [84]. Rozwój teorii
automatów skończenie stanowych pozwolił na szybki rozwój elektronicznej techniki cyfrowej,
a w efekcie budowę mikroprocesora.
W systemach automatyki powszechne są automaty skończenie stanowe obecne we wszyst-
kich warstwach przedstawionego modelu, rys. 2.3. Służą one do odzwierciedlenia zachowania
modelu, w innych przypadkach oddziaływują one bezpośrednio na sterowany obiekt albo pełnią
funkcję nadrzędną w stosunku do innych algorytmów. FSM znajduje zastosowanie w sterowaniu
produkcyjnymi procesami wsadowymi oraz jako uzupełnienie procesów ciągłych. Bardzo trudne
byłoby zbudowanie automatu skończenie stanowego realizującego proces decyzyjny systemu cią-
głego np. regulację temperatury. Taki automat musiałby posiadać bardzo dużą liczbę stanów.
Ze względów praktycznych sterowanie układami ciągłymi jest realizowane w oparciu o inne,
przedstawione dalej, algorytmy automatów nieskończenie stanowych zwane regulatorami.
Zwykle automaty przedstawia się w formie grafów i tablic (najczęściej Karnaugha). Grafy
sporządza się tak, że wierzchołkom odpowiadają stany, natomiast gałęziom wejścia automatu.
Grafom w pełni odpowiadają tablice przejść i wyjść. Forma reprezentacji w postaci grafów jest
wygodniejsza do analizy przez człowieka, natomiast forma tablicowa jest mniej obrazowa, ale
znacznie dogodniejsza przy przekształceniach i implementacji [125].
Książka [85] poświęcona jest syntezie i optymalizacji automatów synchronicznych za pomocą
teorii grafów oraz algebry Boole’a. Przedstawiono dokładne i heurystyczne metody minimalizacji
liczby stanów.
W systemach sterowania nadzorujących procesy technologiczne stosuje się połączenie wza-
jemnie uzupełniających się automatów skończenie stanowych z regulatorami. Najczęściej regula-
tor jest włączany w wybranych stanach automatu skończenie stanowego. Przykładem może być
automat FSM zastosowany w oczyszczalni ścieków, jaki implementował autor w jednej z prac
dla przemysłu.
Na rys. 2.5 przedstawiono algorytm realizujący fazę napowietrzania w bioreaktorze proce-
su wsadowego oczyszczania ścieków komunalnych. Przykładowo w stanie 007 automat załącza
jednocześnie dmuchawę powietrza i regulator ciągły PID stabilizujący zadaną wartość stężenia
tlenu w reaktorze. Przejście z fazy tlenowej do fazy sedymentacji następuje po osiągnięciu gór-
nego poziomu w reaktorze (prawdziwe wyrażenie h1 > h1max). Przejście do fazy beztlenowej
możliwe jest po zadanym czasie(t1 > t1min) i osiągnięciu wymaganego poziomu stężenia tlenu
w bioreaktorze (O2 > O2min).
16
Rys. 2.5. Przykład automatu skończenie stanowego.
2.4. Regulacja
Zwykle algorytm jest zapisany jako formuła matematyczna. Ze względu na rodzaj pętli stero-
wania układy automatyki możemy podzielić na układy działające: w otwartej pętli (ang. open
loop), w pętli sprzężenia zwrotnego (ang. feedback), ze sprzężeniem w przód (ang. feedforward)
oraz różnych kombinacjach (mieszane, kombinowane) [86].
Wiele procesów technologicznych, w szczególności chemicznych, charakteryzuje się wielowy-
17
miarowością, nieliniowością, długimi stałymi czasowymi i długimi opóźnieniami. Czynniki te
powodują duże praktyczne trudności w zastosowaniu klasycznych układów z pętlą sprzężenia
zwrotnego. Pożądaną jakość sterowania można osiągnąć stosując układ ze sprzężeniem w przód,
który nadaje się dobrze do eliminacji częstych i dużych zakłóceń oraz posiada dobre właściwo-
ści nadążne. Wymaga on jednak pomiaru zakłóceń i znajomości wpływu zakłóceń na obiekt.
Teoretycznie rozwiązanie pozwala na całkowite wyeliminowanie uchybu regulacji. W praktyce
błędy modelowania i pomiarowe powodują powstawanie uchybu. Nawet niezbyt poprawnie do-
brany układ regulacji ze sprzężeniem w tył ma zdolności stabilizacyjne czyli eliminacji uchybu.
Powodują one, że układ zamknięty jest w stanie eliminować wpływające na obiekt nieznane
zakłócenia. Najlepsze właściwości posiada układ mieszany łączący korzystne cechy sterowania
w przód i w tył.
Rys. 2.6. Pętla sprzężenia zwrotnego w przód i tył.
Dobór parametrów regulatora dla układów ze sprzężeniem zwrotnym i sprzężeniem w przód
oraz mieszanym jest omówiony w [109, 89, 72, 114]. W niniejszej pracy będą rozważane układy
stabilizacji i nadążne. Metody analizy istotności sprzężeń skrośnych i ich rozprzęgania (ang. de-
coupling) [89, 109, 67] dla obiektów wielowymiarowych przy pomocy analizy wzmocnień względ-
nych i dekompozycji na wartości singularne (ang. Singular Value Decomposition, SVD [1, 38,
105]) pokazano w pracy [30].
Podział algorytmów sterowania ze względu na zdolność do samoczynnego przystosowania się
do zmieniających się warunków pracy, charakterystyk obiektu i zakłóceń obejmuje: algorytmy
zwykłe – nieadaptacyjne i adaptacyjne. Ze względu na liczbę regulowanych zmiennych proceso-
wych możemy dokonać rozdzielenia na układy regulacji jednej zmiennej i wielu zmiennych. Inny
podział ze względu na rodzaj realizowanego zadania: układ regulacji stałowartościowej (stabili-
zacji), układ regulacji programowej, układ regulacji nadążnej oraz układ regulacji ekstremalnej.
Kolejnej klasyfikacji można dokonać dzieląc układy sterowania ze względu na liczbę kaskad
sterowania: bez kaskady, pojedyncza kaskada i wielokaskadowe. Zastosowanie kaskad jest naj-
prostszym przypadkiem sterowania nadrzędnego. W rozwiązaniach kaskadowych stosuje się po-
dział jednej pętli sterowania na mniejsze fragmenty. Te mniejsze fragmenty charakteryzują się
mniejszym czasem opóźnienia, mniejszą bezwładnością oraz lepszą stabilnością w porównaniu
z układami bez kaskad. Stosując rozwiązania kaskadowe eliminujemy błędy regulacji w miejscu
18
ich wystąpienia, a nie na końcowym wyjściu z obiektu, co skutkuje zmniejszeniem się propaga-
cji tych błędów na kolejne sekcje. Wadą rozwiązania jest konieczność uwzględnienia interakcji
pomiędzy kaskadami w procesie syntezy pojedynczych regulatorów. Przykładem lokalnej pętli
regulacji będzie regulator stabilizujący przepływ przez zawór wymiennika ciepła. Natomiast re-
gulator nadrzędny stabilizuje zadaną temperaturę na wyjściu wymiennika sterując strumieniem
wody chłodzącej.
Istnieje jeszcze wiele innych pomniejszych kryteriów klasyfikacji regulatorów, np. ze wzglę-
du na rodzaj energii zastosowanej do zasilenia wyróżniamy regulatory działania bezpośredniego
i pośredniego. Regulatory pośredniego działania są zasilane z nośnika energii: elektrycznego,
pneumatycznego, hydraulicznego oraz mieszanych. Ze względu na postać sygnałów występują-
cych w regulatorze rozróżnia się analogowe i cyfrowe. Regulatory analogowe mogą na wejściu
posiadać sygnał całkowicie ciągły, krokowy, dwupołożeniowy, trójpołożeniowy lub impulsowy.
Zwykle regulatory z wyjściem nieciągłym przeznaczone są do współpracy z obiektami całkują-
cymi, inercyjnymi lub całkującymi z inercją [39].
W zadaniu sterowania problemem jest niepewność parametrów sterowanego modelu. Po-
prawnie przeprowadzona synteza parametrów regulatora powinna uwzględniać taką niepewność
modelu. Jej uwzględnienie zwykle powoduje pogorszenie jakości regulacji względem wybranego
wskaźnika jakości. Uwzględnienie niepewności modelu w procesie syntezy regulatora wymaga
zastosowania iteracyjnych metod optymalizacji. Oprócz niepewności parametrów modelu wyróż-
niamy dodatkowo niepewność informacji pomiarowych, gdyż nie wszystkie działania ze strony
otoczenia mogą być w pełni przewidziane. Regulatory tak dobrane będziemy nazywać odpornymi
(ang. robust control).
2.4.1. Algorytmy regulacji klasycznej (nieadaptacyjne)
Struktura regulatora adaptacyjnego opiera się o istniejące i dobrze zbadane algorytmy stero-
wania nieadaptacyjnego. Prawa regulacji nieadaptacyjne mogą zostać użyte zarówno w kon-
strukcji regulatorów z adaptacją pośrednią jak i bezpośrednią. Jako klasyczne prawa sterowania
nieadaptacyjnego dla systemów liniowych ciągłych możemy wyróżnić algorytmy PID, rozmyte
i neuronowe, metodę alokacji zer i biegunów, regulator liniowo-kwadratowy, predykcyjny.
W [53] podano rozwiązanie problemu alokacji biegunów dla układów inwariantnych ze ste-
rowaniem od stanu i wyjścia (SISO i MISO). Przedstawiono wpływ sprzężenia zwrotnego na
położenie biegunów. Dodatkowo przedstawiono rozwiązanie ze statycznym i dynamicznym sprzę-
żeniem zwrotnym.
Ciągłe regulatory LQR wykorzystujące adaptację pośrednią gwarantują wysoką jakość sta-
bilizacji układów o nieznanych lub zmiennych parametrach. Optymalne rozwiązanie zadania
sterowania liniowo-kwadratowego wraz z eliminacją uchybu statycznego przedstawiono w [30,
45, 53, 67], dla układów z opóźnieniem w [64]. W pracy [45] zostało przedstawione rozwiązanie
19
optymalne problemu liniowo-kwadratowego dla systemów opisanych równaniami różniczkowymi
zwyczajnymi, systemów dyskretnych, systemów opisanych równaniami cząstkowymi, przypad-
ków stacjonarnych i niestacjonarnych. Zagadnienie jest dyskutowane jako problem ze skończo-
nym i nieskończonym czasem sterowania dla systemów z i bez opóźnienia. Systemy z opóźnie-
niem szczegółowo są dyskutowane w monografii [64]. Zastosowanie algorytmów LQR powoduje
konieczność dostępu do zmiennych stanu obiektu. Sporadycznie zmienne te są mierzalne, co
wymusza stosowanie algorytmów obserwacji stanu na podstawie mierzonych zakłóconych wejść
i wyjść obiektu.
W pracy [78, 91] przedstawiono istotę regulacji predykcyjnej zwykłej i adaptacyjnej z modela-
mi parametrycznymi i nieparametrycznymi (odpowiedzi impulsowej i skokowej). Zasady regulacji
predykcyjnej, w szczególności regulator predykcyjny z modelem odpowiedzi skokowej (ang. Dy-
namix Matrix Control, DMC), regulator predykcyjny uogólniony (ang. Generalized Predictive
Control, GPC) z wykorzystaniem modelu odpowiedzi skokowej, z uwzględnieniem ograniczeń,
niepewności modelu oraz zakłóceń zostały przedstawione w pracy [30, 123]. Dodatkowo przed-
stawiono prawa regulacji dla obiektów jedno i wielowymiarowych, modeli w postaci równań
stanu oraz obiektów nieliniowych. Współpracę warstwy optymalizacji statycznej z regulatorem
predykcyjnym przedstawiono w [123]. W monografii [30] przedstawiono regulację predykcyjną
w sterowaniu nadrzędnym oraz optymalizację punktu pracy wraz z kompensacją zakłóceń mie-
rzalnych regulatora predykcyjnego. Opisu dokonano dla zagadnienia stabilizacji i sterowania
z kontrolą ograniczeń całkowych wyjść procesowych.
2.4.2. Regulacja adaptacyjna
Na skutek oddziaływań zewnętrznych (czasu, starzenie się parametrów, awarie) oraz oddzia-
ływań niemierzalnych zakłóceń, instalacje przemysłowe ulegają zmianom. Zachodzące zmiany
parametrów procesów technologicznych wymuszają konieczność przystosowania się do nich (ad-
aptowania) algorytmów sterowania.
Większość algorytmów sterowania w swym działaniu wykorzystuje wiedzę o procesie techno-
logicznym. Najczęściej jest ona reprezentowana w postaci modeli opisanych transmitancją lub
równaniem różniczkowym. Istnieją procesy, dla których skonstruowanie takiego modelu jest zbyt
skomplikowane lub wręcz niemożliwe ze względu na brak możliwości ich poznania i zrozumienia.
Takie procesy nazywamy czarnymi skrzynkami (ang. black box ).
W wielu przypadkach dysponujemy pewną wiedzą o procesie, która jest obarczona błędem
i niepewnością. Błędy modelowania powstają na skutek pojawienia się w rzeczywistym proce-
sie niemierzalnych i nieprzewidywalnych zakłóceń, uproszczeń modelu oraz zmian parametrów
w czasie. Przypadki, w których nie jesteśmy pewni wiedzy, jaką dysponujemy na temat proce-
su, określane są wspólną nazwą szarych skrzynek (ang. gray box ). Jest to przypadek najczęściej
spotykany w przemyśle.
20
Jeżeli dysponujemy kompletną wiedzą na temat procesu, to w takim przypadku mamy do
czynienia z białą skrzynką (ang. white box ). Dla systemów typu biała skrzynka jest stosunkowo
łatwo zbudować regulator, ponieważ dysponujemy dobrze znanymi metodami postępowania.
W przypadku, gdy wiedza o procesie jest niedostępna, konieczne jest przeprowadzenie proce-
dury identyfikacji jego parametrów off-line lub on-line. W praktyce prowadzi to do konieczności
rozwiązania wielu problemów praktycznych, w szczególności: zaplanowania eksperymentu, pilno-
wania ograniczeń na wartości zmiennych procesowych, zapewnienia stabilność procesu w trakcie
estymacji jego parametrów. Wymienione czynniki powodują powstawanie dodatkowych kosztów
w trakcie eksploatacji [56, 73, 74, 115, 116, 117].
Zidentyfikowane parametry obiektu obarczone są pewnym (nieznanym) błędem. Wielkość te-
go błędu możemy oszacować metodami statystycznymi przeprowadzając wielokrotnie procedurę
identyfikacji. Niepewność parametrów modelu powoduje konieczność uwzględnienia jej w proce-
sie syntezy regulatora, tak by otrzymane prawo regulacji mieściło się w przyjętych założeniach
projektowych. Regulatory, które są odporne na niepewność parametrów modelu sterowanego
obiektu nazywamy odpornymi (ang. robust).
Regulatory adaptacyjne możemy podzielić na dwie główne grupy. Pierwszą będą stanowiły
algorytmy z zaprogramowaną zmianą parametrów (ang. gain scheduling). Drugą stanowią ukła-
dy wyliczające na bieżąco parametry regulatora na podstawie dokonywanych pomiarów, które
nazywane są algorytmami samoprzestrajającymi (ang. self-tuning control) .
Zaprogramowana zmiana parametrów regulatora
Regulacja adaptacyjna z zaprogramowaną zmianą parametrów regulatora stosowana jest do pro-
cesów typu biała skrzynka lub z przeprowadzoną wsadową (ang. off-line) identyfikacją para-
metrów, rys. 2.7. Najczęściej regulatory te są realizowane w postaci rozbudowanych wielowy-
miarowych tablic parametrów (ang. look-up table, LUT). Przestrajanie dokonuje się w oparciu
o pomiary zmiennych pomocniczych reprezentujących zakłócenia [3, 4, 50, 91].
Rys. 2.7. Struktura regulatora z programową zmianą parametrów.
21
Podstawową wadą regulatora z programową zmianą jego parametrów jest adaptacja w pętli
otwartej. Na skutek oddziaływania na obiekt również niemierzalnych zakłóceń jego parametry
się zmieniają, co powoduje dezaktualizację przechowywanych map sterowań. Konieczne staje
się okresowe przeprowadzanie identyfikacji parametrów sterowanego obiektu i ponowna synteza
tablic regulatora.
Przykładem zastosowania tego typu rozwiązania może być komputer sterujący pracą silnika
w samochodzie z zaprogramowaną mapą sterowań wtrysku paliwa. Innym przykładem jest sa-
molot, którego praca urządzeń pokładowych zmieniać się będzie wraz z wysokością lotu i ilością
paliwa pozostającą w zbiornikach (obciążeniem).
Estymacja parametrów regulatora
W praktyce przeprowadzenie identyfikacji na bieżąco (ang. on-line) z działającym w sprzęże-
niu zwrotnym regulatorem powoduje powstawanie problemu w postaci poprawności identyfika-
cji. Zagadnienia regulacji (stabilizacji) i identyfikacji są sobie przeciwstawne. Przeprowadzenie
eksperymentu tak, by zadanie identyfikacji było dobrze uwarunkowane numerycznie powoduje
konieczność doboru sygnału wymuszenia o odpowiednio szerokim spektrum częstotliwości. Po-
prawnie dobrany sygnał wymuszający pobudza wszystkie magazyny energii badanego obiektu.
Identyfikacja, by była dobrze uwarunkowana numerycznie, potrzebuje sygnału wymuszenia na
wejściu układu charakteryzującego się szerokim spektrum częstotliwościowym. Natomiast za-
daniem regulacji jest sprowadzenie (pozostawienie) układu w stanie ustalonym. Kolejnym pro-
blemem jest wprowadzenie przez regulator w zamkniętej pętli sprzężenia zwrotnego zależności
między wejściem i wyjściem układu. By uporać się z tymi problemami stosuje się trzy głów-
ne metody. Pierwsza polega na ustawieniu przez operatora pewnego dopuszczalnego marginesu,
w którym nie działałby bezpośrednio regulator, a tak zebrane dane pomiarowe posłużyłyby
do przeprowadzenia identyfikacji parametrów obiektu oraz syntezy regulatora. Drugi polega na
wprowadzeniu dodatkowego sygnału testowego. Powyższe metody nie zawsze są dopuszczalne.
Dlatego stosuje się inne podejście, polegające na detekcji zmian wartości zmiennych procesowych
z wykorzystaniem np. algorytmu Page’a-Hinkley’a.
Algorytmy adaptacyjne z estymacją parametrów regulatora dzielimy na metody bezpośred-
niej i pośredniej estymacji parametrów.
Metoda bezpośrednia
Podstawowym schematem regulacji adaptacyjnej bezpośredniej jest układ MRAC (ang. Model
Reference Adaptive Control) lub MRAS [3]. Tego typu struktury regulacji zostały zaproponowane
po raz pierwszy przez Astrom-Wittenmarka [2] i opisano je w [89, 91].
Na rys. 2.8 przedstawiono schemat układu regulatora adaptacyjnego z bezpośrednią identy-
fikacją jego parametrów [89]. Metoda polega na estymacji parametrów regulatora na podstawie
22
pomiarów różnicy wyjścia z referencyjnego modelu i sterowanego systemu z pominięciem iden-
tyfikacji modelu obiektu. Model referencyjny jest arbitralnie przyjęty jako najbardziej pożądana
odpowiedź całego układu regulacji na wartość zadaną. Dodatkowo założono bardzo wolną zmianę
parametrów sterowanego obiektu w stosunku do dynamiki pętli regulacji. Założenie to pozwala
na iteracyjne dopasowanie do przyjętego wskaźnika jakości parametrów regulatora.
Zaletą metody jest szybkość i prostota działania. Pozwalają na implementowanie rozwiązania
w systemach wbudowanych opartych o mikrokontrolery. Wadą natomiast brak modelu obiektu,
który mógłby być wykorzystany w innych podsystemach będących częścią zintegrowanego sys-
temu sterowania.
Rys. 2.8. Układ adaptacji bezpośredniej.
Najczęściej przemysłowe wdrożenia regulatora adaptacyjnego zbudowane są one w oparciu
o algorytm PID z ciągłą estymacją parametrów. Przykładem może być adaptacyjny algorytm
bezmodelowy (ang. Model-Free Adaptive, MFA) [69].
Estymacja pośrednia
Struktura regulatora z pośrednią estymacją parametrów pokazana jest na rys. 2.9. W przeciwień-
stwie do metody bezpośredniej, w tej metodzie najpierw identyfikowane są parametry modelu
sterowanego obiektu. Dopiero na ich podstawie i założonego wskaźnika jakości system dokonuje
syntezy optymalnych parametrów regulatora. Niewątpliwą zaletą jest możliwość zastosowania
parametrów zidentyfikowanego systemu do innych niż regulacja zadań. W zadaniach syntezy
korzystających z modelu obiektu sterowanego (np. LQR) jest to naturalny schemat adapta-
cji. Pomimo pewnego nakładu obliczeniowego, korzyści przemawiają za wyborem tej struktury
i będzie ona rozpatrywana w dalszej części pracy.
23
Rys. 2.9. Układ adaptacji pośredniej.
2.5. Diagnostyka procesów przemysłowych
W stosunku do instalacji przemysłowych rosną wymagania odnośnie jakości produktu końcowe-
go. Jednocześnie wymaga się, by proces technologiczny był prowadzony w sposób nieinwazyjny
i bezpieczny dla środowiska naturalnego. Powoduje to konieczność podniesienia niezawodności
nowoczesnych systemów sterowania, tak by były odporne na awarie. Podniesienie odporności na
błędy sprzętu kontrolno-pomiarowego uzyskuje się np. poprzez redundancję pomiarów i sprzętu.
Rys. 2.10. Metody detekcji uszkodzeń wykorzystujące wewnętrzny model [60].
Inną klasę problemu stanowią awarie nadzorowanego obiektu. Dla takich przypadków roz-
wija się systemy tolerujące awarie (ang. Fault Tolerant Control System, FTC). Wyposażone są
one w mechanizmy detekcji (ang. Fault Detection, FD) i wyodrębniania (ang. Fault Isolation)
24
błędów i sytuacji krytycznych rozumianych jako odchylenie od normalnej pracy instalacji [60].
Zadaniem takich systemów jest rekonfiguracja pętli sterowania i próba programowego wylicze-
nia brakujących pomiarów (procedury soft-sensoring). Bloki funkcyjne realizujące algorytmy
sensorów programowych mają zadanie wyliczenie wartości zmiennej procesowej na podstawie
znajomości modelu i pozostałych mierzalnych zmiennych procesowych (wejść i wyjść układu).
Kolejnym ważnym zagadnieniem, w którym znajdują zastosowanie identyfikowane modele dy-
namiczne, jest diagnostyka procesów przemysłowych. Metody detekcji oparte są o wewnętrzny
model matematyczny procesu. Metodami statystycznymi badane są residua, czyli różnice między
zmienną procesową pochodzącą z czujników pomiarowych, a odpowiednią jej wartością wyliczoną
na podstawie modelu [60, 63]. Pozyskanie dobrego modelu jest szczególnie ważne dla zagadnie-
nia detekcji, ponieważ wpływa na takie parametry algorytmu detekcji jak: średni czas między
fałszywymi alarmami, prawdopodobieństwo fałszywego alarmu, prawdopodobieństwo braku de-
tekcji. Jako modele stosowane są dyskretne modele regresyjne, modele ciągłe, modele rozmyte
oraz neuronowe [63].
2.6. Obserwatory
Opisane wcześniej algorytmy regulacji stanu i detekcji uszkodzeń oprócz znajomości modelu
wymagają często w swym działaniu dostępu do zmiennych stanu. Zwykle rzeczywiste obiek-
ty charakteryzują się tylko mierzalnym wyjściem, co powoduje konieczność odtwarzania stanu
obiektu. Algorytmy estymujące niemierzalny stan na podstawie modelu i pomiaru wejść i wyjść
nazywamy obserwatorami.
Obserwatory różniczkowe
Filtr Kalmana-Bucy, należący do grupy obserwatorów różniczkowych asymptotycznych, został
zaproponowany przez Kalmana w [55]. Ciągły liniowy inwariantny system dany wzorem:
x(t) = Ax(t) +Bu(t) + Lw(t)y(t) = Cx(t) + v(t),(2.1)
gdzie u(t) ∈ Rm, x(t) ∈ Rn, v(t) ∈ Rq i y(t),w(t) ∈ Rp, x(0) nieznane, znane są i mierzone u(t)i y(t). Ponadto zakłada się, że procesy stochastyczne w(t) i v(t) są białym szumem gaussowskim
o zerowej wartości średniej E(w(t)) = 0 i E(v(t)) = 0 oraz macierzach kowariancji postaci
E(v(t)v(t)T ) = Q i E(w(t)w(t)T ) = R. Procesy v(t) i w(t) są wzajemnie niezależne, czyli:
E(w(t)v(t)T ) = 0. Warunek początkowy x(t0) jest nieznanym wektorem losowym o rozkładzie
gaussowskim z zerową wartością średnią. Posiada on półokreśloną dodatnio macierz kowariancji
P(t0) = E(x(t0)x(t0)T ). Następnie konstruuje się odtwarzanie stanu x(t), tak by minimalizowana
25
była wartość wskaźnika jakości:
Jobs = limt→∞
E({x(t)− x(t)}{x(t)− x(t)}T ). (2.2)
Optymalnym rozwiązaniem jest filtr Kalmana dany równaniem:
˙x(t) = Ax(t) +Bu(t) +K(t)(y(t)−Cx(t)), (2.3)
gdzie x(0) zadawane, macierz filtru określona jest wzorem: K(t) = P(t)CTR−1 [44, 83, 80].
Natomiast macierz kowariancji jest wskazana przez rozwiązanie różniczkowego równania Ric-
catiego dla czasów bieżących:
P(t) = AP(t) +P(t)AT −P(t)CTR−1CP(t) + LQLT , (2.4)
lub odpowiedniego algebraicznego równania Riccatiego dla czasów zmierzających do nieskończo-
ności:
AP+PAT −PCTR−1CP+ LQLT = 0. (2.5)
Dla wyliczenia y(t) i x(t) estymator ten używa znanych u(t) i mierzonych yv(t) (zakłada się,
że stan x(t) jest zakłócony szumem w(t) lub zakłada się, że sterowanie jest również mierzalne
z szumem w(t)). Schemat współpracy estymatora stanu i obiektu przedstawia rys. 2.11.
Rys. 2.11. Schemat współpracy obserwatora z obiektem.
W rzeczywistych aplikacjach filtry te implementuje się w oparciu o procesory sygnałowe,
dlatego w literaturze częściej spotyka się wersje dyskretne [83, 131]. Odmienne deterministyczne
podejście z alokacją biegunów zaproponował Luenberger [71, 86].
Obserwatory całkowe
Obserwatory różniczkowe w oparciu o bieżący pomiar y i u generują bieżącą estymatę stanu dążą-
cą asymptotycznie do stanu rzeczywistego. Dokładne odtworzenie stanu jest możliwe w oparciu
o pomiar wejścia i wyjścia na skończonym odcinku czasu [0, T ]. Dla obserwowanego systemu
26
liniowego, którego wyjście dane jest wzorem:
y(t) = CeAtx(0) +∫ t0CeA(t−τ)Bu(τ)dτ (2.6)
można odtworzyć stan x(0) dokładnie na podstawie znajomości y(t) i u(t) na przedziale [0, T ]
w oparciu o formułę:
x(0) =∫ T0G1(τ)y(τ)dτ +
∫ T0G2(τ)u(τ)dτ . (2.7)
Reguły doboru odpowiednich macierzy G1(τ) i G2(τ) można znaleźć w [12, 13, 14, 15].
Inne obserwatory
W dalszej części pracy, rozdział 6.2, zostaną przedstawione dwa obserwatory stanu. Pierwszy
w swym działaniu wykorzystuje właściwości splotu, drugi korzysta z aproksymacji sygnału po-
miarowego bazowymi funkcjami sklejanymi. Propozycje tych obserwatorów zostały przedstawio-
ne w pracach [16, 20, 21, 23]. W przypadku estymatorów opartych o właściwości splotu to kolejne
pochodne sygnału odtwarzane są poprzez sploty sygnałów wejścia/wyjścia z kolejnymi pochod-
nymi specjalnie dobranej funkcji modulującej. Odmiennym i nowym podejściem jest aproksy-
macja sygnału pomiarowego funkcjami sklejanymi, następnie wyliczenie kolejnych pochodnych.
Wspólną cechą algorytmów jest odtworzenie niemierzalnego stanu x obiektu z wykorzystaniem
macierzy Toeplitza na podstawie kolejnych pochodnych sygnałów pomiarowych u i y.
2.7. Identyfikacja dynamiczna
W celu wyznaczenia modelu przyczynowego odzwierciedlającego zachowanie procesu w zagad-
nieniach diagnostyki, obserwacji i sterowania, należy przeprowadzić czynny eksperyment iden-
tyfikacji. W poprzednich rozdziałach uzasadniona została konieczność znajomości modelu ma-
tematycznego sterowanego procesu przemysłowego. Modele matematyczne możemy pozyskać na
drodze analitycznej, dokonując analizy zjawisk fizycznych zachodzących w procesie. Wykorzy-
stuje się zasady zachowania pędu, energii i masy. Często bywa, że wiedza zgromadzona na temat
procesu jest tak złożona, że otrzymany w postaci zależności matematycznych model jest zbyt
skomplikowany do zastosowania w praktyce. Dodatkowo modele analityczne wymagają przepro-
wadzenia eksperymentów w celu wyznaczenia niektórych ich parametrów. W takich przypadkach
bardziej racjonalne wydaje się zastosowanie podejścia doświadczalnego. W przypadku identyfi-
kacji parametrycznej polega ono na założeniu struktury modelu aproksymującego rzeczywisty
obiekt np. w postaci transmitancji, a następnie estymacji parametrów tej transmitancji [39].
W wyniku dezaktywacji katalizatorów, zużywania się części i maszyn, zmieniają się parametry
sterowanego obiektu oraz wpływu niemierzalnych torów zakłóceń. Dodatkowo zmiana punktu
pracy nieliniowego obiektu pociąga za sobą konieczność przeprowadzenia identyfikacji. Powo-
27
duje to, że jednokrotna identyfikacja jest niewystarczająca i powinna być ona przeprowadzana
w sposób okresowy lub nawet ciągły.
Jednym z głównych podziałów metod identyfikacji jest podział na metody czynne i bier-
ne. Metody czynne polegają na wprowadzeniu do obiektu specjalnie przygotowanych sygnałów
wymuszających. Na rzeczywistych instalacjach takie sygnały muszą spełniać wiele ograniczeń
i nie zawsze są akceptowalne. Metody bierne polegają na rejestracji wejść i wyjść z obiektu bez
możliwości celowego oddziaływania na niego.
Metody identyfikacji dzielone są także na parametryczne i nieparametryczne. Przykładem me-
tod parametrycznych będzie estymacja parametrów transmitancji założonego rzędu. Natomiast
nieparametryczne mogą być reprezentowane przez odpowiedzi na skok jednostkowy i charakte-
rystyki częstotliwościowe.
Kolejnego podziału można dokonać ze względu na dziedzinę częstotliwości i czasu. W dziedzi-
nie czasu rozróżniamy metody identyfikacji ciągłej i dyskretnej. Ze względu na naturalność imple-
mentacji, w systemach cyfrowego przetwarzania rozwijane i stosowane w automatyce kontrolno-
pomiarowej (AKP) były metody identyfikacji dyskretnej. Metody identyfikacji ciągłej były roz-
wijane i udoskonalane, lecz ze względu na praktyczne problemy i niewystarczającą moc oblicze-
niową ówczesnych systemów komputerowych nie były aplikowane. Obecnie wiele z tych ograni-
czeń sprzętowych zostało rozwiązanych tak, by móc stosować algorytmy dla systemów ciągłych
[26, 96].
W pracy przedstawiono szeroko algorytmy identyfikacji ciągłej parametrycznej dla systemu
liniowego. Przedstawione dwa algorytmy wykorzystują właściwości funkcji modulującej i skleja-
nej. Wyniki badań zostały opublikowane w [19, 20, 21, 22, 23, 92].
Identyfikacja dyskretna
Metody identyfikacji dynamicznych liniowych modeli dyskretnych szczegółowo zostały omówio-
ne w pracach Box-Jenkinsa [7], Niederlinskiego [90] oraz wielu innych [56, 67, 73, 74, 117].
Opisane algorytmy bazowały na metodzie najmniejszych kwadratów, zmiennej instrumentalnej
i największej wiarygodności. Przedstawiono warunki nieobciążalności estymatora. Dodatkowo
zostały przedstawione sposoby identyfikacji modeli obiektów ze sprzężeniem zwrotnym oraz do-
bór sygnałów wymuszających dla metod identyfikacji parametrycznej.
Identyfikacja ciągła
Zadania identyfikacji układów ciągłych wysokiego rzędu przeformułowywane są z reguły do wersji
dyskretnej. Stąd bogactwo opracowań i metod dla identyfikacji dyskretnej. W wielu procesach
technicznych pozyskanie modelu ciągłego jest jednak bardziej potrzebne i użyteczne. Model
dyskretny jest zwykle wystarczający do syntezy algorytmów regulacji. W większości zjawiska
28
fizyczne posiadają charakter ciągły i dostarczenie modeli ciągłych ma większy sens fizyczny
w postaci lepszego odzwierciedlenia zachodzących zjawisk.
Stosując algorytmy identyfikacji ciągłej minimalizujemy wpływ fluktuacji czasu dyskretyzacji
na jakość identyfikacji. Inaczej mówiąc, w algorytmach dyskretnych rozbieżności od założonego
czasu dokonania pomiaru (ang. jitter) traktowane są jako zakłócenia wartości mierzonej. Mając
zarejestrowane dokładne chwile czasowe, w których dokonano pomiaru, algorytmy identyfikacji
ciągłej są w stanie uwzględnić rozbieżności czasowe.
Metody estymacji parametrów dla ciągłych procesów możemy podzielić na dwie klasy: po-
średnią i bezpośrednią. Metoda pośrednia polega na aproksymacji oryginalnych równań różnicz-
kowych równaniami różnicowymi. Parametry są estymowane dla systemu dyskretnego w czasie
i następnie z powrotem przeliczane na oryginalne parametry systemu ciągłego. Błędy wpro-
wadzane w tej metodzie silnie zależą od zer estymowanej transmitancji dyskretnej i od prze-
biegu zmiennych procesowych pomiędzy próbkami. Dodatkowo problem stwarza wybór czasu
próbkowania wejść/wyjść tak, by zadanie identyfikacji było dobrze uwarunkowane numerycznie.
W przypadku wystąpienia zespolonych pierwiastków mianownika zidentyfikowanej transmitancji,
charakteryzujących się częścią rzeczywistą mniejszą od zera, przejście na współczynniki ciągłe
jest kłopotliwe.
Metody bezpośredniej identyfikacji układów ciągłych nie korzystają z transformacji na układ
dyskretny. Posługując się danymi wejście/wyjście z układu ciągłego bezpośrednio estymują jego
parametry. Należą do nich metody związane z filtracją stanu. Uzyskiwana ona jest poprzez fil-
trację wejścia u i wyjścia y identyfikowanego systemu przez wybrany system dynamiczny Φ(s).
Zastosowany splot u i y (formalnie na nieskończonym odcinku czasu) z impulsową funkcją przej-
ścia φ(t) ogranicza się do wybranego okna czasowego. Popełniane błędy równości lewej i prawej
strony są tym mniejsze im szybciej zanika φ(t)[98].
Przykładem może być procedura przedstawiona w [67] numerycznej identyfikacji parametrów
systemu ciągłego metodą syntezy transmitancji danej w postaci:
G(s) =B(s)
A(s)=b0 + b1s+ . . .+ bnsn
1 + a1s+ . . .+ ansn=Φ(s)B(s)
Φ(s)A(s). (2.8)
Przedstawione na rys. 2.12a parametry φ1, φ2, φ3 dobierane są tak, by zapewnić stabilność
transmitancji w oznaczonym bloku: Φ(s) = 1sn+φ1sn−1+...+φn
. Identyfikacja polega na dobraniu
takich parametrów ai i bi, dla których wartość przyjętego wskaźnika jakości będzie najmniejsza.
Następnie znalezione optymalne parametry podstawiane są zgodnie ze wzorem Φ(s) = 1Aopt(s)
.
Ponownie dokonywane jest poszukiwanie optymalnych ai i bi. Z kolejnymi iteracjami optymali-
zacji otrzymuje się zbieżność przedstawioną na rys. 2.12b.
Oprócz przedyskutowanej wcześniej wady związanej z nieskończoną odpowiedzią impulsową
funkcji przejścia Φ(s), metoda charakteryzuje się koniecznością ustawienia zwykle nieznanego
29
warunku początkowego transmitancji Φ(s) wpływającego na jakość identyfikacji. Wpływ ten za-
nika wraz z wydłużeniem czasu identyfikacji oraz zastosowanym obcięciem początkowego stałego
fragmentu w przeprowadzanych symulacjach.
Rys. 2.12. Realizacja modelu do syntezy transmitancji obiektu.
Znacznie lepszą alternatywą w klasie metod bezpośrednich jest metodologia użycia funkcji
modulujących o nośniku zwartym φ(t). Pozwala ona na zastosowanie skończonego okna obserwa-
cji, gwarantuje dokładność identyfikacji i formuły analityczne na optymalne parametry obiektu.
Zastosowanie obustronnego splotu z tą funkcją φ(t) do liniowego obiektu o nieznanych parame-
trach ai i bi:n∑i=0
aiy(i)(t) =
m∑i=0
biu(i)(t) (2.9)
i nieznanych funkcjach y(i)(t) i u(i)(t) dla i > 0, powoduje otrzymanie nowego równania obiektu,
które jest już równaniem algebraicznym o znanych wszystkich funkcjach składowych
n∑i=0
aiyi(t) =m∑i=0
biui(t) + ε(t) (2.10)
i tych samych nieznanych parametrach. Do tego systemu można już zastosować metody wyli-
czania najlepszych parametrów ai i bi, np. w oparciu o wskaźniki minimalno-kwadratowe i wy-
korzystanie macierzy Grama. Metodologia stosowania funkcji modulujących była prezentowana
w [77, 113]. Systemowe podejście i wersje optymalne przedstawiono w pracach [17, 19, 21].
Podstawowym problemem jest wybór właściwej funkcji modulującej do badanego systemu.
W niniejszej pracy autor zaproponował metodykę konstrukcji funkcji modulujących poprzez ich
30
aproksymację funkcjami sklejanymi. Wprowadzenie sparametryzowanej rodziny funkcji skleja-
nych pozwoliło na dobór (optymalny) najlepszego kształtu funkcji modulującej. Drugim proble-
mem badawczym, którego rozwiązanie przyniosło bardzo dobre efekty, było zastosowanie funkcji
sklejanych bezpośrednio do aproksymacji sygnałów wejścia i wyjścia. Otrzymanie wzorów ana-
litycznych na zaobserwowany kształt y(t) i u(t) pozwoliło na obliczenie analityczne kolejnych
pochodnych tych sygnałów. Umożliwiło to zastosowanie metod minimalno-kwadratowych na
identyfikację nieznanych parametrów ai i bi bez stosowania transformacji splotowych.
Ostatnim problemem badawczym była realizacja i analiza jakości regulatora adaptacyjnego
wykorzystującego przetransformowany stan, otrzymany z metod splotowych i wykorzystującego
oryginalny stan odtworzony metodą funkcji sklejanych.
2.8. Nowe badania
W rozdziale następnym zostanie przedstawiona splotowa metoda identyfikacji parametrów cią-
głego liniowego systemu. Następnie zostanie pokazana możliwość obserwacji stanu. Identyfikacja
i obserwacja posłużą do syntezy regulatora adaptacyjnego LQR. Metody identyfikacji, obserwa-
cji i regulacji zakładają dostęp do pochodnych sygnałów wejściowego i wyjściowego z obiektu.
Zwykle pochodne te są nie mierzalne i zachodzi potrzeba ich estymacji.
Zastosowanie funkcji modulujących do estymacji pochodnych sygnałów zostanie przedstawio-
ne w rozdziale 4. Inne podejście do estymacji pochodnych sygnału pomiarowego z wykorzysta-
niem funkcji sklejanych zostanie przedstawione w rozdziale 5. Pokaże się możliwość zastosowania
bazowych funkcji sklejanych jako funkcji modulujących o nośniku zwartym. Eksperymenty zo-
staną przedstawione na przykładzie wymiennika ciepła. Budowa i charakterystyka klasycznych
przemysłowych wymienników ciepła jest opisana w [100], ogrzewane reaktory chemiczne z prze-
pływem oscylacyjnym przedstawiono w [119]. Zastosowanie wymienników ciepła w klimatyzacji,
w szczególności obiegi chłodnicze, czynniki chłodnicze, regulacja mocy urządzeń oraz inne za-
gadnienia techniki chłodniczej przedstawiono w [62].
31
Rozdział 3
Splotowa metoda identyfikacjisystemów ciągłych
3.1. Identyfikacja z użyciem funkcji modulującej
W literaturze można spotkać opis metod identyfikacji transmitancji ciągłej [67]. Przedstawiona
w tej pracy metoda splotowa zamiast filtrów o nieskończonej odpowiedzi czasowej (ang. Infi-
nite Impulse Response, IIR) wykorzystuje filtry o skończonej odpowiedzi czasowej (ang. Finite
Impulse Response, FIR). Ogólna metoda estymacji liniowego i częściowo nieliniowego systemu
z użyciem funkcji modulujących została przedstawiona przez Shinbrota (1957). Kontynuacja
dalszych prac spowodowała dostarczenie kolejnych metod różniących się wyborem użytej funkcji
modulującej [102, 103, 104]. Metoda identyfikacji z wykorzystaniem funkcji modulujących o no-
śniku zwartym jest pozbawiona wady, jaką miały wcześniejsze metody, tzn. wpływu warunku
początkowego na jakość identyfikacji.
Metoda bezpośrednia otrzymywania parametrów polega na przetwarzaniu oryginalnych rów-
nań różniczkowych z użyciem filtrów lub innych operacji. Wśród metod w tej klasie ważną rolę
spełniają metody całkowe wykorzystujące funkcje modulujące o nośniku zwartym (o skończonej
odpowiedzi impulsowej ang. Finite Impulse Response, FIR). Mogą być one implementowane je-
dynie jako filtry cyfrowe. Ich cechą jest większy nakład obliczeniowy w porównaniu z filtrami IIR
realizowanymi metodami iteracyjnymi rozwiązań równań różnicowych. Wysoką stabilność nume-
ryczną w obliczeniach stałoprzecinkowych uzyskuje się przez zastosowanie struktur kratowych
[131]. Metody całkowe identyfikacji z funkcją modulującą charakteryzują się brakiem wrażliwości
na warunki początkowe identyfikowanego systemu oraz posiadają dobre właściwości filtracyjne.
Z uwagi na filtrujące właściwości całki metoda gwarantuje bardzo dobrą jakość identyfikacji
w obecności zakłóceń. Powyższe cechy sprawiają, że metody te są z powodzeniem stosowane dla
rzeczywistych procesów.
Praca [129] dotyczy zastosowania metod funkcji modulujących oraz metod wielokrotnego cał-
32
kowania za pomocą nieklasycznego rachunku operatorów R. Bittnera. Metodę zastosowano do
identyfikacji parametrów dynamiki statku jako modelu pierwszego rzędu oraz pokazano moż-
liwości zastosowania do identyfikacji obiektów o parametrach niestacjonarnych na przykładzie
modelu I-go rzędu dynamiki stężenia znacznika w ściekach.
3.2. Omówienie zasad identyfikacji dla obiektów SISO
Schemat poglądowy układu pomiarowego w zagadnieniu identyfikacji parametrów ciągłego sys-
temu SISO przedstawiono na rys. 3.1. Dane pomiarowe z wejść i wyjść identyfikowanego obiektu
przekazywane są do algorytmu co ∆t - czas dyskretyzacji. Zakłada się, że częstotliwość próbko-
wania jest na tyle duża, że efekt dyskretyzacji przetwornika jest pomijalny.
Rys. 3.1. Schemat poglądowy układu identyfikacji SISO z addytywnymi szumami.
Model liniowego, ciągłego procesu o jednym wejściu i jednym wyjściu (ang. Single Input
Single Output, SISO), o parametrach stałych w czasie (ang. Linear Time Invariant, LTI) ma
postać:n∑i=0
aiy(i)(t) =
m∑i=0
biu(i)(t), (3.1)
gdzie: y(i)(t), u(i)(t) są i-tą pochodną wyjścia i wejścia, ai, bi to nieznane stałe parametry modelu
o łącznej ilości n + m + 2. Zachowanie zasady przyczynowo-skutkowego zachowania modelu
wymaga by n m. Przyjęto, że dane są pomiary y(t) i u(t) na przedziale [t0, T ], gdzie T możebyć dalej rozważane jako czas bieżący. Ponadto poczyniono założenia, że warunki początkowe są
nieznane.
Model (3.1) wymaga pewnej uwagi wyjaśniającej. Można zauważyć, że przyjęto w modelu
wszystkie parametry nieznane ai, i ∈ [0, n] i bi, i ∈ [0,m]. Oznacza to, że identyfikacja będziezwiązana z najlepszym dopasowaniem obu stron równania (ang. equation error, EE), przy pew-
nych ogólnych warunkach ograniczających (aby wykluczyć rozwiązanie trywialne ai = bi = 0).
33
Powszechnym podejściem, od czasów C. F. Gaussa, jest identyfikacja tylko względem sygnału
wyjściowego y(t), przy z góry przyjętym założeniu wartości współczynnika a0 = 1 (to jest właśnie
warunek ograniczający) (ang. output error). Wszystkie znane wersje metody najmniejszych kwa-
dratów (MNK) dotyczą takiego przypadku. Metodologia EE wydaje się ogólniejsza, bo pozwala
identyfikować obiekty całkowe (a0 = 0) lub niższego rzędu niż założony (an = 0).
Problemem dla identyfikacji modelu (3.1) jest pomiar pochodnych y(i)(t), u(i)(t), zwłasz-
cza w zadaniach zakłóconych nieskorelowanymi szumami pomiarowymi νu(t) i νy(t) (rys. 3.1).
W celu uniknięcia trudności związanych z pomiarami pochodnych w (3.1) model ten zostanie
przekształcony w bardziej użyteczny poprzez transformację splotową sygnału pomiarowego na
skończonym oknie czasowym ze specjalnie dobranymi funkcjami modulującymi φ(t). Wybierając
specjalną funkcję filtrującą φ(t) ze znanymi pochodnymi φ(i)(t) można policzyć splot obu stron
modelu (3.1) o nieznanych pochodnych y(i)(t), u(i)(t) i funkcji φ(t).
Dla przyjętego liniowego, stacjonarnego oraz ciągłego system SISO n-tego rzędu o stałych
parametrach (3.1) dane są tylko ciągłe pomiary funkcji y(t) i u(t) na przedziale [t0, T ]. Zakłada
się, że y ∈ L2(t0, T ) i u ∈ L2(t0, T ). Nieznanych jest n +m + 2 parametrów ai i bi. Z powodu
nieznanych pochodnych y(i)(t) i u(i)(t) nie jest łatwo przeprowadzić bezpośrednią identyfikację
systemu (3.1). Aby ominąć te trudności, można skorzystać z własności transformacji splotowej,
poddając obie strony równania (3.1) splotowi (całkowanie każdego wyrazu) z wybraną, specjalną
funkcją filtrującą, zwaną też funkcją modulującą φ(t), o znanych również pochodnych φ(i)(t).
Zakłada się, że po wykonaniu splotu każdy wyraz sumy z lewej i prawej strony równania (3.1)
będzie tworzyć nową funkcję, również należącą do przestrzeni L2. W tym celu w dalszej części
tekstu, zostaną podane wymagania co do funkcji φ(t). Podstawową jej własnością powinno być,
że jest to funkcja o nośniku zwartym, tzn. określona i różna od zera na skończonym przedziale
(0, h), gdzie h << T−t0. Aby po wykonaniu operacji splatania równanie (3.1) zachowało równośćobu stron bez względu na warunki początkowe, muszą być też spełnione warunki zerowania się
funkcji φ(t) i jej pochodnych φ(i)(t) na brzegach nośnika. Wtedy otrzymuje się równoważny do
(3.1) model algebraiczny (3.2), w którym po lewej i prawej stronie występują sumy znanych już
funkcji yi(t) i ui(t) otrzymanych w wyniku splatania, z tymi samymi, nieznanymi parametrami
ai i bi:n∑i=0
aiyi(t) =m∑i=0
biui(t). (3.2)
Model ten umożliwia już opracowanie procedur identyfikacji. Poniżej przedstawione zostaną
szczegóły wyżej przeprowadzonych operacji i warunki ich wykonania.
3.3. Splotowa estymacja pochodnych sygnału
Wierne odtworzenie kolejnych pochodnych sygnału pomiarowego jest celem wielu metod jego
przetwarzania. Jedną z metod liniowej transformacji funkcji y jest filtracja splotowa z wybraną
34
funkcją φ. Problem stanowi poprawność doboru odpowiedniego kształtu funkcji modulującej φ(t)
przy nałożonych ograniczeniach. Ta funkcja powinna być niezerowa w przedziale [0, h], h � T
i zero na zewnątrz tego przedziału (funkcja ze zwartym nośnikiem). Z własności splotu wynika
możliwość uniknięcia konieczności liczenia pochodnych y(i) i u(i) na rzecz znanych pochodnych
φ(t). Splot generuje nowe funkcje yi(t), ui(t), dla i = 0, . . . , n(m) i czasu t ∈ [t0 + h, T ]. Z wła-ściwości splotu [8] wynika, że:
yi(t)df= [y(t) ∗ φ(t)](i) = y(i)(t) ∗ φ(t) = y(t) ∗ φ(i)(t). (3.3)
Dla specjalnie dobranych funkcji filtrujących o nośniku zwartym φ(t) ∈ Cn[0, h] oraz ciągłychpomiarów danych funkcją y(t), gdzie y(t) i φ(t) są bezwzględnie całkowalne w t ∈ [t0, T ] zachodzi:
yi(t)df= y(t) ∗ φ(i)(t) df=
+∞∫−∞
y(τ)φ(i)(t− τ)dτ (3.4)
=t−h∫−∞
y(τ)φ(i)(t− τ)dτ +t∫
t−h
y(τ)φ(i)(t− τ)dτ +∞∫t
y(t)φ(i)(t− τ)dτ . (3.5)
Ponieważ funkcja modulująca φ(t) = 0 dla t /∈ (0, h), metoda jest nieczuła na wpływ warunkówpoczątkowych na jakość identyfikacji. Pierwsza i trzecia całka w (3.5) są równe 0. Ostatecznie
z (3.3) otrzymuje się:
yi(t)df=
t∫t−h
y(i)(τ)φ(t− τ)dτ =t∫
t−h
y(τ)φ(i)(t− τ)dτ =h∫0
y(t− τ)φ(i)(τ)dτ . (3.6)
Rys. 3.2. Sploty.
Wyniki operacji splatania sygnału pomiarowego z funkcją modulującą przedstawiono na rys.
3.2. Dla bieżącego czasu t, równanie (3.6) i (3.7) reprezentuje sunące okno, przetwarzające sygnał
35
pomiarowy u i y na przedziale [0, T ]. Odpowiednio dla sygnału wejściowego otrzymujemy:
ui(t)df=
h∫0
u(i)(t− τ)φ(τ)dτ =h∫0
u(t− τ)φ(i)(τ)dτ . (3.7)
3.4. Dobór kształtu funkcji modulującej
Konieczność spełnienia równania (3.1) w klasie funkcji L2 powoduje, że sploty muszą też być
funkcjami należącymi do L2[t0+h, T ]. Wynika z tego, że funkcje φ(t) muszą posiadać odpowiednią
gładkość zerując się wraz ze swoimi pochodnymi na brzegach nośnika:
φ(i)(0) = φ(i)(h) = 0 dla każdego i = 0, . . . , n. (3.8)
Dodatkowy warunek ograniczający dobór funkcji modulującej wynika z rozwinięcia φ(t) w sze-
reg Fouriera o okresie [0, h]. Dla φ(t) poddanego transformacie sinusowej i kosinusowej powinny
występować wszystkie współczynniki rozwinięcia. W przeciwnym razie filtracja będzie usuwa-
ła z sygnału pomiarowego pewne częstotliwości, co spowoduje zubożenie informacji zawartej
w sygnale pomiarowym dla zadania identyfikacji. Wyklucza to funkcje symetryczne postaci:
φ(h
2+ t) = φ(
h
2− t) dla każdego t ∈ (0, h
2) (3.9)
oraz funkcje parzyste:
φ(h
2+ t) = −φ(h
2− t) dla każdego t ∈ (0, h
2). (3.10)
Ogólnie dla funkcji modulującej powinien zachodzić też warunek jednoznaczności splotu w prze-
dziale [0, h]. Jeżeli:
y(t) ∗ φ(t) = 0⇒ y(t) = 0 dla t ∈ [0, h]. (3.11)
Dodatkowe szczegółowe informacje dotyczące wymagań stawianych funkcją modulującym
w zastosowanym do zagadnienia identyfikacji podano w [17].
3.5. Optymalna identyfikacja
Rysunek 3.3 przedstawia schemat poglądowy metody błędu niedopasowania obustronnego rów-
nania (ang. Equantion Error, EE). Niedopasowanie może wynikać z błędów numerycznych, szu-
mów pomiarowych na rejestrowanych przebiegach u(t) i y(t) lub złym doborem rzędów modelu
36
n i m w stosunku do systemu rzeczywistego
n∑i=0
aiyi(t) =m∑i=0
biui(t) + ε(t). (3.12)
Do równania (3.2) dodano więc funkcję skalującą ε(t) ∈ L2(0, T ) wyrażającą sumacyjny efektbłędu niedopasowania równania.
Rys. 3.3. Rysunek poglądowy metody błędu niedopasowania obustronnego równania.
Norma różnicy obu stron równania została przyjęta jako wskaźnik jakości doboru parametrów
modelu
J =
∥∥∥∥∥n∑i=0
aiyi(t)−m∑i=0
biui(t)
∥∥∥∥∥L2[0,T ]
. (3.13)
Wektory funkcji yi(t), ui(t) i parametrów ai, bi zostały oznaczone odpowiednio jako c(t) i Θ:
ε(t) = cT (t)Θ =[yT (t) −uT (t)
]Θ
=[y0(t) . . . yn(t) −u0(t) . . . −um(t)
]·[a0 . . . an b0 . . . bm
]T.(3.14)
Problem minimalizacji ma postać:
minΘJ2 = min
Θ‖ε(t)‖2L2[0,T ] = minΘ
∥∥∥cT (t)Θ∥∥∥2L2[0,T ]
. (3.15)
Kwadrat normy jest iloczynem skalarnym w przestrzeni L2:
J2 =⟨cT (t)Θ, cT (t)Θ
⟩L2= ΘT
⟨c(t), cT (t)
⟩Θ = ΘTGΘ. (3.16)
Macierz Grama G jest symetryczną macierzą liczbową iloczynów skalarnych elementów wektora
37
c(t)
G =
〈y0(t), y0(t)〉 . . . 〈y0(t), yn(t)〉 − 〈y0(t), u0(t)〉 . . . −〈y0(t), um(t)〉... . . . ...
... . . . ...
〈yn(t), y0(t)〉 . . . 〈yn(t), yn(t)〉 − 〈yn(t), u0(t)〉 . . . −〈yn(t), um(t)〉− 〈u0(t), y0(t)〉 . . . −〈u0(t), yn(t)〉 〈u0(t), u0(t)〉 . . . 〈u0(t), um(t)〉
... . . . ...... . . . ...
−〈um(t), y0(t)〉 . . . −〈um(t), yn(t)〉 〈um(t), u0(t)〉 . . . 〈um(t), um(t)〉
, (3.17)
gdzie iloczyny skalarne w L2[h, T ]
〈yi(t), uj(t)〉 =T∫0
yi(τ)uj(τ)dτ =T∫0
[h∫0
y(τ − s)φ(i)(s)ds][h∫0
u(τ − s)φ(j)(s)ds]dτ . (3.18)
Macierz G jest symetryczna, dodatnio określona, nieosobliwa (liniową niezależność elementów
wektora c(t) gwarantują szumy pomiarowe) i posiada rzeczywiste i różne wartości własne.
3.5.1. Ograniczenie liniowe na wartość parametrów
Dla warunku normalizującego, eliminującego rozwiązanie trywialne Θ = 0 przyjmuje się ogólne
liniowe ograniczenie:
ηTΘ = 1, (3.19)
gdzie η ∈ Rn+m+2 jest dowolnym liczbowym wektorem. Jak było to powiedziane, w zagadnieniachidentyfikacji powszechnie przyjmowane jest np. a0 = 1 czyli ηT = [1, 0 . . . 0]. W celu rozwiązania
problemu optymalizacji z ograniczeniami liniowymi tworzymy funkcję Lagrange’a:
L = ΘTGΘ+ λ(ηTΘ− 1). (3.20)
Z warunku koniecznego istnienia minimum:
∂L
∂Θ= 2GΘ+ λη = 0. (3.21)
Mnożąc obustronnie równanie (3.21) przez ΘT otrzymujemy:
2ΘTGΘ+ λ = 0⇒ λ = −2ΘTGΘ. (3.22)
Z (3.21) wynika, że:
Θ = −12λG−1η, (3.23)
38
z równań (3.22) i (3.23) otrzymujemy:
λ = −12λ2ηTG−1GG−1η = −1
2λ2ηTG−1η. (3.24)
Następnie obliczamy λ różne od zera:
λ = − 2ηTG−1η
. (3.25)
Otrzymany z (3.23) i (3.25) wzór na optymalną estymatę parametrów wygląda następująco:
ΘO =G−1ηηTG−1η
. (3.26)
3.5.2. Ograniczenie kwadratowe na wartości parametrów
Inne wyniki na optymalne parametry Θ otrzymuje się przyjmując ograniczenie kwadratowe [19]:
ΘTΘ = 1. (3.27)
Parametry należą do kuli jednostkowej Θ ∈ B(0, 1). Funkcja Lagrange’a L ma postać:
L = ΘTGΘ+ λ(1−ΘTΘ). (3.28)
Z warunków koniecznych optymalności wynika:
∂L
∂Θ= 2GΘ− λΘ = 0⇒ GΘo = λΘo. (3.29)
Optymalny zestaw parametrów Θo jest wektorem własnym wmin macierzy Grama G związa-
nym z minimalną wartością własną λmin, która jest rzeczywista i dodatnia. Jest to szczególny
przypadek wzoru (3.26) dla η = wmin.
3.5.3. Wyliczenie wektorów własnych
Opis rozwiązania pełnego zagadnienia poszukiwania wektorów i wartości własnych można znaleźć
w podręcznikach do metod numerycznych [6, 59, 35, 8] oraz w dokumentacji do najbardziej
popularnych pakietów bibliotek numerycznych [1, 38, 105]. Metody te bazują na dekompozycji
macierzy na iloczyn dwóch macierzy Q i R, gdzie Q jest macierzą ortogonalną, a R jest macierzą
trapezoidalną górną. Ponadto podano uproszczenia metody dla macierzy symetrycznych, jaką
w rozważanej metodzie identyfikacji jest macierz Grama.
Przybliżone rozwiązania bazują na jednokrotnym rozwiązaniu pełnego zagadnienia własnego
dla macierzy Grama. Następnie w kolejnych iteracjach rozwiązywane są tylko odpowiednie rów-
39
nania różniczkowe, które mają zadanie śledzenia wektora własnego skojarzonego z najmniejszą
wartością własną. Postacie równań różniczkowych wraz z porównaniem ich właściwości przed-
stawiono w [18, 19].
Metoda iteracji odwrotnej jest odmianą metody potęgowej o zbieżności porównywalnej z me-
todami dekompozycji QR i LR [35] dla zagadnienia własnego. Charakteryzuje się brakiem
konieczności wyliczenia początkowego wektora własnego skojarzonego z najmniejszą wartością
własną, wystarczy wybrać początkowy wektor ‖x0‖ = 1. Cyklicznie w każdym kroku, kolejnychchwilach czasowych, wyliczana jest jedna iteracja równania:
vi+1 = (A− kiI)−1ximi+1 = ‖vi+1‖
xi+1 =vi+1mi+1, (3.30)
gdzie ki jest przesunięciem, którego dobranie blisko wartości własnej λn powoduje uzyskanie
lepszej zbieżności metody. Stosując metody potęgowe w stosunku do równań różniczkowych nie
ma problemu z wyborem metody rozwiązywania równań różniczkowych.
3.6. Rozszerzane i ruchome okno
Główne okno przetwarzające sygnały ma długość [0, T ]. Można założyć, że w zastosowaniach
on-line prawa jego strona stanie się bieżącym czasem T = t. Takie okno stanie się więc oknem
rozszerzanym. W każdej chwili czasu T = t uzyskane rozwiązanie na parametry Θ reprezentuje
stałą ich wartość w przedziale [0, T ]. W przypadku zmienności parametrów, taka metoda daje
uśrednioną ich wartość zawsze dla przedziału [0, T = t]. Należy wtedy dla ∀T = t doliczyć nowewartości końcowe splotów yi(T ) i ui(T ) oraz nowe wartości iloczynów skalarnych w macierzy
Grama.
Rys. 3.4. Porównanie obserwacji rozszerzanego (a) i okna ruchomego (b).
40
Rozszerzane okno całkowe (ang. expanded window) odpowiada rozwiązaniu równania różnicz-
kowego, gdzie wartość aktualnej chwili czasowej zależy od wartości początkowej, dynamiki układu
oraz historii/trajektorii sterowań. Wadą rozszerzalnego okna jest zbyt wolne adaptowanie się do
zmieniających warunków i brak zapominania historii, rys. 3.4. W zadaniach asymptotycznych
należy posługiwać się wtedy współczynnikiem zapominania.
By obliczyć wartość estymowanych parametrów potrzebna jest aktualna wartość macierzy
Grama. W obliczeniach rekurencyjnych na bieżąco możemy wykorzystać informację o warto-
ści macierzy Grama w poprzedniej chwili czasowej, ewentualnie kilku poprzednich wartościach
macierzy Grama, w zależności od tego, jaką metodę całkowania wykorzystujemy do policzenia
iloczynów skalarnych.
Rozszerzalne okno można wykorzystać do oszacowania minimalnej długości ruchomego okna
o stałej szerokości. Rozszerzane okno od pewnego momentu ma zgromadzoną wystarczającą
ilość informacji by poprawnie wyliczyć parametry identyfikowanego systemu. Taką szerokość
rozszerzanego okna T można uznać za wystarczającą dla uruchomienia ruchu okna. Wtedy należy
odrzucać w macierzy Grama początkowe [t−T, t] iloczyny skalarne nie wchodzące już do obliczeńokna [t − T, t]. Takie przesuwane okno o stałej szerokości T lepiej identyfikuje parametry Θ(t),które mogą być niestacjonarne.
41
Rozdział 4
Optymalizacja kształtu funkcjimodulujących
Bardzo dobrą jakość identyfikacji modeli liniowych, ciągłych w obecności zakłóceń gwarantują
metody wykorzystujące splotowe filtry z funkcjami modulującymi z nośnikiem zwartym. W tym
rozdziale zostaną przedstawione takie funkcje, a w szczególności omówione będą metody filtracji
pochodnych sygnałów w zastosowaniu do identyfikacji systemów ciągłych.
4.1. Przegląd funkcji modulujących
Do identyfikacji systemów ciągłych w dziedzinie czasu wykorzystuje się metody: momentów funk-
cyjnych Poissona (ang. Poisson moment functionals, PMF), Block Pulse Function, funkcji Wal-
sha, wielomianów ortogonalnych, ogólnych hybrydowych funkcji ortogonalnych (ang. general hy-
brid orthogolan functions), wielomianów Laguerry, momentów czasowych (ang. time moments),
delayed state variable filters, metody momentów funkcyjnych Shinbrota, funkcji modulujących
Hermita, funkcji modulujących Fouriera, modulujących funkcji sklejanych, funkcji modulujących
Hartleya.
Tabela 4.1 zawiera przegląd różnych funkcji modulujących. Problemem jest taki dobór pod-
stawowych/charakterystycznych parametrów funkcji modulującej by stanowiły one bazę do ge-
neracji całej rodziny funkcji modulujących danego typu. Takie podejście umożliwi późniejszą
optymalizację kształtu.
W dalszych rozważaniach ograniczymy się do funkcji Loeba i Cahena postaci φ(t) = tM(h−t)N , liczby M 6= N . Taka funkcja określona na przedziale [0, h] zeruje się wraz ze swoimi po-
chodnymi na brzegach przedziału wg (3.8) i ma postać dzwonu, rys. 4.1. Funkcja ta ma jedynie
dwa stopnie swobody M i N wpływania na jej kształt przy ustalonym oknie h. Zwykle taka
ilość stopni swobody okazuje się niewystarczająca w optymalizacji kształtu funkcji modulującej.
Wydaje się naturalnym rozwinięcie tej funkcji jako złożenie kilku wzajemnie poprzesuwanych
42
Tabela4.1.Przeglądfunkcjimodulującychzastosowanychwzagadnieniuidentyfikacjiparametrówsystemuciągłego.
Funkcjamodulująca
Referencje
Uwagi
φm(t):={ sin
m(nπ ht)dlat∈[0,h]
0inaczej
Shinbrot(1954,1957),
PerdreauvilleandGoodson(1996)
liniowyinieliniowysystemII-gorzędu;obiektyopa-
rametrachrozproszonych;linioweinieliniowesystemy
II-goiIV-tegorzęduoparametryzmiennewczasie
φ(t):=
{ (t−h)3
6λ4e−(t−h)/λdlat∈[−h 2,h 2]
0inaczej
PuchoviChinayev(1973)
I-gorzędusystemyzopóźnieniem
φ(t):=e−(t−h 2)2/2H0(t−h 2)
2π
Hi-funkcjaHermite-a
Takaya(1968)
II-gorzędusystemy
φ(t):={ a[1
−cos(2πth)]dlat∈[0,h]
0wprzeciwnymrazie
BruederleiWeber(1970)
II-gorzędusystemy
φk(t):=
{ (h−tk!)e−c(h−t)dlat∈[0,h]
0inaczej
k:=0,1,2,...
FairmaniShen(1970)
SahaiRao(1979,1980,1982)
rozproszonesystemyoparametrachzmieniającychsię
wczasie;II-gorzędusystemyzopóźnieniem,MIMO
2x2
φc,k(t):=
{ ∑[(n+1)/2]
j=0
ak,jcos(mk+jω0t)dlat∈[0,nh]
0inaczej
φs,k(t):=
{ ∑[n/2]
j=0b k,jsin(mk+jω0t)dlat∈[0,nh]
0inaczej
Lee(1985),
Pearson(1979,1983,1984,1985a,b)
symulowanyfiltrdolnoprzepustowy;dynamikaczujni-
ka
φ(t):={ tn
(h−t)nF(t)dlat∈[0,h]
0inaczej
F(t)::funkcjaróżniczkowalnan−1razy
LoebaiCahena(1963),
LoebaiCahena(1965),
II-gorzęduobiekty(VanderPole);linioweinieliniowe;
rozproszone;II-gorzędusystemyniestacjonarne
φn(t):=
nT ∫ 0
···nT ∫ 0
(−1)j( n j) δ(
ih−t)dntdlat∈[0,nh]
0inaczej
Maletinsky(1976,1978)
Metzger(1982,1983)
Preisig(1984)
Presig(1988,1989,1990)
II-gorzędusystemylinioweinieliniowe;dynami-
kaźrenic;II-gorzędunieliniowesystemyelektro-
mechaniczne;użytowobserwacjisystemówliniowych
inieliniowych;nieizotermicznywsadowyreaktorzli-
niowąinieliniowąreakcją;
φ(t)=
{ ∑n i=0(−1)i(n i)(cas(n+m−j)2π Tt0<t¬T
0inaczej
cas(t)=cos(t)+sin(t),m=0,±1,±2,...
PatraiUnbehauen(1995)[96]
Daniel-BarheiUnbehauen(1999)[26]
zastosowaniefunkcjimodulującychHartlejadoiden-
tyfikacjisystemównieliniowychnp.silnikaDC
φ(t)=∑ N−
k−1
i=0
diBk i(t)
Bk i(t)-wielomianbazowy
ByrskiiNowak(2005)
użytowidentyfikacjiiobserwacjisystemówliniowych
φ(t):=
{∑n i=0(hpi−t i)n i(hki−t i)m iai(ti)dlat i∈[hpi,hki]
0inaczej
ai-współczynniki,hpi,hki∈[0,h]
WielokrotnefunkcjeLoebaiCahena
użytowoptymalizacjikształtufunkcjimodulujących
wzagadnieniuidentyfikacjiiobserwacjisystemówli-
niowych
43
funkcji Loeba i Cahena. Oprócz samego zwielokrotnienia ilości parametrów M i N dostajemy
możliwość skalowania poszczególnych funkcji, co znacząco wpływa na ostateczny kształt funkcji
modulującej φ.
Rys. 4.1. Przykład funkcji Loeba i Cahena dla N = 4, M = 5 i h = 3.
Uogólnionym pomysłem kilku wzajemnie poprzesuwanych funkcji Loeba i Cahena jest zasto-
sowanie jako funkcji modulujących bazowych funkcji sklejanych. Bazowe funkcje sklejane mogą
stanowić bazę służącą do generacji krzywych wielomianowych założonego stopnia.
4.2. Bazowe funkcje sklejane
Zaprezentowane zostanie zastosowanie bazowych funkcji sklejanych jako funkcji modulujących.
Krzywe Beziera s(t) budowane w oparciu o wielomiany Bersteina Bni [58] mają postać:
s(t) =n∑i=0
piBni (t) (4.1)
gdzie:
Bnidf=(n
i
)ti(1− t)n−i dla i = 0, · · · , n. (4.2)
Wielomiany Bni (t) są liniowo niezależne. Krzywe Beziera stanowią szczególny przypadek krzy-wych B-sklejanych.
Wielomianowe krzywe oraz płaty powierzchniowe realizowane z wykorzystaniem wielomia-
nów Bersteina charakteryzują się w zastosowaniach praktycznych pewnymi wadami. Przykła-
dowo, przesunięcie punktu kontrolnego powoduje konieczność zmiany całej krzywej albo płata.
44
W praktyce objawia się to niemożnością wprowadzenia lokalnych zmian. Modelowanie skom-
plikowanych kształtów wymaga stosowania wielomianów wysokiego stopnia. Numerycznie ob-
liczenie współczynników krzywej Beziera dla wysokiego rzędu wielomianu jest skomplikowane
i kłopotliwe w systemach komputerowych. Powstają błędy numeryczne oraz dla równania (4.2)
współczynniki dwumianu Newtona szybko przekraczają zakres liczb 32 bitowych [58].
Pomysłem na rozwiązanie powyższych problemów są krzywe złożone z wielu łuków wielo-
mianowych niskiego rzędu. Takie krzywe zwane są krzywymi sklejanymi. Krzywe B-sklejane
stanowią uogólnienie krzywych Beziera i są chętnie stosowane w zagadnieniach interpolacji oraz
aproksymacji dla krzywych i powierzchni.
Funkcje sklejane mogą być wykorzystane do optymalizacji funkcji filtrujących o nośniku zwar-
tym. Umożliwiają łatwiejsze konstruowanie funkcji modulujących przy zachowaniu ograniczeń,
jakie nakłada metoda splotowa identyfikacji. Dodatkowo uzyskujemy wiele parametrów moż-
liwych do wykorzystania w procesie optymalizacji kształtu funkcji modulującej. W rozdziale
zostaną przedstawione bazowe funkcje sklejane (ang. base spline) budowane w oparciu o pewną
klasę funkcji wielomianowych.
W literaturze można spotkać funkcje sklejane budowane w oparciu o funkcje wielomianowe,
funkcje wykładnicze, funkcje trygonometryczne [77, 102]. Funkcje sklejane znajdują zastosowanie
w zagadnieniu interpolacji i aproksymacji punktów pomiarowych dla krzywych i powierzchni.
W dalszej części pracy ograniczono się tylko do zagadnienia aproksymacji, gdyż właśnie to zagad-
nienie znajduje zastosowanie w budowie regulatora adaptacyjnego. Z uwagi na klasę sygnałów
spotykanych w automatyce użycie wykładniczych funkcji sklejanych powinno przynieść lepsze
efekty w postaci zmniejszenia błędu zagadnienia aproksymacji.
4.2.1. Krzywe B-sklejane
Poniżej zostaną opisane ogólne właściwości bazowych funkcji sklejanych. Funkcja sklejana S(t)
dla t ∈ [ti, ti+1] jest opisana:
s(t) = di0 + di1(t− ti) + di1(t− ti)2 + . . .+ din(t− ti)n
=n∑j=0
dij(t− ti)j dla i = 1, 2, . . . , N − 1, (4.3)
gdzie dij to współczynniki skalujące, N jest ilością węzłów, n jest stopniem wielomianu aprok-
symującego. Z uwagi na problemy nieciągłości pochodnych wynikłe z błędów numerycznych po-
wstałych w trakcie sklejania powyższych wielomianów, zrezygnowano z przedstawionego wyżej
wzoru. Wielomianowe funkcje sklejane zostały zastąpione unormowanymi bazowymi funkcjami
sklejanymi, które z uwagi na swoje właściwości gwarantują swobodę wyboru węzłów i ciągłość
założonego rzędu.
Funkcje modulujące i rzeczywiste sygnały pomiarowe mogą przyjmować zbyt skomplikowane
45
kształty by przybliżyć je pojedynczym wielomianem. Stopień takiego wielomianu k musiałby być
zbyt wysoki, co powodowało by w praktyce dużą komplikację obliczenia jego współczynników [58].
Zastosowanie funkcji sklejanych s(t) umożliwia podzielenie tych krzywych na mniejsze fragmenty,
które jesteśmy w stanie przybliżyć wielomianem znacznie niższego stopnia (rys. 4.2).
Rys. 4.2. Przykład bazowych funkcji sklejanych, N = 10, k = 3.
Przyjmujemy niemalejący ciąg N punktów kontrolnych ui, zwanych dalej węzłami funkcji
sklejanej (i - nr węzła), takich że:
u0 ¬ u1 ¬, . . . ,¬ uN−1 ¬ uN dla N > k. (4.4)
Węzły gwarantują ciągłość krzywej s(t) wraz z pochodnymi co najmniej rzędu k − r, gdzier jest krotnością występowania węzła. Krotność występowania tego samego węzła na końcach
krzywej narzuca dodatkowe ograniczenia na wartości kolejnych pochodnych w tym punkcie.
s(t) =N−k−1∑i=0
diBki (t), (4.5)
gdzie di są współrzędnymi w bazie funkcji Bki (t) przestrzeni wielomianów stopnia nie większego
niż k danej zależnością:
Bki (t)def= (−1)k+1(ui+k+1 − ui)Mki (t) (4.6)
46
dla i = 0, . . . , N − k − 1, gdzie:
Mki (t) = gk[ui, . . . , ui+k+1] (4.7)
jest różnicą dzieloną funkcji g o postaci:
gk[ui] = gk(ui) (4.8)
gk[ui, . . . , ui+k+1] =gk[ui . . . ui+k]− gk[ui+1 . . . ui+k+1]
ui − ui+k+1. (4.9)
Postać jawna (nierekurencyjna) dla funkcji różnicy dzielonej dowolnego rzędu:
gk[ui, . . . , ui+k+1] =i+k+1∑j=i
gk(uj)∏l=i,...,i+k+1l 6=j
(uj − ul). (4.10)
Funkcja gk(ui) nazwana jest obciętą funkcją potęgową:
gk(ui) = (t− ui)k+ , (4.11)
którą definiujemy jako:
(t− ui)k+def=
0 dla t < ui
1 dla t 0, k = 0(t− ui)k dla t ui, k > 0
. (4.12)
W praktyce można zaproponować łatwiejszą postać algorytmu dla generacji zbioru funkcji
bazowych (4.6) - (4.12). Algorytm opiera się o wzór rekurencyjny Manfielda-de Boora-Coxa
[58, 87], dla k = 0:
B0i (t) =
1 dla t ∈ [ui, ui+1]0 w przeciwnym razie(4.13)
dla k > 0 wzór rekurencyjny:
Bki (t) =t− ui
ui+k − uiBk−1i (t) +
ui+k+1 − tui+k+1 − ui+1
Bk−1i+1 (t). (4.14)
47
4.2.2. Wybrane właściwości wielomianów bazowych
Przedstawiane funkcje bazowe zwane są również unormowanymi funkcjami sklejanymi. Właści-
wość ta wynika z właściwości rozkładu globalnego:
N−k−1∑i=0
Bki (t) = 1 dla każdego t ∈ [uk, uN−k), (4.15)
oraz rozkładu lokalnego:
l∑i=l−k
Bki (t) = 1 dla każdego t ∈ [ul, ul+1), (4.16)
dla l = 1, . . . , N − n− 1.Pochodne funkcji bazowych mogą być policzone analitycznie. Aproksymacyjne zastosowanie
funkcji sklejanych generuje też oryginalne pochodne stanu i ma charakter filtrujący [25, 58, 92].
Wartość pochodnej funkcji Bki (t) dla k 1 dana jest wzorem: 1
Bki (t) =d
dtBki (t) =
k
ui+k − uiBk−1i (t)−
k
ui+k+1 − ui+1Bk−1i+1 (t). (4.17)
Rys. 4.3. Przykład funkcji modulującej zbudowanej przy pomocy bazowych funkcji sklejanych.
Krzywe Beziera są szczególnym przypadkiem krzywych B-sklejanych. Bazowe funkcje sklejane
1Dowód wzoru można znaleźć w [58] rozdział ”Pochodne krzywej B-sklejanej” na stronach 185-187.
48
w zastosowaniu do budowy funkcji modulującej muszą spełniać ograniczenia stawiane funkcjom
modulującym:
s(t) ∈ Cn[0, h]. (4.18)
Z (4.18) i (4.5) wynika, że
Bki (t) ∈ Cn[0, h]. (4.19)
Przyjmując w powyższym założeniu stopień ciągłości równy stopniowi wielomianu bazowego
k = n wymagana jest jednokrotność węzłów, rys. 4.3. Rozmieszczenie węzłów ui oraz współczyn-
niki skalujące di mogą zostać wykorzystane w procesie optymalizacji kształtu funkcji modulują-
cej.
4.3. Optymalizacja kształtu funkcji φ(t)
Podstawowym nie rozwiązanym dotychczas problemem badawczym było pytanie „jak dobór
kształtu funkcji modulującej φ(t) wpływa na poprawę dokładności identyfikacji”? Można po-
stawić tezę, że kształt najlepszej funkcji φ(t) będzie uzależniony od widma zakłóceń obecnych
w pomiarach u i y. W pracy proponuje się wprowadzenie drugiego etapu, w którym użycie
pomocniczego wskaźnika jakości umożliwi dobór optymalnego kształtu funkcji modulującej.
Zaproponowano dobór kształtu funkcji modulującej przed przystąpieniem do procedury iden-
tyfikacji. Jeżeli zakłócenia pomiarowe będą niewielkie, to kształt funkcji φ nie odgrywa decydu-
jącej roli dla dokładności identyfikacji [21]. Natomiast kształt φ ma znaczący wpływ na sygnał
y0(t) po filtracji. Sygnał y0(t) jest wykorzystywany w budowie obserwatora stanu i algorytmie
adaptacyjnego regulatora. Z tego powodu zależy nam na wierności odtwarzania sygnału y0(t)
w stosunku do sygnału oryginalnego y(t). Jako kryterium jakości wybrano:
J(d) =T∫h
(y(t)− y0(t))2dt =T∫h
(y(t)− y(t) ∗ φ(t, d))2dt. (4.20)
Następnie dobieramy parametry d filtru φ(t, d) poprzez minimalizację:
mind(J(d)). (4.21)
Proces optymalizacji jest przeprowadzany numerycznie z użyciem metody Newtona. W pracy
jako przybliżenie funkcji modulujących wykorzystano bazowe funkcje sklejane. Funkcje te speł-
niają ograniczenia nałożone na właściwości funkcji modulujących przy założeniu jednokrotności
węzłów.
49
Rozdział 5
Funkcje sklejane w identyfikacjiparametrów systemu dynamicznego
Następnym ważnym tematem badawczym rozważanym w niniejszej pracy jest zastosowanie bazo-
wych funkcji sklejanych do bezpośredniej aproksymacji pochodnych sygnałów wejścia i wyjścia.
Metoda odtwarza oryginalne pochodne sygnału wejściowego i wyjściowego, co umożliwia konstru-
owanie algorytmów obserwacji stanu. Ponadto zostanie przedstawiony inny algorytm identyfikacji
z wykorzystaniem aproksymacyjnych właściwości funkcji sklejanych.
5.1. Metoda najmniejszych kwadratów
Zadaniem wykorzystanym w identyfikacji jest dopasowanie krzywej do danych pomiarowych.
Aby takie dopasowanie było poprawne należy poczynić założenia:
� liczba punktów pomiarowych jest znacznie większa niż liczba szukanych parametrów,
� sygnały pomiarowe są zakłócone szumem białym o rozkładzie normalnym.
Takie założenia powodują niemożność zastosowania krzywych interpolacyjnych. Zawierały-
by one zbyt dużo koniecznych do przechowania i przetwarzania parametrów. W dodatku sama
krzywa byłaby zbyt pofałdowana co pogarszało by jakość wyliczonej pochodnej, potrzebnej w za-
daniu identyfikacji. Lepiej skonstruować krzywą, której równanie (4.5) w przybliżeniu przechodzi
przez punkty pomiarowe. To zagadnienie jest typowym zagadnieniem aproksymacyjnym.
W celu wyliczenia parametrów di skalujących wielomiany bazowe (4.5) w zagadnieniu aprok-
symacji, stosuje się metodę najmniejszych kwadratów. W aproksymacji liczba pomiarów jest
znacznie większa niż liczba szukanych parametrów, tzn. układ jest nadokreślony i nie ma na ogół
dokładnych rozwiązań. Duża liczba pomiarów jest korzystna ze względu na szumy pomiarowe,
zakłócenia i niedokładność modelu. Dodatkowe dane pomagają poprawić dokładność estyma-
cji. Dla dokonanych pomiarów yj w chwilach tj zwykle minimalizowany jest średniokwadratowy
50
wskaźnik jakości dla m próbek pomiarowych:
J =1m
m∑j=1
(yj − yj)2. (5.1)
Aproksymacja liniowa określona jest wzorem:
yj =N−k−1∑i=0
diBki (tj). (5.2)
gdzie Bki (tj) jest funkcją bazową (4.6). Powyższe równanie w zapisie macierzowym:
y =[y1 . . . ym
]T1×m= Bd. (5.3)
Macierz B zbudowana jest z wyliczonych wartości poszczególnych wielomianów bazowych
Bki (t) w chwilach pomiarowych tj:
B =
Bk0 (t1) · · · BkN−k−1(t1)... . . . ...
Bk0 (tm) · · · BkN−k−1(tm)
m×(N−k)
. (5.4)
Składowymi wektora d są współczynniki skalujące jak we wzorze (4.5):
d =[d0 . . . dN−k−1
]T1×(N−k)
. (5.5)
Pierwszym krokiem algorytmu określanym a priori na podstawie analizy zjawiska fizycz-
nego lub przeprowadzanej kilkakrotnie optymalizacji, jest wybór N węzłów ui zgodnie z (4.4)
oraz stopnia k wielomianu (4.6). Stopień wielomianu k powinien być tak dobrany by zapewnić
wymaganą ciągłość funkcji aproksymującej. Wybrane węzły pozwalają na wyliczenie wartości
wielomianów bazowych zgodnie z wzorem Mansfielda-de Boora-Coxa (4.13) i (4.14).
Następnym krokiem algorytmu jest wyliczenie parametrów di stanowiących przybliżone roz-
wiązanie (5.2) tak by minimalizowana była wartość wskaźnika (5.1).
Z warunku koniecznego istnienia ekstremum funkcji wielu zmiennych:
∂J
∂dl= 0 dla każdego l = 0, . . . , N − k − 1 (5.6)
otrzymujemy układ N − k równań liniowych z N − k niewiadomymi di:
∂J
∂dl=−2m
m∑j=1
[yj −N−k−1∑i=0
diBki (tj)]B
kl (tj) = 0. (5.7)
51
zwany układem normalnym. Powyższy układ ma współczynniki di różne od zera i jego rozwią-
zanie dla zebranych pomiarów:
y =[y1 . . . ym
]T1×m= Bd. (5.8)
Daje ono minimum wskaźnika J ponieważ funkcje bazowe Bki (tj) tworzą bazę pewnej przestrzeni.
Macierz B jest prostokątną i niemożliwe jest odwrócenie jej by znaleźć parametry d. Dlatego
należy obustronnie pomnożyć równanie przez BT :
BTy = BTBd. (5.9)
Powyższa postać umożliwia dokonanie mnożenia obustronnego przez (BTB)−1 i w efekcie
otrzymujemy wzór na poszukiwane parametry (metoda najmniejszych kwadratów):
d = (BTB)−1BTy. (5.10)
Mając wyliczone parametry d możemy zapisać wzór krzywej aproksymującej:
y = B(BTB)−1BTy. (5.11)
W powyższym wzorze wyrażenie B(BTB)−1BT jest stałe dla wybranych a priori funkcji ba-
zowych. Przy założeniu stałego wymiaru m wektora y i przesuwnego okna wzdłuż zebranych
pomiarów, o liczbie większej niż m, otrzymujemy efekt filtracji o skończonej odpowiedzi impul-
sowej FIR.
W zagadnieniu identyfikacji i obserwacji stanu potrzebna jest znajomość niemierzalnej po-
chodnej sygnału pomiarowego, której policzenie dla sygnału zaszumionego jest trudne i obarczone
dużymi błędami. Z powyższych względów wygodniejsze jest policzenie pochodnej dla aproksy-
maty:
˙y =dBdtd = Bd =
Bk0 (t1) · · · BkN−k−1(t1)... . . . ...
Bk0 (tm) · · · BkN−k−1(tm)
d, (5.12)
gdzie Bki (t) dane jest wzorem (4.17).
Wybór węzłów ui krzywej jest bardzo istotny bo od tego zależy jakość aproksymacji sygnału
pomiarowego. Zbyt mała ilość węzłów lub złe ich rozmieszczenie może powodować zbyt zgrub-
ne przybliżenie. Natomiast zbyt duża liczba węzłów może powodować powstawanie zafalowań
krzywej.
Ponadto wybór rozmieszczenia węzłów przed dokonaniem aproksymacji umożliwia zastoso-
wanie liniowej metody najmniejszych kwadratów do jednoznacznego wyliczenia parametrów d.
52
Tak postawione zadanie zwane jest w literaturze regularnym. Natomiast brak wyboru węzłów
prowadzi do zagadnienia nieregularnego posiadającego nieskończenie wiele rozwiązań i znacz-
nie trudniejszego do rozwiązania. W praktyce wystarcza równomierne rozmieszczenie węzłów
o liczbie kilkakrotnie mniejszej niż liczba próbek m sygnału pomiarowego.
Z uwagi na powstające błędy numeryczne równanie (5.10) nie jest wyliczane zgodnie ze
wzorem. Zamiast tego stosuje się metodę z użyciem rozkładu ortogonalno-trójkątnego macierzy
albo w przypadku słabych uwarunkowań numerycznych dekompozycję na wartości singularne.
5.2. Uogólniona metoda najmniejszych kwadratów
Stosowanie w praktyce kryterium (5.1) powoduje problemy z gładkością krzywej, w szczególności
przy zbyt dużej liczbie węzłów ui określanej przed przystąpieniem do algorytmu najmniejszych
kwadratów (5.10). Ponadto brak jest parametru wpływającego na filtrację dla wybranego rozkła-
du węzłów funkcji sklejanej. Dlatego dobór współczynników di funkcji sklejanej y(t) zrealizowano
w oparciu o kwadratowy wskaźnik jakości z wygładzaniem [41]:
J =1m
m∑j=1
(yj − yj)2 + γ · E(T ), (5.13)
gdzie yj to próbki pomiarowe sygnału y(t) w chwilach ti, yj – aproksymowane wartości sygnału
y(t) otrzymane z zastosowania funkcji sklejanych w chwilach ti, m – liczba próbek pomiarowych
w horyzoncie czasowym, T – aproksymowany horyzont czasowy. Parametr wygładzający γ po-
maga poprawić ciągłość pochodnej drugiego rzędu. Stanowi on kompromis pomiędzy bliskością
krzywej do punktów pomiarowych a gładkością tej krzywej. Ciągłość ta wiąże się z ciągłością
krzywizny.
Pierwsza część tego kryterium jest dobrze znaną metodą najmniejszych kwadratów. Nato-
miast druga część to funkcjonał E(T ) opisujący energię potencjalną krzywej y(t); można powie-
dzieć, że jest to „energia sprężystości wygiętej listwy” o kształcie danym funkcją y(t):
E(T ) =T∫0
[y(2)(t)]2dt, (5.14)
gdzie y(2) – druga pochodna z postaci y(t) funkcji sklejanych (spotykane są w literaturze również
pochodne wyższych rzędów).
Dla serii danych pomiarowych zebranych co stały krok dyskretyzacji ∆t, zmodyfikowany
w celu uproszczenia dalszych obliczeń, wzór (5.13) i (5.14) został zapisany w następujący sposób:
J =1m
m∑j=1
(yj − yj)2 + γm∑j=1
(y(2)j (∆t)2)2. (5.15)
53
Problemem jest nieznana wartość drugiej pochodnej yi w powyższym wyrażeniu, którą przy-
bliżamy różnicą skończoną:
y(2)j =
1(∆t)2
(yj−1 − 2yj + yj+1). (5.16)
Powyższy schemat różniczkowania został otrzymany poprzez rozwiązanie układu równań roz-
winięcia w szereg Taylora względem pochodnych yi(1) i yi(2): yj−1 = yj − ∆t1! y(1)j +
(∆t)2
2! y(2)j
yj+1 = yj + ∆t1! y(1)j +
(∆t)2
2! y(2)j
(5.17)
Ostatecznie wskaźnik jakości (5.15) po dokonanych przekształceniach oraz zmniejszeniu gra-
nic sumowanie wynikłego z zastosowania różnic skończonych:
J =1m
m∑j=1
(yj − yj)2 + γm−1∑j=2
(yj−1 − 2yj + yj+1)2. (5.18)
Tak przekształcony wskaźnik jakości zapisano w postaci macierzowej:
J =1m‖y− y‖2 + γ‖Hy‖2, (5.19)
gdzie:
y =
y1
y2...
ym
, y =
y1
y2...
ym
, H(m−2)×m =
1 −2 1 0 0 · · · 00 1 −2 1 0 · · · 0... . . . . . . . . . . . . . . .
...
0 · · · 0 1 −2 1 0
0 · · · 0 0 1 −2 1
. (5.20)
Jako funkcje aproksymujące wybieramy wielomiany bazowe (5.2) zapisane w postaci macie-
rzowej (5.3):
J =1m(y−Bd)T (y−Bd) + γdTBTRBd, (5.21)
gdzie R = HTH.
Optymalną minimalną wartość poszukiwanego wektora d znajdujemy z warunku koniecznego
istnienia ekstremum (5.6) otrzymując równanie:
− 2mBT (y−Bd) + 2γBTRBd = 0. (5.22)
Po wyprowadzeniu dostajemy d:
d = (mγBTRB+BTB)−1BTy = (mγRB+B)−1y. (5.23)
54
W konsekwencji otrzymujemy:
y = B(mγRB+B)−1y. (5.24)
Wyrażenie B(mγRB+B)−1 jest stałe dla założonego parametru wygładzania γ, rzędu oraz
rozkładu węzłów funkcji sklejanej B. Podobnie jak w metodzie najmniejszych kwadratów, dla
przesuwnego okna otrzymujemy efekt filtracji FIR oraz możliwe jest policzenie pochodnej funkcji
aproksymującej zgodnie ze wzorem (5.12). Filtry o skończonej odpowiedzi impulsowej w stosunku
do filtrów o nieskończonej odpowiedzi impulsowej charakteryzują się znaczną liczbą parametrów.
Powoduje to trudności w poprawnym dobraniu wartości tych parametrów. Przedstawiona meto-
dologia doboru parametrów dla filtrów typu FIR upraszcza ten proces.
Dobór współczynnika wygładzania γ
W dokumentacji technicznej pakietów wyliczających wielomiany sklejane [82] spotyka się pro-
pozycję doboru parametru γ = 1/(1 + (∆t)3/6), gdzie ∆t jest średnim odstępem między prób-
kowanymi danymi. Dla danych jednostajnie próbkowanych zaleca się γ = 1/(1 + (∆t)3/60).
Próbę analitycznego wyprowadzenia parametru przedstawiono w pracy [25]. Rozwiązanie po-
stawionego problemu optymalizacji jest nieliniowe. Ibrib w [49] zaproponował algorytm, w któ-
rym wykorzystał metodę Newtona [9, 34, 40, 111, 110, 65] do rozwiązania problemu optymali-
zacji.
Rys. 5.1. Wpływ współczynnika wygładzania γ na kształt krzywej.
Rysunek 5.1 pokazuje zmianę kształtu krzywizny aproksymującej punkty w zależność od
wartość parametru γ. Dobór parametru γ jest realizowany poprzez minimalizacje kryterium
55
GCV (ang. Generalized Cross-Validation ) [49, 92]. W praktyce jego wartość kształtuje się na
poziomie 0, 001.
5.3. Identyfikacja z wykorzystaniem funkcji sklejanych
Rozdział przedstawia metodę identyfikacji parametrów ciągłego systemu liniowego. Dla aproksy-
macji kolejnych pochodnych funkcji wejścia i wyjścia wykorzystuje się bazowe funkcje sklejane.
Następnie znalezione współczynniki bazowych funkcji sklejanych służą do wyliczenia iloczynów
skalarnych będących elementami liczbowej symetrycznej macierzy Grama. Optymalne parame-
try są uzyskiwane jako wektor własny skojarzony z najmniejszą wartością własną odpowiedniej
macierzy Grama. Metoda odtwarza również niemierzalny stan układu, który jest wykorzystany
w zadaniu regulacji.
Rys. 5.2. Porównanie schematów identyfikacji splotowej i sklejanej
Na rys. 5.2 przedstawiono blokowy schemat poglądowy porównujący etapy działania algoryt-
mów identyfikacji splotowej i sklejanej. W przypadku identyfikacji sklejanej możliwe jest wypro-
wadzenie wzorów analitycznych na wartości poszczególnych współczynników macierzy Grama.
Wskaźnik jakości (5.1) zastosowano w doborze parametrów di funkcji sklejanej (4.5) aprok-
symującej próbki pomiarowe sygnału wejściowego u(t) i wyjściowego y(t) (rys. 3.1).
W literaturze można znaleźć wiele przykładów zastosowań funkcji sklejanych w problemie ste-
rowania procesami. Dotychczas wykorzystywano funkcje sklejane do interpolacji wartości funkcji
w dyskretnych punktach symulowanych i pomiarowych, np. modelowania krzywych i powierzch-
ni, śledzenia trajektorii ruchomych obiektów [87]. Niniejszy rozdział przedstawia ich przydatność
do identyfikacji ciągłego układu przez aproksymację wartości sygnału pomiarowego wraz z po-
chodnymi, obserwacji stanu układu w zastosowaniu do regulacji LQR obiektów SISO.
56
Rozdział 6
Regulator adaptacyjny
W rozdziale zostanie przedstawiona koncepcja budowy regulatora LQR z adaptacją pośrednią.
Wykorzystuje on w swym działaniu metody identyfikacji parametrów i obserwacji stanu.
6.1. Obserwator bazujący na macierzy Toeplitza
Wyprowadzenie równania na obserwator stanu pokażemy na przykładzie rzędu 3. Dana standar-
dowa postać obserwowalna:x1
x2
x3
=0 0 −a0
a3
1 0 −a1a3
0 1 −a2a3
x1
x2
x3
+b0a3b1a3b2a3
u (6.1)
y =[0 0 1
] x1
x2
x3
(6.2)
podstawiając za y i y:
y = x3 (6.3)
y = x3 = x2 −a2a3x3 +
b2a3u (6.4)
y = x3 = x2 −a2a3x3 +
b2a3u (6.5)
= x1 −a2a3x2 + (
a22a23− a1a3)x3 + (
b1a3− b2a2
a23)u+
b2a3u, (6.6)
57
otrzymanym w zapisie macierzowym:
y
y
y
=0 0 1
0 1 −−a2a3
1 −a2a3
a22a23− a1a3
︸ ︷︷ ︸
Cd
x1
x2
x3
+
0 0b2a3
0b1a3− b2a2a23
b2a3
︸ ︷︷ ︸
Dd
u
u
. (6.7)
Następnie wprowadzamy nowe oznaczenia na macierze współczynników modelu
y = Cdx+Ddu. (6.8)
Macierz Cd jest nieosobliwa, co pozwala nam ją odwrócić by uzyskać ostatecznie stan:
x = C−1d y −C−1d Ddu (6.9)
C−1d = H1 =1a3
a1 a2 a3
a2 a3 0
a3 0 0
,C−1d Dd = H2 = 1a3b1 b2
b2 0
0 0
. (6.10)
Przy znanych przebiegach sygnałów y, y i y - z równania (6.9) można odtworzyć stan x(t).
6.2. Algorytm obserwacji stanu
Równanie modelu (3.1) można przedstawić w postaci równania stanu wraz z równaniem wyjścia:
x(t) = Ax(t) +Bu(t)y(t) = Cx(t)(6.11)
Macierze w (6.11) są dobrane w postaci Frobeniusa gwarantującej obserwowalność stanu:
A =
0 . . . . . . 0 − a0an
1 . . ....
...
0 . . . . . ....
...... . . . . . . 0
...
0 . . . 0 1 −an−1an
n×n
B =
b0an...bn−1an
n×1
C =[0 · · · 0 1
]1×n.
(6.12)
58
Z równania (3.1) i (6.12) można otrzymać następującą postać wektora stanu – równoważną
w sensie dystrybucyjnym stanowi z (6.11) i wykorzystującą pochodne wejść i wyjść.
x(t) = H1
y(0)(t)
y(1)(t)...
y(n−1)(t)
n×1
−H2
u(0)(t)
u(1)(t)...
u(n−2)(t)
n−1×1
, (6.13)
gdzie H1 i H2 są macierzami Toeplitza zawierającymi zidentyfikowane parametry systemu o po-
staci:
H1 =1an
a1 . . . an−1 an
a2 . . . an 0... ... ... ...
an 0 . . . 0
n×n
, H2 =1an
b1 . . . bn−2 bn−1
b2 . . . bn−1 0... ... ... ...
bn−1 0 . . . 0
n×(n−1)
. (6.14)
Równanie (6.13), jakkolwiek mało znane i używane ze względu na konieczność dostępu do
pochodnych sygnałów, jest w pełni przydatne w naszym rozwiązaniu. Pochodne sygnałów wej-
ściowych i wyjściowych, jak również same sygnały u i y uzyskuje się przy pomocy funkcji mo-
dulujących lub sklejanych. W ten sposób po podstawieniu tych danych do algorytmu (6.13)
otrzymuje się sygnał x(t), który jest estymatą stanu oryginalnego x(t).
x(t) = H1
y(0)(t)
y(1)(t)...
y(n−1)(t)
n×1
−H2
u(0)(t)
u(1)(t)...
u(n−2)(t)
(n−1)×1
. (6.15)
W przypadku przetwarzania u i y metodą splotów z funkcją φ otrzymuje się y(i)(t) = yi(t),
u(i)(t) = ui(t). Stan x(t) reprezentuje wtedy liniową transformację stanu oryginalnego x(t) ∗y(t) = x(t). Splotowi poddaje się obie strony równania (6.13). W przypadku aproksymacji
bezpośredniej funkcji y(i)(t) i u(i)(t) w (6.13) funkcjami sklejanymi, otrzymuje się funkcje y(i)(t)
i u(i)(t) w (6.15).
6.3. Adaptacyjny regulator liniowo-kwadratowy
W przedstawionym rozwiązaniu zakładamy, że sterowanie jest proporcjonalne do stanu x(t)
u(t) = −Kx(t). (6.16)
59
Układ równań po zamknięciu pętli sprzężenia zwrotnego ma postać:
˙x(t) = (A−BK)x(t) = Azx(t). (6.17)
Zastosowanie splotów lub funkcji sklejanych umożliwia jednoczesną identyfikację parametrów
układu ciągłego i estymację stanu x. Przedstawione rozwiązanie może być użyte do budowy
regulatora adaptacyjnego, którego schemat blokowy przedstawiono na rys. 6.1.
Rys. 6.1. Schemat adaptacyjnego regulatora stanu.
Macierz regulatora K spełnia Algebraiczne Równanie Riccatiego w standardowym schemacie
LQR z macierzami wagowymi Q i R.
KA+ATK−KBR−1BTK+Q = 0. (6.18)
Dla stabilizowanych obiektów inercyjnych dobre efekty daje zwiększenie rzędu wektora stanu
(wprowadzenie dodatkowego członu całkującego) w celu eliminacji uchybu statycznego. Ponadto
dla obiektów nieliniowych warto jest zastosować pętle regulacji w przód [109], której zadaniem
będzie eliminacja dużych uchybów poprzez uwzględnienie wpływu dynamiki mierzalnych torów
zakłóceń.
60
Rozdział 7
Rezultaty implementacji algorytmówidentyfikacji i sterowania
W rozdziale tym zostaną przedstawione najważniejsze wyniki badań przeprowadzonych na obiek-
tach symulacyjnych i rzeczywistych. Symulowane obiekty to różnego rodzaju transmitancje od
I-go do III-go rzędu, również z opóźnieniem. Dodatkowym badanym obiektem był symulowa-
ny model wymiennika ciepła oparty o rzeczywisty laboratoryjny system takiego wymiennika.
Na obiektach dokonywano identyfikacji parametrów ciągłych, obserwacji stanu oraz regulacji
liniowo-kwadratowej.
7.1. Filtracja sygnału pomiarowego
7.1.1. Metody numeryczne filtracji splotowej
Dla pierwszego etapu identyfikacji splotowej koniecznym jest przetransformowanie sygnału po-
miarowego za pomocą splotu z odpowiednią funkcją filtrującą (dla przetworzenia pochodnych
u i y). Omówiono to w rozdziale 3. Problemem jest wybranie najlepszej metody numerycznej
dla wyliczenia splotu dla filtru typu FIR. Rozważono następujące metody: (1) z definicji splotu,
wyliczanie całki metodą prostokątów i Simpsona, (2) z użyciem szybkiej transformaty Fouriera,
(3) z wykorzystaniem struktury filtru dyskretnego drabinkowego (ang. ladder) oraz (4) z wyko-
rzystaniem struktury filtru dyskretnego kratowego (ang. lattice). Jedynie pierwszą z powyższych
metodę można zastosować dla sygnałów pomiarowych o nierównym próbkowaniu, pozostałe me-
tody wymagają stałego kwantu dyskretyzacji.
Badano odpowiedź filtru na wymuszenie w postaci skoku jednostkowego y(t) = 1(t + h)
(dla uproszczenia założono, że skok wystąpił w chwili czasowej t = −h). Z równania (3.6)
61
otrzymujemy:
y0(t) = y(t) ∗ φ(t) =h∫0
y(t− τ)φ(τ)dτ =h∫0
1(t+ h− τ)φ(τ)dτ =h∫0
φ(τ)dτ . (7.1)
Do badań wybrano filtr postaci φ(t) = tN(h− t)M , gdzie założone parametry M = 3, N = 2,długość okna h = 1. Jak pokazano w równaniu (7.1) policzenie odpowiedzi filtru typu FIR na
wymuszenie jednostkowe sprowadza się do scałkowania w czasie jego odpowiedzi impulsowej. Dla
wybranego filtru i założonych parametrów otrzymujemy
t∫0
φ(τ)dτ = −1/6t6 + 3/5t5 − 3/4t4 + 1/3t3, t ∈ [0, h]. (7.2)
Tak otrzymany analitycznie wzór na wartości odpowiedzi na skok jednostkowy wybranego filtru
posłuży jako odpowiedź wzorcowa przy porównaniu metod numerycznych.
Do bezpośredniego wyliczenia odpowiedzi filtru użyto funkcji filter() wykorzystującej rów-
nanie postaci y(n) = b(1)x(n) + b(2)x(n − 1) + . . . + b(nb + 1)x(n − nb) − a(2)y(n − 1) −. . .− a(na+ 1)y(n− na). Jest ona stosowana zarówno do filtrów typu FIR jak i IIR. Przelicze-niu parametrów filtru φ(t) na parametry filtru kratowego dokonano z wykorzystaniem funkcji
tf2latc(), odpowiedź otrzymano stosując latcfilt(). Metoda całkowania Simpsona została
oprogramowana przez autora na podstawie [35] w wersji stałokrokowej. Wyliczenia splotu z wyko-
rzystaniem szybkiej transformaty Fouriera i odwrotnej transformaty Fouriera uzyskano stosując
funkcje fftfilt(). Złożoność obliczeniowa wyliczania splotu z definicji jest O(n2), natomiast
dla FFT tylko O(n log n). W przedstawionej metodzie ilość operacji po zmiennoprzecinkowych
zależy od rzędu licznika, rzędu mianownika, długości okna i czasu dyskretyzacji i wynosi (n+m)hdt.
W wersji on-line (obliczenia wykonywane w czasie rzeczywistym) można wykorzystać procesory
sygnałowe (ang. Digital Signal Processor, DSP). Procesory te posiadają wewnętrzną architekturę
zoptymalizowaną pod kątem wykonywania w jednym rozkazie operacji mnożenia i dodawania.
Dodatkowe przyspieszenie operacji splotu można uzyskać stosując programowalne układy lo-
giczne (ang. Field Programmable Gate Array, FPGA ). Wszystkie wymienione powyżej funkcje
wchodzą w skład pakietu [81]. Obliczenia przeprowadzono na liczbach zmiennoprzecinkowych
o podwójnej precyzji.
Na rys. 7.1 przedstawiono wykresy zmiany różnych błędów. Przedstawiono przebieg błędu po-
między wartością całki splotowej liczonej analitycznie (7.2) i całki liczonej w oparciu o 5 różnych
metod numerycznych wewnątrz okna obserwacji [0, h = 1] (przedstawiono błąd względny i bez-
względny) dla dt = 0.05. Wykreślono również zależność błędu średniokwadratowego od różnych
czasów dyskretyzacji dt. Zastosowane metody filtracji drabinkowej, filtracji kratowej i filtracji
FFT dały zbliżone do siebie wyniki wartości błędu. Zapewne wyniki te różniłyby się w przypadku
62
obliczeń przeprowadzonych na liczbach w reprezentacji stałoprzecinkowej. Metody całkowania
numerycznego, prostokątów i Simpsona, dały podobnie wyniki wartości błędu średniokwadrato-
wego. Metody całkowe w stosunku do metod filtracji cechowały się mniejszą wartością błędu.
Wyniki pomiaru czasu dla poszczególnych procedur nie zostały przedstawione, gdyż pomiar
czasu wykonania przy pomocy funkcji tic-toc w Matlab daje silnie zafałszowany wynik. Ze
względu na prostotę użycia, niewielkie błędy i szybkość działania w dalszych eksperymentach
numerycznych do wyliczania splotów została wybrana funkcja filter().
Rys. 7.1. Porównanie metod filtracji.
7.1.2. Splotowa filtracja nieadaptacyjna
W tym rozdziale przeprowadzona zostanie dyskusja sposobu konstrukcji funkcji filtrujących φ za
pomocą funkcji bazowych. Na rys. 7.2 przedstawiono wpływ zmiany d1 - jednego z dwóch współ-
czynników skalujących wielomian bazowy, (parametr d0 pozostawał stały) na zmianę charak-
terystyk czasowo-częstotliwościowych funkcji φ. Można zauważyć charakterystyczne zerowanie
się charakterystyk częstotliwościowych modułu dla pewnych częstotliwości. Zmiana parametrów
funkcji bazowych pozwala kształtować szerokość dolnego zakresu nie zerowania się funkcji φ.
Opisane wyżej procedury znajdują zastosowanie głównie w zadaniu identyfikacji parametrów.
Filtracja nieadaptacyjna będzie się wiązać z jednokrotnym wyborem parametrów d0 i d1.
Ciekawy wniosek można wysnuć z eksperymentów numerycznych, o wpływie poszczególnych
parametrów na kształt i moment zerowania się charakterystyk częstotliwościowych. Parametr d1wpływa na kształt charakterystyki, a długość okna h na moment zerowania, rys. 7.3. Przy dosta-
tecznej liczbie funkcji bazowych, a co za tym idzie współczynników skalujących di, możliwa jest
zmiana momentu zerowania się charakterystyki częstotliwościowej osiągana poprzez zerowanie
się współczynników skalujących - zmiana długości filtru. Z tego względu w dalszych badaniach
z użyciem filtru φ zbudowanego z funkcji bazowych ograniczono się do filtrów φ o stałej długości
okna h.
63
Rys. 7.2. Wpływ zmiany wartości współczynnika skalującego d1 wielomianu bazowego.
Rys. 7.3. Wpływ zmiany długości okna h.
7.1.3. Splotowa filtracja adaptacyjna
W niniejszym rozdziale przedstawiono specjalne zastosowanie funkcji splotowej z nienarzuconym
z góry kształtem funkcji φ. Celem splotu funkcji φ z przetwarzaną funkcją y jest uzyskanie
najlepszej aproksymacji samej funkcji y czyli najlepsze odfiltrowanie jej szumów. Zastosowano
64
w tym celu dynamicznie zmieniający się kształt funkcji y w każdym kroku okna przesuwnego.
Dla dynamicznej optymalizacji kształtu funkcji filtrującej zastosowano krótkie przesuwne
okno T0, wewnątrz którego w każdym kroku, dobiera się optymalne parametry funkcji bazowych
di (parametry skalujące) zgodnie z regułą najmniejszych kwadratów (5.10). Parametry te da-
ją minimum całki z kwadratu błędu między funkcją filtrowaną na oknie T0 i efektem filtracji
i zmieniają się z biegiem czasu. Procedura ta została zaproponowana przez autora nie dla za-
dania identyfikacji, ale do tworzenia lepszej aproksymaty sygnału wyjścia (i jego pochodnych),
czyli zadania obserwacji stanu. Ma to szczególne znaczenie dla zadania stabilizacji stanu, gdyż
wierność odtworzenia stanu decyduje o jakości stabilizacji w układzie zamkniętym. Tak więc, fil-
tracja adaptacyjna nie będzie stosowana dla zadań bieżącej identyfikacji parametrów. Adaptacja
filtru ma związek z ciągle zmieniającym się charakterem sygnału filtrowanego i może pozwolić
na zmniejszenie się błędu filtracji.
Rys. 7.4. Filtracja adaptacyjna dla wielomianów bazowych jako funkcji modulującej.
Wyniki symulacji dla adaptacyjnej wersji filtru z użyciem wielomianów bazowych przedsta-
wiono na rys. 7.4. Niestacjonarnym sygnałem testowym y był sygnał sinusoidalny o częstotliwości
modulowanej liniowo (ang. chirp signal). Wykreślono niezaszumiony przebieg oryginalnej funkcji
y i estymowanej ye. Przebieg pochodnej estymacji y(1)e uzyskano poprzez filtracje oryginalnego
przebiegu z pochodną filtru φ. Użyto trzech wielomianów bazowych stopnia czwartego, długość
okna filtracji h = 100, długość okna optymalizacji dla błędu średnio kwadratowego TO = 100.
Ponadto wykreślono zmianę parametrów skalujących d1, d2, d3 wielomiany bazowe w czasie. Do-
datkowo wykreślono odpowiedź impulsową filtru w wybranych chwilach symulacji oraz odpowia-
dającą jej charakterystykę amplitudowo-częstotliwościową. Zastosowany algorytm optymalizacji
65
to fminunc z [79]. Wraz ze wzrostem częstotliwości filtrowanego sygnału wzrasta jakość odtwa-
rzania jego pochodnej. Na wykresie zmiany współczynników można zauważyć okresową zmianę
współczynników d skalujących wielomiany bazowe.
7.1.4. Aproksymacja w całym horyzoncie czasowym
Innym podejściem do filtracji sygnałów pomiarowych jest ich bezpośrednia aproksymacja bazo-
wymi funkcjami sklejanymi, której podstawy teoretyczne przedstawiono w rozdziale 5. W celu
porównania filtracji z poprzedniego rozdziału z aproksymacją opartą o aproksymację sygnału te-
stowego funkcjami sklejanymi do sygnału testowego dodano zakłócenie w postaci szumu białego
o zerowej wartości średniej i wariancji 0.09, rys. 7.5. Czas symulacji T = 1000, do aproksy-
macji użyto 150 funkcji bazowych trzeciego rzędu o równomiernym rozkładzie węzłów w całym
horyzoncie czasowym, współczynnik wygładzania γ = 0 (5.15).
Rys. 7.5. Aproksymacja całego sygnału testowego funkcjami sklejanymi.
W początkowym fragmencie odpowiedzi wyraźna jest nadparametryzacja liczby bazowych
funkcji sklejanych. Wraz ze wzrostem czasu, a co za tym idzie częstotliwości sygnału testowego,
efekt nadparametryzacji się zmniejsza. Można iteracyjne dokonać optymalizacji rozmieszczenia
mniejszej, niż założona (120), liczby węzłów. Innym podejściem jest zastosowanie kryterium jako-
ści doboru współczynników skalujących funkcje sklejane z wygładzaniem. Efekt wpływu różnych
wartości współczynnika wygładzania γ na wartość błędu średnio-kwadratowy w stosunku do sy-
gnału niezaszumionego przedstawiono na rys. 7.5. Istnieje minimum błędu średniokwadratowego
dla γ ≈ 0.5. Aproksymacja sygnału pomiarowego (testowego) funkcjami bazowymi znajdujezastosowanie w metodach identyfikacji parametrycznej dla systemów ciągłych w wersji off-line.
7.1.5. Aproksymacja w ruchomym oknie
Przedstawiony w poprzednim rozdziale 7.1.4 sposób aproksymacji sygnałów pomiarowych jest
trudny do zastosowania w wersji ciągłej on-line. Z tego względu w niniejszym rozdziale przedsta-
66
wiona zostanie koncepcja aproksymacji sygnałów pomiarowych w ruchomym oknie czasowym.
W oknie tym znajdowana jest najlepsza aproksymacja sygnału pomiarowego, następnie bra-
na jest tylko jedna próbka (zwykle ostatnia) z tak wyliczonej aproksymaty. W kolejnej chwili
czasowej okno jest przesuwane i ponownie przeprowadzana jest procedura aproksymacji.
Użytym sygnałem testowym był sygnał z liniową modulacją częstotliwości, długość ruchome-
go okna TO = 100, użyto 6 bazowych funkcji trzeciego rzędu o równomiernym rozkładzie węzłów
(rys. 7.6), współczynnik wygładzania γ = 0. Wyniki przeprowadzonych symulacji przedstawiono
na rys. 7.6.
Rys. 7.6. Aproksymacja w ruchomym oknie sygnału testowego funkcjami sklejanymi.
Przetestowano pomysł wprowadzenia dodatkowych wag dla zadania aproksymacji w oknie
przyjmując, że jakość aproksymacji dla początkowych próbek w oknie może być gorsza od jako-
ści aproksymacji w końcowym fragmencie okna. Wagi wewnątrz okna będą więc miały postać
różnych funkcji małych wartości z lewej stroni i dążących do 1 z prawej strony okna (rys. 7.7).
Rys. 7.7. Wpływ przesunięcia próbek na błąd średnio-kwadratowy. Rozkład wag w oknie aprok-symacji ruchomym oknem.
Na rys. 7.7 przedstawiono rozkład wag w czasie dla przesuwnego okna z sygnałami pomiaro-
wymi aproksymowanymi funkcjami bazowymi. Zastosowano kryterium jakości dla pojedynczego
okna:
J =1m
∑j
w(j) ‖y(j)− f(x(j))‖2 , (7.3)
gdzie j - jest numerem próbki po dyskretyzacji Ts = 1, m - jest liczbą próbek pomiarowych.
We wskaźniku jakości pominięto człon odpowiedzialny za gładkość krzywej sklejanej (γ = 0).
67
W eksperymentach wykorzystano funkcje spap2() z pakietu [82]. Wybrano rozkłady wag: rów-
nomierny, liniowonarastający, progresywny i regresywny, rys. 7.7. W wyniku przeprowadzonych
eksperymentów nie stwierdzono wpływu braku wag lub ich narastającego rozkładu w oknie na
wartość przyjętego średnio-kwadratowego wskaźnika jakości, który wyniósł J ≈ 0, 0107 dla fil-tracji w ruchomym oknie. Malejący rozkład wag w oknie pogarszał wartość przyjętego wskaźnika
jakości.
Ciekawy wynik uzyskano podczas analizy jakości aproksymacji. Lepszy rezultat dla błędu
średnio-kwadratowego gwarantuje wzięcie pod uwagę nie ostatniej próbki ruchomego okna, lecz
pierwszej albo drugiej od końca, (przesunięcie odczytu próbek pokazano na rys. 7.7). W przed-
stawionym przypadku parametr γ > 0 wpływa negatywnie na jakość odtwarzania sygnału ory-
ginalnego.
7.2. Identyfikacja
W tym rozdziale zaprezentowane zostaną wyniki porównania 2 typów identyfikacji parametrycz-
nej:
1. w oparciu o przetworzone splotowo sygnały pomiarowe,
2. w oparciu o bezpośrednio aproksymowane funkcjami sklejanymi sygnały pomiarowe.
Parametry obiektu identyfikowanego w testach będą stałe lub będą zmieniały się skokowo.
Dla celów identyfikacji splotowej znajdują zastosowanie metody filtracji nieadaptacyjnej z roz-
działu 7.1.2. Również aproksymacja sygnałów pomiarowych w całym horyzoncie czasowym, roz-
dział 7.1.4, zastosowana zostanie do zagadnienia identyfikacji. Do testów przyjęto liniowy model
nieminimalnofazowy dany unormowaną transmitancją postaci:
G(s) =−0.2381s+ 0.5952
0.1786s2 + 0.6845s+ 0.2976, (7.4)
gdzie Θ wektor pięciu parametrów (3.14) i (3.27) (ΘTΘ = 1). Symulacje przeprowadzono dla
czasu T = 30 i czasie dyskretyzacji dt = 0.01, zarejestrowanoM = 3000 próbek pomiarowych dla
sygnału wejściowego i wyjściowego. Jako sygnał wymuszający u(t) przyjęto przebieg prostokątny
z okresem Tu = 10 i amplitudą ±0.5.Następnie w t = 15 nastąpiła skokowa zmiana parametru transmitancji (7.4) z a0 = 0.2976 na
a0 = 0.7976, co spowodowało zmianę wszystkich współczynników transmitancji unormowanej:
G(s) =−0.1914s+ 0.4785
0.1436s2 + 0.5502s+ 0.6412. (7.5)
Szum pomiarowy nie został dodany do sygnału wejściowego u i wyjściowego y, dzięki czemu me-
toda identyfikacji wprowadza mniejsze błędy na estymowane parametry i łatwiejsza jest analiza
68
otrzymanych wyników.
Dla pierwszego typu identyfikacji długość okna filtru h = 3. Czas dyskretyzacji ∆t = 0.01,
funkcja modulująca φ(t) = t4(h−t)5, gdzie h = 3. Dokonano operacji splatania sygnałów pomia-rowych z kolejnymi pochodnymi funkcji modulującej. W chwili czasowej t = 3 równej h możliwe
jest wyliczenie pierwszego splotu. Sploty sygnałów pomiarowych wejściowego u i wyjściowego
wykreślono na rys. 7.8.
Rys. 7.8. Wynik filtracji i aproksymacji z sygnałami pomiarowymi wejścia i wyjścia.
Dla drugiego typu identyfikacji rząd funkcji modulującej (4.5) k = 4, ilość węzłów N = 50.
Na rys. 7.8 wykreślono wyniki aproksymacji sygnałów pomiarowych wejściowego u i wyjściowego
y funkcjami sklejanymi. Dodatkowo przedstawiono przebiegi kolejnych pochodnych aproksymaty
dla zarejestrowanych sygnałów pomiarowych.
Założono odpowiednio równe identyfikowanej transmitancji rzędy licznika m = 1 i mianow-
nika n = 2. Na rys. 7.9 przedstawiono przebieg identyfikowanych parametrów metodą dokładną
poprzez rozwiązanie pełnego zagadnienia własnego dla symulowanego obiektu. Długość prze-
suwanego okna została przyjęta jako dwukrotnie większa od długości funkcji modulującej h
i wynosi T = 6. Dla t = 5 sploty są już na tyle długie, że wartości własne macierzy Grama
zaczynają się stabilizować. Dla oszacowania dolnej wartość długości okna T można przyjąć tę
chwilę czasową. Identyfikacja parametrów w przesuwanym oknie powoduje, że estymowane pa-
rametry dążą do rzeczywistych i dopiero po czasie t = T + h = 24 mogą być im równe, t = 24.
Natomiast rozszerzane okno jest cały czas obciążone pomiarami z przeszłości, co objawia się
wolniejszą zbieżnością parametrów, które dopiero w czasie t zmierzającym do nieskończoności
mogą osiągnąć rzeczywiste wartości.
Zaobserwowano podobne wyniki dla metody identyfikacji z użyciem aproksymacji funkcjami
sklejanymi. Przykładowo dla parametru a0 i b0 metoda daje lepsze wyniki niż metoda identy-
fikacji w oparciu o filtrację. W metodzie aproksymacyjnej otrzymano poprawne identyfikowane
parametry wcześniej o długość okna h metody splotowej. Natomiast dla pozostałych parametrów
można zauważyć gorsze wyniki.
69
Rys. 7.9. Przebieg identyfikacji parametrów w rozszerzanym i ruchomym oknie.
Rysunek 7.10 przedstawia porównanie wyliczenia wartości własnej poprzez rozwiązanie peł-
nego zagadnienia własnego jedną z metod numerycznych oraz równania różnicowego (3.30) w za-
stosowaniu dla metody filtracji. Metoda iteracji odwrotnej śledzi rzeczywisty parametr dokładnie
tak, jak to czyni rozwiązanie pełnego zagadnienia.
Rys. 7.10. Porównanie wyników rozwiązania pełnego i przybliżonego zagadnienia własnego.
7.3. Obserwacja stanu
W rozdziale tym wykorzystamy metodologię obserwatora stanu opartego o wzory z rozdziału 6.2.
Badania przeprowadzono na symulowanej transmitancji danej równaniem (7.4). Do eksperymen-
tów wykorzystane zostaną sygnały wejścia i wyjścia: przetworzone splotowo z funkcją filtrującą
(φ(t) = t4(h− t)5 i h = 3) oraz aproksymowane bezpośrednio funkcjami sklejanymi. Obiekt dany
70
wzorem (7.4) w wersji zmiennych stanu ma postać:
x(t) =
0 −1.66631 −3.8326
x+ 3.3326−1.3331
uy(t) =
[0 1
]x. (7.6)
Porównanie odpowiedzi obserwatora danego równaniem (6.15) z rzeczywistym stanem przed-
stawiono na rys. 7.11. Symulację przeprowadzono dla obiektu danego postacią Frobeniusa (6.12).
W celu eliminacji błędów wynikających z zadania identyfikacji w algorytmach obserwacji użyto
oryginalnej dokładnej transmitancji obiektu (7.4), która zmienia się skokowo dla czasu symulacji
t = 15.
Rys. 7.11. Obserwacja stanu bezpośrednia w oparciu o sploty i aproksymację.
7.4. Regulacja LQR
Porównanie przebiegów zmiennych stanu i sterowania w układzie regulacji z obiektem (7.6)
i regulatorem LQR działającym w oparciu o różne obserwatory stanu przedstawia rys. 7.12.
Funkcja modulująca φ wykorzystana w budowie obserwatora i regulatora wprowadza opóźnie-
nie, wynikające z jej długości h. To opóźnienie powinno być uwzględnione w procesie syntezy
parametrów regulatora. Początek pracy obserwatora, a przez to regulatora, rozpoczyna się gdy,
całe okno filtru zostanie wypełnione danymi pomiarowymi. W zastosowaniach praktycznych,
gdzie rozruch instalacji następuje w sposób ręczny, algorytm obserwacji może zostać włączony
znacznie wcześniej, tak by całe okno filtru zostało wypełnione pomiarami. Innym rozwiązaniem
jest zastosowanie prostszego regulatora np. PID do rozruchu algorytmu.
71
Rys. 7.12. Porównanie przebiegów w układzie (7.6) i regulatorem LQR z różnymi obserwatora-mi.
Ze względu na opóźnienie w układzie regulacji, została zmniejszona długość okna filtru z h = 3
do h = 2. Nie jest możliwe zbytnie zmniejszenie okna h, gdyż prowadzi to do pogorszenia
właściwości filtrujących i zwiększenia wpływu zakłóceń na wartość estymowanych zmiennych
stanu. Dodatkowo układ przetwarzający sygnał z postaci analogowej na cyfrową charakteryzuje
się skończonym czasem próbkowania (dyskretyzacji) i w trakcie eksperymentów zauważono, że
okno po dyskretyzacji powinno składać się z ponad 100 próbek.
7.5. Identyfikacja w zamkniętej pętli
Układ obiekt z regulatorem LQR posiada właściwości stabilizacyjne. W wyniku tego pasmo czę-
stotliwości sygnału wartości procesowej jest ograniczone i nadaje się w ograniczonym stopniu
do identyfikacji. Regulator LQR w wersji bez eliminacji uchybu statycznego został zainstalowa-
ny na mierzonym stanie obiektu. Jedna z metod identyfikacji obiektu objętego pętlą sprzężenia
zwrotnego polega na dodaniu sygnału wymuszającego uz do wyliczonej przez regulator wartości
sterującej u, rys. 7.13. W przedstawionym eksperymencie użyto sygnału prostokątnego. Dodat-
kowy sygnał wymuszający powoduje pogorszenie przyjętego wskaźnika jakości układu regulacji
72
i dlatego czas jego obecność powinien być redukowany do niezbędnego minimum wynikającego
z identyfikacji, np. w tym przypadku wystarcza T + h. Przykładowo sygnał dodatkowy powi-
nien być wprowadzony w momencie zmiany punktu pracy, okresowo w celu sprawdzenia czy nie
zmieniły się parametry sterowanego obiektu. Można zastosować również bardziej zaawansowane
metody sprawdzające aktualność parametrów modelu dla sterowanego obiektu.
Rys. 7.13. Przebieg stabilizacji i identyfikacji z regulatorem LQR.
Przebieg identyfikowanego parametru dla rozszerzanego i ruchomego okna przedstawiono na
rys. 7.13. W tym przypadku rozszerzane okno bliskie jest rzeczywistej wartości parametru a0 dla
czasu t > 10. Dlatego wybrano szerokość rozszerzanego okna T = 12, pozostałe parametry nie
zostały zmienione.
Przeprowadzono również eksperymenty ze zmodyfikowanym obiektem poprzez uwzględnienie
w nim modelu dynamiki zaworu sterującego jako członu całkującego. Wyniki przeprowadzonych
symulacji przedstawiono na rys. 7.14. Dla układu regulacji LQR z eliminacją uchybu statycznego
zmieniono macierz wagową na Q = [0 0 0; 0 1 0; 0 0 1] i odpowiednio zmodyfikowano macierze
stanu obiektu:
x(t) =
0 −1.6663 01 −3.8326 00 1 0
x+3.3326
−1.33310
u
y(t) =
0 1 00 0 1
x. (7.7)
Jakość stabilizacji jest bardzo dobra.
73
Rys. 7.14. Przebieg stabilizacji i identyfikacji z regulatorem LQR eliminującym uchyb statyczny.
7.6. Fizyczny model wymiennika ciepła
W poprzednich rozdziałach zostały przedstawione wyniki przeprowadzonych eksperymentów na
obiektach liniowych o stałych i zmiennych w czasie parametrach. Jako kolejny testowy obiekt
wybrano model wymiennika ciepła. Na rys. 7.15 przedstawiono schemat rozważanego modelu
wymiennika ciepła.
Rys. 7.15. Schemat wymiennika ciepła.
Równanie przewodnictwa ciepła dla ośrodka izotropowego, jednorodnego, ze stałymi współ-
czynnikami oraz bez źródeł ciepła w rozważanym obszarze, charakteryzującego się: k – współ-
czynnik przewodnictwa, c – ciepło właściwe, ρ – gęstość, przyjmuje postać:
∂2T
∂x2+∂2T
∂y2+∂2T
∂z2− cρ
k
∂T
∂t= 0
i jest równaniem typu parabolicznego [57, 130].
Analiza dynamiki wymiennika przepływowego typu ”rura w rurze” prowadzi jednak do rów-
74
nań hiperbolicznych. Model uproszczony można uzyskać zakładając brak wzdłużnego przewod-
nictwa ciepła, idealne mieszanie cieczy w płaszczu i rurze wymiennika na odcinku ∆z, brak
promieniowania cieplnego płaszcza, brak zmiany gęstości cieczy w zależności od temperatu-
ry medium, itp. Dla wymiennika ciepła typu ”rura w rurze” z przepływem przeciwprądowym
(rys. 7.15), przy powyższych założeniach otrzymujemy układ równań różniczkowych cząstkowych
pierwszego rzędu: ∂T1(z,t)∂t
= −υ1(t)∂T1∂z + ω1[T2(z, t)− T1(z, t)]∂T2(z,t)∂t
= υ2(t)∂T2∂z + ω2[T1(z, t)− T2(z, t)](7.8)
gdzie: z ∈ [0, 1], t 0, ω1, ω2 są stałymi dodatnimi parametrami [42]. Przykładowo, wielkościfizyczne wyrażone w międzynarodowym układzie jednostek miar (franc. Systeme International
d’Unites, SI ) posiadają następujący wymiar: temperatur T1, T2[K], czas t[s], prędkość przepływu
υ1, υ2[m/s], droga z[m], częstotliwość ω1, ω2[Hz]. Warunki brzegowe
T1(0, t) = Tin, T2(1, t) = Tout, t 0,
warunek początkowy:
T1(z, 0) = T10(z), T2(z, 0) = T20(z).
W stanie ustalonym T∞(z) =[T1∞(z) T2∞(z)
]TPrzy założeniu, że ω1 > ω2 > 0 to rozkład temperatur wzdłuż wymiennika w stanie ustalonym
jest dany:
T∞(z) =1
α− βeβ−α
Tin[αe(β−α)z − βe(β−α)] + αTout[1− e(β−α)z]βTin[e(β−α)z − e(β−α)]− Tout[α− βe(β−α)z]
, (7.9)
gdzie α := ω1υ1∞
> β := ω2υ2∞. Natomiast υ1∞ i υ2∞ reprezentują odpowiednio wartości strumienia
w stanie ustalonym i zachodzi między nimi relacja υ2∞ > υ1∞ > 0.
Transmitancja zlinearyzowanego toru wymiennika w punkcie pracy dana jest:
g(s) =αβe(β−α)(β − α)(Tin − Tout)( e
λ1(s)+α−β−1λ1(s)+α−β −
eλ2(s)+α−β−1λ2(s)+α−β )
υ1∞(α− βe(β−α))([λ2(s)− sυ2∞− β]eλ1(s) + [−λ1(s) + s
υ2∞+ β]eλ2(s))
, (7.10)
λ1,2 =s( 1υ2∞− 1υ1∞)− α+ β ∓
√∆(s)
2, (7.11)
∆(s) = [s(1υ2∞+1υ1∞) + (α+ β)]2 − 4αβ. (7.12)
7.7. Opracowanie wyników eksperymentów
W niniejszym rozdziale zostaną przedstawione i opracowane wyniki eksperymentów przeprowa-
dzonych na rzeczywistych danych pomiarowych. Dane te zostały zebrane w trakcie eksperymen-
75
tów przeprowadzonych przez autora na laboratoryjnym modelu wymiennika ciepła dostępnym
w Laboratorium Sterowania Procesami, Katedry Automatyki Akademii Górniczo-Hutniczej. Wy-
miennik jest częścią aparatury laboratoryjnej kolumny destylacyjnej, rys. 7.16. Pomiary tem-
peratury wykonano czujnikami Pt100, a ciągły ich przestrzenny rozkład rejestrowano kamerą
termowizyjną Flir ThermoVision A20.
Rys. 7.16. Badany wymiennik. Zdjęcie, schemat oraz zdjęcie w podczerwieni.
Przedstawiony w rozdziale 7.6 model wymiennika, rys. 7.15 różni się w stosunku do rys. 7.16,
co stwarza konieczność uwzględnienia odpowiednich współczynników skalujących. Dodatkowe
zwoje wewnętrzne wymiennika powodują zwiększenie powierzchni wymiany ciepła. W rozważa-
nym modelu przyjęto uproszczoną wersję z wewnętrzną rurą prostą, co powoduje konieczność
przeskalowania strumienia o odpowiedni współczynnik.
7.7.1. Neuralny model statyczny wymiennika
Tabela 7.1 zawiera część z prawie 200 zebranych w trakcie eksperymentów stanów ustalonych.
Wyniki posłużą do dalszego planowania eksperymentów np. doboru zmiany wymuszeń dla eks-
76
Wejścia WyjściaF156 T116 F153 T101 T117 T103ml/s [�] [ml/s] [�] [�] [�]
10 50.8 1 9.5 36.3 49.510 51.3 3.1 9 30.7 44.510 50.8 5 8.5 27.8 37.710 51.1 6.9 9 26.1 32.510 50.5 10.1 8.5 23.5 26.510 50.6 15 8 22 20.510 50.5 20 8 21.1 1710 49.9 25.1 7.5 20.3 14.89.9 50.2 30.2 7.5 19.6 1310 49.9 35.2 7.5 18.9 1210 49.7 40 7.5 18.3 1110 49.9 45.2 7.5 17.9 1010 49 49.9 8 17.3 9.510 48.7 54.8 7.5 16.7 910 48.6 59.8 7.5 16.5 8.510 48.9 64.6 7 16.2 810 60.5 1 7 42.6 5910 60.2 3 7 35.9 54.510 59.9 5 8 31.8 45.510 59.7 6.9 7.5 29 37.510 60.5 10.2 8 27 31.510 60.8 20.1 8 24.2 19.510 60.2 24.8 7.5 23.4 17.510 60.1 29.6 7.5 22.5 1510 59.8 39.2 7.5 21.1 1310 59.9 50.2 7 20.2 1110 59.6 60.3 7 19.3 10
Wejścia WyjściaF156 T116 F153 T101 T117 T103ml/s [�] [ml/s] [�] [�] [�]
10 40.2 30.3 6 16.1 8.910 39.7 39.8 6 15.2 7.510 39.1 50 5.5 14.3 6.710 39.6 60.5 6 13.9 6.29.9 39.7 70.2 5.5 13.4 5.85 50.2 9.6 7 15 16.85 50.2 5 7.5 19.2 25.65 49.8 3 7.5 22.6 32.55 50.1 1 7.5 30.9 39.14.9 49.9 19.6 7.5 13.1 10.95 49.6 30 7 11.9 8.75 49.8 49.8 6.5 10.4 6.75 49.8 70 6 9.5 5.71 40.6 1 7.5 11.5 261 40.6 3 7.5 7.7 15.71 40.3 5 7.5 6.6 11.61 40.2 10 7.5 5.6 8.11 40.2 20 7 4.9 5.91 40 29.6 7 4.6 51 39.7 50 6.5 4.2 4.31 40 70.1 6 4.1 41 50.3 1 7.5 13.2 32.21 50.4 2.9 8 8.5 18.91 50.3 5 7.5 7.3 13.61 50.3 9.6 7.5 6.2 9.11 50.1 30 7.5 4.9 5.51 50.1 69.6 6 4.4 4.4
Tabela 7.1. Fragment zarejestrowanych stanów ustalonych wymiennika (z rys. 7.16).
perymentów identyfikacji dynamicznej. Dodatkowo wartości stanów ustalonych po aproksymacji
będą dodawane do sterowania regulatora tworząc statyczną pętle sprzężenia w przód, zalety
której przedstawiono we wstępie.
Rysunek 7.17 przedstawia wyniki aproksymacji stanów ustalonych siecią neuronową o trzech
neuronach wejściowych reprezentujących zmienne wejściowe obiektu T116, F153 i F156. W war-
stwie ukrytej znajdowało się 20 neuronów charakteryzujących się sigmoidalną funkcją przejścia.
W warstwie wyjściowej znajdował się jeden neuron z liniową funkcją aktywacji (T117). W war-
stwie wejściowej powinny znajdować się cztery neurony, ale w trakcie eksperymentów zmiana
T101 = 9[�] była nieznaczna. Natomiast w warstwie wyjściowej powinien być dodatkowo neuron
odpowiedzialny za odtwarzanie T103, z którego zrezygnowano dla przejrzystości rozważań. Do
uczenia użyto 154 pomiarów. Jako algorytm uaktualniający wartości wag użyto algorytmu opty-
malizacji Levenberg-Marquardt. Na rysunku można zauważyć fragment źle dopasowanej krzywej
objawiający się nagłym skokiem. Ten brak dopasowania jest spowodowany niedostateczną ilością
pomiarów w tych miejscach co skutkuje pogorszeniem aproksymacji.
7.7.2. Dobór parametrów modelu wymiennika
Model wymiennika dany równaniem (7.8) posiada długość jednostkową. Chcąc zastosować ten
model do rzeczywistego wymiennika należy przeskalować mierzone strumienie przepływu υ1 i υ2na prędkość przepływu υ1(t) = f1υ1(t) i υ2(t) = f2υ2(t), uwzględniając powierzchnie przepływu
77
Rys. 7.17. Charakterystyki statyczne wymiennika aproksymowane siecią neuronową.
i długość przepływu.
Wstępne badania i próby doboru parametrów ω1, ω2, f1, f2 wykazały istnienie wielu mi-
nimów w procesie optymalizacji oraz bardzo dużą czasochłonność obliczeń wymiennika danego
równaniem dynamicznym. Dlatego dobór parametrów okazał się trudny i wymagał specjalnego
wieloetapowego podejścia.
Tabela 7.2 przedstawia wartości współczynników parametrów modelu wymiennika cieplnego.
Pierwszy etap doboru parametrów polegał na odczytaniu z tablic fizycznych wartości poszcze-
gólnych współczynników. Jedynym brakującym współczynnikiem okazał się tzw. wewnętrzny
współczynnik przewodności ciepła k. Jego wartość została wstępnie dobrana w trakcie obliczeń
polegających na poszukiwaniu minimum na prostej dla wybranego stanu ustalonego. Jako model
użyte zostało równanie (7.9) opisujące zachowanie wymiennika w stanie ustalonym. Następnie
tak dobrane parametry posłużyły jako parametry startowe w procedurze optymalizacji po pa-
rametrach ω1, ω2 przy ustalonych stałych f1, f2. Również wykorzystano równanie dla stanów
ustalonych wymiennika, co powoduje, że parametry ω1, ω2, f1, f2 dla modelu wymiennika w stanie
78
ustalonym są zależne od siebie. Z tego względu f1, f2 jako stałe. Parametry otrzymane w wyniku
optymalizacji modelu w stanach ustalonych posłużyły jako warunek początkowy w optymalizacji
dynamicznej. Do optymalizacji użyto standardowych procedur pakietu Matlab fminsearch. Wy-
korzystano równanie (7.8) opisujące zachowanie dynamiczne wymiennika. Symulacji dokonano
dzieląc każde z równań różniczkowych cząstkowych układu (7.8) na n = 40:
d
dt
T1( 1n , t)...
T1(nn , t)
T2( 1n , t)...
T2(nn , t)
2n×1
=
ψ ω1
ν. . . . . .
ν ψ ω1
ω2 ζ κ. . . . . . κ
ω2 ζ
T1( 1n , t)...
T1(nn , t)
T2( 1n , t)...
T2(nn , t)
+
ν 0
0...
......
......
... 0
0 κ
T1in
T2in
, (7.13)
gdzie ψ = −nυ1(t) − ω1, ζ = −nυ2(t) − ω2, ν = nυ1(t) i κ = nυ2(t) oraz wyjścia obiektu
T1out(t) = T1(nn , t), T2out(t) = T2(1n, t).
Oznaczenie Opis Wartość JednostkaParametry fizyczne
L Długość zewnętrzna 0.44 [m]φR Średnica rury 10e-3 [m]φZ Średnica spirali 44e-3 [m]φP Średnica płaszcza 54e-3 [m]Z Liczba zwoji 33
C1, C2 Ciepło właściwe wody 4187 [J/(kg*K)]ρ1, ρ1 Gęstość wody w 22� 998 [kg/m3]
Wyliczone parametryz1 = L+ Z ∗ π ∗ (φZ − φR) - długość rury 3.97 [m]z2 = L - długość płaszcza 0.44 [m]A1 = 1/4 ∗ z1 ∗ pi ∗ φ2R - przekrój poprzeczny 7.1e-004 [m2]A2 = 1/4 ∗ π ∗ φ2P −A1 1.6e-3 [m2]At = z1 ∗ π ∗ φR - pole wymiany 0.1246 [m2]k nieznany wew. współczynnik przew. ciepła [W/(m*K)]f1 = z1/(A1 ∗ 1[m]) - skalowanie strumienia rury 5.5915e+003 [1/m2]f1 = z2/(A2 ∗ 1[m]) - skalowanie strumienia płaszcza 275 [1/m2]ω1 = k ∗At2/(C1 ∗ ρ1 ∗A1) 2.2742e− 005 ∗ k [Hz]ω2 = k ∗At2/(C2 ∗ ρ2 ∗A2) 9.4758e− 007 ∗ k [Hz]
Optymalizacja na prostejk wew. współczynnik przew. ciepła 0.6 [W/(m*K)]ω1 k ∗At2/(C1 ∗ ρ1 ∗A1) 2.2742e-005 [Hz]ω2 k ∗At2/(C2 ∗ ρ2 ∗A2) 9.4758e-007 [Hz]
Optymalizacja dynamicznaf1 po optymalizacji dynamicznej wraz ze średnią 4.0684e-003 [1/m2]f2 j.w. 1.6439e-003 [1/m2]ω1 j.w. 3.8699e-002 [Hz]ω2 j.w. 1.7651e-002 [Hz]
Tabela 7.2. Parametry wymiennika
Zastosowane wieloetapowe podejście zamiast bezpośredniej symulacji dynamicznej dało lep-
sze rezultaty, gdyż optymalizacja dynamiczna wykazywała wiele lokalnych minimów. Powodo-
wało to, że parametry dostosowywały się dobrze (zależnie od punktu startowego) dla zbioru
przebiegów uczących, natomiast wykazywały duży błąd dla zbioru przebiegów testowych. Do-
79
datkowo podejście wieloetapowe umożliwiło znalezienie parametrów startowych do kolejnych
optymalizacji już w pobliżu globalnego minimum.
W kolejnym zestawie eksperymentów będą identyfikowane parametry uproszczonego w sto-
sunku do (7.8) liniowego modelu pierwszego rzędu o parametrach stałych w czasie. Do identy-
fikacji tych parametrów zostaną zastosowane algorytmy identyfikajci splotowej i sklejanej prze-
stawione wcześniej. Przyczyną wybrania obiektu pierwszego rzędu była jego prostota, łatwość
interpretacji fizycznej poszczególnych współczynników k i T oraz brak konieczności dostępu do
wielu zmiennych stanu. Jednocześnie model dany transmitancją dobrze przybliża zachowanie
wymiennika ciepła w punkcie pracy. W przeprowadzonym eksperymencie identyfikacji założono
następujący uproszczony model liniowy o parametrach stałych w czasie:
G(s) =k
Ts+ 1(7.14)
Wyniki eksperymentów wielokrotnej identyfikacji metodami identyfikacji splotowej i skleja-
nej parametrów T i k – równanie (7.14) – wykreślono na rys. 7.18. W trakcie eksperymentów
zmienne wejściowe ulegały niewielkim wahaniom i ich wartość średnia wynosiła odpowiednio
F156 = 10 [ml/s], T116 = 50 [�], T101 = 20 [�]. Jako wymuszenie zastosowano pseudolosowy
sygnał binarny o wartości średniej F153 = 10 [ml/s] i amplitudzie 3 [ml/s]. Eksperyment prze-
prowadzono w otwartej pętli sterowania. Podobnie jak dla metody splotowej te same trendy
historyczne poddano identyfikacji metodą funkcji sklejanych i wyniki również przedstawiono na
rys. 7.18. Dodatkowo na wykresach wykreślono krzywą o rozkładzie normalnym. Z wyjątkiem
wzmocnienia k identyfikowanego metodą funkcji sklejanych otrzymane wyniki nie przystają do
rozkładu normalnego. Przyczyną może być zbyt mała liczba przeprowadzonych eksperymentów.
W tabeli 7.3 przedstawiono niepewność parametrów identyfikacji zamieszczając ich własności
średnie i odchylenie standardowe dla wersji parametrów otrzymanych metodą splotową i metodą
funkcji sklejanych z rys.7.18.
Parametr Wartość średnia Odchylenie standardowem. splotowa
T 32.9533 0.98488k -0.61519 0.0090817
m. sklejanaT 38.6447 1.5936k -0.62197 0.0094655
Tabela 7.3. Statystyka parametrów.
Następnie wykonano na wymienniku rzeczywistym 15 eksperymentów. Rysunek 7.19 przed-
stawia przebieg wymuszeń F153 o odpowiedzi T103 i T117 przy ustalonych T101 = 20 [�], T116 =
60 [�] i F156 = 10 [ml/s]. Jako wymuszenie użyto pseudolosowego sygnału binarnego o wartości
średniej równej stanowi ustalonemu. Eksperymenty przeprowadzono dla rożnych punktów pracy
F153. Ze względu na silne nieliniowości obiektu amplitudę sygnału wymuszającego uzależniono od
80
Rys. 7.18. Rozkład stałych T i k dla wielokrotnie przeprowadzonego eksperymentu identyfikacji(7.14) w wybranym punkcie pracy.
punktu pracy. Eksperyment przeprowadzono ze stanu ustalonego do stanu ustalonego w otwartej
pętli sterowania.
Rys. 7.19. Pomiary odpowiedzi wymiennika na różne wymuszenia.
Na rys. 7.20 przedstawiono wyniki identyfikacji parametrów k i T dla równania (7.14) w roż-
nych punktach pracy (F153) dla metody identyfikacji splotowej i sklejanej. Porównanie wyników
identyfikacji otrzymanych na podstawie eksperymentów z symulacją wymiennika – równanie (7.8)
81
– dla różnych punktów pracy F153 wykreślono na rys. 7.20. Dodatkowo zaznaczono wyniki iden-
tyfikacji symulowanego wymiennika danego równaniem (7.8) o parametrach przedstawionych w
tabeli 7.2. Można zauważyć dużą zgodność wyników niezależnie od metody identyfikacji zarówno
dla rzeczywistego, jak i symulowanego obiektu.
Rys. 7.20. Porównanie wyników identyfikacji stałych T i k (7.14).
Aproksymacji zebranych pomiarów dokonano z wykorzystaniem funkcji fit1. Dodatkowo
na wykresach wykreślono krzywe 95% przedziałów ufności dla obserwacji (ang. simultaneous
prediction bounds for observation, SPBO) oraz dla funkcji (ang. simultaneous prediction bounds
for function, SPBF). Jako funkcję aproksymującą pomiary T (F153) i k(F153) użyto:
y = aebx + cedx. (7.15)
i wyniki aproksymacji oznaczono odpowiednio Tmean i kmean. W celu łatwiejszego zobrazowania
na rys. 7.21 przedstawiono krzywe w zależności od jednego wejścia. W rzeczywistości są to
fragmenty hiperpłaszczyzn czteroargumentowych, których fragmenty przedstawiono na rys. 7.22.
W tabeli 7.4 zebrano wartości parametrów (7.15) oraz statystykę dopasowania dla poszczególnych
krzywych.
Rysunek 7.23 przedstawia aproksymację funkcjami sklejanymi zmiany parametruK1 [ml/(s�)]
regulatora w zależności od F153 i T116 dokonanej dla dwóch metod identyfikacji (splotowa i funk-
cjami sklejanymi). Wartość wzmocnienia K2 = 0.1 [ml/(�s2)] pozostaje stała. W rzeczywi-
stości dla rozważanego przypadku dziedzina tej hiperpłaszczyzny jest czteroelementowa. Obie
powierzchnie mają bardzo zbliżony kształt. Takie krzywe można przygotować off-line. W trakcie1Dostarczona w bibliotekach Curve Fitting Toolbox pakietu Matlab
82
T [s] k [�s/ml]Opis m. splotowa m. sklejana m. splotowa m. sklejana
a 130.304503 131.835845 -6.427504 -6.509010b -0.242781 -0.217806 -0.285865 -0.282606c 39.530094 41.563691 -0.304146 -0.289958d -0.013369 -0.010614 -0.025476 -0.024114SSEa 690.108425 686.260447 0.094848 0.094469R-Square 0.953232 0.957556 0.995470 0.995634DFEb 11.000000 11.000000 11.000000 11.000000adjrsquare 0.940477 0.945981 0.994235 0.994443RMSEc 7.920677 7.898564 0.092858 0.092672
aSuma kwadratów błędu (ang. Sum of Squares Due to Error, SSE)bStopnie swobody (ang. Degrees of Freedom Adjusted R-Square, DFE)cBłąd średniokwadratowy (ang. Root Mean Squared Error, RMSE)
Tabela 7.4. Parametry i statystyka dopasowania.
Rys. 7.21. Aproksymacja wyników identyfikacji dla eksperymentów wraz z przedziałami ufności.
pracy on-line regulator może bezpośrednio korzystać z nich na zasadzie regulatora gain schedu-
ling bez konieczności przeprowadzania syntezy wzmocnienia regulatora on-line. Okresowo należy
przeprowadzać procedurę identyfikacji i syntezy regulatora celem aktualizacji kształtu krzywych.
Jak pokazano, w wyniku przeprowadzonych eksperymentów identyfikacji dostajemy całą ro-
dzinę rozkładu zmiany wartości wyniku. Czyni to proces syntezy parametrów trudniejszym.
83
Rys. 7.22. Powierzchnia zmiany parametrów wymiennika bez aproksymacji.
Rys. 7.23. Powierzchnia zmiany wzmocnienia regulatora K1.
Należy bowiem jednoznacznie odpowiedzieć na pytanie, które parametry przyjąć – z wielokrot-
nej identyfikacji czy z przedziałów ufności identyfikacji przeprowadzonych w różnych punktach
pracy (rys. 7.21). Analityczne sposoby uwzględnienia wpływu rozrzutu zidentyfikowanych para-
metrów modelu liniowego na dobór parametrów regulatora zebrano w pracy [5] dla systemów
84
nieliniowych [106]. Innym sposobem uwzględnienia niepewności parametrów T i k zidentyfiko-
wanego modelu jest zastosowanie metody symulacji Monte Carlo dla wygenerowania zestawu
dwóch parametrów z ich potrójnego przedziału ufności (rys. 7.21). Poniżej przedstawimy dwa
zestawy bloków eksperymentów dla regulatora LQR i modeli zidentyfikowanych off-line.
Eksperymenty z doborem odpornego regulatora LQR i identyfikacją off-line
Wykonano ciekawe eksperymenty z zestawem regulatorów LQR syntetyzowanych dla średnich
wartości parametrów modelu k i T , odpowiadających wybranemu przepływowi F153 (rys. 7.21)
ale wspópracujących z modelami o parametrach innych, wybieranych do symulacji metodą losową
z ich przedziałów ufności ksym i Tsym. Dla każdego regulatoraKmean wyliczonego z algebraicznego
równania Riccatiego dla obiektu kmean i Tmean symulowano jego pracę z 10 różnymi modelami
ksym i Tsym (dla wybranego F153). Uzyskano różne wartości wskaźnika jakości i różne efekty sta-
bilizacji. Podjęto próbę syntezy regulatora LQR odpornego poprzez numeryczną minimalizację
symu wszystkich wskaźników jakości w funkcji współczynnika wzmocnienia regulatora K. Otrzy-
many współczynnikKrbst (różny od współczynnikaKmean) gwarantował optymalność przebiegów
stabilizacji w sensie średniej wartości wskaźnika (uśrednionego po 10 eksperymentach z różnymi
modelami). Wyniki optymalnych nastaw regulatora LQR otrzymane jako Kmean i wyniki współ-
czynnika Krbst dobrane numerycznie dla całego konkretnego przedziału ufności współczynników
kmean i Tmean przedstawiono na rys. 7.24.
Rys. 7.24. Wzmocnienia regulatora po optymalizacji metodą Monte Carlo.
W eksperymentach symulowanych dla zagwarantowania zerowego błędu statycznego w ukła-
85
dzie zamkniętym przyjmowano obecność dodatkowego członu całkującego w obiekcie jakim był
w rzeczywistości pracujący zawór na przepływie. Stąd dynamika systemu przyjmowała drugi
rząd. W końcowym efekcie symulowane były dwa współczynniki regulatora K1 i K2 (rys. 7.24).
Należy zauważyć, że na skutek skończonego czasu symulacji T = 3000 [s] niektóre wyniki
dla F153 > 20 [ml/s] dla badanego obiektu wymiennika dawały niezadawalający efekt stabilizacji
mimo mniejszej wartości średniego wskaźnika jakości. Z tych eksperymentów płynie ważny wnio-
sek, że niektóre proste metodologie uodporniania regulatorów na zmiany parametrów modelu
muszą być weryfikowane dodatkowymi metodami.
Eksperymenty identyfikacji z pełnym, nieliniowym modelem wymienika
Następny zestaw eksperymentów przeprowadzono z pełny, nieliniowym modelem wymiennika
o parametrach rozłożonych (7.8) dla różnych wartości sygnału F153. W tabeli 7.5 zebrano wyniki
przeprowadzonych symulacji dla zagadnienia stabilizacji przy założonym dotychczas wskaźniku
jakości. Parametry pracy wymiennika T116 = 60 [�], F156 = 10 [ml/s], T101 = 20 [�]. Ekspe-
ryment przeprowadzono z różnych warunków początkowych PV0 będących w stanie ustalonym.
Dla syntezy regulatora adaptacyjnego typu ”gain scheduling” wartości parametru modelu stałej
czasowej T i wzmocnienia k uzależniono od CV (przepływ F153), SP (zadana wartość temp.
T117) i PV (procesowa wartość temp. T117). Do wyjścia regulatora dodano wartość sterowania
w stanie ustalonym F153 = 13.317 [ml/s]. W trakcie symulacji równania (7.8) rozwiązywano rów-
nanie Riccatiego dla aktualnych wartości parametrów modelu i wybranych macierzy wagowych
wskaźnika Q = [1 0; 0 1], R = [100]. Otrzymane optymalne nastawy regulatora posłużyły do
wyliczenia sterowania CV dla następującego modelu:
x =
− 1T 01 0
x+ − kT0
u (7.16)
W eksperymentach symulowanych układu zamkniętego brały udział dane pochodzące z peł-
nego modelu (7.8). W celu uproszczenia dalszych rozważań założono pomijalny wpływ niemie-
rzalnych zmiennych stanu związanych z opóźnieniem. Założenie jest o tyle słuszne, że wartość
zaobserwowanego opóźnienia była znacznie mniejsza od stałej czasowej. Istnienie opóźnienia
wpływa destabilizująco na układ regulacji. Niemniej jednak dobrze (odpornie) dobrany układ
regulacji powinien być w stanie skompensować wpływ niemierzalnych zmiennych stanu. Podobnie
jak wartość stałej czasowej, wartość opóźnienia silnie zależała od wartości przepływów.
W tabeli 7.5 przedstawiono wartości wskaźnika jakości stabilizacji z wykorzystaniem peł-
nego zakresu zmian parametrów regulacji w regulatorze adaptacyjnym (zgodnie z wykresem
7.23) przy jednoczesnym doborze różnych wariantów uzależnienia parametrów modelu T ik od
punktu pracy (ang. set point, SP), od zmiany wyjścia obiektu (ang. process value, PV) i od
zmiany sterowania (ang. control value, CV). Poszczególne eksperymenty reprezentują wiersze
86
tabeli 7.5. Przykładowo SP i CV w 4-tym eksperymencie oznaczają, że parametr modelu T był
uzależniony od zmiany SP, a współczynnik wzmocnienia modelu k od sterowania CV. Tabela
reprezentuje wyniki dla stałej końcowej wartości PV=SP=40[�] i różnych początkowych warto-
ści PV0. Wszystkie eksperymenty z regulatorem adaptacyjnym i pełnym modelem wymiennika
(7.8) zakończyły się pozytywnie doprowadzając model z jednego punktu pracy do drugiego.
T k J[s] [ ml
s�] PV0 = 56[�] PV0 = 50[�] PV0 = 43[�] PV0 = 37[�] PV0 = 36[�] suma
m. splotowaCV CV 3.1732e+008 2.6400e+008 1.8993e+008 1.6533e+007 2.1267e+009 2.9145e+009CV SP 2.9109e+008 2.4106e+008 9.4544e+007 2.1522e+007 2.4380e+007 6.7259e+008CV PV 2.2013e+008 1.2265e+008 3.7901e+007 1.9971e+007 2.2581e+007 4.2323e+008SP CV 3.2071e+008 2.6706e+008 1.8935e+008 1.8417e+007 2.2190e+009 3.0146e+009SP SP 2.8625e+008 2.4035e+008 9.8581e+007 2.1197e+007 2.4308e+007 6.7069e+008SP PV 2.2162e+008 1.2490e+008 3.8261e+007 1.9795e+007 2.2516e+007 4.2709e+008PV CV 3.2384e+008 2.6660e+008 1.8893e+008 1.9889e+007 2.2567e+009 3.0559e+009PV SP 2.8477e+008 2.4144e+008 1.0803e+008 2.1298e+007 2.4467e+007 6.8000e+008PV PV 2.5113e+008 1.4246e+008 4.1344e+007 1.9889e+007 2.2622e+007 4.7745e+008
m. sklejanaCV CV 3.1696e+008 2.6392e+008 1.8995e+008 1.6951e+007 2.1154e+009 2.9032e+009CV SP 2.9143e+008 2.4187e+008 9.6930e+007 2.1632e+007 2.4484e+007 6.7635e+008CV PV 2.2338e+008 1.2552e+008 3.9206e+007 2.0059e+007 2.2653e+007 4.3082e+008SP CV 3.2009e+008 2.6656e+008 1.8940e+008 1.8387e+007 2.2122e+009 3.0066e+009SP SP 2.8714e+008 2.4121e+008 1.0090e+008 2.1334e+007 2.4420e+007 6.7500e+008SP PV 2.2565e+008 1.2807e+008 3.9595e+007 1.9900e+007 2.2598e+007 4.3581e+008PV CV 3.2278e+008 2.6615e+008 1.8899e+008 1.9557e+007 2.2353e+009 3.0328e+009PV SP 2.8565e+008 2.4214e+008 1.0951e+008 2.1428e+007 2.4567e+007 6.8330e+008PV PV 2.5383e+008 1.4459e+008 4.2388e+007 1.9987e+007 2.2698e+007 4.8349e+008
Tabela 7.5. Porównanie wskaźnika jakości pracy układu zamkniętego dla różnych parametrówmodelu liniowego zależnych od zmiennych procesowych dla symulowanego wymien-nika, SP=40�.
87
Rozdział 8
Wnioski
W pracy przedstawiono najważniejsze wyniki teorii optymalnej identyfikacji parametrów dla
ciągłych i liniowych obiektów z wykorzystaniem funkcji modulujących i sklejanych. Następ-
nie pokazano możliwość jednoczesnej i dokładnej (nieasymptotycznej) obserwacji stanu układu
z wykorzystaniem tych metod. Jednoczesna identyfikacja parametrów i stanu modelu posłużyły
do zbudowania adaptacyjnego regulatora bazującego na klasycznej teorii LQR. Przeprowadzo-
ne testy numeryczne potwierdziły skuteczność stosowania niniejszego adaptacyjnego algorytmu
regulacji dla układów ciągłych.
Zastosowanie bazowych funkcji sklejanych do budowy funkcji modulującej w metodzie splo-
towej umożliwia dogodne kształtowanie charakterystyk czasowo-częstotliwościowych. Takie do-
pasowanie jest szczególnie ważne dla sygnałów niestacjonarnych i znajduje zastosowanie w za-
gadnieniu obserwacji.
W wyniku prac nad przedstawionymi metodami identyfikacji powstała biblioteka o nazwie
Continous Identification Toolbox IDC w języku programowania Matlab. Zrealizowana bibliote-
ka w swoim interfejsie przypomina komercyjną bibliotekę identyfikacji dyskretnej Identyfication
Toolbox i będzie używana do dalszych badań. Biblioteka może być udostępniona osobom zain-
teresowanym.
Możemy określić dokładne właściwości częstotliwościowe (filtracyjne) funkcji modulującej co
powoduje, że metody oparte o nią są bardziej przewidywalne i poddają się analizie. W przypad-
ku użycia funkcji sklejanych w metodzie estymacji pochodnych praktycznie nie mamy możliwo-
ści wpłynięcia na parametry filtracyjne. Dobieramy ilość i rozkład węzłów, stopień wielomianu
bazowego. Jak pokazały przedstawione eksperymenty, funkcje bazowe aproksymujące sygnały
pomiarowe nadają się do zagadnienia identyfikacji i obserwacji.
Potwierdzono słuszność tezy gwarancji optymalnej jakości identyfikacji parametrów dla meto-
dy identyfikacji układów liniowych, ciągłych wykorzystującej splotowy filtr z nośnikiem zwartym
i kwadratowy wskaźnik jakości.
W pracy pokazano możliwość dwojakiego zastosowania funkcji sklejanych. Pierwszym zasto-
88
sowaniem było użycie ich do budowy optymalnych modulujących funkcji filtrujących o nośni-
ku zwartym. Drugim zadaniem była bezpośrednia aproksymacja pochodnych sygnałów wejścia
i wyjścia dla bezsplotowej metody identyfikacji.
W kolejnym etapie prowadzonych badań potwierdzono tezę, że ciągłe adaptacyjne regulatory
LQR wykorzystujące jednoczesną obserwację stanu i identyfikację parametrów obiektu (w opar-
ciu o funkcje modulujące i sklejane) gwarantują wysoką jakość stabilizacji układów o nieznanych
lub zmiennych parametrach.
Niezależnie od osiągniętych wyników przedstawionych w pracy, przeprowadzone analizy i ba-
dania ujawniły szereg interesujących kierunków dalszych prac. Przede wszystkim wydaje się
być celowa implementacja przedstawionych algorytmów w zintegrowanych systemach sterowa-
nia w środowisku czasu rzeczywistego PLC, softPLC. Rozbudowanie algorytmów o arytmety-
kę interwałową. Innym zagadnieniem jest badanie związku algorytmów identyfikacji splotowej
z transformatą falkową.
Podsumowując wyniki pracy można stwierdzić, że postawione w rozdziale 1 tezy naukowe
zostały przebadane. Ich prawdziwość starano się potwierdzić zarówno analitycznie jak i w wy-
niku przeprowadzonych eksperymentów numerycznych. W tych ostatnich wykorzystywano dane
symulowane, jak również dane rzeczywiste, uzyskane z fizycznego modelu.
89
Dodatek – stanowisko laboratoryjne
Na rys. 1 przedstawiono schemat konfiguracji stanowiska laboratoryjnego dwuskładnikowej ko-
lumny destylacyjnej. Pokazano obieg cieczy surowiec-produkt, obieg wody chłodzącej oraz spo-
sób podpięcia stanowiska operatorskiego i badawczego do instalacji. Surowcem jest roztwór wody
z etanolem o niskim stężeniu procentowym.
Przedstawiony schemat został znacznie uproszczony. Rzeczywistych punktów pomiarowych
jest 65. Są to czujniki pomiarowe temperatury, ciśnienia, poziomu i składu. Jako elementów wy-
konawczych użyto na instalacji: zawory, pompy i grzałki. Na schemacie zrezygnowano z przed-
stawienia zaworów rekonfigurujących strukturę stanowiska i jedynie przedstawiono zawory regu-
lacyjne. Pompy pracują ze stałą wydajnością. Regulacja przepływu jest osiągana poprzez zmianę
otwarcia zaworów. Elementem grzejnym jest zespół 9 grzałek elektrycznych umieszczonych w tu-
lejach olejowych o łącznej mocy 13.5 KW.
Praca instalacji nie byłaby możliwa bez obwodów pomiarowo-wykonawczych podpiętych do
sterownika logicznego PLC, który realizuje algorytmy sterowania stosowane w warstwie stero-
wania bezpośredniego. Zainstalowany sterownik logiczny posiada szereg wejść analogowych do
pomiaru ciągłych zmiennych pomiarowych. Wejścia binarne wykorzystane są do realizacji obwo-
dów potwierdzenia i osiągnięcia wartości granicznych zmiennych procesowych. Wejścia szybkich
liczników są połączone z przepływomierzami turbinkowymi. Wyjścia przekaźnikowe sterownika
podpięte są do odpowiednich obwodów wykonawczych.
Surowiec ze zbiornika poprzez pompę jest dostarczany do półkowej kolumny destylacyjnej.
W kolumnie zachodzą procesy wymiany masy pomiędzy cieczą i parą. Skutkuje to wzrostem
stężenia par etanolu, który jest skraplany w skraplaczach. Następnie skropliny gromadzone są
w zbiorniku wyrównawczym refluksu. Poprzez pompę gotowy surowiec przepompowywany jest
do zbiornika produktu. Cześć destylatu - refluks zawracana jest na szczyt kolumny. Wielokrotna
destylacja powoduje wzrost stężenia etanolu w produkcie końcowym.
Woda chłodząca ze zbiornika wyrównawczego jest dostarczana poprzez pompę do skraplaczy,
zbiornika refluksu oraz wymienników ciepła. Następnie ogrzana woda przepływa do chłodnicy
powietrznej z dmuchawą. Schłodzona woda jest buforowana w zbiorniku wyrównawczym. Ewen-
tualne braki wody chłodzącej są uzupełniane z sieci wodociągowej.
Gromadzenie i wizualizacja danych pomiarowych są realizowane na stacji operatorskiej wy-
90
posażonej w wykonane w Katedrze Automatyki oprogramowanie do nadzoru, kontroli i akwizycji
danych SCADA, uzupełnione i poprawione przez autora, rys. 2 i rys. 3. W celu podniesienia bez-
pieczeństwa prowadzonych eksperymentów prace badawcze są realizowane na dodatkowej stacji
roboczej wyposażonej w pakiet do obliczeń Matlab.W wielopoziomowym systemie sterowania zainstalowane są dwa systemy operacyjne QNX
i MS Windows NT. Sterowniki PLC to w większości sterowniki firmy GE Fanuc. Na sprzętkomputerowy składają się komputer przemysłowy firmy Advantech i dwa stacjonarne komputerytypu PC.
Rys. 1. Kolumna destylacyjna.
91
Rys. 2. Widok obwodu chłodzenia w SCADA.
Rys. 3. Widok obwodu wyparki w SCADA.
92
Bibliografia
[1] E. Anderson, Z. Bai, C. Bischof. LAPACK Users’ Guide. Society for Industrial and AppliedMathematics, wydanie III, 1999.
[2] K. J. Astrom, B. Wittenmarka. On self-tuning regulators. Automatica, 9:185-199, 1973.
[3] K. J. Astrom, B. Wittenmarka. Adaptive control. Addison-Wesley Publishing Company, 1989.
[4] K. J. Astrom, B. Wittenmarka. Computer-controlled systems : theory and design. Prentice Hall,1997.
[5] S.P. Bhattacharyya, H. Chapellat, L.H. Keel. Robust control. The parametric approach. PrenticeHall, Upper Saddle River 1995.
[6] A. Bjorck, L. Dahlquist. Metody numeryczne. PWN, Warszawa 1987.
[7] G. E. P. Box, G. M. Jenkins. Analiza szeregów czasowych: prognozowanie i sterowanie. PWN,Warszawa 1983.
[8] I. N. Bronsztejn, K. A. Siemiendiajew. Nowoczesne kompendium matematyki. PWN, Warszawa2004.
[9] C.G. Broyden. The convergence of a class of double-rank minimization algorithms. J. Inst. Maths.Applics, 6:76-90, 1970.
[10] N.P. Buslenko, W.W. Kałasznikow, I.N. Kowalenko. Teoria systemów złożonych. PWN, Warszawa1979.
[11] J. Byrski. Przegląd technologii CORBA ze szczególnym uwzględnieniem zagadnień czasu rzeczy-wistego. Automatyka, 7(3):423-432, 2003.
[12] W. Byrski. Theory and application of the optimal integral state observer. ECC, strona 526-531,1995.
[13] W. Byrski. Dokładna rekonstrukcja stanu - teoria i przykłady zastosowania. Automatyka, 7(3),AGH, Kraków 2003.
[14] W. Byrski. Obserwatory i ich zastosowanie w systemach sterowania adaptacyjnego. Automatyka,65, AGH, Monografie, Kraków 1993.
[15] W. Byrski. Obserwacja i sterowanie w systemach dynamicznych. Wydawnictwo PAN-AGH,Kraków 2007.
[16] W. Byrski, S. Fuksa. Linear quadratic controller for continuous systems with compact support fil-ter for optimal identification and state observation. Second International Symposium on Methodsand Models in Automation and Robotic MMAR, 1995.
93
[17] W. Byrski, S. Fuksa. Optimal identification of continuous systems in l2 space by the use ofcompact support filter. Interational Journal of Modelling and Simulation, 15(4), 1995.
[18] W. Byrski, S. Fuksa. Time variable Gram matrix eigen-problem and its application to optimalidentification of continuous systems. ECC, Karlsruhe 1999.
[19] W. Byrski, S. Fuksa, M. Nowak. The quality of identification for different normalizations of conti-nuous transfer functions. Proceedings of the 22nd IASTED International Conference on Modelling,Identification, and Control, Innsbruck 2003.
[20] W. Byrski, S. Fuksa, M. Nowak. Optymalny filtr splotowy dla jednoczesnej identyfikacji parame-trów i obserwacji stanu. Zastosowanie w regulatorze adaptacyjnym. Seminarium nt.: Przetwarza-nie i analiza sygnałów w systemach wizji i sterowania. Wyd. ACGM Łódź, Słok 2002.
[21] W. Byrski, S. Fuksa, M. Nowak. Optymalizacja funkcji modulującej dla zastosowań w regulatorzeadaptacyjnym. XXXIV OKZM. Komitet Matematyki PAN, Zakopane 2005.
[22] W. Byrski, M. Nowak. Optymalny filtr splotowy dla jednoczesnej identyfikacji parametrów i ob-serwacji stanu. Zastosowanie w regulatorze adaptacyjnym. XV Krajowa Konferencja Automatyki.Instytut Badań Systemowych Polskiej Akademii Nauk, Warszawa 2005.
[23] W. Byrski, M. Nowak. Optymalizacja funkcji modulującej dla zastosowań w regulatorze ad-aptacyjnym. XXXIII Ogólnopolska Konferencja Zastosowań Matematyki. Komitet MatematykiPolskiej Akademii Nauk, Zakopane 2004.
[24] J. Celko. SQL zaawansowane techniki programowania. Wydawnictwo MIKOM, Warszawa 1999.
[25] P. Craven, G. Wahba. Smoothing noisy data with spline functions: Estimation the correct degreeof smoothing by the method of generalized cross-validation. Math, 31:377-403, 1979.
[26] S. Daniel-Berhe, H. Unbehauen. Physical parameters estiamtion of the nonlinear continous-timedynamics of a DC motor using Hartley modulating functions method. Journal of The FranklinInstitute, 336:481-501, 1999.
[27] J. M. Douglas. Dynamika i sterowanie procesów. WNT, Warszawa 1976.
[28] G. Dragffy. The VLSI route for highly reliable ESDs. ISA Transactrions, 38(1):101-119, 1999.
[29] J. T. Duda. Modelowanie i symulacja procesów w systemach komputerowych sterowania nad-rzędnego. Automatyka, 4, 2000.
[30] J. T. Duda. Modele matematyczne, struktury i algorytmy nadrzędnego sterowania komputerowego.Uczelniane Wydawnictwa Naukowo-Dydaktyczne, Kraków 2003.
[31] W. Findeisen. Wielopoziomowe układy sterowania. Biblioteka Naukowa Inżyniera. PWN, War-szawa 1974.
[32] W. Findeisen. Analiza systemowa. Podstawy i metodologia. PWN, Warszawa 1985.
[33] W. Findeisen. Struktury sterowania dla złożonych systemów. Oficyna Wydawnicza PolitechnikiWarszawskiej, Warszawa 1997.
[34] R. Fletcher. A new approach to variable metric algorithms. Computer Journal, 13:317-322, 1970.
[35] Z. Fortuna, B. Macukow, J. Wąsowski. Metody numeryczne. WNT, wydanie V, Warszawa 2001.
94
[36] P. Gaś, M. Nowak, J. Kusiak. Narzędzia wspierające praktyczne zajęcia laboratoryjne we współ-czesnej uczelni technicznej, na przykładzie Akademii Górniczo-Hutniczej. Studium przypadku.Wirtualne Campusy - nowy wymiar edukacji. PTI i KRUN, Warszawa 2005.
[37] M. Gabassi, B. Dupouy. Przetwarzanie rozproszone w systemie Unix. Wydawnictwo LUPUS,Warszawa 1996.
[38] M. Galassi, J. Davies, J. Theiler, B. Gough, G. Jungman, M. Booth, F. Rossi. GNU ScientificLibrary Reference Manual. Free Software Foundation, wydanie 1.7, 2005.
[39] A. Gawdzik, B. Tabiś, W. Figiel. Zasady sterowania procesami technologicznymi i inżynieriichemicznej. Wydawnictwo Politechniki Krakowskiej, Kraków 1991.
[40] D. Goldfarb. A family of variable metric updates derived by variational means. Mathematics ofComputing, 24:23-26, 1970.
[41] T. Goto, J. Miyakura, K. Umeda. A robust spline filter on the basis of L2-norm. PrecisionEngineering, 29(2):157-161, 2005.
[42] P. Grabowski. Abstract model of a heat exchanger and its application. 11th IEEE InternationalConference on Methods and Models in Automation and Robotics, 2005.
[43] A. Górecka-Drzazga. Mikrotas-y (zastosowanie mikrosystemów w medycynie). Ra-port instytutowy, Politechnika Wrocławska, Wydział Elektroniki Mikrosystemów i Fotoniki,http://www.wemif.pwr.wroc.pl/agd/mikroTAS-y.pdf, 2004.
[44] H. Górecki.Wstęp do teorii układów sterowania z uwzględnieniem przypadkowych zakłóceń. Poldexs.c., Kraków 1997.
[45] H. Górecki, S. Fuksa, A. Korytowski, W. Mitkowski. Sterowanie optymalne z kwadratowym wskaź-nikiem jakości. Biblioteka Naukowa Inżyniera. PWN, Warszawa 1983.
[46] W. Grega. Metody i algorytmy sterowania cyfrowego w układach scentralizowanych i rozproszo-nych. Uczelniane Wydawnictwa Naukowo-Dydaktyczne, Kraków 2004.
[47] M.W. Głuszkow. Synteza automatów cyfrowych. WNT, Warszawa 1968.
[48] S. Hasebe. Design and operation of micro-chemical plants–bridging the gap between nano, microand macro technologies. Computers and Chemical Engineering, 29:57-64, 2004.
[49] S. Ibrir, S. Diop. Numerical procedure for filtering and efficient high-order signal differentiation.International Journal of Applied Mathematics And Computer Science, 14(2):201-208, 2004.
[50] R. Isermann, K. Lachmann, D. Matko. Adaptive control. Prentice Hall, N.Y. 1992.
[51] J. Jakubiec. Redukcyjna arytmetyka interwałowa w zastosowaniu do wyznaczania niepewności al-gorytmów przetwarzania danych pomiarowych. Wydawnictwo Politechniki Śląskiej, Gliwice 2002.
[52] K. Janik, M. Nowak. Relacyjna baza danych jako narzędzie przetwarzania danych w systemieczasu rzeczywistego. Systemy Czasu Rzeczywistego (SCR’01), strona 361-369, 2001.
[53] T. Kaczorek. Teoria sterowania i systemów. PWN, Warszawa 1999.
[54] V. Kale. SAP R/3 Przewodnik dla menadżerów. Helion, Gliwice 2001.
[55] R. E. Kalman. A new approach to linear filtering and prediction problems. Transaction of hteASME. Journal of basic engineering, 82(D):35-45, 1960.
95
[56] J. Kasprzyk. Identyfikacja procesów. Wydawnictwo Politechniki Śląskiej, Gliwice 2002.
[57] E. Kącki. Równania różniczkowe cząstkowe. WNT, Warszawa 1989.
[58] P. Kiciak. Podstawy modelowania krzywych i powierzchni. WNT, wydanie II, Warszawa 2000,2005.
[59] A. Kiełbasiński, H. Schwetlick. Numeryczna algebra liniowa: wprowadzenie do obliczeń zautoma-tyzowanych. WNT, Warszawa 1992.
[60] M. Klemiato. Przegląd statystycznych metod detekcji małych zmian w przebiegach procesowych.Pomiary Automatyka Robotyka, 1, 2006.
[61] M. Klemiato. Algorytmiczne nadzorowanie układów regulacji nadrzędnej. Praca doktorska, Aka-demia Górniczo-Hutnicza, Kraków 2001.
[62] L. Kołodziejczyk, M. Rubik. Technika chłodnicza w klimatyzacji. Arkady, Warszawa 1976.
[63] J. Korbicz, J.M. Kościelny, Z. Kowalczuk, W. Cholewa. Diagnostyka procesów przemysłowych:modele, metody sztucznej inteligencji, zastosowania. WNT, Warszawa 2002.
[64] A. Korytowski. Analityczne rozwiązanie liniowo-kwadratowego problemu sterowania optymalnegoz opóźnieniem, wolumen 24. Monografie AGH, Kraków 1995.
[65] A. Korytowski, M. Ziółko. Metody optymalizacji z ćwiczeniami laboratoryjnymi, wolumen 1300.Wydawnictwo AGH, Kraków 1992.
[66] R. Kulikowski. Sterowanie w wielkich systemach. WNT, Warszawa 1974.
[67] P. De Larminat, Y. Thomas. Automatyka układy liniowe. Sygnały i układy. Sterowanie. Identy-fikacja. WNT, Warszawa 1983.
[68] G. Lausen, G. Vossen. Obiektowe bazy danych. Modele danych i języki. WNT, Warszawa 2000.
[69] B. Liptak. Process control and optimization, wolumen 2 serii Instrument Engineers’ Handbook.CRC Press, wydanie IV, 2005.
[70] T. Łuba, M.A. Markowski, B. Zbierzchowski. Komputerowe projektowanie układów cyfrowychw strukturach PLD. Wydawnictwo Komunikacji i Łączności, Warszawa 1993.
[71] D. G. Luenberger. An introduction to observers. IEEE Transaction on Automatic Control,16:596-602, 1971.
[72] W. L. Luyben. Modele, symulacje i sterowanie procesów przemysłu chemicznego. InżynieriaChemiczna. WNT, Warszawa 1976.
[73] K. Mańczak. Metoda identyfikacji wielowymiarowych obiektów sterowania. WNT, Warszawa 1971.
[74] K. Mańczak, Z. Nahorski. Komputerowa identyfikacja obiektów dynamicznych. PWN, Warszawa1983.
[75] S. Maguire. Niezawodność oprogramowania. Techniki tworzenia bezbłędnych programów języku C— rodem z Microsoftu. HELION, Gliwice 2002.
[76] Young-Joon Choi Mal-Rey Lee, Tae-Eyn Kim. An expert-system approach to monitoring thegeneral operating procedures of PWR plant. Engng. Applic. Artif. Intell, 9(3):321-329, 1996.
96
[77] V. Maletynsky. Identification of continous dynamical systems with spline-type modulating func-tions method. IFAC Congr. on Parameter Identification and Parameter Estimation, wolumen 1,strona 275-281, Darmstad 1979.
[78] Mathworks. MATLAB Model Predictive Control Toolbox User’s Guide.
[79] Mathworks. MATLAB Optimization Toolbox User’s Guide.
[80] Mathworks. MATLAB Robust Control Toolbox User’s Guide.
[81] Mathworks. MATLAB Signal Processing Toolbox User’s Guide.
[82] Mathworks. MATLAB Spline Toolbox User’s Guide.
[83] Mathworks. MATLAB The Control System Toolbox User’s Guide.
[84] Mathworks. Stateflow User’s Guide.
[85] G. De Micheli. Synteza i optymalizacja układów cyfrowych. WNT, Warszawa 1998.
[86] W. Mitkowski. Stabilizacja systemów dynamicznych. WNT, Warszawa 1991.
[87] Z. Mrozek. Wybrane, skończenie wymiarowe metody aproksymacji obiektów o parametrach rozło-żonych. Praca doktorska, Akademia Górniczo-Hutnicza, Kraków 1982.
[88] National Instruments Corporation. LabVIEW FPGA Module User Manual, 2004.
[89] A. Niederliński. Systemy komputerowe automatyki przemysłowej. T. 2, Zastosowania. WNT,Warszawa 1985.
[90] A. Niederliński, J. Kasprzyk, J. Figwer. Multi-edip. Analizator wielowymiarowych sygnałówi obiektów. Wydawnictwo Politechniki Śląskiej, Gliwice 1997. Skrypt 2017.
[91] A. Niederliński, J. Mościński, Z. Ogonowski. Regulacja adaptacyjna. PWN, Warszawa 1995.
[92] M. Nowak, A. Adamek, W. Byrski. Zastosowanie funkcji sklejanych w zadaniu optymalnej iden-tyfikacji ciągłego systemu liniowego. XXXIII Ogólnopolska Konferencja Zastosowań Matematyki,Zakopane 2004.
[93] M. Nowak, R. Dudek. Język SCADAML opisu budowy systemów kontroli, nadzoru i akwizycjidanych. Systemy Czasu Rzeczywistego (SCR’05), 2005.
[94] M. Nowak, M. Klemiato, W. Byrski. Remote laboratory Uniboss for distributed real-time andembedded control system. 16th EAEEIE conference, Lappeenranta 2005.
[95] M. Nowak, B. Schmidt. Implementacja rozproszonych aplikacji sterowania i nadzoru w architek-turze CORBA. Systemy Czasu Rzeczywistego (SCR’05), 2005.
[96] A. Patra, H. Unbehauen. Identification of a class of nonlinear continuous-time systems usingHartley modulating functions. Int. J. Control, 62(2):1431-1451, 1995.
[97] A. Peszko. Elementy organizacji i zarządzania przedsiębiorstwem. Wydawnictwa AGH, Kraków1996.
[98] K. Peter, R. Isermann. Parameter-adaptive PID control based on continuous time process models.wolumen 2, strona 495-500, 1989.
97
[99] A. Piłat. Programmable analog hardware for control systems exampled by magnetic suspension.Regular sessions: Computer Methods and Systems, wolumen 2, strona 143-148, Kraków 2005.
[100] J.W. Pietrowski, W.G. Fastowski. Współczesne wysokosprawne wymienniki ciepła. WNT, War-szawa 1964.
[101] P. Piątek. Sterowanie magnetycznym zawieszeniem z wykorzystaniem szybkich sterowników opar-tych na technologii FPGA. XV Konferencja Automatyki, II:111-116, 2005.
[102] H. A. Preisig, D. W. T. Rippin. Theory and application of the modulating function method – I.review and theory of the method and theory of the spline-type modulating functions. ComputersChem. Engng., 17(1):1-16, 1993.
[103] H. A. Preisig, D. W. T. Rippin. Theory and application of the modulating function method –II. algebraic representation of Maletinsky’s spline-type modulating functions. Computers Chem.Engng., 17(1):17-28, 1993.
[104] H. A. Preisig, D. W. T. Rippin. Theory and application of the modulating function method– III. application to iddustrial process, a well-stirred tank reactor. Computers Chem. Engng.,17(1):29-39, 1993.
[105] W. H. Press, S. A. Teukolsky, W. T. Vetterling, B. P. Flannery. Numerical recipes in C. NumericalRecipes Software, wydanie II.
[106] Zhihua Qu. Robust control of nonlinear uncertain systems. A Wiley-Iterscience Publication, 1998.
[107] Ł. Rauch, M. Nowak, M. Paćko, S. Węglarczyk, J. Kusiak. Wirtualne laboratorium dydaktyczneprocesów obróbki skrawaniem. Polska metalurgia w latach 2002-2006, Krynica 2006.
[108] P. Reinermann. The maturation of a technology: Predictive emissions monitoring. ChemicalEngineering, July:50-55, 2006.
[109] D. E. Seborg, T. F. Edgar, D. A. Mellichamp. Process dynamics and control. John Wiley & Sons,1989.
[110] J. Seidler, A. Badach, W. Molisz. Metody rozwiązywania zadań optymalizacji. Podręczniki Aka-demickie. Elektronika-Informatyka-Telekomunikacja. WNT, Warszawa 1980.
[111] D. F. Shanno. Conditioning of quasi-Newton methods for function minimization. Mathematicsof Computing, 24:647-656, 1970.
[112] J. A. Shaw. How critical is your control system? ISA Transactions 34, strona 185-192, 1995.
[113] M. Shinbrot. On the analysis of linear and nonlinear dynamic systems from transient-responsedata. National Advisory Committee for Aeronautics NACA, Washington 1954.
[114] F.G. Shinskey. Process-control systems. Application Design Adjustment. McGraw-Hill BookCompany, 1967.
[115] M. G. Singh, P. Varaiya, M. Aizerman. Identification of continuous systems. Elsevier SciencePublishers B.V., Amsterdam 1987.
[116] S. Skoczowski. Deterministyczna identyfikacja i jej wykorzystanie w odpornej regulacji PID tem-peratury. Wydawnictwo Uczelniane Politechniki Szczecińskiej, Szczecin.
[117] T. Soderstrom, P. Stoica. Identyfikacja systemów. PWN, Warszawa 1997.
98
[118] B. S. Sotskow. Niezawodność elementów i urządzeń automatyki. WNT, Warszawa 1973.
[119] G.G. Stephens, M.R. Mackley. Heat transfer performance for batch oscillatory flow mixing.Experiment Thermal and Fluid Science, 25:583-594, 2002.
[120] W. R. Stevens. Programowanie zastosowań sieciowych w systemie Unix. WNT, Warszawa 1998.
[121] T. Szmuc. Zaawansowane metody tworzenia oprogramowania systemów czasu rzeczywistego. CCA-TIE, Kraków 1998.
[122] R. Tadeusiewicz. Sieci neuronowe. WNT, Warszawa 1997.
[123] P. Tatjewski. Sterowanie zaawansowane obiektów przemysłowych. Struktury i algorytmy. Akade-micka Oficyna Wydawnicza Exit, Warszawa 2002.
[124] M. Tay, M. Macharia. Reducing energy costs with model predictive control solutions. EthanolProducer Magazine, July, 2006.
[125] W. Traczyk. Układy cyfrowe. Podstawy teoretyczne i metody syntezy. WNT, Warszawa 1982.
[126] J. Trzcieniecki. Projektowanie systemów zarządzania. PWN, Warszawa 1980.
[127] K. Warwick, W. Irwin, K.J. Hunt. Neural networks for control and systems. Peter Peregrinus,London 1992.
[128] A. Weiss, T. Gruźlewski. Programowanie współbieżne i rozproszone w przykładach i zadaniach.WNT, Warszawa 1993.
[129] H. Wysocki. Zastosowanie nieklasycznego rachunku operatorów do identyfikacji liniowych układówdynamicznych. AOW Exit, Warszawa 2006.
[130] W. Żakowski, W. Leksiński. Matematyka IV. Podręczniki Akademickie. Elektronika-Informatyka-Telekomunikacja. WNT, Warszawa 1995.
[131] T. P. Zieliński. Od teorii do cyfrowego przetwarzania sygnałów. Wykonano nakładem WEAIiEAkademii Górniczo-Hutniczej, Kraków 2002.
99