Metody identyﬁkacji układów ciągłych z wykorzystaniem...

PRACA DOKTORSKA

Metody identyfikacji układów ciągłychz wykorzystaniem funkcji modulujących

i sklejanych i ich zastosowaniew regulatorze adaptacyjnym

mgr inż. Marcin W. Nowak

Akademia Górniczo-Hutnicza

im. Stanisława Staszica

w Krakowie

Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Katedra Automatyki

Promotor: dr hab. inż. Witold Byrski, profesor nadzw. AGH

Kraków, lipiec 2007

Pragnę podziękować Promotorowi za

poświęcony czas, okazaną wyrozumia-

łość i cenne uwagi.

Spis treści

1. Wstęp 1

2. Wprowadzenie 4

2.1. Współczesne systemy automatyki przemysłowej . . . . . . . . . . . . . . . . . . 4

2.1.1. Warstwa zarządzania produkcją . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.2. Warstwa optymalizacji statycznej . . . . . . . . . . . . . . . . . . . . . . 10

2.1.3. Warstwa nadzoru i koordynacji . . . . . . . . . . . . . . . . . . . . . . . 10

2.1.4. Warstwa sterowania adaptacyjnego . . . . . . . . . . . . . . . . . . . . . 11

2.1.5. Warstwa sterowania bezpośredniego i zabezpieczeń . . . . . . . . . . . . 11

2.1.6. Implementacja komputerowych systemów sterowania . . . . . . . . . . . 13

2.2. Modele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3. Automat skończenie stanowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.4. Regulacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.4.1. Algorytmy regulacji klasycznej (nieadaptacyjne) . . . . . . . . . . . . . . 19

2.4.2. Regulacja adaptacyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.5. Diagnostyka procesów przemysłowych . . . . . . . . . . . . . . . . . . . . . . . . 24

2.6. Obserwatory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.7. Identyfikacja dynamiczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.8. Nowe badania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3. Splotowa metoda identyfikacji systemów ciągłych 32

3.1. Identyfikacja z użyciem funkcji modulującej . . . . . . . . . . . . . . . . . . . . 32

3.2. Omówienie zasad identyfikacji dla obiektów SISO . . . . . . . . . . . . . . . . . 33

3.3. Splotowa estymacja pochodnych sygnału . . . . . . . . . . . . . . . . . . . . . . 34

3.4. Dobór kształtu funkcji modulującej . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.5. Optymalna identyfikacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.5.1. Ograniczenie liniowe na wartość parametrów . . . . . . . . . . . . . . . . 38

3.5.2. Ograniczenie kwadratowe na wartości parametrów . . . . . . . . . . . . . 39

3.5.3. Wyliczenie wektorów własnych . . . . . . . . . . . . . . . . . . . . . . . 39

ii

3.6. Rozszerzane i ruchome okno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4. Optymalizacja kształtu funkcji modulujących 42

4.1. Przegląd funkcji modulujących . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.2. Bazowe funkcje sklejane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.2.1. Krzywe B-sklejane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2.2. Wybrane właściwości wielomianów bazowych . . . . . . . . . . . . . . . . 48

4.3. Optymalizacja kształtu funkcji φ(t) . . . . . . . . . . . . . . . . . . . . . . . . . 49

5. Funkcje sklejane w identyfikacji parametrów systemu dynamicznego 50

5.1. Metoda najmniejszych kwadratów . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.2. Uogólniona metoda najmniejszych kwadratów . . . . . . . . . . . . . . . . . . . 53

5.3. Identyfikacja z wykorzystaniem funkcji sklejanych . . . . . . . . . . . . . . . . . 56

6. Regulator adaptacyjny 57

6.1. Obserwator bazujący na macierzy Toeplitza . . . . . . . . . . . . . . . . . . . . 57

6.2. Algorytm obserwacji stanu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

6.3. Adaptacyjny regulator liniowo-kwadratowy . . . . . . . . . . . . . . . . . . . . . 59

7. Rezultaty implementacji algorytmów identyfikacji i sterowania 61

7.1. Filtracja sygnału pomiarowego . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

7.1.1. Metody numeryczne filtracji splotowej . . . . . . . . . . . . . . . . . . . 61

7.1.2. Splotowa filtracja nieadaptacyjna . . . . . . . . . . . . . . . . . . . . . . 63

7.1.3. Splotowa filtracja adaptacyjna . . . . . . . . . . . . . . . . . . . . . . . . 64

7.1.4. Aproksymacja w całym horyzoncie czasowym . . . . . . . . . . . . . . . 66

7.1.5. Aproksymacja w ruchomym oknie . . . . . . . . . . . . . . . . . . . . . . 66

7.2. Identyfikacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

7.3. Obserwacja stanu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

7.4. Regulacja LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

7.5. Identyfikacja w zamkniętej pętli . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

7.6. Fizyczny model wymiennika ciepła . . . . . . . . . . . . . . . . . . . . . . . . . 74

7.7. Opracowanie wyników eksperymentów . . . . . . . . . . . . . . . . . . . . . . . 75

7.7.1. Neuralny model statyczny wymiennika . . . . . . . . . . . . . . . . . . . 76

7.7.2. Dobór parametrów modelu wymiennika . . . . . . . . . . . . . . . . . . . 77

8. Wnioski 88

Dodatek – stanowisko laboratoryjne 90

Bibliografia 91

iii

Streszczenie

W pracy przedstawiono zastosowanie bazowych funkcji sklejanych w zagadnieniu identyfika-

cji parametrów i estymacji stanu systemu ciągłego. Funkcje te użyto w zadaniu aproksymacji

niemierzonych pochodnych sygnału pomiarowego dla wejść/wyjść systemu.

Przedstawiono również ich zastosowanie do konstrukcji funkcji modulujących w splotowej

metodzie estymacji parametrów systemu ciągłego. Optymalne parametry systemu są wyliczane

wtedy jako wektor własny skojarzony z najmniejszą wartością własną odpowiedniej macierzy

Grama. Metoda ta dodatkowo rekonstruuje niemierzony stan systemu, który może zostać wyko-

rzystany w stabilizującym regulatorze adaptacyjnym LQR.

Abstract

The PhD thesis presents the application of the basis spline function in the parameter iden-

tification method and state reconstruction of linear continuous system for adaptive self-tuning

control. For the approximation of the unmeasured derivative of the measured input/output sys-

tem’s signal, B-spline functions were used.

Additionally, basis spline function was applied to construction of the modulating function by

convolution method used for parameters estimation of the continuous-time system. The optimal

parameters of the system are calculated as eigenvector associated with the minimal eigenvalue

of the Gram matrix. This method simultaneously reconstructs unmeasured state of the system

witch will be used for adaptive stabilizing controller.

Rozdział 1

Wstęp

Pomimo znaczącego postępu w dziedzinie projektowania adaptacyjnych algorytmów regulacji

on-line, obecnie w przemyśle dominują klasyczne regulatory PID przestrajane okresowo. Panuje

powszechna opinia o niezawodności tych regulatorów i znanych jest wiele metod ich przestrajania.

Jednak ze względu na stabilność układu zamkniętego, dla wielowymiarowych systemów MIMO

wysokiego rzędu, metodologia regulatora LQR jest bardziej nowoczesna, wydajniejsza i pewniej-

sza. Standaryzacja tych algorytmów wymaga opracowania dodatkowych metod identyfikacji dla

układów ciągłych, które mogą współpracować z LQR on-line. Fakt ten stwarza potrzebę budowy

odpowiednich algorytmów identyfikacji parametrycznej oraz właściwych algorytmów obserwacji

stanu. W tym celu układ automatyki procesów ciągłych wymaga dostępu do sygnałów stanu

lub sygnałów wyjścia oraz do ich pochodnych. Przede wszystkim wierne odtwarzanie kolejnych

pochodnych sygnału pomiarowego (zakłóconego) jest podstawowym zadaniem badawczym dla

metodologii filtracji. Ta tematyka jest przedmiotem niniejszej pracy doktorskiej.

W wielu dziedzinach wiedzy (technicznych i przyrodniczych) pojawia się konieczność iden-

tyfikowania parametrów systemów dynamicznych, co umożliwia opis i zrozumienie zachowania

rzeczywistych zjawisk. Zdecydowana większość zjawisk fizycznych ma charakter ciągły. Dlate-

go, w porównaniu z modelami dyskretnymi, większy sens fizyczny mają zidentyfikowane modele

ciągłe. Parametry modeli ciągłych i dyskretnych są wykorzystywane między innymi w procesie

syntezy regulatorów, obserwatorów stanu i w systemach detekcji uszkodzeń.

Powszechnie stosuje się identyfikację pośrednią parametrów modelu ciągłego, która polega

na zamianie modelu ciągłego na dyskretny, następnie identyfikacji parametrów modelu dyskret-

nego znanymi metodami i powrocie do modelu ciągłego. Podejście takie nie zawsze przynosi

zadawalające efekty, a bywa, że jest zawodne.

Celem pracy jest dostarczenie nowych oraz udoskonalenie istniejących już bezpośrednich me-

tod identyfikacji parametrów ciągłego liniowego modelu. Metody te będą stosowane do budowy

regulatora stabilizującego z adaptacją pośrednią. Rozprawa składa się z ośmiu rozdziałów.

W rozdziale drugim przedstawiono strukturę wielopoziomowych i wielowarstwowych syste-

1

mów sterowania oraz nadzoru. Zaprezentowano ogólną koncepcję takiego systemu, opisano jego

poszczególne składowe oraz relacje zachodzące między nimi. Opisano przebieg zdecentralizowa-

nego procesu decyzyjnego. W skład takiego systemu będą wchodzić układy: regulacji bezpo-

średniej, identyfikacji modeli dynamicznych i statycznych, optymalizacji tych modeli, obserwacji

stanu oraz detekcji stanów ustalonych. Zamieszczono również przegląd metod identyfikacji ukła-

dów ciągłych i dyskretnych, które mogą być stosowane w zagadnieniu sterowania adaptacyjnego.

Następnie uzasadniona została potrzeba zastosowania metody bezpośredniej identyfikacji para-

metrów modelu ciągłego w zadaniu regulacji adaptacyjnej.

Rozdział trzeci dotyczy opisu metody splotowej identyfikacji ciągłych systemów liniowych

wysokiego rzędu SISO. Metoda ta została przedstawiona z użyciem funkcji modulujących okre-

ślonych na zbiorach zwartych. Dodatkowo pokazano jej ulepszenia zaproponowane przez autora.

Wśród różnych funkcji modulujących wykorzystywane były funkcje wykładnicze zapropo-

nowane przez Loeba i Cahena (1965) lub funkcje sklejane zaproponowane przez Maletyńskiego

(1979). Funkcje Loeba i Cahena charakteryzują się tylko dwoma stopniami swobody (parame-

trami), co w znacznym stopniu ogranicza możliwość doboru ich kształtu. Z tego powodu autor

pracy, w rozdziale czwartym, zaproponował złożenie kilku takich funkcji z parametrami skalują-

cymi w zależności od wzajemnego przesunięcia w czasie. Parametry skalujące można wykorzystać

w procesie optymalizacji kształtu funkcji modulującej. W rozdziale zawarto również przegląd

funkcji modulujących, znajdujących zastosowanie w zagadnieniu identyfikacji układów ciągłych.

Dodatkowo została zaproponowana metoda doboru parametrów funkcji filtrującej dla regulacji

i obserwacji stanu.

W omawianym rozdziale skoncentrowano się wokół zagadnienia użycia bazowych funkcji skle-

janych (ang. basis spline, b-spline) jako funkcji modulujących o nośniku zwartym. Stanowi to

rozwinięcie pomysłu zastosowania wielu funkcji Loeba i Cahena oraz funkcji sklejanych. Funkcje

te będące uogólnionymi krzywymi Beziera, mogą zostać wykorzystane do optymalizacji funk-

cji filtrujących o nośniku zwartym. Są one tak konstruowane, by spełnić wymagania stawiane

funkcjom modulującym o nośniku zwartym. Przedstawiono bazowe funkcje sklejane stosowa-

ne dotychczas w zagadnieniu modelowania krzywych i powierzchni. Wykorzystuje się je także

w aproksymacji modeli statycznych i zlinearyzowanych niestacjonarnych modeli dynamicznych.

Rozdział piąty prezentuje oryginalne zastosowanie bazowych funkcji sklejanych do bezpośred-

niej aproksymacji kolejnych pochodnych sygnałów wejścia i wyjścia. Podobnie jak w metodzie

splotowej, informację o pochodnych sygnału można wykorzystać w algorytmach identyfikacji,

obserwacji oraz regulacji. Dodatkową zaletą metody z funkcjami sklejanymi jest możliwość wy-

prowadzenia gotowych wzorów analitycznych dla identyfikowanego obiektu na podstawie otrzy-

manych współczynników funkcji sklejanych.

W rozdziale szóstym przedstawiono propozycję adaptacyjnego regulatora wykorzystującego

metody identyfikacji i obserwacji. Ciągłe regulatory LQR, wykorzystujące adaptację pośred-

2

nią gwarantują wysoką jakość stabilizacji układów o nieznanych lub zmiennych parametrach.

Wymagają one jednak dostępu do zmiennych stanu, które mogą być niemierzalne. W takich

przypadkach konieczne jest zastosowanie algorytmów obserwacji stanu systemu ciągłego z wy-

korzystaniem: klasycznych obserwatorów asymptotycznych (filtr Kalmana i obserwator Luen-

bergera), całkowych obserwatorów określonych na skończonym oknie obserwacji lub specjalnych

obserwatorów, omawianych w niniejszej pracy.

Podsumowanie osiągniętych wyników w zastosowaniu do obiektów rzeczywistych i symu-

lowanych numerycznie opracowano i zebrano w rozdziale siódmym. W celu przeprowadzenia

eksperymentów wybrano dwa rodzaje obiektów. Pierwszym z nich jest rzeczywisty obiekt wy-

miennika ciepła1, natomiast drugim odpowiadający mu symulowany model wymiennika ciepła

o parametrach rozproszonych.

Pracę kończy rozdział ósmy, w którym przedstawiono wnioski z przeprowadzonych badań

i wskazano zagadnienia, stanowiące przedmiot przyszłych prac autora. Zasadnicze wyniki badań

zostały ujęte w rozdziałach czwartym, piątym, szóstym i siódmym.

W pracy postawiono trzy zasadnicze tezy naukowe:

� Minimalno-kwadratowa wersja bezpośredniej metody identyfikacji układów liniowych, cią-

głych wykorzystująca splotowy filtr z nośnikiem zwartym dla arbitralnie przyjętej funkcji

modulującej gwarantuje optymalną jakość identyfikacji parametrów.

� Funkcje sklejane mogą być wykorzystane do dwóch różnych zadań:

– budowy optymalnych modulujących funkcji filtrujących o nośniku zwartym,

– bezpośredniej aproksymacji pochodnych sygnałów wejścia i wyjścia dla bezsplotowej

metody optymalnej identyfikacji.

� Ciągłe adaptacyjne regulatory LQR wykorzystujące jednoczesną obserwację stanu i identy-

fikację parametrów obiektu (w oparciu o funkcje modulujące i sklejane) gwarantują wysoką

jakość stabilizacji układów o nieznanych lub zmiennych parametrach.

1Laboratorium Sterowania Procesami, Katedry Automatyki, Akademii Górniczo-Hutniczej.

3

Rozdział 2

Wprowadzenie

W rozdziale zostaną przedstawione współczesne wielowarstwowe i wielopoziomowe systemy ste-

rowania. Zostaną umiejscowione w nich metody identyfikacji systemów ciągłych będące tematem

niniejszej pracy. Dodatkowo zostały przedstawione metody identyfikacji parametrów modeli cią-

głych, obserwacji stanu i regulacji adaptacyjnej.

2.1. Współczesne systemy automatyki przemysłowej

Opisowa definicja systemu charakteryzuje go jako wyodrębniony z otoczenia obiekt, którego gra-

nice zależą od zasięgu oddziaływania podmiotu decyzyjnego. Otoczenie może mieć wpływ na

system, natomiast system nie ma wpływu na otoczenie. Gdyby taki wpływ istniał, należało-

by zwiększyć granice systemu. Niemierzalne oddziaływanie otoczenia na system nazywane jest

zakłóceniem [33].

Współczesne systemy automatyki przemysłowej są częścią rozbudowanych wielopoziomowych

hierarchicznych systemów decyzyjnych przedsiębiorstwa przedstawionych na rys. 2.1. W hierar-

chii służbowej rozróżnia się struktury liniowe, sztabowo-liniowe i macierzowe. Jednostka decyzyj-

na będąca na szczycie obejmuje swym zasięgiem cały system. Natomiast jednostki niższych po-

ziomów obejmują zasięgiem kompetencji coraz to mniejsze fragmenty systemu (posiadają mniej-

szy zasięg przestrzenny). W strukturach takich mamy do czynienia z wieloetapowym procesem

decyzyjnym. Dzięki temu na poszczególnych etapach procesu decyzyjnego można uwzględnić

niepewności wynikające z obserwacji (pomiaru) i modelu. W przemyśle decyzje jednoetapowe

podejmowane są w trakcie projektowania instalacji przemysłowej, doborze praw sterujących itp.

Decyzje wieloetapowe to np. cykliczne wyliczenie wartości sterującej.

Decyzje podstawowe dotyczące umiejscowienia i wpływu budowy zakładów przemysłowych

na lokalny region oraz środowisko naturalne muszą wykorzystywać narzędzia analizy systemowej

[32]. Zanim zostaną podjęte decyzje o budowie, typie i wielkości instalacji przemysłowej, dokony-

wany jest szereg analiz jej potencjalnego wpływu na zmianę warunków społeczno-ekonomicznych

4

oraz środowisko naturalne. Bywa, że z uwagi na długi horyzont czasowy przeprowadzanej ana-

lizy, dodatkowo korzysta się z wiedzy ekspertów. Metodologia analizy systemowej składa się

z następujących zagadnień: formułowanie problemu, analiza kosztów, wykorzystanie wiedzy eks-

pertów, budowa modeli, planowanie dodatkowych eksperymentów, estymacji i weryfikacji. Na-

stępnie sprawdza się modele poprzez symulację, optymalizację, prognozowanie, ocenę ryzyka.

W ostatnim etapie przeprowadzana jest ocena dostarczonych wariantów oraz podejmowane są

decyzje.

Przedsiębiorstwo osadzone jest w konkurencyjnych realiach rynkowo-ekonomicznych. Ekono-

miczne przesłanki zarządzania przedsiębiorstwem, struktura organizacyjna procesu zarządzania,

marketing oraz zarządzanie personelem zostało przedstawione w [97]. Zagadnieniem całościowego

opisu modelu przedsiębiorstwa wraz z jego dekompozycją, sterowaniem i optymalizacją zajmuje

się teoria wielkich systemów rozwijana od wczesnych lat sześćdziesiątych [10, 66].

Opis wielopoziomowych systemów sterowania wraz z zadaniami i strukturami układów stero-

wania, warstwy układów sterowania, metody optymalizacji, sterowania i koordynacji w złożonych

systemach przedstawiono w [31, 33].

Rys. 2.1. Wielopoziomowa struktura hierarchiczna przedsiębiorstwa.

Na świecie obserwowany jest ciągły proces ewolucji instalacji przemysłowych, przejawiający

się we wzroście stopnia ich skomplikowania i zaawansowania. Wzrost jest spowodowany zwięk-

szeniem wymogów bezpieczeństwa, rosnącymi cenami surowców naturalnych oraz koniecznością

dostarczenia lepszego produktu i jednocześnie bardziej konkurencyjnego. Ponadto, coraz waż-

5

niejszym czynnikiem stymulującym rozwój procesów technologicznych, a wraz z nimi systemów

sterowania, jest konieczność ochrony środowiska naturalnego. Organizacje rządowe ogranicza-

ją maksymalną wielkość emisji szkodliwych substancji do środowiska poprzez nakładanie kar

i sankcji. Próby zastąpienia energii pozyskiwanej ze źródeł kopalnianych poprzez wykorzystanie

źródeł odnawialnych mają na celu zmniejszenie efektu cieplarnianego, dzięki zmniejszeniu emisji

dwutlenku węgla do atmosfery. Opłacalność stosowanie energii odnawialnej jest silnie skorelowa-

na z jakością sterowania procesu biotechnologicznego lub innego. Wzrost opłacalności produkcji

osiągany jest poprzez udoskonalanie i unowocześnianie procesu produkcji, jak również poprzez

wprowadzanie nowych, bardziej wydajnych algorytmów sterowania i nadzoru. Ważnym czynni-

kiem jest przewidywanie zwiększenia emisji szkodliwych substancji do środowiska naturalnego

i odpowiednio wczesne reagowanie na mogące nastąpić przekroczenie przyjętych norm [108].

Przekroczenie to powoduje wzrost liczby zachorowań osób, a przez to zwiększenie nakładu na

leczenie. W przemyśle zwiększenie wydajności chemicznych procesów technologicznych uzyskuje

się dzięki zwiększeniu gabarytów reaktorów. Od wczesnych lat dziewięćdziesiątych rozwija się też

dziedzina nauki zajmująca się budową i prowadzeniem procesów chemicznych w skali mikro (ang.

micro process), dzięki której uzyskuje się większą sprawność procesu, co zmienia trend rozwoju

wielkich instalacji przemysłowych. Mikroreaktory stanowią pomost między skalą laboratoryjną

a przemysłową, łącząc najlepsze cechy obu rozwiązań [48]. Dodatkowo w swych rozwiązaniach

łączą najnowsze osiągnięcia z dziedziny elektroniki i mechaniki (ang. Micro-Electro-Mechanical-

Systems, MEMS). Kompletne rozwiązanie laboratoryjne dostarczane jest w jednym układzie

scalonym tzw. ”laboratorium na chipie” (ang. Lab on a Chip, LoC) [43] pracującym w skali

nano1.

Z postępem technologicznym związana jest z automatyzacja i zastępowanie pracy ludzkiej

przez maszyny. Nowe, bardziej skomplikowane technologie wymagają dobrze wyszkolonej ka-

dry obsługującej. Konieczne jest ciągłe szkolenie kadry pracowniczej w celu poprawnej obsługi

skomplikowanych instalacji, w szczególności w sytuacjach alarmowych. Tego typu działania szko-

leniowe są niemożliwe do przeprowadzenia w systemie produkcyjnym. Pojawiła się konieczność

przygotowania specjalnych, dedykowanych systemów testowych, na których pracownicy mogliby

ćwiczyć podejmowanie decyzji w przypadkach krytycznych np. awarii poszczególnych członów

instalacji. Do realizowania takich scenariuszy dobrze nadają się rzeczywiste i symulowane labora-

toria. Rzeczywiste laboratoria często znajdują się w innych ośrodkach (np. naukowo-badawczych)

i są oddalone o wiele kilometrów. Z tego powodu można wykorzystać zdalny dostęp do specjali-

stycznego laboratorium bez konieczności okresowego oddelegowywania pracownika na szkolenie.

Systemy takie nazywamy systemami zarządzającymi nauczaniem (ang. Learning Management

Systems, LMS) [94, 36, 107].

Wzrostem stopnia zaawansowania składowych systemu sterowania wiąże się z wprowadza-

1Przedrostki nano i mikro pochodzą od wielkości przepływu części litra na sekundę, a nie od części metrazwiązanego z rozmiarem reaktora.

6

niem nowych algorytmów sterowania. Jak wspomniano realizacja obsługi różnych scenariuszy

zdarzeń, strategii sterowania i szkoleń na rzeczywistej instalacji produkcyjnej jest nieuzasadnio-

na. Wprowadza to konieczność budowy wirtualnych symulowanych środowisk – laboratoriów,

w których przeprowadzanie szkoleń jest bezpieczne i nie powoduje dodatkowych kosztów związa-

nych z przestojami instalacji produkcyjnej. Zalety to niskie koszty i łatwość powielania rozwiązań.

Wadami może być zbyt duże uproszczenie zachodzących rzeczywistych zjawisk [36]. Jak wspo-

mniano, cennym jest możliwość dostępu zdalnego do takiego laboratorium poprzez sieć globalną

Internet [94].

Rys. 2.2. Proces zarządzania realizowany w poziomach struktury organizacyjnej [126].

Procesy technologiczne dzielimy na jednorazowe (np. wsad do reaktora), cykliczne (wielo-

krotnie powtarzane procesy jednorazowe) oraz ciągłe. Obiekty przemysłowe charakteryzują się

wieloma wejściami i wyjściami. Ważny problem stanowi dobór wielkości sterujących dla zagad-

nienia stabilizacji i optymalizacji, tak by wpływ zakłóceń na proces był jak najmniejszy [33].

Współczesne systemy sterowania instalacjami przemysłowymi są realizowane jako wbudowa-

ne i rozproszone komputerowe systemy sterowania (ang. Distributed Real-time and Embedded,

DRE) [95]. Parametry potrzebne do opisu konfiguracji takiego rozproszonego systemu są przecho-

wywane w ujednoliconych strukturach hierarchicznych, zdefiniowanych jako rozszerzalny język

znaczników (ang. Extensible Markup Language, XML) [93], w obiektowych [68] albo relacyjnych

bazach danych [52, 24].

Przede wszystkim, w systemach sterowania najważniejsze jest bezpieczeństwo, niezawodność

i odporność na błędy zastosowanego rozwiązania. Dział nauki badający niezawodność elemen-

7

tów i urządzeń technicznych nazywa się teorią niezawodności. W ramach teorii rozważana jest

niezawodność pojedynczych elementów np. elektronicznych (rezystory, tranzystory), elementów

pomiarowych (czujniki), wykonawczych (grzejniki, zawory) oraz wielu innych. Ponadto, podda-

wane analizie niezawodnościowej są różne struktury całościowe, jak połączenia szeregowe, równo-

ległe oraz mieszane, a także wpływ elementów i struktur na niezawodność, koszty oraz zależność

między kosztami a niezawodnością. Badane są fizyko-chemiczne przyczyny i skutki uszkodzeń

zarówno w kontekście oddziaływania na sąsiednie elementy systemu, jak i jego całość. Rozwijane

są metody obliczania niezawodności, analizowane są wyniki przeprowadzonych badań i testów

obiektów w procesie produkcyjnym i okresie eksploatacji. Niezawodność określana jest także na

podstawie wyników odpowiednich pomiarów dokonanych w trakcie eksploatacji. Analizę i bu-

dowę modeli uszkodzeń przeprowadza się z wykorzystaniem metod statystycznych i rachunku

prawdopodobieństwa. Powyższe zagadnienia opisane są w [118].

W dalszej kolejności rozważana jest optymalność prowadzenia procesu produkcyjnego. Zasto-

sowanie adaptacyjnych regulatorów wpływa w znaczny sposób na podniesienie bezpieczeństwa

instalacji, szczególnie w obszarach bliskich ograniczeniom technologicznym.

Rys. 2.3. Wielowarstwowy model systemu sterowania.

Rysunek 2.3 przedstawia wielowarstwowy model współczesnego komputerowego systemu ste-

rowania. Ze względu na wydzielone cele sterowania i częstotliwość interwencji, w zintegrowanych

systemach sterowania możemy wyodrębnić warstwy: zarządzania produkcją, optymalizacji sta-

8

tycznej, nadzoru i koordynacji, sterowania adaptacyjnego oraz sterowania bezpośredniego i za-

bezpieczeń. Struktura wielopoziomowa charakteryzuje się podziałem równoległym i koordynacją

realizowaną na wyższym poziomie. Natomiast warstwy nakładają się na siebie. Struktury złożo-

ne są realizowane przez równoczesne połączenie struktur wielopoziomowych i wielowarstwowych.

Praktycznie struktura mieszana okazuje się najwłaściwsza do zastosowania w zagadnieniu rozpro-

szonego sterowania dużą liczbą obiektów w długim decyzyjnym horyzoncie czasowym. Obiekty są

rozumiane jako elementy systemu nie podlegające dalszemu podziałowi. W warstwie sterowania

bezpośredniego i zabezpieczeń czas podejmowania interwencji sterujących oraz prognozowany

horyzont czasowy sterowania (czas podtrzymania sterowania) jest najkrótszy. Czas ten ulegają

wydłużeniu w wyższych warstwach, równocześnie rosną też koszty związane z ryzykiem podjęcia

błędnych decyzji. Sumaryczny efekt częstych błędnych decyzji w warstwie sterowania bezpo-

średniego może powodować straty porównywalne z błędnymi decyzjami w warstwach wyższych.

W skrajnym przypadku błędne zadziałanie systemu zabezpieczeń, skutkujące natychmiastowym

wyłączeniem instalacji, przyczyni się do znacznego wzrostu kosztów. Obserwuje się tendencję

do automatyzacji działania poszczególnych warstw sterowania. Praktycznie w warstwie sterowa-

nia bezpośredniego praca ludzka została zredukowana do czynności projektowych, nadzorowania

i serwisowych.

2.1.1. Warstwa zarządzania produkcją

Instalacja przemysłowa, a wraz z nią systemy sterowania i wspomagania podejmowania decyzji,

należą do grupy silnie rozproszonej. Mają do nich dostęp osoby różnych szczebli. Taki system

powinien pozwolić na dostęp i reprezentację zgromadzonych danych w sposób właściwy dla ope-

ratorów z różnych działów (poziomów). Obecnie jest już normą, że systemy sterowania sprzężone

są z systemami śledzenia i zarządzania produkcją oraz systemami kontrolującymi wydajność pro-

dukcji (ang. Manufacturing Execution Systems, MES). Standard ISA S95 ”Enterprise-Control

System Integration” definiuje warstwy integracji i współpracy z systemami planowania i zarzą-

dzania produkcją, finansowo-księgowymi, sprzedażą, gospodarką materiałową, zarządzaniem ja-

kością oraz logistycznymi (ang. Enterprise Resources Planning, ERP) [54], planowanie zasobami

produkcyjnymi (ang. Manufacturing Resource Planning, MRP). Z tych to systemów informacja

jest przekazywana do systemów sterowania. Obecnie klient (odbiorca gotowego produktu) ma

możliwość złożenia zamówienia za pośrednictwem sieci INTERNET. Z tego powodu szczególne

ważne staje się bezpieczeństwo informatyczne i technologiczne, niezawodność oraz zabezpieczenie

interfejsu systemu sterowania z innymi programami. W niższych warstwach wzrasta częstotliwość

zakłóceń, co powoduje konieczność zmniejszenia czasu podejmowania decyzji.

9

2.1.2. Warstwa optymalizacji statycznej

W warstwie optymalizacji statycznej zwykle ma się do czynienia ze strategiami maksymaliza-

cji przychodów lub minimalizacji kosztów, przy zadanych ograniczeniach produkcyjnych. Innym

kryterium jest maksymalizacja ilości produktu końcowego – przychodu – przy stałym poziomie

kosztów i spełnionych więzach ograniczających. Warstwa optymalizacji statycznej charakteryzuje

się częstotliwością interwencji wynoszącą nawet 1 dzień, nie jest ona stała i silnie zależy od wła-

ściwości dynamicznych sterowanego obiektu. Podjęte decyzje sterujące rozciągają się następnie

na długi horyzont czasowy.

W warstwie optymalizacji statycznej wykorzystuje się algorytmy selekcji, grupowania danych,

detekcji stanów ustalonych, identyfikacji modeli statycznych oraz optymalizacji, które to algoryt-

my charakteryzują się największym zapotrzebowaniem na moc obliczeniową. Z tych względów

obliczenia prowadzi się na maszynach równoległych z wykorzystaniem technologii wieloproce-

sorowych, rozproszonych systemów klastrowych i gridowych opartych o stacje robocze. Proces

decyzyjny w tej warstwie został praktycznie sformalizowany.

Dla sygnałów sterowania nadrzędnego konieczne jest konstruowanie algorytmów przetwa-

rzania sygnałów mających na celu detekcję stanów ustalonych. Dostęp do zmiennych stanu

umożliwia konstruowanie algorytmów detekcji stanu ustalonego [61]. Zebrane stany ustalone

umożliwiają budowę modeli statycznych dla procesu. Modele takie konstruuje się z wykorzysta-

niem metod regresji i wielomianów zadanego stopnia. Bardziej ogólne wydaje się zastosowanie

wielomianów sklejanych. Informację zawartą w modelach statycznych można wykorzystać do

optymalizacji procesu w stanie ustalonym przy zadanym wskaźniku jakości. Bywa, że na skutek

błędów pomiarowych i modelowych osiągnięty na podstawie modelu statycznego stan jest dla

rzeczywistego procesu nieoptymalny. Należy wtedy uaktualnić model statyczny oraz zastoso-

wać metodę bezpośredniego iteracyjnego poszukiwania optymalnego punktu pracy na obiekcie

rzeczywistym.

2.1.3. Warstwa nadzoru i koordynacji

Poszczególne warstwy sterowania nadrzędnego realizowane są na stacjach operatorskich. Infor-

macje na temat implementacji tego typu rozwiązań można znaleźć w [29, 30, 11]. Stacje i panele

operatorskie stosowane są w warstwie nadzoru i koordynacji. Systemy automatycznego rozruchu

są budowane w oparciu o wiedzę eksperta. Systemy eksperckie bazują na informacji dostarczonej

z algorytmów przetwarzania danych np. klasyfikacji przebiegów sygnału pomiarowego.

Trzon warstwy stanowią automaty skończenie stanowe w połączeniu z interfejsami człowiek-

maszyna (ang. Humman Machine Interface, HIM).

10

2.1.4. Warstwa sterowania adaptacyjnego

Warstwa sterowania adaptacyjnego najczęściej realizowana jest w oparciu o dedykowane kom-

putery przemysłowe oraz dysponujące coraz większą mocą obliczeniową PLC.

W tej warstwie wykorzystywane są algorytmy identyfikacji, automatów skończenie stanowych,

optymalizacji parametrów regulatorów i obserwatorów. Proces decyzyjny zachodzący w warstwie

został w pełni sformalizowany i obecnie trwają prace nad jego dalszym rozwojem.

2.1.5. Warstwa sterowania bezpośredniego i zabezpieczeń

Współczesne realia wolnego rynku przemysłowego i konsumenckiego zmuszające przedsiębior-

stwo do bycia konkurencyjnym wymagają od niego adaptacji do nieustannie zmieniających się

warunków, np. poprzez zmianę strategii sterowania. Powoduje to konieczność prowadzenia pro-

cesu produkcyjnego w pobliżu aktywnych ograniczeń technologicznych lub nawet fizycznych.

Niedopuszczalność przekroczenia tych ograniczeń wymaga zastosowania lepszych algorytmów

sterowania i predykcji zachowania obiektu, np. ze względu na skażenie. Te algorytmy wymagają

dokładniejszych modeli obsługiwanego procesu.

W warstwie sterowania bezpośredniego proces podejmowania decyzji został w pełni sforma-

lizowany najwcześniej, co umożliwiło konstruowanie i stosowanie sterowania automatycznego.

W wyższych warstwach proces podejmowania decyzji jest mniej formalny i sformalizowana część

procesu stanowi komputerowe wspomaganie podejmowania decyzji. Dalszy postęp formalizacji

wymaga opracowania lepszych, dostatecznie wiarygodnych modeli matematycznych. Identyfi-

kacja struktury i parametrów modelu (na podstawie trendów historycznych) służy pozyskaniu

wiedzy, która będzie mogła być zastosowana w przyszłości. Ogólnie pozyskiwaniem wiedzy z rze-

czywistych systemów zajmuje się eksploracja danych (ang. Data Mining). Ograniczenie rozwoju

formalizowania procesu decyzyjnego jest spowodowane koniecznością dużego nakładu wiedzy

i wysiłku w prowadzenie badań i doświadczeń potrzebnych do budowy adekwatnych modeli.

Moc obliczeniowa współczesnych zestawów komputerowych nie stanowi bariery ograniczającej

rozwój tej dziedziny.

Z uwagi na wymogi czasowe oraz konieczność bezpośredniego dostępu do obiektu warstwa bez-

pośredniego sterowania cyfrowego (ang. Direct Digital Control, DDC) wraz z zabezpieczeniami

jest realizowana w oparciu o dedykowane programowalne sterowniki logiczne (ang. Programmable

Logic Controler, PLC), procesory sygnałowe (ang. Digital Signal Processor, DSP), macierze bra-

mek programowane polem (ang. Field Programmable Gate Array, FPGA) [101, 88, 70], macierze

analogowe programowane polem (ang. Field Programmable Analog Array, FPAA) [99], lub jest

aplikowana w systemach czasu rzeczywistego (ang.Real Time Operating Systems, RTOS) inaczej

softPLC [46].

W tej warstwie wykorzystuje się algorytmy regulacji, obserwacji stanu oraz automaty skoń-

11

czenie stanowe (ang. Finite State Machine, FSM).

W różnych warstwach mogą być realizowane dowolne wskaźniki jakości i strategie sterowa-

nia. Przykładowo w warstwie sterowania bezpośredniego mamy do czynienia ze wskaźnikami

całkowymi, min-maxowymi oraz strategią sterowania czasooptymalnego [66, 27].

Równolegle do systemów sterowania, budowane są niezależne, redundantne i wyizolowa-

ne z systemów sterowania systemy bezpieczeństwa (ang. Emergency Shutdown System, ESD)

[112, 76, 28]. Zdarzenie polegające na przekroczeniu ograniczenia technologicznego wartości

zmiennej procesowej powoduje powiadomienie operatora systemu i oczekiwane jest potwierdzenie

zaistniałego alarmu. W przypadku braku stosownej reakcji ze strony obsługi i zbliżeniu wartości

zmiennej procesowej do ograniczenia fizycznego, system nadzorujący zaprogramowany jest tak,

by przejąć kontrolę nad procesem i przeprowadzić procedurę awaryjnego bezpiecznego wyłącze-

nia instalacji (ang. soft shutdown). Wykorzystują one w swym działaniu automaty skończenie

stanowe.

Rozwinięciem systemów ESD są systemy przewidujące możliwość zaistnienia sytuacji krytycz-

nej jeszcze przed jej wystąpieniem. W swym działaniu wykorzystują one modele matematyczne

nadzorowanego procesu wspólnie z zaawansowanym przetwarzaniem sygnałów pochodzących ze

zmiennych procesowych. Modele matematyczne mogą być otrzymane z wykorzystaniem sploto-

wych i sklejanych metod identyfikacji układów ciągłych.

Przykładem kompleksowego systemu sterowania i nadzoru w zastosowaniu do instalacji wy-

twarzania etanolu ze źródeł odnawialnych jest system Pavilion [124]. Łączy on optymalizację

statyczną z regulacją predykcyjną opartą o nieliniowe modele procesu zbudowane na sieciach

neuronowych.

Rys. 2.4. Wykorzystany schemat blokowy przetwarzania cyfrowego w układzie regulacji.

W przypadku przetwarzania cyfrowego (rys. 2.4) ważne jest spełnienie twierdzenia Kotiel-

nikowa-Shanona o podwójnej częstotliwości próbkowania [131]. Drugim ważnym czynnikiem

ograniczającym dokładność przetwarzania jest efekt kwantyzacji wywołany obecnością w to-

12

rze pomiarowym przetwornika analogowo-cyfrowego i w torze sterowania przetwornika cyfrowo-

analogowego. Obliczenia numeryczne charakteryzują się skończoną dokładnością numeryczną,

która jest przyczyną dodatkowej propagacji błędów i niepewności. Z tych przyczyn w najbardziej

zaawansowanych systemach przetwarzania cyfrowego stosuje się osiągnięcia arytmetyki interwa-

łowej [51].

2.1.6. Implementacja komputerowych systemów sterowania

Implementacja systemów sterowania i zarządzania w rozproszonych wielozadaniowych systemach

napotyka na wiele trudności natury synchronizacyjnej i komunikacyjnej. Mechanizmy komunika-

cji międzyprocesowej (ang. Inter Proccess Communication, IPC) wykorzystywane w systemach

sterowania rozproszonego – sieciowego opisano w [120, 37] wraz z przykładowymi kodami źródło-

wymi implementacji. Ponadto przedstawiono model warstw ISO OSI, komunikację typu klient–

serwer, zdalne wywoływanie procedur (ang. Remote Procedure Call, RPC), opisano rozwiązania

szczególnie ważnego problemu synchronizacji czasu w systemach sieciowych. Dodatkowo opisano

sposoby dostępu do wspólnych zasobów (arbitraż) oraz wzajemne wykluczanie sekcji krytycznej.

Omówione zostały zagrożenia bezpieczeństwa systemów rozproszonych. Przykłady programowa-

nia współbieżnego i rozproszonego wraz z problemami zarządzania zasobami komputerowymi

w przykładach i zadaniach przedstawiono w [128]. Przedstawiono tam mechanizmy nisko- i wy-

sokopoziomowe komunikacji i synchronizacji, mechanizmy powstawania niekorzystnych blokad

i zakleszczenia (ang. deadlock) dla wątków i procesów w wielozadaniowych systemach operacyj-

nych, w których jednocześnie wiele zadań konkuruje o dostęp do wspólnych zasobów. Przedsta-

wiono sposoby implementacji mechanizmów komunikacji międzyprocesowej z wykorzystaniem

mechanizmów niskopoziomowych jak przerwania, arbitrażu pamięci oraz instrukcji specjalnych

wykonywanych w jednym niepodzielnym (atomowym) cyklu maszynowym mikroprocesora typu

odczyt-modyfikacja-zapis (ang. read-modify-write). Opisano mechanizmy wysokopoziomowe

dostępne w systemach operacyjnych: semafory i monitory, oraz w językach programowania: sy-

metryczne i asymetryczne spotkania w ADA oraz przestrzeń krotek. Dobre praktyki programi-

styczne konieczne do implementacji bezpiecznego, stabilnego oraz wydajnego systemu sterowania

opisano w [75]. Natomiast zaawansowane techniki tworzenia oprogramowania czasu rzeczywiste-

go przedstawiono w [121].

2.2. Modele

Modelem nazywamy pewne odwzorowanie rzeczywistego systemu poprzez przedstawienie w nim

interesujących istotnych cech. Model powinien zewnętrznie zachowywać się jak system, nie jest

wymagana zgodność struktury wewnętrznej. Model cechuje się niepełną zgodnością z rzeczy-

wistością na skutek powstałych uproszczeń przy jego budowie i działaniem odbiegającym od

13

rzeczywistych warunków. Modelem określane jest narzędzie opisujące wzajemne procesy zacho-

dzące w systemie. Rozróżnia się modele systemu:

� koncepcyjne i jakościowe,

� fizyczne, analogowe, komputerowe i matematyczne.

Cele tworzenia modeli:

� badanie, czyli analiza właściwości procesu (np. stabilności),

� prognozowanie wyjścia procesu dla znanego sterowania,

� projektowanie, czyli synteza sterowania dla założonego wyjścia.

Dla rozpatrywanych systemów sterowania ze względów ekonomicznych i praktycznych pre-

ferowane jest tworzenie sformalizowanych modeli matematycznych symulowanych jako modele

komputerowe.

W monografii [33] wyróżnia się następujący podział modeli:

� Sformalizowane i intuicyjne. Modele zdeterminowane w działaniu, które opisano wyra-

żeniami matematycznymi i logicznymi, nazywane są modelami sformalizowanymi. Modele

zawarte w umyśle eksperta, zawierające niejednoznaczności, nazywane są modelami intu-

icyjnymi.

� Przyczynowe i korelacyjne. Modele przyczynowe odzwierciedlają wpływ jednej wielko-

ści na drugą. Natomiast modele korelacyjne wskazują na istnienie pewnych zależności np.

pomiędzy dwoma skutkami tej samej przyczyny. Tworzenie modeli przyczynowych wymaga

przeprowadzenia czynnego eksperymentu identyfikacyjnego. Natomiast w pracy z modela-

mi korelacyjnymi wystarczy tylko bierne obserwowanie poddane obróbce statystycznej.

� Statyczne i dynamiczne. Zachowanie obiektu w stanach równowagi statycznej z pomi-

nięciem jego dynamiki opisują modele statyczne. Natomiast modele dynamiczne opisują

trajektorię wpływu jednej wielkości na drugą, zarówno w czasie jak i statycznie. Zwykle

modele dynamiczne nie oddają w pełni poprawnie zachowania statycznego obiektu.

� Deterministyczne i probabilistyczne. Zwykle modele probabilistyczne są badane po-

przez przeprowadzenie symulacji stochastycznej lub analizę odpowiedniej formuły matema-

tycznej. Symulacja stochastyczna może dotyczyć niepewności wewnętrznej, zakłóceń oraz

symulowanych przebiegów losowych. W przypadku tych modeli operuje się na wielkościach

statystycznych tj. wartość oczekiwana i wariancja.

14

� Dyskretne procesów ciągłych. Te modele posiadają zarówno dyskretne równanie stanu,

jak i ciągłe równanie stanu. Błędy dyskretyzacji maleją przy zmniejszeniu czasu dyskrety-

zacji.

� Zjawisk ziarnistych i procesów dyskretnych.

Ponadto w literaturze [127, 122, 63] można spotkać omówienie modeli rozmytych i neuronowych.

W oparciu o różnego typu modele jednostki decyzyjne w warstwach i poziomach generu-

ją decyzje sterujące. Dodatkowo jako modele rozumiane będą różne części widzianego w niż-

szych szczeblach struktury hierarchicznej podsystemu. Przykładowo dla warstwy sterowania

nadrzędnego modelem będzie odzwierciedlenie wewnętrznych mechanizmów zachowania stero-

wanego obiektu fizycznego wraz z jednostką decyzyjną zrealizowaną w warstwie sterowania bez-

pośredniego. Szczegółowe informacje na temat różnych typów modeli wraz z opisem interakcji

i wzajemnego ich przenikania się dla wewnętrznych modeli systemu i modeli otoczenia można

znaleźć w [32, 33].

Budując modele dążymy do uzyskania z nich informacji o charakterze jakościowym. Zwykle

w przypadku systemów automatyki taka informacja jest niewystarczająca i dążymy do uzyskania

wniosków ilościowych. Jedynie modele sformalizowane rozpatrywanego systemu gwarantują nam

uzyskanie informacji o charakterze ilościowym.

Modele można dowolnie komplikować i rozbudowywać. Bardziej złożone modele lepiej opisują

rzeczywisty system, ale wymagają większego nakładu na ich budowę i późniejszą analizę. Zbytnie

uproszczenie może spowodować, że model będzie nieadekwatny. Weryfikacją modelu nazywamy

proces polegający na sprawdzeniu adekwatności modelu.

2.3. Automat skończenie stanowy

Automat skończenie stanowy (ang. Finite State Machine, FSM) jest to abstrakcyjne pojęcie

matematyczne wytworzone na bazie maszyn cyfrowych, którego zadaniem jest obsługa zadań

napływających asynchronicznie do systemu. Na podstawie zdarzeń oraz wewnętrznego stanu ge-

nerowane są zaprogramowane decyzje sterujące. Wewnętrzne stany układu sekwencyjnego zależą

zarówno od wejść jak i poprzedniego stanu, czyli układ posiada pamięć wewnętrzną. Z kolei sta-

nom przyporządkowane są wartość wyjść. Automaty te znajdują zastosowanie w zagadnieniu

modelowania, sterowania i przetwarzania informacji (telekomunikacja, teletransmisja, protokoły

komunikacyjne, kompilatory). Ponadto są wykorzystane do analizy różnego rodzaju gramatyk.

Sygnałami wejściowymi i wyjściowymi z automatu są sygnały binarne.

Rozróżniamy automaty asynchroniczne i synchroniczne. W automatach synchronicznych, tak-

towanych zewnętrznym zegarem, nie występują wyścigi przełączeń (ang. hazard). Automat asyn-

chroniczny działa niezależnie od zegara. Inny podział to automaty Moore’a, w których stan wyjść

15

zależy od pośredniego wewnętrznego stanu i automaty Mealy’ego, w którym stan wyjść zależy

od pośredniego wewnętrznego stanu oraz od stanu wejść [125]. Powyższe automaty nazywamy

deterministycznymi. Odrębną grupę stanowią automaty, w których nowy stan zależy nie tylko

od stanu poprzedniego i sygnału wejściowego, ale również od pewnego prawdopodobieństwa.

Syntetyczne ujęcie teorii automatów cyfrowych przedstawione jest w [47]. Opis zintegrowane-

go środowiska wspomagającego rozwój i testowanie automatów ujęty jest w [84]. Rozwój teorii

automatów skończenie stanowych pozwolił na szybki rozwój elektronicznej techniki cyfrowej,

a w efekcie budowę mikroprocesora.

W systemach automatyki powszechne są automaty skończenie stanowe obecne we wszyst-

kich warstwach przedstawionego modelu, rys. 2.3. Służą one do odzwierciedlenia zachowania

modelu, w innych przypadkach oddziaływują one bezpośrednio na sterowany obiekt albo pełnią

funkcję nadrzędną w stosunku do innych algorytmów. FSM znajduje zastosowanie w sterowaniu

produkcyjnymi procesami wsadowymi oraz jako uzupełnienie procesów ciągłych. Bardzo trudne

byłoby zbudowanie automatu skończenie stanowego realizującego proces decyzyjny systemu cią-

głego np. regulację temperatury. Taki automat musiałby posiadać bardzo dużą liczbę stanów.

Ze względów praktycznych sterowanie układami ciągłymi jest realizowane w oparciu o inne,

przedstawione dalej, algorytmy automatów nieskończenie stanowych zwane regulatorami.

Zwykle automaty przedstawia się w formie grafów i tablic (najczęściej Karnaugha). Grafy

sporządza się tak, że wierzchołkom odpowiadają stany, natomiast gałęziom wejścia automatu.

Grafom w pełni odpowiadają tablice przejść i wyjść. Forma reprezentacji w postaci grafów jest

wygodniejsza do analizy przez człowieka, natomiast forma tablicowa jest mniej obrazowa, ale

znacznie dogodniejsza przy przekształceniach i implementacji [125].

Książka [85] poświęcona jest syntezie i optymalizacji automatów synchronicznych za pomocą

teorii grafów oraz algebry Boole’a. Przedstawiono dokładne i heurystyczne metody minimalizacji

liczby stanów.

W systemach sterowania nadzorujących procesy technologiczne stosuje się połączenie wza-

jemnie uzupełniających się automatów skończenie stanowych z regulatorami. Najczęściej regula-

tor jest włączany w wybranych stanach automatu skończenie stanowego. Przykładem może być

automat FSM zastosowany w oczyszczalni ścieków, jaki implementował autor w jednej z prac

dla przemysłu.

Na rys. 2.5 przedstawiono algorytm realizujący fazę napowietrzania w bioreaktorze proce-

su wsadowego oczyszczania ścieków komunalnych. Przykładowo w stanie 007 automat załącza

jednocześnie dmuchawę powietrza i regulator ciągły PID stabilizujący zadaną wartość stężenia

tlenu w reaktorze. Przejście z fazy tlenowej do fazy sedymentacji następuje po osiągnięciu gór-

nego poziomu w reaktorze (prawdziwe wyrażenie h1 > h1max). Przejście do fazy beztlenowej

możliwe jest po zadanym czasie(t1 > t1min) i osiągnięciu wymaganego poziomu stężenia tlenu

w bioreaktorze (O2 > O2min).

16

Rys. 2.5. Przykład automatu skończenie stanowego.

2.4. Regulacja

Zwykle algorytm jest zapisany jako formuła matematyczna. Ze względu na rodzaj pętli stero-

wania układy automatyki możemy podzielić na układy działające: w otwartej pętli (ang. open

loop), w pętli sprzężenia zwrotnego (ang. feedback), ze sprzężeniem w przód (ang. feedforward)

oraz różnych kombinacjach (mieszane, kombinowane) [86].

Wiele procesów technologicznych, w szczególności chemicznych, charakteryzuje się wielowy-

17

miarowością, nieliniowością, długimi stałymi czasowymi i długimi opóźnieniami. Czynniki te

powodują duże praktyczne trudności w zastosowaniu klasycznych układów z pętlą sprzężenia

zwrotnego. Pożądaną jakość sterowania można osiągnąć stosując układ ze sprzężeniem w przód,

który nadaje się dobrze do eliminacji częstych i dużych zakłóceń oraz posiada dobre właściwo-

ści nadążne. Wymaga on jednak pomiaru zakłóceń i znajomości wpływu zakłóceń na obiekt.

Teoretycznie rozwiązanie pozwala na całkowite wyeliminowanie uchybu regulacji. W praktyce

błędy modelowania i pomiarowe powodują powstawanie uchybu. Nawet niezbyt poprawnie do-

brany układ regulacji ze sprzężeniem w tył ma zdolności stabilizacyjne czyli eliminacji uchybu.

Powodują one, że układ zamknięty jest w stanie eliminować wpływające na obiekt nieznane

zakłócenia. Najlepsze właściwości posiada układ mieszany łączący korzystne cechy sterowania

w przód i w tył.

Rys. 2.6. Pętla sprzężenia zwrotnego w przód i tył.

Dobór parametrów regulatora dla układów ze sprzężeniem zwrotnym i sprzężeniem w przód

oraz mieszanym jest omówiony w [109, 89, 72, 114]. W niniejszej pracy będą rozważane układy

stabilizacji i nadążne. Metody analizy istotności sprzężeń skrośnych i ich rozprzęgania (ang. de-

coupling) [89, 109, 67] dla obiektów wielowymiarowych przy pomocy analizy wzmocnień względ-

nych i dekompozycji na wartości singularne (ang. Singular Value Decomposition, SVD [1, 38,

105]) pokazano w pracy [30].

Podział algorytmów sterowania ze względu na zdolność do samoczynnego przystosowania się

do zmieniających się warunków pracy, charakterystyk obiektu i zakłóceń obejmuje: algorytmy

zwykłe – nieadaptacyjne i adaptacyjne. Ze względu na liczbę regulowanych zmiennych proceso-

wych możemy dokonać rozdzielenia na układy regulacji jednej zmiennej i wielu zmiennych. Inny

podział ze względu na rodzaj realizowanego zadania: układ regulacji stałowartościowej (stabili-

zacji), układ regulacji programowej, układ regulacji nadążnej oraz układ regulacji ekstremalnej.

Kolejnej klasyfikacji można dokonać dzieląc układy sterowania ze względu na liczbę kaskad

sterowania: bez kaskady, pojedyncza kaskada i wielokaskadowe. Zastosowanie kaskad jest naj-

prostszym przypadkiem sterowania nadrzędnego. W rozwiązaniach kaskadowych stosuje się po-

dział jednej pętli sterowania na mniejsze fragmenty. Te mniejsze fragmenty charakteryzują się

mniejszym czasem opóźnienia, mniejszą bezwładnością oraz lepszą stabilnością w porównaniu

z układami bez kaskad. Stosując rozwiązania kaskadowe eliminujemy błędy regulacji w miejscu

18

ich wystąpienia, a nie na końcowym wyjściu z obiektu, co skutkuje zmniejszeniem się propaga-

cji tych błędów na kolejne sekcje. Wadą rozwiązania jest konieczność uwzględnienia interakcji

pomiędzy kaskadami w procesie syntezy pojedynczych regulatorów. Przykładem lokalnej pętli

regulacji będzie regulator stabilizujący przepływ przez zawór wymiennika ciepła. Natomiast re-

gulator nadrzędny stabilizuje zadaną temperaturę na wyjściu wymiennika sterując strumieniem

wody chłodzącej.

Istnieje jeszcze wiele innych pomniejszych kryteriów klasyfikacji regulatorów, np. ze wzglę-

du na rodzaj energii zastosowanej do zasilenia wyróżniamy regulatory działania bezpośredniego

i pośredniego. Regulatory pośredniego działania są zasilane z nośnika energii: elektrycznego,

pneumatycznego, hydraulicznego oraz mieszanych. Ze względu na postać sygnałów występują-

cych w regulatorze rozróżnia się analogowe i cyfrowe. Regulatory analogowe mogą na wejściu

posiadać sygnał całkowicie ciągły, krokowy, dwupołożeniowy, trójpołożeniowy lub impulsowy.

Zwykle regulatory z wyjściem nieciągłym przeznaczone są do współpracy z obiektami całkują-

cymi, inercyjnymi lub całkującymi z inercją [39].

W zadaniu sterowania problemem jest niepewność parametrów sterowanego modelu. Po-

prawnie przeprowadzona synteza parametrów regulatora powinna uwzględniać taką niepewność

modelu. Jej uwzględnienie zwykle powoduje pogorszenie jakości regulacji względem wybranego

wskaźnika jakości. Uwzględnienie niepewności modelu w procesie syntezy regulatora wymaga

zastosowania iteracyjnych metod optymalizacji. Oprócz niepewności parametrów modelu wyróż-

niamy dodatkowo niepewność informacji pomiarowych, gdyż nie wszystkie działania ze strony

otoczenia mogą być w pełni przewidziane. Regulatory tak dobrane będziemy nazywać odpornymi

(ang. robust control).

2.4.1. Algorytmy regulacji klasycznej (nieadaptacyjne)

Struktura regulatora adaptacyjnego opiera się o istniejące i dobrze zbadane algorytmy stero-

wania nieadaptacyjnego. Prawa regulacji nieadaptacyjne mogą zostać użyte zarówno w kon-

strukcji regulatorów z adaptacją pośrednią jak i bezpośrednią. Jako klasyczne prawa sterowania

nieadaptacyjnego dla systemów liniowych ciągłych możemy wyróżnić algorytmy PID, rozmyte

i neuronowe, metodę alokacji zer i biegunów, regulator liniowo-kwadratowy, predykcyjny.

W [53] podano rozwiązanie problemu alokacji biegunów dla układów inwariantnych ze ste-

rowaniem od stanu i wyjścia (SISO i MISO). Przedstawiono wpływ sprzężenia zwrotnego na

położenie biegunów. Dodatkowo przedstawiono rozwiązanie ze statycznym i dynamicznym sprzę-

żeniem zwrotnym.

Ciągłe regulatory LQR wykorzystujące adaptację pośrednią gwarantują wysoką jakość sta-

bilizacji układów o nieznanych lub zmiennych parametrach. Optymalne rozwiązanie zadania

sterowania liniowo-kwadratowego wraz z eliminacją uchybu statycznego przedstawiono w [30,

45, 53, 67], dla układów z opóźnieniem w [64]. W pracy [45] zostało przedstawione rozwiązanie

19

optymalne problemu liniowo-kwadratowego dla systemów opisanych równaniami różniczkowymi

zwyczajnymi, systemów dyskretnych, systemów opisanych równaniami cząstkowymi, przypad-

ków stacjonarnych i niestacjonarnych. Zagadnienie jest dyskutowane jako problem ze skończo-

nym i nieskończonym czasem sterowania dla systemów z i bez opóźnienia. Systemy z opóźnie-

niem szczegółowo są dyskutowane w monografii [64]. Zastosowanie algorytmów LQR powoduje

konieczność dostępu do zmiennych stanu obiektu. Sporadycznie zmienne te są mierzalne, co

wymusza stosowanie algorytmów obserwacji stanu na podstawie mierzonych zakłóconych wejść

i wyjść obiektu.

W pracy [78, 91] przedstawiono istotę regulacji predykcyjnej zwykłej i adaptacyjnej z modela-

mi parametrycznymi i nieparametrycznymi (odpowiedzi impulsowej i skokowej). Zasady regulacji

predykcyjnej, w szczególności regulator predykcyjny z modelem odpowiedzi skokowej (ang. Dy-

namix Matrix Control, DMC), regulator predykcyjny uogólniony (ang. Generalized Predictive

Control, GPC) z wykorzystaniem modelu odpowiedzi skokowej, z uwzględnieniem ograniczeń,

niepewności modelu oraz zakłóceń zostały przedstawione w pracy [30, 123]. Dodatkowo przed-

stawiono prawa regulacji dla obiektów jedno i wielowymiarowych, modeli w postaci równań

stanu oraz obiektów nieliniowych. Współpracę warstwy optymalizacji statycznej z regulatorem

predykcyjnym przedstawiono w [123]. W monografii [30] przedstawiono regulację predykcyjną

w sterowaniu nadrzędnym oraz optymalizację punktu pracy wraz z kompensacją zakłóceń mie-

rzalnych regulatora predykcyjnego. Opisu dokonano dla zagadnienia stabilizacji i sterowania

z kontrolą ograniczeń całkowych wyjść procesowych.

2.4.2. Regulacja adaptacyjna

Na skutek oddziaływań zewnętrznych (czasu, starzenie się parametrów, awarie) oraz oddzia-

ływań niemierzalnych zakłóceń, instalacje przemysłowe ulegają zmianom. Zachodzące zmiany

parametrów procesów technologicznych wymuszają konieczność przystosowania się do nich (ad-

aptowania) algorytmów sterowania.

Większość algorytmów sterowania w swym działaniu wykorzystuje wiedzę o procesie techno-

logicznym. Najczęściej jest ona reprezentowana w postaci modeli opisanych transmitancją lub

równaniem różniczkowym. Istnieją procesy, dla których skonstruowanie takiego modelu jest zbyt

skomplikowane lub wręcz niemożliwe ze względu na brak możliwości ich poznania i zrozumienia.

Takie procesy nazywamy czarnymi skrzynkami (ang. black box ).

W wielu przypadkach dysponujemy pewną wiedzą o procesie, która jest obarczona błędem

i niepewnością. Błędy modelowania powstają na skutek pojawienia się w rzeczywistym proce-

sie niemierzalnych i nieprzewidywalnych zakłóceń, uproszczeń modelu oraz zmian parametrów

w czasie. Przypadki, w których nie jesteśmy pewni wiedzy, jaką dysponujemy na temat proce-

su, określane są wspólną nazwą szarych skrzynek (ang. gray box ). Jest to przypadek najczęściej

spotykany w przemyśle.

20

Jeżeli dysponujemy kompletną wiedzą na temat procesu, to w takim przypadku mamy do

czynienia z białą skrzynką (ang. white box ). Dla systemów typu biała skrzynka jest stosunkowo

łatwo zbudować regulator, ponieważ dysponujemy dobrze znanymi metodami postępowania.

W przypadku, gdy wiedza o procesie jest niedostępna, konieczne jest przeprowadzenie proce-

dury identyfikacji jego parametrów off-line lub on-line. W praktyce prowadzi to do konieczności

rozwiązania wielu problemów praktycznych, w szczególności: zaplanowania eksperymentu, pilno-

wania ograniczeń na wartości zmiennych procesowych, zapewnienia stabilność procesu w trakcie

estymacji jego parametrów. Wymienione czynniki powodują powstawanie dodatkowych kosztów

w trakcie eksploatacji [56, 73, 74, 115, 116, 117].

Zidentyfikowane parametry obiektu obarczone są pewnym (nieznanym) błędem. Wielkość te-

go błędu możemy oszacować metodami statystycznymi przeprowadzając wielokrotnie procedurę

identyfikacji. Niepewność parametrów modelu powoduje konieczność uwzględnienia jej w proce-

sie syntezy regulatora, tak by otrzymane prawo regulacji mieściło się w przyjętych założeniach

projektowych. Regulatory, które są odporne na niepewność parametrów modelu sterowanego

obiektu nazywamy odpornymi (ang. robust).

Regulatory adaptacyjne możemy podzielić na dwie główne grupy. Pierwszą będą stanowiły

algorytmy z zaprogramowaną zmianą parametrów (ang. gain scheduling). Drugą stanowią ukła-

dy wyliczające na bieżąco parametry regulatora na podstawie dokonywanych pomiarów, które

nazywane są algorytmami samoprzestrajającymi (ang. self-tuning control) .

Zaprogramowana zmiana parametrów regulatora

Regulacja adaptacyjna z zaprogramowaną zmianą parametrów regulatora stosowana jest do pro-

cesów typu biała skrzynka lub z przeprowadzoną wsadową (ang. off-line) identyfikacją para-

metrów, rys. 2.7. Najczęściej regulatory te są realizowane w postaci rozbudowanych wielowy-

miarowych tablic parametrów (ang. look-up table, LUT). Przestrajanie dokonuje się w oparciu

o pomiary zmiennych pomocniczych reprezentujących zakłócenia [3, 4, 50, 91].

Rys. 2.7. Struktura regulatora z programową zmianą parametrów.

21

Podstawową wadą regulatora z programową zmianą jego parametrów jest adaptacja w pętli

otwartej. Na skutek oddziaływania na obiekt również niemierzalnych zakłóceń jego parametry

się zmieniają, co powoduje dezaktualizację przechowywanych map sterowań. Konieczne staje

się okresowe przeprowadzanie identyfikacji parametrów sterowanego obiektu i ponowna synteza

tablic regulatora.

Przykładem zastosowania tego typu rozwiązania może być komputer sterujący pracą silnika

w samochodzie z zaprogramowaną mapą sterowań wtrysku paliwa. Innym przykładem jest sa-

molot, którego praca urządzeń pokładowych zmieniać się będzie wraz z wysokością lotu i ilością

paliwa pozostającą w zbiornikach (obciążeniem).

Estymacja parametrów regulatora

W praktyce przeprowadzenie identyfikacji na bieżąco (ang. on-line) z działającym w sprzęże-

niu zwrotnym regulatorem powoduje powstawanie problemu w postaci poprawności identyfika-

cji. Zagadnienia regulacji (stabilizacji) i identyfikacji są sobie przeciwstawne. Przeprowadzenie

eksperymentu tak, by zadanie identyfikacji było dobrze uwarunkowane numerycznie powoduje

konieczność doboru sygnału wymuszenia o odpowiednio szerokim spektrum częstotliwości. Po-

prawnie dobrany sygnał wymuszający pobudza wszystkie magazyny energii badanego obiektu.

Identyfikacja, by była dobrze uwarunkowana numerycznie, potrzebuje sygnału wymuszenia na

wejściu układu charakteryzującego się szerokim spektrum częstotliwościowym. Natomiast za-

daniem regulacji jest sprowadzenie (pozostawienie) układu w stanie ustalonym. Kolejnym pro-

blemem jest wprowadzenie przez regulator w zamkniętej pętli sprzężenia zwrotnego zależności

między wejściem i wyjściem układu. By uporać się z tymi problemami stosuje się trzy głów-

ne metody. Pierwsza polega na ustawieniu przez operatora pewnego dopuszczalnego marginesu,

w którym nie działałby bezpośrednio regulator, a tak zebrane dane pomiarowe posłużyłyby

do przeprowadzenia identyfikacji parametrów obiektu oraz syntezy regulatora. Drugi polega na

wprowadzeniu dodatkowego sygnału testowego. Powyższe metody nie zawsze są dopuszczalne.

Dlatego stosuje się inne podejście, polegające na detekcji zmian wartości zmiennych procesowych

z wykorzystaniem np. algorytmu Page’a-Hinkley’a.

Algorytmy adaptacyjne z estymacją parametrów regulatora dzielimy na metody bezpośred-

niej i pośredniej estymacji parametrów.

Metoda bezpośrednia

Podstawowym schematem regulacji adaptacyjnej bezpośredniej jest układ MRAC (ang. Model

Reference Adaptive Control) lub MRAS [3]. Tego typu struktury regulacji zostały zaproponowane

po raz pierwszy przez Astrom-Wittenmarka [2] i opisano je w [89, 91].

Na rys. 2.8 przedstawiono schemat układu regulatora adaptacyjnego z bezpośrednią identy-

fikacją jego parametrów [89]. Metoda polega na estymacji parametrów regulatora na podstawie

22

pomiarów różnicy wyjścia z referencyjnego modelu i sterowanego systemu z pominięciem iden-

tyfikacji modelu obiektu. Model referencyjny jest arbitralnie przyjęty jako najbardziej pożądana

odpowiedź całego układu regulacji na wartość zadaną. Dodatkowo założono bardzo wolną zmianę

parametrów sterowanego obiektu w stosunku do dynamiki pętli regulacji. Założenie to pozwala

na iteracyjne dopasowanie do przyjętego wskaźnika jakości parametrów regulatora.

Zaletą metody jest szybkość i prostota działania. Pozwalają na implementowanie rozwiązania

w systemach wbudowanych opartych o mikrokontrolery. Wadą natomiast brak modelu obiektu,

który mógłby być wykorzystany w innych podsystemach będących częścią zintegrowanego sys-

temu sterowania.

Rys. 2.8. Układ adaptacji bezpośredniej.

Najczęściej przemysłowe wdrożenia regulatora adaptacyjnego zbudowane są one w oparciu

o algorytm PID z ciągłą estymacją parametrów. Przykładem może być adaptacyjny algorytm

bezmodelowy (ang. Model-Free Adaptive, MFA) [69].

Estymacja pośrednia

Struktura regulatora z pośrednią estymacją parametrów pokazana jest na rys. 2.9. W przeciwień-

stwie do metody bezpośredniej, w tej metodzie najpierw identyfikowane są parametry modelu

sterowanego obiektu. Dopiero na ich podstawie i założonego wskaźnika jakości system dokonuje

syntezy optymalnych parametrów regulatora. Niewątpliwą zaletą jest możliwość zastosowania

parametrów zidentyfikowanego systemu do innych niż regulacja zadań. W zadaniach syntezy

korzystających z modelu obiektu sterowanego (np. LQR) jest to naturalny schemat adapta-

cji. Pomimo pewnego nakładu obliczeniowego, korzyści przemawiają za wyborem tej struktury

i będzie ona rozpatrywana w dalszej części pracy.

23

Rys. 2.9. Układ adaptacji pośredniej.

2.5. Diagnostyka procesów przemysłowych

W stosunku do instalacji przemysłowych rosną wymagania odnośnie jakości produktu końcowe-

go. Jednocześnie wymaga się, by proces technologiczny był prowadzony w sposób nieinwazyjny

i bezpieczny dla środowiska naturalnego. Powoduje to konieczność podniesienia niezawodności

nowoczesnych systemów sterowania, tak by były odporne na awarie. Podniesienie odporności na

błędy sprzętu kontrolno-pomiarowego uzyskuje się np. poprzez redundancję pomiarów i sprzętu.

Rys. 2.10. Metody detekcji uszkodzeń wykorzystujące wewnętrzny model [60].

Inną klasę problemu stanowią awarie nadzorowanego obiektu. Dla takich przypadków roz-

wija się systemy tolerujące awarie (ang. Fault Tolerant Control System, FTC). Wyposażone są

one w mechanizmy detekcji (ang. Fault Detection, FD) i wyodrębniania (ang. Fault Isolation)

24

błędów i sytuacji krytycznych rozumianych jako odchylenie od normalnej pracy instalacji [60].

Zadaniem takich systemów jest rekonfiguracja pętli sterowania i próba programowego wylicze-

nia brakujących pomiarów (procedury soft-sensoring). Bloki funkcyjne realizujące algorytmy

sensorów programowych mają zadanie wyliczenie wartości zmiennej procesowej na podstawie

znajomości modelu i pozostałych mierzalnych zmiennych procesowych (wejść i wyjść układu).

Kolejnym ważnym zagadnieniem, w którym znajdują zastosowanie identyfikowane modele dy-

namiczne, jest diagnostyka procesów przemysłowych. Metody detekcji oparte są o wewnętrzny

model matematyczny procesu. Metodami statystycznymi badane są residua, czyli różnice między

zmienną procesową pochodzącą z czujników pomiarowych, a odpowiednią jej wartością wyliczoną

na podstawie modelu [60, 63]. Pozyskanie dobrego modelu jest szczególnie ważne dla zagadnie-

nia detekcji, ponieważ wpływa na takie parametry algorytmu detekcji jak: średni czas między

fałszywymi alarmami, prawdopodobieństwo fałszywego alarmu, prawdopodobieństwo braku de-

tekcji. Jako modele stosowane są dyskretne modele regresyjne, modele ciągłe, modele rozmyte

oraz neuronowe [63].

2.6. Obserwatory

Opisane wcześniej algorytmy regulacji stanu i detekcji uszkodzeń oprócz znajomości modelu

wymagają często w swym działaniu dostępu do zmiennych stanu. Zwykle rzeczywiste obiek-

ty charakteryzują się tylko mierzalnym wyjściem, co powoduje konieczność odtwarzania stanu

obiektu. Algorytmy estymujące niemierzalny stan na podstawie modelu i pomiaru wejść i wyjść

nazywamy obserwatorami.

Obserwatory różniczkowe

Filtr Kalmana-Bucy, należący do grupy obserwatorów różniczkowych asymptotycznych, został

zaproponowany przez Kalmana w [55]. Ciągły liniowy inwariantny system dany wzorem:

x(t) = Ax(t) +Bu(t) + Lw(t)y(t) = Cx(t) + v(t),(2.1)

gdzie u(t) ∈ Rm, x(t) ∈ Rn, v(t) ∈ Rq i y(t),w(t) ∈ Rp, x(0) nieznane, znane są i mierzone u(t)i y(t). Ponadto zakłada się, że procesy stochastyczne w(t) i v(t) są białym szumem gaussowskim

o zerowej wartości średniej E(w(t)) = 0 i E(v(t)) = 0 oraz macierzach kowariancji postaci

E(v(t)v(t)T ) = Q i E(w(t)w(t)T ) = R. Procesy v(t) i w(t) są wzajemnie niezależne, czyli:

E(w(t)v(t)T ) = 0. Warunek początkowy x(t0) jest nieznanym wektorem losowym o rozkładzie

gaussowskim z zerową wartością średnią. Posiada on półokreśloną dodatnio macierz kowariancji

P(t0) = E(x(t0)x(t0)T ). Następnie konstruuje się odtwarzanie stanu x(t), tak by minimalizowana

25

była wartość wskaźnika jakości:

Jobs = limt→∞

E({x(t)− x(t)}{x(t)− x(t)}T ). (2.2)

Optymalnym rozwiązaniem jest filtr Kalmana dany równaniem:

˙x(t) = Ax(t) +Bu(t) +K(t)(y(t)−Cx(t)), (2.3)

gdzie x(0) zadawane, macierz filtru określona jest wzorem: K(t) = P(t)CTR−1 [44, 83, 80].

Natomiast macierz kowariancji jest wskazana przez rozwiązanie różniczkowego równania Ric-

catiego dla czasów bieżących:

P(t) = AP(t) +P(t)AT −P(t)CTR−1CP(t) + LQLT , (2.4)

lub odpowiedniego algebraicznego równania Riccatiego dla czasów zmierzających do nieskończo-

ności:

AP+PAT −PCTR−1CP+ LQLT = 0. (2.5)

Dla wyliczenia y(t) i x(t) estymator ten używa znanych u(t) i mierzonych yv(t) (zakłada się,

że stan x(t) jest zakłócony szumem w(t) lub zakłada się, że sterowanie jest również mierzalne

z szumem w(t)). Schemat współpracy estymatora stanu i obiektu przedstawia rys. 2.11.

Rys. 2.11. Schemat współpracy obserwatora z obiektem.

W rzeczywistych aplikacjach filtry te implementuje się w oparciu o procesory sygnałowe,

dlatego w literaturze częściej spotyka się wersje dyskretne [83, 131]. Odmienne deterministyczne

podejście z alokacją biegunów zaproponował Luenberger [71, 86].

Obserwatory całkowe

Obserwatory różniczkowe w oparciu o bieżący pomiar y i u generują bieżącą estymatę stanu dążą-

cą asymptotycznie do stanu rzeczywistego. Dokładne odtworzenie stanu jest możliwe w oparciu

o pomiar wejścia i wyjścia na skończonym odcinku czasu [0, T ]. Dla obserwowanego systemu

26

liniowego, którego wyjście dane jest wzorem:

y(t) = CeAtx(0) +∫ t0CeA(t−τ)Bu(τ)dτ (2.6)

można odtworzyć stan x(0) dokładnie na podstawie znajomości y(t) i u(t) na przedziale [0, T ]

w oparciu o formułę:

x(0) =∫ T0G1(τ)y(τ)dτ +

∫ T0G2(τ)u(τ)dτ . (2.7)

Reguły doboru odpowiednich macierzy G1(τ) i G2(τ) można znaleźć w [12, 13, 14, 15].

Inne obserwatory

W dalszej części pracy, rozdział 6.2, zostaną przedstawione dwa obserwatory stanu. Pierwszy

w swym działaniu wykorzystuje właściwości splotu, drugi korzysta z aproksymacji sygnału po-

miarowego bazowymi funkcjami sklejanymi. Propozycje tych obserwatorów zostały przedstawio-

ne w pracach [16, 20, 21, 23]. W przypadku estymatorów opartych o właściwości splotu to kolejne

pochodne sygnału odtwarzane są poprzez sploty sygnałów wejścia/wyjścia z kolejnymi pochod-

nymi specjalnie dobranej funkcji modulującej. Odmiennym i nowym podejściem jest aproksy-

macja sygnału pomiarowego funkcjami sklejanymi, następnie wyliczenie kolejnych pochodnych.

Wspólną cechą algorytmów jest odtworzenie niemierzalnego stanu x obiektu z wykorzystaniem

macierzy Toeplitza na podstawie kolejnych pochodnych sygnałów pomiarowych u i y.

2.7. Identyfikacja dynamiczna

W celu wyznaczenia modelu przyczynowego odzwierciedlającego zachowanie procesu w zagad-

nieniach diagnostyki, obserwacji i sterowania, należy przeprowadzić czynny eksperyment iden-

tyfikacji. W poprzednich rozdziałach uzasadniona została konieczność znajomości modelu ma-

tematycznego sterowanego procesu przemysłowego. Modele matematyczne możemy pozyskać na

drodze analitycznej, dokonując analizy zjawisk fizycznych zachodzących w procesie. Wykorzy-

stuje się zasady zachowania pędu, energii i masy. Często bywa, że wiedza zgromadzona na temat

procesu jest tak złożona, że otrzymany w postaci zależności matematycznych model jest zbyt

skomplikowany do zastosowania w praktyce. Dodatkowo modele analityczne wymagają przepro-

wadzenia eksperymentów w celu wyznaczenia niektórych ich parametrów. W takich przypadkach

bardziej racjonalne wydaje się zastosowanie podejścia doświadczalnego. W przypadku identyfi-

kacji parametrycznej polega ono na założeniu struktury modelu aproksymującego rzeczywisty

obiekt np. w postaci transmitancji, a następnie estymacji parametrów tej transmitancji [39].

W wyniku dezaktywacji katalizatorów, zużywania się części i maszyn, zmieniają się parametry

sterowanego obiektu oraz wpływu niemierzalnych torów zakłóceń. Dodatkowo zmiana punktu

pracy nieliniowego obiektu pociąga za sobą konieczność przeprowadzenia identyfikacji. Powo-

27

duje to, że jednokrotna identyfikacja jest niewystarczająca i powinna być ona przeprowadzana

w sposób okresowy lub nawet ciągły.

Jednym z głównych podziałów metod identyfikacji jest podział na metody czynne i bier-

ne. Metody czynne polegają na wprowadzeniu do obiektu specjalnie przygotowanych sygnałów

wymuszających. Na rzeczywistych instalacjach takie sygnały muszą spełniać wiele ograniczeń

i nie zawsze są akceptowalne. Metody bierne polegają na rejestracji wejść i wyjść z obiektu bez

możliwości celowego oddziaływania na niego.

Metody identyfikacji dzielone są także na parametryczne i nieparametryczne. Przykładem me-

tod parametrycznych będzie estymacja parametrów transmitancji założonego rzędu. Natomiast

nieparametryczne mogą być reprezentowane przez odpowiedzi na skok jednostkowy i charakte-

rystyki częstotliwościowe.

Kolejnego podziału można dokonać ze względu na dziedzinę częstotliwości i czasu. W dziedzi-

nie czasu rozróżniamy metody identyfikacji ciągłej i dyskretnej. Ze względu na naturalność imple-

mentacji, w systemach cyfrowego przetwarzania rozwijane i stosowane w automatyce kontrolno-

pomiarowej (AKP) były metody identyfikacji dyskretnej. Metody identyfikacji ciągłej były roz-

wijane i udoskonalane, lecz ze względu na praktyczne problemy i niewystarczającą moc oblicze-

niową ówczesnych systemów komputerowych nie były aplikowane. Obecnie wiele z tych ograni-

czeń sprzętowych zostało rozwiązanych tak, by móc stosować algorytmy dla systemów ciągłych

[26, 96].

W pracy przedstawiono szeroko algorytmy identyfikacji ciągłej parametrycznej dla systemu

liniowego. Przedstawione dwa algorytmy wykorzystują właściwości funkcji modulującej i skleja-

nej. Wyniki badań zostały opublikowane w [19, 20, 21, 22, 23, 92].

Identyfikacja dyskretna

Metody identyfikacji dynamicznych liniowych modeli dyskretnych szczegółowo zostały omówio-

ne w pracach Box-Jenkinsa [7], Niederlinskiego [90] oraz wielu innych [56, 67, 73, 74, 117].

Opisane algorytmy bazowały na metodzie najmniejszych kwadratów, zmiennej instrumentalnej

i największej wiarygodności. Przedstawiono warunki nieobciążalności estymatora. Dodatkowo

zostały przedstawione sposoby identyfikacji modeli obiektów ze sprzężeniem zwrotnym oraz do-

bór sygnałów wymuszających dla metod identyfikacji parametrycznej.

Identyfikacja ciągła

Zadania identyfikacji układów ciągłych wysokiego rzędu przeformułowywane są z reguły do wersji

dyskretnej. Stąd bogactwo opracowań i metod dla identyfikacji dyskretnej. W wielu procesach

technicznych pozyskanie modelu ciągłego jest jednak bardziej potrzebne i użyteczne. Model

dyskretny jest zwykle wystarczający do syntezy algorytmów regulacji. W większości zjawiska

28

fizyczne posiadają charakter ciągły i dostarczenie modeli ciągłych ma większy sens fizyczny

w postaci lepszego odzwierciedlenia zachodzących zjawisk.

Stosując algorytmy identyfikacji ciągłej minimalizujemy wpływ fluktuacji czasu dyskretyzacji

na jakość identyfikacji. Inaczej mówiąc, w algorytmach dyskretnych rozbieżności od założonego

czasu dokonania pomiaru (ang. jitter) traktowane są jako zakłócenia wartości mierzonej. Mając

zarejestrowane dokładne chwile czasowe, w których dokonano pomiaru, algorytmy identyfikacji

ciągłej są w stanie uwzględnić rozbieżności czasowe.

Metody estymacji parametrów dla ciągłych procesów możemy podzielić na dwie klasy: po-

średnią i bezpośrednią. Metoda pośrednia polega na aproksymacji oryginalnych równań różnicz-

kowych równaniami różnicowymi. Parametry są estymowane dla systemu dyskretnego w czasie

i następnie z powrotem przeliczane na oryginalne parametry systemu ciągłego. Błędy wpro-

wadzane w tej metodzie silnie zależą od zer estymowanej transmitancji dyskretnej i od prze-

biegu zmiennych procesowych pomiędzy próbkami. Dodatkowo problem stwarza wybór czasu

próbkowania wejść/wyjść tak, by zadanie identyfikacji było dobrze uwarunkowane numerycznie.

W przypadku wystąpienia zespolonych pierwiastków mianownika zidentyfikowanej transmitancji,

charakteryzujących się częścią rzeczywistą mniejszą od zera, przejście na współczynniki ciągłe

jest kłopotliwe.

Metody bezpośredniej identyfikacji układów ciągłych nie korzystają z transformacji na układ

dyskretny. Posługując się danymi wejście/wyjście z układu ciągłego bezpośrednio estymują jego

parametry. Należą do nich metody związane z filtracją stanu. Uzyskiwana ona jest poprzez fil-

trację wejścia u i wyjścia y identyfikowanego systemu przez wybrany system dynamiczny Φ(s).

Zastosowany splot u i y (formalnie na nieskończonym odcinku czasu) z impulsową funkcją przej-

ścia φ(t) ogranicza się do wybranego okna czasowego. Popełniane błędy równości lewej i prawej

strony są tym mniejsze im szybciej zanika φ(t)[98].

Przykładem może być procedura przedstawiona w [67] numerycznej identyfikacji parametrów

systemu ciągłego metodą syntezy transmitancji danej w postaci:

G(s) =B(s)

A(s)=b0 + b1s+ . . .+ bnsn

1 + a1s+ . . .+ ansn=Φ(s)B(s)

Φ(s)A(s). (2.8)

Przedstawione na rys. 2.12a parametry φ1, φ2, φ3 dobierane są tak, by zapewnić stabilność

transmitancji w oznaczonym bloku: Φ(s) = 1sn+φ1sn−1+...+φn

. Identyfikacja polega na dobraniu

takich parametrów ai i bi, dla których wartość przyjętego wskaźnika jakości będzie najmniejsza.

Następnie znalezione optymalne parametry podstawiane są zgodnie ze wzorem Φ(s) = 1Aopt(s)

.

Ponownie dokonywane jest poszukiwanie optymalnych ai i bi. Z kolejnymi iteracjami optymali-

zacji otrzymuje się zbieżność przedstawioną na rys. 2.12b.

Oprócz przedyskutowanej wcześniej wady związanej z nieskończoną odpowiedzią impulsową

funkcji przejścia Φ(s), metoda charakteryzuje się koniecznością ustawienia zwykle nieznanego

29

warunku początkowego transmitancji Φ(s) wpływającego na jakość identyfikacji. Wpływ ten za-

nika wraz z wydłużeniem czasu identyfikacji oraz zastosowanym obcięciem początkowego stałego

fragmentu w przeprowadzanych symulacjach.

Rys. 2.12. Realizacja modelu do syntezy transmitancji obiektu.

Znacznie lepszą alternatywą w klasie metod bezpośrednich jest metodologia użycia funkcji

modulujących o nośniku zwartym φ(t). Pozwala ona na zastosowanie skończonego okna obserwa-

cji, gwarantuje dokładność identyfikacji i formuły analityczne na optymalne parametry obiektu.

Zastosowanie obustronnego splotu z tą funkcją φ(t) do liniowego obiektu o nieznanych parame-

trach ai i bi:n∑i=0

aiy(i)(t) =

m∑i=0

biu(i)(t) (2.9)

i nieznanych funkcjach y(i)(t) i u(i)(t) dla i > 0, powoduje otrzymanie nowego równania obiektu,

które jest już równaniem algebraicznym o znanych wszystkich funkcjach składowych

n∑i=0

aiyi(t) =m∑i=0

biui(t) + ε(t) (2.10)

i tych samych nieznanych parametrach. Do tego systemu można już zastosować metody wyli-

czania najlepszych parametrów ai i bi, np. w oparciu o wskaźniki minimalno-kwadratowe i wy-

korzystanie macierzy Grama. Metodologia stosowania funkcji modulujących była prezentowana

w [77, 113]. Systemowe podejście i wersje optymalne przedstawiono w pracach [17, 19, 21].

Podstawowym problemem jest wybór właściwej funkcji modulującej do badanego systemu.

W niniejszej pracy autor zaproponował metodykę konstrukcji funkcji modulujących poprzez ich

30

aproksymację funkcjami sklejanymi. Wprowadzenie sparametryzowanej rodziny funkcji skleja-

nych pozwoliło na dobór (optymalny) najlepszego kształtu funkcji modulującej. Drugim proble-

mem badawczym, którego rozwiązanie przyniosło bardzo dobre efekty, było zastosowanie funkcji

sklejanych bezpośrednio do aproksymacji sygnałów wejścia i wyjścia. Otrzymanie wzorów ana-

litycznych na zaobserwowany kształt y(t) i u(t) pozwoliło na obliczenie analityczne kolejnych

pochodnych tych sygnałów. Umożliwiło to zastosowanie metod minimalno-kwadratowych na

identyfikację nieznanych parametrów ai i bi bez stosowania transformacji splotowych.

Ostatnim problemem badawczym była realizacja i analiza jakości regulatora adaptacyjnego

wykorzystującego przetransformowany stan, otrzymany z metod splotowych i wykorzystującego

oryginalny stan odtworzony metodą funkcji sklejanych.

2.8. Nowe badania

W rozdziale następnym zostanie przedstawiona splotowa metoda identyfikacji parametrów cią-

głego liniowego systemu. Następnie zostanie pokazana możliwość obserwacji stanu. Identyfikacja

i obserwacja posłużą do syntezy regulatora adaptacyjnego LQR. Metody identyfikacji, obserwa-

cji i regulacji zakładają dostęp do pochodnych sygnałów wejściowego i wyjściowego z obiektu.

Zwykle pochodne te są nie mierzalne i zachodzi potrzeba ich estymacji.

Zastosowanie funkcji modulujących do estymacji pochodnych sygnałów zostanie przedstawio-

ne w rozdziale 4. Inne podejście do estymacji pochodnych sygnału pomiarowego z wykorzysta-

niem funkcji sklejanych zostanie przedstawione w rozdziale 5. Pokaże się możliwość zastosowania

bazowych funkcji sklejanych jako funkcji modulujących o nośniku zwartym. Eksperymenty zo-

staną przedstawione na przykładzie wymiennika ciepła. Budowa i charakterystyka klasycznych

przemysłowych wymienników ciepła jest opisana w [100], ogrzewane reaktory chemiczne z prze-

pływem oscylacyjnym przedstawiono w [119]. Zastosowanie wymienników ciepła w klimatyzacji,

w szczególności obiegi chłodnicze, czynniki chłodnicze, regulacja mocy urządzeń oraz inne za-

gadnienia techniki chłodniczej przedstawiono w [62].

31

Rozdział 3

Splotowa metoda identyfikacjisystemów ciągłych

3.1. Identyfikacja z użyciem funkcji modulującej

W literaturze można spotkać opis metod identyfikacji transmitancji ciągłej [67]. Przedstawiona

w tej pracy metoda splotowa zamiast filtrów o nieskończonej odpowiedzi czasowej (ang. Infi-

nite Impulse Response, IIR) wykorzystuje filtry o skończonej odpowiedzi czasowej (ang. Finite

Impulse Response, FIR). Ogólna metoda estymacji liniowego i częściowo nieliniowego systemu

z użyciem funkcji modulujących została przedstawiona przez Shinbrota (1957). Kontynuacja

dalszych prac spowodowała dostarczenie kolejnych metod różniących się wyborem użytej funkcji

modulującej [102, 103, 104]. Metoda identyfikacji z wykorzystaniem funkcji modulujących o no-

śniku zwartym jest pozbawiona wady, jaką miały wcześniejsze metody, tzn. wpływu warunku

początkowego na jakość identyfikacji.

Metoda bezpośrednia otrzymywania parametrów polega na przetwarzaniu oryginalnych rów-

nań różniczkowych z użyciem filtrów lub innych operacji. Wśród metod w tej klasie ważną rolę

spełniają metody całkowe wykorzystujące funkcje modulujące o nośniku zwartym (o skończonej

odpowiedzi impulsowej ang. Finite Impulse Response, FIR). Mogą być one implementowane je-

dynie jako filtry cyfrowe. Ich cechą jest większy nakład obliczeniowy w porównaniu z filtrami IIR

realizowanymi metodami iteracyjnymi rozwiązań równań różnicowych. Wysoką stabilność nume-

ryczną w obliczeniach stałoprzecinkowych uzyskuje się przez zastosowanie struktur kratowych

[131]. Metody całkowe identyfikacji z funkcją modulującą charakteryzują się brakiem wrażliwości

na warunki początkowe identyfikowanego systemu oraz posiadają dobre właściwości filtracyjne.

Z uwagi na filtrujące właściwości całki metoda gwarantuje bardzo dobrą jakość identyfikacji

w obecności zakłóceń. Powyższe cechy sprawiają, że metody te są z powodzeniem stosowane dla

rzeczywistych procesów.

Praca [129] dotyczy zastosowania metod funkcji modulujących oraz metod wielokrotnego cał-

32

kowania za pomocą nieklasycznego rachunku operatorów R. Bittnera. Metodę zastosowano do

identyfikacji parametrów dynamiki statku jako modelu pierwszego rzędu oraz pokazano moż-

liwości zastosowania do identyfikacji obiektów o parametrach niestacjonarnych na przykładzie

modelu I-go rzędu dynamiki stężenia znacznika w ściekach.

3.2. Omówienie zasad identyfikacji dla obiektów SISO

Schemat poglądowy układu pomiarowego w zagadnieniu identyfikacji parametrów ciągłego sys-

temu SISO przedstawiono na rys. 3.1. Dane pomiarowe z wejść i wyjść identyfikowanego obiektu

przekazywane są do algorytmu co ∆t - czas dyskretyzacji. Zakłada się, że częstotliwość próbko-

wania jest na tyle duża, że efekt dyskretyzacji przetwornika jest pomijalny.

Rys. 3.1. Schemat poglądowy układu identyfikacji SISO z addytywnymi szumami.

Model liniowego, ciągłego procesu o jednym wejściu i jednym wyjściu (ang. Single Input

Single Output, SISO), o parametrach stałych w czasie (ang. Linear Time Invariant, LTI) ma

postać:n∑i=0

aiy(i)(t) =

m∑i=0

biu(i)(t), (3.1)

gdzie: y(i)(t), u(i)(t) są i-tą pochodną wyjścia i wejścia, ai, bi to nieznane stałe parametry modelu

o łącznej ilości n + m + 2. Zachowanie zasady przyczynowo-skutkowego zachowania modelu

wymaga by n m. Przyjęto, że dane są pomiary y(t) i u(t) na przedziale [t0, T ], gdzie T możebyć dalej rozważane jako czas bieżący. Ponadto poczyniono założenia, że warunki początkowe są

nieznane.

Model (3.1) wymaga pewnej uwagi wyjaśniającej. Można zauważyć, że przyjęto w modelu

wszystkie parametry nieznane ai, i ∈ [0, n] i bi, i ∈ [0,m]. Oznacza to, że identyfikacja będziezwiązana z najlepszym dopasowaniem obu stron równania (ang. equation error, EE), przy pew-

nych ogólnych warunkach ograniczających (aby wykluczyć rozwiązanie trywialne ai = bi = 0).

33

Powszechnym podejściem, od czasów C. F. Gaussa, jest identyfikacja tylko względem sygnału

wyjściowego y(t), przy z góry przyjętym założeniu wartości współczynnika a0 = 1 (to jest właśnie

warunek ograniczający) (ang. output error). Wszystkie znane wersje metody najmniejszych kwa-

dratów (MNK) dotyczą takiego przypadku. Metodologia EE wydaje się ogólniejsza, bo pozwala

identyfikować obiekty całkowe (a0 = 0) lub niższego rzędu niż założony (an = 0).

Problemem dla identyfikacji modelu (3.1) jest pomiar pochodnych y(i)(t), u(i)(t), zwłasz-

cza w zadaniach zakłóconych nieskorelowanymi szumami pomiarowymi νu(t) i νy(t) (rys. 3.1).

W celu uniknięcia trudności związanych z pomiarami pochodnych w (3.1) model ten zostanie

przekształcony w bardziej użyteczny poprzez transformację splotową sygnału pomiarowego na

skończonym oknie czasowym ze specjalnie dobranymi funkcjami modulującymi φ(t). Wybierając

specjalną funkcję filtrującą φ(t) ze znanymi pochodnymi φ(i)(t) można policzyć splot obu stron

modelu (3.1) o nieznanych pochodnych y(i)(t), u(i)(t) i funkcji φ(t).

Dla przyjętego liniowego, stacjonarnego oraz ciągłego system SISO n-tego rzędu o stałych

parametrach (3.1) dane są tylko ciągłe pomiary funkcji y(t) i u(t) na przedziale [t0, T ]. Zakłada

się, że y ∈ L2(t0, T ) i u ∈ L2(t0, T ). Nieznanych jest n +m + 2 parametrów ai i bi. Z powodu

nieznanych pochodnych y(i)(t) i u(i)(t) nie jest łatwo przeprowadzić bezpośrednią identyfikację

systemu (3.1). Aby ominąć te trudności, można skorzystać z własności transformacji splotowej,

poddając obie strony równania (3.1) splotowi (całkowanie każdego wyrazu) z wybraną, specjalną

funkcją filtrującą, zwaną też funkcją modulującą φ(t), o znanych również pochodnych φ(i)(t).

Zakłada się, że po wykonaniu splotu każdy wyraz sumy z lewej i prawej strony równania (3.1)

będzie tworzyć nową funkcję, również należącą do przestrzeni L2. W tym celu w dalszej części

tekstu, zostaną podane wymagania co do funkcji φ(t). Podstawową jej własnością powinno być,

że jest to funkcja o nośniku zwartym, tzn. określona i różna od zera na skończonym przedziale

(0, h), gdzie h << T−t0. Aby po wykonaniu operacji splatania równanie (3.1) zachowało równośćobu stron bez względu na warunki początkowe, muszą być też spełnione warunki zerowania się

funkcji φ(t) i jej pochodnych φ(i)(t) na brzegach nośnika. Wtedy otrzymuje się równoważny do

(3.1) model algebraiczny (3.2), w którym po lewej i prawej stronie występują sumy znanych już

funkcji yi(t) i ui(t) otrzymanych w wyniku splatania, z tymi samymi, nieznanymi parametrami

ai i bi:n∑i=0

aiyi(t) =m∑i=0

biui(t). (3.2)

Model ten umożliwia już opracowanie procedur identyfikacji. Poniżej przedstawione zostaną

szczegóły wyżej przeprowadzonych operacji i warunki ich wykonania.

3.3. Splotowa estymacja pochodnych sygnału

Wierne odtworzenie kolejnych pochodnych sygnału pomiarowego jest celem wielu metod jego

przetwarzania. Jedną z metod liniowej transformacji funkcji y jest filtracja splotowa z wybraną

34

funkcją φ. Problem stanowi poprawność doboru odpowiedniego kształtu funkcji modulującej φ(t)

przy nałożonych ograniczeniach. Ta funkcja powinna być niezerowa w przedziale [0, h], h � T

i zero na zewnątrz tego przedziału (funkcja ze zwartym nośnikiem). Z własności splotu wynika

możliwość uniknięcia konieczności liczenia pochodnych y(i) i u(i) na rzecz znanych pochodnych

φ(t). Splot generuje nowe funkcje yi(t), ui(t), dla i = 0, . . . , n(m) i czasu t ∈ [t0 + h, T ]. Z wła-ściwości splotu [8] wynika, że:

yi(t)df= [y(t) ∗ φ(t)](i) = y(i)(t) ∗ φ(t) = y(t) ∗ φ(i)(t). (3.3)

Dla specjalnie dobranych funkcji filtrujących o nośniku zwartym φ(t) ∈ Cn[0, h] oraz ciągłychpomiarów danych funkcją y(t), gdzie y(t) i φ(t) są bezwzględnie całkowalne w t ∈ [t0, T ] zachodzi:

yi(t)df= y(t) ∗ φ(i)(t) df=

+∞∫−∞

y(τ)φ(i)(t− τ)dτ (3.4)

=t−h∫−∞

y(τ)φ(i)(t− τ)dτ +t∫

t−h

y(τ)φ(i)(t− τ)dτ +∞∫t

y(t)φ(i)(t− τ)dτ . (3.5)

Ponieważ funkcja modulująca φ(t) = 0 dla t /∈ (0, h), metoda jest nieczuła na wpływ warunkówpoczątkowych na jakość identyfikacji. Pierwsza i trzecia całka w (3.5) są równe 0. Ostatecznie

z (3.3) otrzymuje się:

yi(t)df=

t∫t−h

y(i)(τ)φ(t− τ)dτ =t∫

t−h

y(τ)φ(i)(t− τ)dτ =h∫0

y(t− τ)φ(i)(τ)dτ . (3.6)

Rys. 3.2. Sploty.

Wyniki operacji splatania sygnału pomiarowego z funkcją modulującą przedstawiono na rys.

3.2. Dla bieżącego czasu t, równanie (3.6) i (3.7) reprezentuje sunące okno, przetwarzające sygnał

35

pomiarowy u i y na przedziale [0, T ]. Odpowiednio dla sygnału wejściowego otrzymujemy:

ui(t)df=

h∫0

u(i)(t− τ)φ(τ)dτ =h∫0

u(t− τ)φ(i)(τ)dτ . (3.7)

3.4. Dobór kształtu funkcji modulującej

Konieczność spełnienia równania (3.1) w klasie funkcji L2 powoduje, że sploty muszą też być

funkcjami należącymi do L2[t0+h, T ]. Wynika z tego, że funkcje φ(t) muszą posiadać odpowiednią

gładkość zerując się wraz ze swoimi pochodnymi na brzegach nośnika:

φ(i)(0) = φ(i)(h) = 0 dla każdego i = 0, . . . , n. (3.8)

Dodatkowy warunek ograniczający dobór funkcji modulującej wynika z rozwinięcia φ(t) w sze-

reg Fouriera o okresie [0, h]. Dla φ(t) poddanego transformacie sinusowej i kosinusowej powinny

występować wszystkie współczynniki rozwinięcia. W przeciwnym razie filtracja będzie usuwa-

ła z sygnału pomiarowego pewne częstotliwości, co spowoduje zubożenie informacji zawartej

w sygnale pomiarowym dla zadania identyfikacji. Wyklucza to funkcje symetryczne postaci:

φ(h

2+ t) = φ(

h

2− t) dla każdego t ∈ (0, h

2) (3.9)

oraz funkcje parzyste:

φ(h

2+ t) = −φ(h

2− t) dla każdego t ∈ (0, h

2). (3.10)

Ogólnie dla funkcji modulującej powinien zachodzić też warunek jednoznaczności splotu w prze-

dziale [0, h]. Jeżeli:

y(t) ∗ φ(t) = 0⇒ y(t) = 0 dla t ∈ [0, h]. (3.11)

Dodatkowe szczegółowe informacje dotyczące wymagań stawianych funkcją modulującym

w zastosowanym do zagadnienia identyfikacji podano w [17].

3.5. Optymalna identyfikacja

Rysunek 3.3 przedstawia schemat poglądowy metody błędu niedopasowania obustronnego rów-

nania (ang. Equantion Error, EE). Niedopasowanie może wynikać z błędów numerycznych, szu-

mów pomiarowych na rejestrowanych przebiegach u(t) i y(t) lub złym doborem rzędów modelu

36

n i m w stosunku do systemu rzeczywistego

n∑i=0

aiyi(t) =m∑i=0

biui(t) + ε(t). (3.12)

Do równania (3.2) dodano więc funkcję skalującą ε(t) ∈ L2(0, T ) wyrażającą sumacyjny efektbłędu niedopasowania równania.

Rys. 3.3. Rysunek poglądowy metody błędu niedopasowania obustronnego równania.

Norma różnicy obu stron równania została przyjęta jako wskaźnik jakości doboru parametrów

modelu

J =

∥∥∥∥∥n∑i=0

aiyi(t)−m∑i=0

biui(t)

∥∥∥∥∥L2[0,T ]

. (3.13)

Wektory funkcji yi(t), ui(t) i parametrów ai, bi zostały oznaczone odpowiednio jako c(t) i Θ:

ε(t) = cT (t)Θ =[yT (t) −uT (t)

]Θ

=[y0(t) . . . yn(t) −u0(t) . . . −um(t)

]·[a0 . . . an b0 . . . bm

]T.(3.14)

Problem minimalizacji ma postać:

minΘJ2 = min

Θ‖ε(t)‖2L2[0,T ] = minΘ

∥∥∥cT (t)Θ∥∥∥2L2[0,T ]

. (3.15)

Kwadrat normy jest iloczynem skalarnym w przestrzeni L2:

J2 =⟨cT (t)Θ, cT (t)Θ

⟩L2= ΘT

⟨c(t), cT (t)

⟩Θ = ΘTGΘ. (3.16)

Macierz Grama G jest symetryczną macierzą liczbową iloczynów skalarnych elementów wektora

37

c(t)

G =

〈y0(t), y0(t)〉 . . . 〈y0(t), yn(t)〉 − 〈y0(t), u0(t)〉 . . . −〈y0(t), um(t)〉... . . . ...

... . . . ...

〈yn(t), y0(t)〉 . . . 〈yn(t), yn(t)〉 − 〈yn(t), u0(t)〉 . . . −〈yn(t), um(t)〉− 〈u0(t), y0(t)〉 . . . −〈u0(t), yn(t)〉〈u0(t), u0(t)〉 . . . 〈u0(t), um(t)〉

... . . . ...... . . . ...

−〈um(t), y0(t)〉 . . . −〈um(t), yn(t)〉〈um(t), u0(t)〉 . . . 〈um(t), um(t)〉

, (3.17)

gdzie iloczyny skalarne w L2[h, T ]

〈yi(t), uj(t)〉 =T∫0

yi(τ)uj(τ)dτ =T∫0

[h∫0

y(τ − s)φ(i)(s)ds][h∫0

u(τ − s)φ(j)(s)ds]dτ . (3.18)

Macierz G jest symetryczna, dodatnio określona, nieosobliwa (liniową niezależność elementów

wektora c(t) gwarantują szumy pomiarowe) i posiada rzeczywiste i różne wartości własne.

3.5.1. Ograniczenie liniowe na wartość parametrów

Dla warunku normalizującego, eliminującego rozwiązanie trywialne Θ = 0 przyjmuje się ogólne

liniowe ograniczenie:

ηTΘ = 1, (3.19)

gdzie η ∈ Rn+m+2 jest dowolnym liczbowym wektorem. Jak było to powiedziane, w zagadnieniachidentyfikacji powszechnie przyjmowane jest np. a0 = 1 czyli ηT = [1, 0 . . . 0]. W celu rozwiązania

problemu optymalizacji z ograniczeniami liniowymi tworzymy funkcję Lagrange’a:

L = ΘTGΘ+ λ(ηTΘ− 1). (3.20)

Z warunku koniecznego istnienia minimum:

∂L

∂Θ= 2GΘ+ λη = 0. (3.21)

Mnożąc obustronnie równanie (3.21) przez ΘT otrzymujemy:

2ΘTGΘ+ λ = 0⇒ λ = −2ΘTGΘ. (3.22)

Z (3.21) wynika, że:

Θ = −12λG−1η, (3.23)

38

z równań (3.22) i (3.23) otrzymujemy:

λ = −12λ2ηTG−1GG−1η = −1

2λ2ηTG−1η. (3.24)

Następnie obliczamy λ różne od zera:

λ = − 2ηTG−1η

. (3.25)

Otrzymany z (3.23) i (3.25) wzór na optymalną estymatę parametrów wygląda następująco:

ΘO =G−1ηηTG−1η

. (3.26)

3.5.2. Ograniczenie kwadratowe na wartości parametrów

Inne wyniki na optymalne parametry Θ otrzymuje się przyjmując ograniczenie kwadratowe [19]:

ΘTΘ = 1. (3.27)

Parametry należą do kuli jednostkowej Θ ∈ B(0, 1). Funkcja Lagrange’a L ma postać:

L = ΘTGΘ+ λ(1−ΘTΘ). (3.28)

Z warunków koniecznych optymalności wynika:

∂L

∂Θ= 2GΘ− λΘ = 0⇒ GΘo = λΘo. (3.29)

Optymalny zestaw parametrów Θo jest wektorem własnym wmin macierzy Grama G związa-

nym z minimalną wartością własną λmin, która jest rzeczywista i dodatnia. Jest to szczególny

przypadek wzoru (3.26) dla η = wmin.

3.5.3. Wyliczenie wektorów własnych

Opis rozwiązania pełnego zagadnienia poszukiwania wektorów i wartości własnych można znaleźć

w podręcznikach do metod numerycznych [6, 59, 35, 8] oraz w dokumentacji do najbardziej

popularnych pakietów bibliotek numerycznych [1, 38, 105]. Metody te bazują na dekompozycji

macierzy na iloczyn dwóch macierzy Q i R, gdzie Q jest macierzą ortogonalną, a R jest macierzą

trapezoidalną górną. Ponadto podano uproszczenia metody dla macierzy symetrycznych, jaką

w rozważanej metodzie identyfikacji jest macierz Grama.

Przybliżone rozwiązania bazują na jednokrotnym rozwiązaniu pełnego zagadnienia własnego

dla macierzy Grama. Następnie w kolejnych iteracjach rozwiązywane są tylko odpowiednie rów-

39

nania różniczkowe, które mają zadanie śledzenia wektora własnego skojarzonego z najmniejszą

wartością własną. Postacie równań różniczkowych wraz z porównaniem ich właściwości przed-

stawiono w [18, 19].

Metoda iteracji odwrotnej jest odmianą metody potęgowej o zbieżności porównywalnej z me-

todami dekompozycji QR i LR [35] dla zagadnienia własnego. Charakteryzuje się brakiem

konieczności wyliczenia początkowego wektora własnego skojarzonego z najmniejszą wartością

własną, wystarczy wybrać początkowy wektor ‖x0‖ = 1. Cyklicznie w każdym kroku, kolejnychchwilach czasowych, wyliczana jest jedna iteracja równania:

vi+1 = (A− kiI)−1ximi+1 = ‖vi+1‖

xi+1 =vi+1mi+1, (3.30)

gdzie ki jest przesunięciem, którego dobranie blisko wartości własnej λn powoduje uzyskanie

lepszej zbieżności metody. Stosując metody potęgowe w stosunku do równań różniczkowych nie

ma problemu z wyborem metody rozwiązywania równań różniczkowych.

3.6. Rozszerzane i ruchome okno

Główne okno przetwarzające sygnały ma długość [0, T ]. Można założyć, że w zastosowaniach

on-line prawa jego strona stanie się bieżącym czasem T = t. Takie okno stanie się więc oknem

rozszerzanym. W każdej chwili czasu T = t uzyskane rozwiązanie na parametry Θ reprezentuje

stałą ich wartość w przedziale [0, T ]. W przypadku zmienności parametrów, taka metoda daje

uśrednioną ich wartość zawsze dla przedziału [0, T = t]. Należy wtedy dla ∀T = t doliczyć nowewartości końcowe splotów yi(T ) i ui(T ) oraz nowe wartości iloczynów skalarnych w macierzy

Grama.

Rys. 3.4. Porównanie obserwacji rozszerzanego (a) i okna ruchomego (b).

40

Rozszerzane okno całkowe (ang. expanded window) odpowiada rozwiązaniu równania różnicz-

kowego, gdzie wartość aktualnej chwili czasowej zależy od wartości początkowej, dynamiki układu

oraz historii/trajektorii sterowań. Wadą rozszerzalnego okna jest zbyt wolne adaptowanie się do

zmieniających warunków i brak zapominania historii, rys. 3.4. W zadaniach asymptotycznych

należy posługiwać się wtedy współczynnikiem zapominania.

By obliczyć wartość estymowanych parametrów potrzebna jest aktualna wartość macierzy

Grama. W obliczeniach rekurencyjnych na bieżąco możemy wykorzystać informację o warto-

ści macierzy Grama w poprzedniej chwili czasowej, ewentualnie kilku poprzednich wartościach

macierzy Grama, w zależności od tego, jaką metodę całkowania wykorzystujemy do policzenia

iloczynów skalarnych.

Rozszerzalne okno można wykorzystać do oszacowania minimalnej długości ruchomego okna

o stałej szerokości. Rozszerzane okno od pewnego momentu ma zgromadzoną wystarczającą

ilość informacji by poprawnie wyliczyć parametry identyfikowanego systemu. Taką szerokość

rozszerzanego okna T można uznać za wystarczającą dla uruchomienia ruchu okna. Wtedy należy

odrzucać w macierzy Grama początkowe [t−T, t] iloczyny skalarne nie wchodzące już do obliczeńokna [t − T, t]. Takie przesuwane okno o stałej szerokości T lepiej identyfikuje parametry Θ(t),które mogą być niestacjonarne.

41

Rozdział 4

Optymalizacja kształtu funkcjimodulujących

Bardzo dobrą jakość identyfikacji modeli liniowych, ciągłych w obecności zakłóceń gwarantują

metody wykorzystujące splotowe filtry z funkcjami modulującymi z nośnikiem zwartym. W tym

rozdziale zostaną przedstawione takie funkcje, a w szczególności omówione będą metody filtracji

pochodnych sygnałów w zastosowaniu do identyfikacji systemów ciągłych.

4.1. Przegląd funkcji modulujących

Do identyfikacji systemów ciągłych w dziedzinie czasu wykorzystuje się metody: momentów funk-

cyjnych Poissona (ang. Poisson moment functionals, PMF), Block Pulse Function, funkcji Wal-

sha, wielomianów ortogonalnych, ogólnych hybrydowych funkcji ortogonalnych (ang. general hy-

brid orthogolan functions), wielomianów Laguerry, momentów czasowych (ang. time moments),

delayed state variable filters, metody momentów funkcyjnych Shinbrota, funkcji modulujących

Hermita, funkcji modulujących Fouriera, modulujących funkcji sklejanych, funkcji modulujących

Hartleya.

Tabela 4.1 zawiera przegląd różnych funkcji modulujących. Problemem jest taki dobór pod-

stawowych/charakterystycznych parametrów funkcji modulującej by stanowiły one bazę do ge-

neracji całej rodziny funkcji modulujących danego typu. Takie podejście umożliwi późniejszą

optymalizację kształtu.

W dalszych rozważaniach ograniczymy się do funkcji Loeba i Cahena postaci φ(t) = tM(h−t)N , liczby M 6= N . Taka funkcja określona na przedziale [0, h] zeruje się wraz ze swoimi po-

chodnymi na brzegach przedziału wg (3.8) i ma postać dzwonu, rys. 4.1. Funkcja ta ma jedynie

dwa stopnie swobody M i N wpływania na jej kształt przy ustalonym oknie h. Zwykle taka

ilość stopni swobody okazuje się niewystarczająca w optymalizacji kształtu funkcji modulującej.

Wydaje się naturalnym rozwinięcie tej funkcji jako złożenie kilku wzajemnie poprzesuwanych

42

Tabela4.1.Przeglądfunkcjimodulującychzastosowanychwzagadnieniuidentyfikacjiparametrówsystemuciągłego.

Funkcjamodulująca

Referencje

Uwagi

φm(t):={ sin

m(nπ ht)dlat∈[0,h]

0inaczej

Shinbrot(1954,1957),

PerdreauvilleandGoodson(1996)

liniowyinieliniowysystemII-gorzędu;obiektyopa-

rametrachrozproszonych;linioweinieliniowesystemy

II-goiIV-tegorzęduoparametryzmiennewczasie

φ(t):=

{ (t−h)3

6λ4e−(t−h)/λdlat∈[−h 2,h 2]

0inaczej

PuchoviChinayev(1973)

I-gorzędusystemyzopóźnieniem

φ(t):=e−(t−h 2)2/2H0(t−h 2)

2π

Hi-funkcjaHermite-a

Takaya(1968)

II-gorzędusystemy

φ(t):={ a[1

−cos(2πth)]dlat∈[0,h]

0wprzeciwnymrazie

BruederleiWeber(1970)

II-gorzędusystemy

φk(t):=

{ (h−tk!)e−c(h−t)dlat∈[0,h]

0inaczej

k:=0,1,2,...

FairmaniShen(1970)

SahaiRao(1979,1980,1982)

rozproszonesystemyoparametrachzmieniającychsię

wczasie;II-gorzędusystemyzopóźnieniem,MIMO

2x2

φc,k(t):=

{ ∑[(n+1)/2]

j=0

ak,jcos(mk+jω0t)dlat∈[0,nh]

0inaczej

φs,k(t):=

{ ∑[n/2]

j=0b k,jsin(mk+jω0t)dlat∈[0,nh]

0inaczej

Lee(1985),

Pearson(1979,1983,1984,1985a,b)

symulowanyfiltrdolnoprzepustowy;dynamikaczujni-

ka

φ(t):={ tn

(h−t)nF(t)dlat∈[0,h]

0inaczej

F(t)::funkcjaróżniczkowalnan−1razy

LoebaiCahena(1963),

LoebaiCahena(1965),

II-gorzęduobiekty(VanderPole);linioweinieliniowe;

rozproszone;II-gorzędusystemyniestacjonarne

φn(t):=

nT ∫ 0

···nT ∫ 0

(−1)j( n j) δ(

ih−t)dntdlat∈[0,nh]

0inaczej

Maletinsky(1976,1978)

Metzger(1982,1983)

Preisig(1984)

Presig(1988,1989,1990)

II-gorzędusystemylinioweinieliniowe;dynami-

kaźrenic;II-gorzędunieliniowesystemyelektro-

mechaniczne;użytowobserwacjisystemówliniowych

inieliniowych;nieizotermicznywsadowyreaktorzli-

niowąinieliniowąreakcją;

φ(t)=

{ ∑n i=0(−1)i(n i)(cas(n+m−j)2π Tt0<t¬T

0inaczej

cas(t)=cos(t)+sin(t),m=0,±1,±2,...

PatraiUnbehauen(1995)[96]

Daniel-BarheiUnbehauen(1999)[26]

zastosowaniefunkcjimodulującychHartlejadoiden-

tyfikacjisystemównieliniowychnp.silnikaDC

φ(t)=∑ N−

k−1

i=0

diBk i(t)

Bk i(t)-wielomianbazowy

ByrskiiNowak(2005)

użytowidentyfikacjiiobserwacjisystemówliniowych

φ(t):=

{∑n i=0(hpi−t i)n i(hki−t i)m iai(ti)dlat i∈[hpi,hki]

0inaczej

ai-współczynniki,hpi,hki∈[0,h]

WielokrotnefunkcjeLoebaiCahena

użytowoptymalizacjikształtufunkcjimodulujących

wzagadnieniuidentyfikacjiiobserwacjisystemówli-

niowych

43

funkcji Loeba i Cahena. Oprócz samego zwielokrotnienia ilości parametrów M i N dostajemy

możliwość skalowania poszczególnych funkcji, co znacząco wpływa na ostateczny kształt funkcji

modulującej φ.

Rys. 4.1. Przykład funkcji Loeba i Cahena dla N = 4, M = 5 i h = 3.

Uogólnionym pomysłem kilku wzajemnie poprzesuwanych funkcji Loeba i Cahena jest zasto-

sowanie jako funkcji modulujących bazowych funkcji sklejanych. Bazowe funkcje sklejane mogą

stanowić bazę służącą do generacji krzywych wielomianowych założonego stopnia.

4.2. Bazowe funkcje sklejane

Zaprezentowane zostanie zastosowanie bazowych funkcji sklejanych jako funkcji modulujących.

Krzywe Beziera s(t) budowane w oparciu o wielomiany Bersteina Bni [58] mają postać:

s(t) =n∑i=0

piBni (t) (4.1)

gdzie:

Bnidf=(n

i

)ti(1− t)n−i dla i = 0, · · · , n. (4.2)

Wielomiany Bni (t) są liniowo niezależne. Krzywe Beziera stanowią szczególny przypadek krzy-wych B-sklejanych.

Wielomianowe krzywe oraz płaty powierzchniowe realizowane z wykorzystaniem wielomia-

nów Bersteina charakteryzują się w zastosowaniach praktycznych pewnymi wadami. Przykła-

dowo, przesunięcie punktu kontrolnego powoduje konieczność zmiany całej krzywej albo płata.

44

W praktyce objawia się to niemożnością wprowadzenia lokalnych zmian. Modelowanie skom-

plikowanych kształtów wymaga stosowania wielomianów wysokiego stopnia. Numerycznie ob-

liczenie współczynników krzywej Beziera dla wysokiego rzędu wielomianu jest skomplikowane

i kłopotliwe w systemach komputerowych. Powstają błędy numeryczne oraz dla równania (4.2)

współczynniki dwumianu Newtona szybko przekraczają zakres liczb 32 bitowych [58].

Pomysłem na rozwiązanie powyższych problemów są krzywe złożone z wielu łuków wielo-

mianowych niskiego rzędu. Takie krzywe zwane są krzywymi sklejanymi. Krzywe B-sklejane

stanowią uogólnienie krzywych Beziera i są chętnie stosowane w zagadnieniach interpolacji oraz

aproksymacji dla krzywych i powierzchni.

Funkcje sklejane mogą być wykorzystane do optymalizacji funkcji filtrujących o nośniku zwar-

tym. Umożliwiają łatwiejsze konstruowanie funkcji modulujących przy zachowaniu ograniczeń,

jakie nakłada metoda splotowa identyfikacji. Dodatkowo uzyskujemy wiele parametrów moż-

liwych do wykorzystania w procesie optymalizacji kształtu funkcji modulującej. W rozdziale

zostaną przedstawione bazowe funkcje sklejane (ang. base spline) budowane w oparciu o pewną

klasę funkcji wielomianowych.

W literaturze można spotkać funkcje sklejane budowane w oparciu o funkcje wielomianowe,

funkcje wykładnicze, funkcje trygonometryczne [77, 102]. Funkcje sklejane znajdują zastosowanie

w zagadnieniu interpolacji i aproksymacji punktów pomiarowych dla krzywych i powierzchni.

W dalszej części pracy ograniczono się tylko do zagadnienia aproksymacji, gdyż właśnie to zagad-

nienie znajduje zastosowanie w budowie regulatora adaptacyjnego. Z uwagi na klasę sygnałów

spotykanych w automatyce użycie wykładniczych funkcji sklejanych powinno przynieść lepsze

efekty w postaci zmniejszenia błędu zagadnienia aproksymacji.

4.2.1. Krzywe B-sklejane

Poniżej zostaną opisane ogólne właściwości bazowych funkcji sklejanych. Funkcja sklejana S(t)

dla t ∈ [ti, ti+1] jest opisana:

s(t) = di0 + di1(t− ti) + di1(t− ti)2 + . . .+ din(t− ti)n

=n∑j=0

dij(t− ti)j dla i = 1, 2, . . . , N − 1, (4.3)

gdzie dij to współczynniki skalujące, N jest ilością węzłów, n jest stopniem wielomianu aprok-

symującego. Z uwagi na problemy nieciągłości pochodnych wynikłe z błędów numerycznych po-

wstałych w trakcie sklejania powyższych wielomianów, zrezygnowano z przedstawionego wyżej

wzoru. Wielomianowe funkcje sklejane zostały zastąpione unormowanymi bazowymi funkcjami

sklejanymi, które z uwagi na swoje właściwości gwarantują swobodę wyboru węzłów i ciągłość

założonego rzędu.

Funkcje modulujące i rzeczywiste sygnały pomiarowe mogą przyjmować zbyt skomplikowane

45

kształty by przybliżyć je pojedynczym wielomianem. Stopień takiego wielomianu k musiałby być

zbyt wysoki, co powodowało by w praktyce dużą komplikację obliczenia jego współczynników [58].

Zastosowanie funkcji sklejanych s(t) umożliwia podzielenie tych krzywych na mniejsze fragmenty,

które jesteśmy w stanie przybliżyć wielomianem znacznie niższego stopnia (rys. 4.2).

Rys. 4.2. Przykład bazowych funkcji sklejanych, N = 10, k = 3.

Przyjmujemy niemalejący ciąg N punktów kontrolnych ui, zwanych dalej węzłami funkcji

sklejanej (i - nr węzła), takich że:

u0 ¬ u1 ¬, . . . ,¬ uN−1 ¬ uN dla N > k. (4.4)

Węzły gwarantują ciągłość krzywej s(t) wraz z pochodnymi co najmniej rzędu k − r, gdzier jest krotnością występowania węzła. Krotność występowania tego samego węzła na końcach

krzywej narzuca dodatkowe ograniczenia na wartości kolejnych pochodnych w tym punkcie.

s(t) =N−k−1∑i=0

diBki (t), (4.5)

gdzie di są współrzędnymi w bazie funkcji Bki (t) przestrzeni wielomianów stopnia nie większego

niż k danej zależnością:

Bki (t)def= (−1)k+1(ui+k+1 − ui)Mki (t) (4.6)

46

dla i = 0, . . . , N − k − 1, gdzie:

Mki (t) = gk[ui, . . . , ui+k+1] (4.7)

jest różnicą dzieloną funkcji g o postaci:

gk[ui] = gk(ui) (4.8)

gk[ui, . . . , ui+k+1] =gk[ui . . . ui+k]− gk[ui+1 . . . ui+k+1]

ui − ui+k+1. (4.9)

Postać jawna (nierekurencyjna) dla funkcji różnicy dzielonej dowolnego rzędu:

gk[ui, . . . , ui+k+1] =i+k+1∑j=i

gk(uj)∏l=i,...,i+k+1l 6=j

(uj − ul). (4.10)

Funkcja gk(ui) nazwana jest obciętą funkcją potęgową:

gk(ui) = (t− ui)k+ , (4.11)

którą definiujemy jako:

(t− ui)k+def=

0 dla t < ui

1 dla t 0, k = 0(t− ui)k dla t ui, k > 0

. (4.12)

W praktyce można zaproponować łatwiejszą postać algorytmu dla generacji zbioru funkcji

bazowych (4.6) - (4.12). Algorytm opiera się o wzór rekurencyjny Manfielda-de Boora-Coxa

[58, 87], dla k = 0:

B0i (t) =

1 dla t ∈ [ui, ui+1]0 w przeciwnym razie(4.13)

dla k > 0 wzór rekurencyjny:

Bki (t) =t− ui

ui+k − uiBk−1i (t) +

ui+k+1 − tui+k+1 − ui+1

Bk−1i+1 (t). (4.14)

47

4.2.2. Wybrane właściwości wielomianów bazowych

Przedstawiane funkcje bazowe zwane są również unormowanymi funkcjami sklejanymi. Właści-

wość ta wynika z właściwości rozkładu globalnego:

N−k−1∑i=0

Bki (t) = 1 dla każdego t ∈ [uk, uN−k), (4.15)

oraz rozkładu lokalnego:

l∑i=l−k

Bki (t) = 1 dla każdego t ∈ [ul, ul+1), (4.16)

dla l = 1, . . . , N − n− 1.Pochodne funkcji bazowych mogą być policzone analitycznie. Aproksymacyjne zastosowanie

funkcji sklejanych generuje też oryginalne pochodne stanu i ma charakter filtrujący [25, 58, 92].

Wartość pochodnej funkcji Bki (t) dla k 1 dana jest wzorem: 1

Bki (t) =d

dtBki (t) =

k

ui+k − uiBk−1i (t)−

k

ui+k+1 − ui+1Bk−1i+1 (t). (4.17)

Rys. 4.3. Przykład funkcji modulującej zbudowanej przy pomocy bazowych funkcji sklejanych.

Krzywe Beziera są szczególnym przypadkiem krzywych B-sklejanych. Bazowe funkcje sklejane

1Dowód wzoru można znaleźć w [58] rozdział ”Pochodne krzywej B-sklejanej” na stronach 185-187.

48

w zastosowaniu do budowy funkcji modulującej muszą spełniać ograniczenia stawiane funkcjom

modulującym:

s(t) ∈ Cn[0, h]. (4.18)

Z (4.18) i (4.5) wynika, że

Bki (t) ∈ Cn[0, h]. (4.19)

Przyjmując w powyższym założeniu stopień ciągłości równy stopniowi wielomianu bazowego

k = n wymagana jest jednokrotność węzłów, rys. 4.3. Rozmieszczenie węzłów ui oraz współczyn-

niki skalujące di mogą zostać wykorzystane w procesie optymalizacji kształtu funkcji modulują-

cej.

4.3. Optymalizacja kształtu funkcji φ(t)

Podstawowym nie rozwiązanym dotychczas problemem badawczym było pytanie „jak dobór

kształtu funkcji modulującej φ(t) wpływa na poprawę dokładności identyfikacji”? Można po-

stawić tezę, że kształt najlepszej funkcji φ(t) będzie uzależniony od widma zakłóceń obecnych

w pomiarach u i y. W pracy proponuje się wprowadzenie drugiego etapu, w którym użycie

pomocniczego wskaźnika jakości umożliwi dobór optymalnego kształtu funkcji modulującej.

Zaproponowano dobór kształtu funkcji modulującej przed przystąpieniem do procedury iden-

tyfikacji. Jeżeli zakłócenia pomiarowe będą niewielkie, to kształt funkcji φ nie odgrywa decydu-

jącej roli dla dokładności identyfikacji [21]. Natomiast kształt φ ma znaczący wpływ na sygnał

y0(t) po filtracji. Sygnał y0(t) jest wykorzystywany w budowie obserwatora stanu i algorytmie

adaptacyjnego regulatora. Z tego powodu zależy nam na wierności odtwarzania sygnału y0(t)

w stosunku do sygnału oryginalnego y(t). Jako kryterium jakości wybrano:

J(d) =T∫h

(y(t)− y0(t))2dt =T∫h

(y(t)− y(t) ∗ φ(t, d))2dt. (4.20)

Następnie dobieramy parametry d filtru φ(t, d) poprzez minimalizację:

mind(J(d)). (4.21)

Proces optymalizacji jest przeprowadzany numerycznie z użyciem metody Newtona. W pracy

jako przybliżenie funkcji modulujących wykorzystano bazowe funkcje sklejane. Funkcje te speł-

niają ograniczenia nałożone na właściwości funkcji modulujących przy założeniu jednokrotności

węzłów.

49

Rozdział 5

Funkcje sklejane w identyfikacjiparametrów systemu dynamicznego

Następnym ważnym tematem badawczym rozważanym w niniejszej pracy jest zastosowanie bazo-

wych funkcji sklejanych do bezpośredniej aproksymacji pochodnych sygnałów wejścia i wyjścia.

Metoda odtwarza oryginalne pochodne sygnału wejściowego i wyjściowego, co umożliwia konstru-

owanie algorytmów obserwacji stanu. Ponadto zostanie przedstawiony inny algorytm identyfikacji

z wykorzystaniem aproksymacyjnych właściwości funkcji sklejanych.

5.1. Metoda najmniejszych kwadratów

Zadaniem wykorzystanym w identyfikacji jest dopasowanie krzywej do danych pomiarowych.

Aby takie dopasowanie było poprawne należy poczynić założenia:

� liczba punktów pomiarowych jest znacznie większa niż liczba szukanych parametrów,

� sygnały pomiarowe są zakłócone szumem białym o rozkładzie normalnym.

Takie założenia powodują niemożność zastosowania krzywych interpolacyjnych. Zawierały-

by one zbyt dużo koniecznych do przechowania i przetwarzania parametrów. W dodatku sama

krzywa byłaby zbyt pofałdowana co pogarszało by jakość wyliczonej pochodnej, potrzebnej w za-

daniu identyfikacji. Lepiej skonstruować krzywą, której równanie (4.5) w przybliżeniu przechodzi

przez punkty pomiarowe. To zagadnienie jest typowym zagadnieniem aproksymacyjnym.

W celu wyliczenia parametrów di skalujących wielomiany bazowe (4.5) w zagadnieniu aprok-

symacji, stosuje się metodę najmniejszych kwadratów. W aproksymacji liczba pomiarów jest

znacznie większa niż liczba szukanych parametrów, tzn. układ jest nadokreślony i nie ma na ogół

dokładnych rozwiązań. Duża liczba pomiarów jest korzystna ze względu na szumy pomiarowe,

zakłócenia i niedokładność modelu. Dodatkowe dane pomagają poprawić dokładność estyma-

cji. Dla dokonanych pomiarów yj w chwilach tj zwykle minimalizowany jest średniokwadratowy

50

wskaźnik jakości dla m próbek pomiarowych:

J =1m

m∑j=1

(yj − yj)2. (5.1)

Aproksymacja liniowa określona jest wzorem:

yj =N−k−1∑i=0

diBki (tj). (5.2)

gdzie Bki (tj) jest funkcją bazową (4.6). Powyższe równanie w zapisie macierzowym:

y =[y1 . . . ym

]T1×m= Bd. (5.3)

Macierz B zbudowana jest z wyliczonych wartości poszczególnych wielomianów bazowych

Bki (t) w chwilach pomiarowych tj:

B =

Bk0 (t1) · · · BkN−k−1(t1)... . . . ...

Bk0 (tm) · · · BkN−k−1(tm)

m×(N−k)

. (5.4)

Składowymi wektora d są współczynniki skalujące jak we wzorze (4.5):

d =[d0 . . . dN−k−1

]T1×(N−k)

. (5.5)

Pierwszym krokiem algorytmu określanym a priori na podstawie analizy zjawiska fizycz-

nego lub przeprowadzanej kilkakrotnie optymalizacji, jest wybór N węzłów ui zgodnie z (4.4)

oraz stopnia k wielomianu (4.6). Stopień wielomianu k powinien być tak dobrany by zapewnić

wymaganą ciągłość funkcji aproksymującej. Wybrane węzły pozwalają na wyliczenie wartości

wielomianów bazowych zgodnie z wzorem Mansfielda-de Boora-Coxa (4.13) i (4.14).

Następnym krokiem algorytmu jest wyliczenie parametrów di stanowiących przybliżone roz-

wiązanie (5.2) tak by minimalizowana była wartość wskaźnika (5.1).

Z warunku koniecznego istnienia ekstremum funkcji wielu zmiennych:

∂J

∂dl= 0 dla każdego l = 0, . . . , N − k − 1 (5.6)

otrzymujemy układ N − k równań liniowych z N − k niewiadomymi di:

∂J

∂dl=−2m

m∑j=1

[yj −N−k−1∑i=0

diBki (tj)]B

kl (tj) = 0. (5.7)

51

zwany układem normalnym. Powyższy układ ma współczynniki di różne od zera i jego rozwią-

zanie dla zebranych pomiarów:

y =[y1 . . . ym

]T1×m= Bd. (5.8)

Daje ono minimum wskaźnika J ponieważ funkcje bazowe Bki (tj) tworzą bazę pewnej przestrzeni.

Macierz B jest prostokątną i niemożliwe jest odwrócenie jej by znaleźć parametry d. Dlatego

należy obustronnie pomnożyć równanie przez BT :

BTy = BTBd. (5.9)

Powyższa postać umożliwia dokonanie mnożenia obustronnego przez (BTB)−1 i w efekcie

otrzymujemy wzór na poszukiwane parametry (metoda najmniejszych kwadratów):

d = (BTB)−1BTy. (5.10)

Mając wyliczone parametry d możemy zapisać wzór krzywej aproksymującej:

y = B(BTB)−1BTy. (5.11)

W powyższym wzorze wyrażenie B(BTB)−1BT jest stałe dla wybranych a priori funkcji ba-

zowych. Przy założeniu stałego wymiaru m wektora y i przesuwnego okna wzdłuż zebranych

pomiarów, o liczbie większej niż m, otrzymujemy efekt filtracji o skończonej odpowiedzi impul-

sowej FIR.

W zagadnieniu identyfikacji i obserwacji stanu potrzebna jest znajomość niemierzalnej po-

chodnej sygnału pomiarowego, której policzenie dla sygnału zaszumionego jest trudne i obarczone

dużymi błędami. Z powyższych względów wygodniejsze jest policzenie pochodnej dla aproksy-

maty:

˙y =dBdtd = Bd =

Bk0 (t1) · · · BkN−k−1(t1)... . . . ...

Bk0 (tm) · · · BkN−k−1(tm)

d, (5.12)

gdzie Bki (t) dane jest wzorem (4.17).

Wybór węzłów ui krzywej jest bardzo istotny bo od tego zależy jakość aproksymacji sygnału

pomiarowego. Zbyt mała ilość węzłów lub złe ich rozmieszczenie może powodować zbyt zgrub-

ne przybliżenie. Natomiast zbyt duża liczba węzłów może powodować powstawanie zafalowań

krzywej.

Ponadto wybór rozmieszczenia węzłów przed dokonaniem aproksymacji umożliwia zastoso-

wanie liniowej metody najmniejszych kwadratów do jednoznacznego wyliczenia parametrów d.

52

Tak postawione zadanie zwane jest w literaturze regularnym. Natomiast brak wyboru węzłów

prowadzi do zagadnienia nieregularnego posiadającego nieskończenie wiele rozwiązań i znacz-

nie trudniejszego do rozwiązania. W praktyce wystarcza równomierne rozmieszczenie węzłów

o liczbie kilkakrotnie mniejszej niż liczba próbek m sygnału pomiarowego.

Z uwagi na powstające błędy numeryczne równanie (5.10) nie jest wyliczane zgodnie ze

wzorem. Zamiast tego stosuje się metodę z użyciem rozkładu ortogonalno-trójkątnego macierzy

albo w przypadku słabych uwarunkowań numerycznych dekompozycję na wartości singularne.

5.2. Uogólniona metoda najmniejszych kwadratów

Stosowanie w praktyce kryterium (5.1) powoduje problemy z gładkością krzywej, w szczególności

przy zbyt dużej liczbie węzłów ui określanej przed przystąpieniem do algorytmu najmniejszych

kwadratów (5.10). Ponadto brak jest parametru wpływającego na filtrację dla wybranego rozkła-

du węzłów funkcji sklejanej. Dlatego dobór współczynników di funkcji sklejanej y(t) zrealizowano

w oparciu o kwadratowy wskaźnik jakości z wygładzaniem [41]:

J =1m

m∑j=1

(yj − yj)2 + γ · E(T ), (5.13)

gdzie yj to próbki pomiarowe sygnału y(t) w chwilach ti, yj – aproksymowane wartości sygnału

y(t) otrzymane z zastosowania funkcji sklejanych w chwilach ti, m – liczba próbek pomiarowych

w horyzoncie czasowym, T – aproksymowany horyzont czasowy. Parametr wygładzający γ po-

maga poprawić ciągłość pochodnej drugiego rzędu. Stanowi on kompromis pomiędzy bliskością

krzywej do punktów pomiarowych a gładkością tej krzywej. Ciągłość ta wiąże się z ciągłością

krzywizny.

Pierwsza część tego kryterium jest dobrze znaną metodą najmniejszych kwadratów. Nato-

miast druga część to funkcjonał E(T ) opisujący energię potencjalną krzywej y(t); można powie-

dzieć, że jest to „energia sprężystości wygiętej listwy” o kształcie danym funkcją y(t):

E(T ) =T∫0

[y(2)(t)]2dt, (5.14)

gdzie y(2) – druga pochodna z postaci y(t) funkcji sklejanych (spotykane są w literaturze również

pochodne wyższych rzędów).

Dla serii danych pomiarowych zebranych co stały krok dyskretyzacji ∆t, zmodyfikowany

w celu uproszczenia dalszych obliczeń, wzór (5.13) i (5.14) został zapisany w następujący sposób:

J =1m

m∑j=1

(yj − yj)2 + γm∑j=1

(y(2)j (∆t)2)2. (5.15)

53

Problemem jest nieznana wartość drugiej pochodnej yi w powyższym wyrażeniu, którą przy-

bliżamy różnicą skończoną:

y(2)j =

1(∆t)2

(yj−1 − 2yj + yj+1). (5.16)

Powyższy schemat różniczkowania został otrzymany poprzez rozwiązanie układu równań roz-

winięcia w szereg Taylora względem pochodnych yi(1) i yi(2): yj−1 = yj − ∆t1! y(1)j +

(∆t)2

2! y(2)j

yj+1 = yj + ∆t1! y(1)j +

(∆t)2

2! y(2)j

(5.17)

Ostatecznie wskaźnik jakości (5.15) po dokonanych przekształceniach oraz zmniejszeniu gra-

nic sumowanie wynikłego z zastosowania różnic skończonych:

J =1m

m∑j=1

(yj − yj)2 + γm−1∑j=2

(yj−1 − 2yj + yj+1)2. (5.18)

Tak przekształcony wskaźnik jakości zapisano w postaci macierzowej:

J =1m‖y− y‖2 + γ‖Hy‖2, (5.19)

gdzie:

y =

y1

y2...

ym

, y =

y1

y2...

ym

, H(m−2)×m =

1 −2 1 0 0 · · · 00 1 −2 1 0 · · · 0... . . . . . . . . . . . . . . .

...

0 · · · 0 1 −2 1 0

0 · · · 0 0 1 −2 1

. (5.20)

Jako funkcje aproksymujące wybieramy wielomiany bazowe (5.2) zapisane w postaci macie-

rzowej (5.3):

J =1m(y−Bd)T (y−Bd) + γdTBTRBd, (5.21)

gdzie R = HTH.

Optymalną minimalną wartość poszukiwanego wektora d znajdujemy z warunku koniecznego

istnienia ekstremum (5.6) otrzymując równanie:

− 2mBT (y−Bd) + 2γBTRBd = 0. (5.22)

Po wyprowadzeniu dostajemy d:

d = (mγBTRB+BTB)−1BTy = (mγRB+B)−1y. (5.23)

54

W konsekwencji otrzymujemy:

y = B(mγRB+B)−1y. (5.24)

Wyrażenie B(mγRB+B)−1 jest stałe dla założonego parametru wygładzania γ, rzędu oraz

rozkładu węzłów funkcji sklejanej B. Podobnie jak w metodzie najmniejszych kwadratów, dla

przesuwnego okna otrzymujemy efekt filtracji FIR oraz możliwe jest policzenie pochodnej funkcji

aproksymującej zgodnie ze wzorem (5.12). Filtry o skończonej odpowiedzi impulsowej w stosunku

do filtrów o nieskończonej odpowiedzi impulsowej charakteryzują się znaczną liczbą parametrów.

Powoduje to trudności w poprawnym dobraniu wartości tych parametrów. Przedstawiona meto-

dologia doboru parametrów dla filtrów typu FIR upraszcza ten proces.

Dobór współczynnika wygładzania γ

W dokumentacji technicznej pakietów wyliczających wielomiany sklejane [82] spotyka się pro-

pozycję doboru parametru γ = 1/(1 + (∆t)3/6), gdzie ∆t jest średnim odstępem między prób-

kowanymi danymi. Dla danych jednostajnie próbkowanych zaleca się γ = 1/(1 + (∆t)3/60).

Próbę analitycznego wyprowadzenia parametru przedstawiono w pracy [25]. Rozwiązanie po-

stawionego problemu optymalizacji jest nieliniowe. Ibrib w [49] zaproponował algorytm, w któ-

rym wykorzystał metodę Newtona [9, 34, 40, 111, 110, 65] do rozwiązania problemu optymali-

zacji.

Rys. 5.1. Wpływ współczynnika wygładzania γ na kształt krzywej.

Rysunek 5.1 pokazuje zmianę kształtu krzywizny aproksymującej punkty w zależność od

wartość parametru γ. Dobór parametru γ jest realizowany poprzez minimalizacje kryterium

55

GCV (ang. Generalized Cross-Validation ) [49, 92]. W praktyce jego wartość kształtuje się na

poziomie 0, 001.

5.3. Identyfikacja z wykorzystaniem funkcji sklejanych

Rozdział przedstawia metodę identyfikacji parametrów ciągłego systemu liniowego. Dla aproksy-

macji kolejnych pochodnych funkcji wejścia i wyjścia wykorzystuje się bazowe funkcje sklejane.

Następnie znalezione współczynniki bazowych funkcji sklejanych służą do wyliczenia iloczynów

skalarnych będących elementami liczbowej symetrycznej macierzy Grama. Optymalne parame-

try są uzyskiwane jako wektor własny skojarzony z najmniejszą wartością własną odpowiedniej

macierzy Grama. Metoda odtwarza również niemierzalny stan układu, który jest wykorzystany

w zadaniu regulacji.

Rys. 5.2. Porównanie schematów identyfikacji splotowej i sklejanej

Na rys. 5.2 przedstawiono blokowy schemat poglądowy porównujący etapy działania algoryt-

mów identyfikacji splotowej i sklejanej. W przypadku identyfikacji sklejanej możliwe jest wypro-

wadzenie wzorów analitycznych na wartości poszczególnych współczynników macierzy Grama.

Wskaźnik jakości (5.1) zastosowano w doborze parametrów di funkcji sklejanej (4.5) aprok-

symującej próbki pomiarowe sygnału wejściowego u(t) i wyjściowego y(t) (rys. 3.1).

W literaturze można znaleźć wiele przykładów zastosowań funkcji sklejanych w problemie ste-

rowania procesami. Dotychczas wykorzystywano funkcje sklejane do interpolacji wartości funkcji

w dyskretnych punktach symulowanych i pomiarowych, np. modelowania krzywych i powierzch-

ni, śledzenia trajektorii ruchomych obiektów [87]. Niniejszy rozdział przedstawia ich przydatność

do identyfikacji ciągłego układu przez aproksymację wartości sygnału pomiarowego wraz z po-

chodnymi, obserwacji stanu układu w zastosowaniu do regulacji LQR obiektów SISO.

56

Rozdział 6

Regulator adaptacyjny

W rozdziale zostanie przedstawiona koncepcja budowy regulatora LQR z adaptacją pośrednią.

Wykorzystuje on w swym działaniu metody identyfikacji parametrów i obserwacji stanu.

6.1. Obserwator bazujący na macierzy Toeplitza

Wyprowadzenie równania na obserwator stanu pokażemy na przykładzie rzędu 3. Dana standar-

dowa postać obserwowalna:x1

x2

x3

=0 0 −a0

a3

1 0 −a1a3

0 1 −a2a3

x1

x2

x3

+b0a3b1a3b2a3

u (6.1)

y =[0 0 1

] x1

x2

x3

(6.2)

podstawiając za y i y:

y = x3 (6.3)

y = x3 = x2 −a2a3x3 +

b2a3u (6.4)

y = x3 = x2 −a2a3x3 +

b2a3u (6.5)

= x1 −a2a3x2 + (

a22a23− a1a3)x3 + (

b1a3− b2a2

a23)u+

b2a3u, (6.6)

57

otrzymanym w zapisie macierzowym:

y

y

y

=0 0 1

0 1 −−a2a3

1 −a2a3

a22a23− a1a3

︸︷︷︸

Cd

x1

x2

x3

+

0 0b2a3

0b1a3− b2a2a23

b2a3

︸︷︷︸

Dd

u

u

. (6.7)

Następnie wprowadzamy nowe oznaczenia na macierze współczynników modelu

y = Cdx+Ddu. (6.8)

Macierz Cd jest nieosobliwa, co pozwala nam ją odwrócić by uzyskać ostatecznie stan:

x = C−1d y −C−1d Ddu (6.9)

C−1d = H1 =1a3

a1 a2 a3

a2 a3 0

a3 0 0

,C−1d Dd = H2 = 1a3b1 b2

b2 0

0 0

. (6.10)

Przy znanych przebiegach sygnałów y, y i y - z równania (6.9) można odtworzyć stan x(t).

6.2. Algorytm obserwacji stanu

Równanie modelu (3.1) można przedstawić w postaci równania stanu wraz z równaniem wyjścia:

x(t) = Ax(t) +Bu(t)y(t) = Cx(t)(6.11)

Macierze w (6.11) są dobrane w postaci Frobeniusa gwarantującej obserwowalność stanu:

A =

0 . . . . . . 0 − a0an

1 . . ....

...

0 . . . . . ....

...... . . . . . . 0

...

0 . . . 0 1 −an−1an

n×n

B =

b0an...bn−1an

n×1

C =[0 · · · 0 1

]1×n.

(6.12)

58

Z równania (3.1) i (6.12) można otrzymać następującą postać wektora stanu – równoważną

w sensie dystrybucyjnym stanowi z (6.11) i wykorzystującą pochodne wejść i wyjść.

x(t) = H1

y(0)(t)

y(1)(t)...

y(n−1)(t)

n×1

−H2

u(0)(t)

u(1)(t)...

u(n−2)(t)

n−1×1

, (6.13)

gdzie H1 i H2 są macierzami Toeplitza zawierającymi zidentyfikowane parametry systemu o po-

staci:

H1 =1an

a1 . . . an−1 an

a2 . . . an 0... ... ... ...

an 0 . . . 0

n×n

, H2 =1an

b1 . . . bn−2 bn−1

b2 . . . bn−1 0... ... ... ...

bn−1 0 . . . 0

n×(n−1)

. (6.14)

Równanie (6.13), jakkolwiek mało znane i używane ze względu na konieczność dostępu do

pochodnych sygnałów, jest w pełni przydatne w naszym rozwiązaniu. Pochodne sygnałów wej-

ściowych i wyjściowych, jak również same sygnały u i y uzyskuje się przy pomocy funkcji mo-

dulujących lub sklejanych. W ten sposób po podstawieniu tych danych do algorytmu (6.13)

otrzymuje się sygnał x(t), który jest estymatą stanu oryginalnego x(t).

x(t) = H1

y(0)(t)

y(1)(t)...

y(n−1)(t)

n×1

−H2

u(0)(t)

u(1)(t)...

u(n−2)(t)

(n−1)×1

. (6.15)

W przypadku przetwarzania u i y metodą splotów z funkcją φ otrzymuje się y(i)(t) = yi(t),

u(i)(t) = ui(t). Stan x(t) reprezentuje wtedy liniową transformację stanu oryginalnego x(t) ∗y(t) = x(t). Splotowi poddaje się obie strony równania (6.13). W przypadku aproksymacji

bezpośredniej funkcji y(i)(t) i u(i)(t) w (6.13) funkcjami sklejanymi, otrzymuje się funkcje y(i)(t)

i u(i)(t) w (6.15).

6.3. Adaptacyjny regulator liniowo-kwadratowy

W przedstawionym rozwiązaniu zakładamy, że sterowanie jest proporcjonalne do stanu x(t)

u(t) = −Kx(t). (6.16)

59

Układ równań po zamknięciu pętli sprzężenia zwrotnego ma postać:

˙x(t) = (A−BK)x(t) = Azx(t). (6.17)

Zastosowanie splotów lub funkcji sklejanych umożliwia jednoczesną identyfikację parametrów

układu ciągłego i estymację stanu x. Przedstawione rozwiązanie może być użyte do budowy

regulatora adaptacyjnego, którego schemat blokowy przedstawiono na rys. 6.1.

Rys. 6.1. Schemat adaptacyjnego regulatora stanu.

Macierz regulatora K spełnia Algebraiczne Równanie Riccatiego w standardowym schemacie

LQR z macierzami wagowymi Q i R.

KA+ATK−KBR−1BTK+Q = 0. (6.18)

Dla stabilizowanych obiektów inercyjnych dobre efekty daje zwiększenie rzędu wektora stanu

(wprowadzenie dodatkowego członu całkującego) w celu eliminacji uchybu statycznego. Ponadto

dla obiektów nieliniowych warto jest zastosować pętle regulacji w przód [109], której zadaniem

będzie eliminacja dużych uchybów poprzez uwzględnienie wpływu dynamiki mierzalnych torów

zakłóceń.

60

Rozdział 7

Rezultaty implementacji algorytmówidentyfikacji i sterowania

W rozdziale tym zostaną przedstawione najważniejsze wyniki badań przeprowadzonych na obiek-

tach symulacyjnych i rzeczywistych. Symulowane obiekty to różnego rodzaju transmitancje od

I-go do III-go rzędu, również z opóźnieniem. Dodatkowym badanym obiektem był symulowa-

ny model wymiennika ciepła oparty o rzeczywisty laboratoryjny system takiego wymiennika.

Na obiektach dokonywano identyfikacji parametrów ciągłych, obserwacji stanu oraz regulacji

liniowo-kwadratowej.

7.1. Filtracja sygnału pomiarowego

7.1.1. Metody numeryczne filtracji splotowej

Dla pierwszego etapu identyfikacji splotowej koniecznym jest przetransformowanie sygnału po-

miarowego za pomocą splotu z odpowiednią funkcją filtrującą (dla przetworzenia pochodnych

u i y). Omówiono to w rozdziale 3. Problemem jest wybranie najlepszej metody numerycznej

dla wyliczenia splotu dla filtru typu FIR. Rozważono następujące metody: (1) z definicji splotu,

wyliczanie całki metodą prostokątów i Simpsona, (2) z użyciem szybkiej transformaty Fouriera,

(3) z wykorzystaniem struktury filtru dyskretnego drabinkowego (ang. ladder) oraz (4) z wyko-

rzystaniem struktury filtru dyskretnego kratowego (ang. lattice). Jedynie pierwszą z powyższych

metodę można zastosować dla sygnałów pomiarowych o nierównym próbkowaniu, pozostałe me-

tody wymagają stałego kwantu dyskretyzacji.

Badano odpowiedź filtru na wymuszenie w postaci skoku jednostkowego y(t) = 1(t + h)

(dla uproszczenia założono, że skok wystąpił w chwili czasowej t = −h). Z równania (3.6)

61

otrzymujemy:

y0(t) = y(t) ∗ φ(t) =h∫0

y(t− τ)φ(τ)dτ =h∫0

1(t+ h− τ)φ(τ)dτ =h∫0

φ(τ)dτ . (7.1)

Do badań wybrano filtr postaci φ(t) = tN(h− t)M , gdzie założone parametry M = 3, N = 2,długość okna h = 1. Jak pokazano w równaniu (7.1) policzenie odpowiedzi filtru typu FIR na

wymuszenie jednostkowe sprowadza się do scałkowania w czasie jego odpowiedzi impulsowej. Dla

wybranego filtru i założonych parametrów otrzymujemy

t∫0

φ(τ)dτ = −1/6t6 + 3/5t5 − 3/4t4 + 1/3t3, t ∈ [0, h]. (7.2)

Tak otrzymany analitycznie wzór na wartości odpowiedzi na skok jednostkowy wybranego filtru

posłuży jako odpowiedź wzorcowa przy porównaniu metod numerycznych.

Do bezpośredniego wyliczenia odpowiedzi filtru użyto funkcji filter() wykorzystującej rów-

nanie postaci y(n) = b(1)x(n) + b(2)x(n − 1) + . . . + b(nb + 1)x(n − nb) − a(2)y(n − 1) −. . .− a(na+ 1)y(n− na). Jest ona stosowana zarówno do filtrów typu FIR jak i IIR. Przelicze-niu parametrów filtru φ(t) na parametry filtru kratowego dokonano z wykorzystaniem funkcji

tf2latc(), odpowiedź otrzymano stosując latcfilt(). Metoda całkowania Simpsona została

oprogramowana przez autora na podstawie [35] w wersji stałokrokowej. Wyliczenia splotu z wyko-

rzystaniem szybkiej transformaty Fouriera i odwrotnej transformaty Fouriera uzyskano stosując

funkcje fftfilt(). Złożoność obliczeniowa wyliczania splotu z definicji jest O(n2), natomiast

dla FFT tylko O(n log n). W przedstawionej metodzie ilość operacji po zmiennoprzecinkowych

zależy od rzędu licznika, rzędu mianownika, długości okna i czasu dyskretyzacji i wynosi (n+m)hdt.

W wersji on-line (obliczenia wykonywane w czasie rzeczywistym) można wykorzystać procesory

sygnałowe (ang. Digital Signal Processor, DSP). Procesory te posiadają wewnętrzną architekturę

zoptymalizowaną pod kątem wykonywania w jednym rozkazie operacji mnożenia i dodawania.

Dodatkowe przyspieszenie operacji splotu można uzyskać stosując programowalne układy lo-

giczne (ang. Field Programmable Gate Array, FPGA ). Wszystkie wymienione powyżej funkcje

wchodzą w skład pakietu [81]. Obliczenia przeprowadzono na liczbach zmiennoprzecinkowych

o podwójnej precyzji.

Na rys. 7.1 przedstawiono wykresy zmiany różnych błędów. Przedstawiono przebieg błędu po-

między wartością całki splotowej liczonej analitycznie (7.2) i całki liczonej w oparciu o 5 różnych

metod numerycznych wewnątrz okna obserwacji [0, h = 1] (przedstawiono błąd względny i bez-

względny) dla dt = 0.05. Wykreślono również zależność błędu średniokwadratowego od różnych

czasów dyskretyzacji dt. Zastosowane metody filtracji drabinkowej, filtracji kratowej i filtracji

FFT dały zbliżone do siebie wyniki wartości błędu. Zapewne wyniki te różniłyby się w przypadku

62

obliczeń przeprowadzonych na liczbach w reprezentacji stałoprzecinkowej. Metody całkowania

numerycznego, prostokątów i Simpsona, dały podobnie wyniki wartości błędu średniokwadrato-

wego. Metody całkowe w stosunku do metod filtracji cechowały się mniejszą wartością błędu.

Wyniki pomiaru czasu dla poszczególnych procedur nie zostały przedstawione, gdyż pomiar

czasu wykonania przy pomocy funkcji tic-toc w Matlab daje silnie zafałszowany wynik. Ze

względu na prostotę użycia, niewielkie błędy i szybkość działania w dalszych eksperymentach

numerycznych do wyliczania splotów została wybrana funkcja filter().

Rys. 7.1. Porównanie metod filtracji.

7.1.2. Splotowa filtracja nieadaptacyjna

W tym rozdziale przeprowadzona zostanie dyskusja sposobu konstrukcji funkcji filtrujących φ za

pomocą funkcji bazowych. Na rys. 7.2 przedstawiono wpływ zmiany d1 - jednego z dwóch współ-

czynników skalujących wielomian bazowy, (parametr d0 pozostawał stały) na zmianę charak-

terystyk czasowo-częstotliwościowych funkcji φ. Można zauważyć charakterystyczne zerowanie

się charakterystyk częstotliwościowych modułu dla pewnych częstotliwości. Zmiana parametrów

funkcji bazowych pozwala kształtować szerokość dolnego zakresu nie zerowania się funkcji φ.

Opisane wyżej procedury znajdują zastosowanie głównie w zadaniu identyfikacji parametrów.

Filtracja nieadaptacyjna będzie się wiązać z jednokrotnym wyborem parametrów d0 i d1.

Ciekawy wniosek można wysnuć z eksperymentów numerycznych, o wpływie poszczególnych

parametrów na kształt i moment zerowania się charakterystyk częstotliwościowych. Parametr d1wpływa na kształt charakterystyki, a długość okna h na moment zerowania, rys. 7.3. Przy dosta-

tecznej liczbie funkcji bazowych, a co za tym idzie współczynników skalujących di, możliwa jest

zmiana momentu zerowania się charakterystyki częstotliwościowej osiągana poprzez zerowanie

się współczynników skalujących - zmiana długości filtru. Z tego względu w dalszych badaniach

z użyciem filtru φ zbudowanego z funkcji bazowych ograniczono się do filtrów φ o stałej długości

okna h.

63

Rys. 7.2. Wpływ zmiany wartości współczynnika skalującego d1 wielomianu bazowego.

Rys. 7.3. Wpływ zmiany długości okna h.

7.1.3. Splotowa filtracja adaptacyjna

W niniejszym rozdziale przedstawiono specjalne zastosowanie funkcji splotowej z nienarzuconym

z góry kształtem funkcji φ. Celem splotu funkcji φ z przetwarzaną funkcją y jest uzyskanie

najlepszej aproksymacji samej funkcji y czyli najlepsze odfiltrowanie jej szumów. Zastosowano

64

w tym celu dynamicznie zmieniający się kształt funkcji y w każdym kroku okna przesuwnego.

Dla dynamicznej optymalizacji kształtu funkcji filtrującej zastosowano krótkie przesuwne

okno T0, wewnątrz którego w każdym kroku, dobiera się optymalne parametry funkcji bazowych

di (parametry skalujące) zgodnie z regułą najmniejszych kwadratów (5.10). Parametry te da-

ją minimum całki z kwadratu błędu między funkcją filtrowaną na oknie T0 i efektem filtracji

i zmieniają się z biegiem czasu. Procedura ta została zaproponowana przez autora nie dla za-

dania identyfikacji, ale do tworzenia lepszej aproksymaty sygnału wyjścia (i jego pochodnych),

czyli zadania obserwacji stanu. Ma to szczególne znaczenie dla zadania stabilizacji stanu, gdyż

wierność odtworzenia stanu decyduje o jakości stabilizacji w układzie zamkniętym. Tak więc, fil-

tracja adaptacyjna nie będzie stosowana dla zadań bieżącej identyfikacji parametrów. Adaptacja

filtru ma związek z ciągle zmieniającym się charakterem sygnału filtrowanego i może pozwolić

na zmniejszenie się błędu filtracji.

Rys. 7.4. Filtracja adaptacyjna dla wielomianów bazowych jako funkcji modulującej.

Wyniki symulacji dla adaptacyjnej wersji filtru z użyciem wielomianów bazowych przedsta-

wiono na rys. 7.4. Niestacjonarnym sygnałem testowym y był sygnał sinusoidalny o częstotliwości

modulowanej liniowo (ang. chirp signal). Wykreślono niezaszumiony przebieg oryginalnej funkcji

y i estymowanej ye. Przebieg pochodnej estymacji y(1)e uzyskano poprzez filtracje oryginalnego

przebiegu z pochodną filtru φ. Użyto trzech wielomianów bazowych stopnia czwartego, długość

okna filtracji h = 100, długość okna optymalizacji dla błędu średnio kwadratowego TO = 100.

Ponadto wykreślono zmianę parametrów skalujących d1, d2, d3 wielomiany bazowe w czasie. Do-

datkowo wykreślono odpowiedź impulsową filtru w wybranych chwilach symulacji oraz odpowia-

dającą jej charakterystykę amplitudowo-częstotliwościową. Zastosowany algorytm optymalizacji

65

to fminunc z [79]. Wraz ze wzrostem częstotliwości filtrowanego sygnału wzrasta jakość odtwa-

rzania jego pochodnej. Na wykresie zmiany współczynników można zauważyć okresową zmianę

współczynników d skalujących wielomiany bazowe.

7.1.4. Aproksymacja w całym horyzoncie czasowym

Innym podejściem do filtracji sygnałów pomiarowych jest ich bezpośrednia aproksymacja bazo-

wymi funkcjami sklejanymi, której podstawy teoretyczne przedstawiono w rozdziale 5. W celu

porównania filtracji z poprzedniego rozdziału z aproksymacją opartą o aproksymację sygnału te-

stowego funkcjami sklejanymi do sygnału testowego dodano zakłócenie w postaci szumu białego

o zerowej wartości średniej i wariancji 0.09, rys. 7.5. Czas symulacji T = 1000, do aproksy-

macji użyto 150 funkcji bazowych trzeciego rzędu o równomiernym rozkładzie węzłów w całym

horyzoncie czasowym, współczynnik wygładzania γ = 0 (5.15).

Rys. 7.5. Aproksymacja całego sygnału testowego funkcjami sklejanymi.

W początkowym fragmencie odpowiedzi wyraźna jest nadparametryzacja liczby bazowych

funkcji sklejanych. Wraz ze wzrostem czasu, a co za tym idzie częstotliwości sygnału testowego,

efekt nadparametryzacji się zmniejsza. Można iteracyjne dokonać optymalizacji rozmieszczenia

mniejszej, niż założona (120), liczby węzłów. Innym podejściem jest zastosowanie kryterium jako-

ści doboru współczynników skalujących funkcje sklejane z wygładzaniem. Efekt wpływu różnych

wartości współczynnika wygładzania γ na wartość błędu średnio-kwadratowy w stosunku do sy-

gnału niezaszumionego przedstawiono na rys. 7.5. Istnieje minimum błędu średniokwadratowego

dla γ ≈ 0.5. Aproksymacja sygnału pomiarowego (testowego) funkcjami bazowymi znajdujezastosowanie w metodach identyfikacji parametrycznej dla systemów ciągłych w wersji off-line.

7.1.5. Aproksymacja w ruchomym oknie

Przedstawiony w poprzednim rozdziale 7.1.4 sposób aproksymacji sygnałów pomiarowych jest

trudny do zastosowania w wersji ciągłej on-line. Z tego względu w niniejszym rozdziale przedsta-

66

wiona zostanie koncepcja aproksymacji sygnałów pomiarowych w ruchomym oknie czasowym.

W oknie tym znajdowana jest najlepsza aproksymacja sygnału pomiarowego, następnie bra-

na jest tylko jedna próbka (zwykle ostatnia) z tak wyliczonej aproksymaty. W kolejnej chwili

czasowej okno jest przesuwane i ponownie przeprowadzana jest procedura aproksymacji.

Użytym sygnałem testowym był sygnał z liniową modulacją częstotliwości, długość ruchome-

go okna TO = 100, użyto 6 bazowych funkcji trzeciego rzędu o równomiernym rozkładzie węzłów

(rys. 7.6), współczynnik wygładzania γ = 0. Wyniki przeprowadzonych symulacji przedstawiono

na rys. 7.6.

Rys. 7.6. Aproksymacja w ruchomym oknie sygnału testowego funkcjami sklejanymi.

Przetestowano pomysł wprowadzenia dodatkowych wag dla zadania aproksymacji w oknie

przyjmując, że jakość aproksymacji dla początkowych próbek w oknie może być gorsza od jako-

ści aproksymacji w końcowym fragmencie okna. Wagi wewnątrz okna będą więc miały postać

różnych funkcji małych wartości z lewej stroni i dążących do 1 z prawej strony okna (rys. 7.7).

Rys. 7.7. Wpływ przesunięcia próbek na błąd średnio-kwadratowy. Rozkład wag w oknie aprok-symacji ruchomym oknem.

Na rys. 7.7 przedstawiono rozkład wag w czasie dla przesuwnego okna z sygnałami pomiaro-

wymi aproksymowanymi funkcjami bazowymi. Zastosowano kryterium jakości dla pojedynczego

okna:

J =1m

∑j

w(j) ‖y(j)− f(x(j))‖2 , (7.3)

gdzie j - jest numerem próbki po dyskretyzacji Ts = 1, m - jest liczbą próbek pomiarowych.

We wskaźniku jakości pominięto człon odpowiedzialny za gładkość krzywej sklejanej (γ = 0).

67

W eksperymentach wykorzystano funkcje spap2() z pakietu [82]. Wybrano rozkłady wag: rów-

nomierny, liniowonarastający, progresywny i regresywny, rys. 7.7. W wyniku przeprowadzonych

eksperymentów nie stwierdzono wpływu braku wag lub ich narastającego rozkładu w oknie na

wartość przyjętego średnio-kwadratowego wskaźnika jakości, który wyniósł J ≈ 0, 0107 dla fil-tracji w ruchomym oknie. Malejący rozkład wag w oknie pogarszał wartość przyjętego wskaźnika

jakości.

Ciekawy wynik uzyskano podczas analizy jakości aproksymacji. Lepszy rezultat dla błędu

średnio-kwadratowego gwarantuje wzięcie pod uwagę nie ostatniej próbki ruchomego okna, lecz

pierwszej albo drugiej od końca, (przesunięcie odczytu próbek pokazano na rys. 7.7). W przed-

stawionym przypadku parametr γ > 0 wpływa negatywnie na jakość odtwarzania sygnału ory-

ginalnego.

7.2. Identyfikacja

W tym rozdziale zaprezentowane zostaną wyniki porównania 2 typów identyfikacji parametrycz-

nej:

1. w oparciu o przetworzone splotowo sygnały pomiarowe,

2. w oparciu o bezpośrednio aproksymowane funkcjami sklejanymi sygnały pomiarowe.

Parametry obiektu identyfikowanego w testach będą stałe lub będą zmieniały się skokowo.

Dla celów identyfikacji splotowej znajdują zastosowanie metody filtracji nieadaptacyjnej z roz-

działu 7.1.2. Również aproksymacja sygnałów pomiarowych w całym horyzoncie czasowym, roz-

dział 7.1.4, zastosowana zostanie do zagadnienia identyfikacji. Do testów przyjęto liniowy model

nieminimalnofazowy dany unormowaną transmitancją postaci:

G(s) =−0.2381s+ 0.5952

0.1786s2 + 0.6845s+ 0.2976, (7.4)

gdzie Θ wektor pięciu parametrów (3.14) i (3.27) (ΘTΘ = 1). Symulacje przeprowadzono dla

czasu T = 30 i czasie dyskretyzacji dt = 0.01, zarejestrowanoM = 3000 próbek pomiarowych dla

sygnału wejściowego i wyjściowego. Jako sygnał wymuszający u(t) przyjęto przebieg prostokątny

z okresem Tu = 10 i amplitudą ±0.5.Następnie w t = 15 nastąpiła skokowa zmiana parametru transmitancji (7.4) z a0 = 0.2976 na

a0 = 0.7976, co spowodowało zmianę wszystkich współczynników transmitancji unormowanej:

G(s) =−0.1914s+ 0.4785

0.1436s2 + 0.5502s+ 0.6412. (7.5)

Szum pomiarowy nie został dodany do sygnału wejściowego u i wyjściowego y, dzięki czemu me-

toda identyfikacji wprowadza mniejsze błędy na estymowane parametry i łatwiejsza jest analiza

68

otrzymanych wyników.

Dla pierwszego typu identyfikacji długość okna filtru h = 3. Czas dyskretyzacji ∆t = 0.01,

funkcja modulująca φ(t) = t4(h−t)5, gdzie h = 3. Dokonano operacji splatania sygnałów pomia-rowych z kolejnymi pochodnymi funkcji modulującej. W chwili czasowej t = 3 równej h możliwe

jest wyliczenie pierwszego splotu. Sploty sygnałów pomiarowych wejściowego u i wyjściowego

wykreślono na rys. 7.8.

Rys. 7.8. Wynik filtracji i aproksymacji z sygnałami pomiarowymi wejścia i wyjścia.

Dla drugiego typu identyfikacji rząd funkcji modulującej (4.5) k = 4, ilość węzłów N = 50.

Na rys. 7.8 wykreślono wyniki aproksymacji sygnałów pomiarowych wejściowego u i wyjściowego

y funkcjami sklejanymi. Dodatkowo przedstawiono przebiegi kolejnych pochodnych aproksymaty

dla zarejestrowanych sygnałów pomiarowych.

Założono odpowiednio równe identyfikowanej transmitancji rzędy licznika m = 1 i mianow-

nika n = 2. Na rys. 7.9 przedstawiono przebieg identyfikowanych parametrów metodą dokładną

poprzez rozwiązanie pełnego zagadnienia własnego dla symulowanego obiektu. Długość prze-

suwanego okna została przyjęta jako dwukrotnie większa od długości funkcji modulującej h

i wynosi T = 6. Dla t = 5 sploty są już na tyle długie, że wartości własne macierzy Grama

zaczynają się stabilizować. Dla oszacowania dolnej wartość długości okna T można przyjąć tę

chwilę czasową. Identyfikacja parametrów w przesuwanym oknie powoduje, że estymowane pa-

rametry dążą do rzeczywistych i dopiero po czasie t = T + h = 24 mogą być im równe, t = 24.

Natomiast rozszerzane okno jest cały czas obciążone pomiarami z przeszłości, co objawia się

wolniejszą zbieżnością parametrów, które dopiero w czasie t zmierzającym do nieskończoności

mogą osiągnąć rzeczywiste wartości.

Zaobserwowano podobne wyniki dla metody identyfikacji z użyciem aproksymacji funkcjami

sklejanymi. Przykładowo dla parametru a0 i b0 metoda daje lepsze wyniki niż metoda identy-

fikacji w oparciu o filtrację. W metodzie aproksymacyjnej otrzymano poprawne identyfikowane

parametry wcześniej o długość okna h metody splotowej. Natomiast dla pozostałych parametrów

można zauważyć gorsze wyniki.

69

Rys. 7.9. Przebieg identyfikacji parametrów w rozszerzanym i ruchomym oknie.

Rysunek 7.10 przedstawia porównanie wyliczenia wartości własnej poprzez rozwiązanie peł-

nego zagadnienia własnego jedną z metod numerycznych oraz równania różnicowego (3.30) w za-

stosowaniu dla metody filtracji. Metoda iteracji odwrotnej śledzi rzeczywisty parametr dokładnie

tak, jak to czyni rozwiązanie pełnego zagadnienia.

Rys. 7.10. Porównanie wyników rozwiązania pełnego i przybliżonego zagadnienia własnego.

7.3. Obserwacja stanu

W rozdziale tym wykorzystamy metodologię obserwatora stanu opartego o wzory z rozdziału 6.2.

Badania przeprowadzono na symulowanej transmitancji danej równaniem (7.4). Do eksperymen-

tów wykorzystane zostaną sygnały wejścia i wyjścia: przetworzone splotowo z funkcją filtrującą

(φ(t) = t4(h− t)5 i h = 3) oraz aproksymowane bezpośrednio funkcjami sklejanymi. Obiekt dany

70

wzorem (7.4) w wersji zmiennych stanu ma postać:

x(t) =

0 −1.66631 −3.8326

x+ 3.3326−1.3331

uy(t) =

[0 1

]x. (7.6)

Porównanie odpowiedzi obserwatora danego równaniem (6.15) z rzeczywistym stanem przed-

stawiono na rys. 7.11. Symulację przeprowadzono dla obiektu danego postacią Frobeniusa (6.12).

W celu eliminacji błędów wynikających z zadania identyfikacji w algorytmach obserwacji użyto

oryginalnej dokładnej transmitancji obiektu (7.4), która zmienia się skokowo dla czasu symulacji

t = 15.

Rys. 7.11. Obserwacja stanu bezpośrednia w oparciu o sploty i aproksymację.

7.4. Regulacja LQR

Porównanie przebiegów zmiennych stanu i sterowania w układzie regulacji z obiektem (7.6)

i regulatorem LQR działającym w oparciu o różne obserwatory stanu przedstawia rys. 7.12.

Funkcja modulująca φ wykorzystana w budowie obserwatora i regulatora wprowadza opóźnie-

nie, wynikające z jej długości h. To opóźnienie powinno być uwzględnione w procesie syntezy

parametrów regulatora. Początek pracy obserwatora, a przez to regulatora, rozpoczyna się gdy,

całe okno filtru zostanie wypełnione danymi pomiarowymi. W zastosowaniach praktycznych,

gdzie rozruch instalacji następuje w sposób ręczny, algorytm obserwacji może zostać włączony

znacznie wcześniej, tak by całe okno filtru zostało wypełnione pomiarami. Innym rozwiązaniem

jest zastosowanie prostszego regulatora np. PID do rozruchu algorytmu.

71

Rys. 7.12. Porównanie przebiegów w układzie (7.6) i regulatorem LQR z różnymi obserwatora-mi.

Ze względu na opóźnienie w układzie regulacji, została zmniejszona długość okna filtru z h = 3

do h = 2. Nie jest możliwe zbytnie zmniejszenie okna h, gdyż prowadzi to do pogorszenia

właściwości filtrujących i zwiększenia wpływu zakłóceń na wartość estymowanych zmiennych

stanu. Dodatkowo układ przetwarzający sygnał z postaci analogowej na cyfrową charakteryzuje

się skończonym czasem próbkowania (dyskretyzacji) i w trakcie eksperymentów zauważono, że

okno po dyskretyzacji powinno składać się z ponad 100 próbek.

7.5. Identyfikacja w zamkniętej pętli

Układ obiekt z regulatorem LQR posiada właściwości stabilizacyjne. W wyniku tego pasmo czę-

stotliwości sygnału wartości procesowej jest ograniczone i nadaje się w ograniczonym stopniu

do identyfikacji. Regulator LQR w wersji bez eliminacji uchybu statycznego został zainstalowa-

ny na mierzonym stanie obiektu. Jedna z metod identyfikacji obiektu objętego pętlą sprzężenia

zwrotnego polega na dodaniu sygnału wymuszającego uz do wyliczonej przez regulator wartości

sterującej u, rys. 7.13. W przedstawionym eksperymencie użyto sygnału prostokątnego. Dodat-

kowy sygnał wymuszający powoduje pogorszenie przyjętego wskaźnika jakości układu regulacji

72

i dlatego czas jego obecność powinien być redukowany do niezbędnego minimum wynikającego

z identyfikacji, np. w tym przypadku wystarcza T + h. Przykładowo sygnał dodatkowy powi-

nien być wprowadzony w momencie zmiany punktu pracy, okresowo w celu sprawdzenia czy nie

zmieniły się parametry sterowanego obiektu. Można zastosować również bardziej zaawansowane

metody sprawdzające aktualność parametrów modelu dla sterowanego obiektu.

Rys. 7.13. Przebieg stabilizacji i identyfikacji z regulatorem LQR.

Przebieg identyfikowanego parametru dla rozszerzanego i ruchomego okna przedstawiono na

rys. 7.13. W tym przypadku rozszerzane okno bliskie jest rzeczywistej wartości parametru a0 dla

czasu t > 10. Dlatego wybrano szerokość rozszerzanego okna T = 12, pozostałe parametry nie

zostały zmienione.

Przeprowadzono również eksperymenty ze zmodyfikowanym obiektem poprzez uwzględnienie

w nim modelu dynamiki zaworu sterującego jako członu całkującego. Wyniki przeprowadzonych

symulacji przedstawiono na rys. 7.14. Dla układu regulacji LQR z eliminacją uchybu statycznego

zmieniono macierz wagową na Q = [0 0 0; 0 1 0; 0 0 1] i odpowiednio zmodyfikowano macierze

stanu obiektu:

x(t) =

0 −1.6663 01 −3.8326 00 1 0

x+3.3326

−1.33310

u

y(t) =

0 1 00 0 1

x. (7.7)

Jakość stabilizacji jest bardzo dobra.

73

Rys. 7.14. Przebieg stabilizacji i identyfikacji z regulatorem LQR eliminującym uchyb statyczny.

7.6. Fizyczny model wymiennika ciepła

W poprzednich rozdziałach zostały przedstawione wyniki przeprowadzonych eksperymentów na

obiektach liniowych o stałych i zmiennych w czasie parametrach. Jako kolejny testowy obiekt

wybrano model wymiennika ciepła. Na rys. 7.15 przedstawiono schemat rozważanego modelu

wymiennika ciepła.

Rys. 7.15. Schemat wymiennika ciepła.

Równanie przewodnictwa ciepła dla ośrodka izotropowego, jednorodnego, ze stałymi współ-

czynnikami oraz bez źródeł ciepła w rozważanym obszarze, charakteryzującego się: k – współ-

czynnik przewodnictwa, c – ciepło właściwe, ρ – gęstość, przyjmuje postać:

∂2T

∂x2+∂2T

∂y2+∂2T

∂z2− cρ

k

∂T

∂t= 0

i jest równaniem typu parabolicznego [57, 130].

Analiza dynamiki wymiennika przepływowego typu ”rura w rurze” prowadzi jednak do rów-

74

nań hiperbolicznych. Model uproszczony można uzyskać zakładając brak wzdłużnego przewod-

nictwa ciepła, idealne mieszanie cieczy w płaszczu i rurze wymiennika na odcinku ∆z, brak

promieniowania cieplnego płaszcza, brak zmiany gęstości cieczy w zależności od temperatu-

ry medium, itp. Dla wymiennika ciepła typu ”rura w rurze” z przepływem przeciwprądowym

(rys. 7.15), przy powyższych założeniach otrzymujemy układ równań różniczkowych cząstkowych

pierwszego rzędu: ∂T1(z,t)∂t

= −υ1(t)∂T1∂z + ω1[T2(z, t)− T1(z, t)]∂T2(z,t)∂t

= υ2(t)∂T2∂z + ω2[T1(z, t)− T2(z, t)](7.8)

gdzie: z ∈ [0, 1], t 0, ω1, ω2 są stałymi dodatnimi parametrami [42]. Przykładowo, wielkościfizyczne wyrażone w międzynarodowym układzie jednostek miar (franc. Systeme International

d’Unites, SI ) posiadają następujący wymiar: temperatur T1, T2[K], czas t[s], prędkość przepływu

υ1, υ2[m/s], droga z[m], częstotliwość ω1, ω2[Hz]. Warunki brzegowe

T1(0, t) = Tin, T2(1, t) = Tout, t 0,

warunek początkowy:

T1(z, 0) = T10(z), T2(z, 0) = T20(z).

W stanie ustalonym T∞(z) =[T1∞(z) T2∞(z)

]TPrzy założeniu, że ω1 > ω2 > 0 to rozkład temperatur wzdłuż wymiennika w stanie ustalonym

jest dany:

T∞(z) =1

α− βeβ−α

Tin[αe(β−α)z − βe(β−α)] + αTout[1− e(β−α)z]βTin[e(β−α)z − e(β−α)]− Tout[α− βe(β−α)z]

, (7.9)

gdzie α := ω1υ1∞

> β := ω2υ2∞. Natomiast υ1∞ i υ2∞ reprezentują odpowiednio wartości strumienia

w stanie ustalonym i zachodzi między nimi relacja υ2∞ > υ1∞ > 0.

Transmitancja zlinearyzowanego toru wymiennika w punkcie pracy dana jest:

g(s) =αβe(β−α)(β − α)(Tin − Tout)( e

λ1(s)+α−β−1λ1(s)+α−β −

eλ2(s)+α−β−1λ2(s)+α−β )

υ1∞(α− βe(β−α))([λ2(s)− sυ2∞− β]eλ1(s) + [−λ1(s) + s

υ2∞+ β]eλ2(s))

, (7.10)

λ1,2 =s( 1υ2∞− 1υ1∞)− α+ β ∓

√∆(s)

2, (7.11)

∆(s) = [s(1υ2∞+1υ1∞) + (α+ β)]2 − 4αβ. (7.12)

7.7. Opracowanie wyników eksperymentów

W niniejszym rozdziale zostaną przedstawione i opracowane wyniki eksperymentów przeprowa-

dzonych na rzeczywistych danych pomiarowych. Dane te zostały zebrane w trakcie eksperymen-

75

tów przeprowadzonych przez autora na laboratoryjnym modelu wymiennika ciepła dostępnym

w Laboratorium Sterowania Procesami, Katedry Automatyki Akademii Górniczo-Hutniczej. Wy-

miennik jest częścią aparatury laboratoryjnej kolumny destylacyjnej, rys. 7.16. Pomiary tem-

peratury wykonano czujnikami Pt100, a ciągły ich przestrzenny rozkład rejestrowano kamerą

termowizyjną Flir ThermoVision A20.

Rys. 7.16. Badany wymiennik. Zdjęcie, schemat oraz zdjęcie w podczerwieni.

Przedstawiony w rozdziale 7.6 model wymiennika, rys. 7.15 różni się w stosunku do rys. 7.16,

co stwarza konieczność uwzględnienia odpowiednich współczynników skalujących. Dodatkowe

zwoje wewnętrzne wymiennika powodują zwiększenie powierzchni wymiany ciepła. W rozważa-

nym modelu przyjęto uproszczoną wersję z wewnętrzną rurą prostą, co powoduje konieczność

przeskalowania strumienia o odpowiedni współczynnik.

7.7.1. Neuralny model statyczny wymiennika

Tabela 7.1 zawiera część z prawie 200 zebranych w trakcie eksperymentów stanów ustalonych.

Wyniki posłużą do dalszego planowania eksperymentów np. doboru zmiany wymuszeń dla eks-

76

Wejścia WyjściaF156 T116 F153 T101 T117 T103ml/s [�] [ml/s] [�] [�] [�]

10 50.8 1 9.5 36.3 49.510 51.3 3.1 9 30.7 44.510 50.8 5 8.5 27.8 37.710 51.1 6.9 9 26.1 32.510 50.5 10.1 8.5 23.5 26.510 50.6 15 8 22 20.510 50.5 20 8 21.1 1710 49.9 25.1 7.5 20.3 14.89.9 50.2 30.2 7.5 19.6 1310 49.9 35.2 7.5 18.9 1210 49.7 40 7.5 18.3 1110 49.9 45.2 7.5 17.9 1010 49 49.9 8 17.3 9.510 48.7 54.8 7.5 16.7 910 48.6 59.8 7.5 16.5 8.510 48.9 64.6 7 16.2 810 60.5 1 7 42.6 5910 60.2 3 7 35.9 54.510 59.9 5 8 31.8 45.510 59.7 6.9 7.5 29 37.510 60.5 10.2 8 27 31.510 60.8 20.1 8 24.2 19.510 60.2 24.8 7.5 23.4 17.510 60.1 29.6 7.5 22.5 1510 59.8 39.2 7.5 21.1 1310 59.9 50.2 7 20.2 1110 59.6 60.3 7 19.3 10

Wejścia WyjściaF156 T116 F153 T101 T117 T103ml/s [�] [ml/s] [�] [�] [�]

10 40.2 30.3 6 16.1 8.910 39.7 39.8 6 15.2 7.510 39.1 50 5.5 14.3 6.710 39.6 60.5 6 13.9 6.29.9 39.7 70.2 5.5 13.4 5.85 50.2 9.6 7 15 16.85 50.2 5 7.5 19.2 25.65 49.8 3 7.5 22.6 32.55 50.1 1 7.5 30.9 39.14.9 49.9 19.6 7.5 13.1 10.95 49.6 30 7 11.9 8.75 49.8 49.8 6.5 10.4 6.75 49.8 70 6 9.5 5.71 40.6 1 7.5 11.5 261 40.6 3 7.5 7.7 15.71 40.3 5 7.5 6.6 11.61 40.2 10 7.5 5.6 8.11 40.2 20 7 4.9 5.91 40 29.6 7 4.6 51 39.7 50 6.5 4.2 4.31 40 70.1 6 4.1 41 50.3 1 7.5 13.2 32.21 50.4 2.9 8 8.5 18.91 50.3 5 7.5 7.3 13.61 50.3 9.6 7.5 6.2 9.11 50.1 30 7.5 4.9 5.51 50.1 69.6 6 4.4 4.4

Tabela 7.1. Fragment zarejestrowanych stanów ustalonych wymiennika (z rys. 7.16).

perymentów identyfikacji dynamicznej. Dodatkowo wartości stanów ustalonych po aproksymacji

będą dodawane do sterowania regulatora tworząc statyczną pętle sprzężenia w przód, zalety

której przedstawiono we wstępie.

Rysunek 7.17 przedstawia wyniki aproksymacji stanów ustalonych siecią neuronową o trzech

neuronach wejściowych reprezentujących zmienne wejściowe obiektu T116, F153 i F156. W war-

stwie ukrytej znajdowało się 20 neuronów charakteryzujących się sigmoidalną funkcją przejścia.

W warstwie wyjściowej znajdował się jeden neuron z liniową funkcją aktywacji (T117). W war-

stwie wejściowej powinny znajdować się cztery neurony, ale w trakcie eksperymentów zmiana

T101 = 9[�] była nieznaczna. Natomiast w warstwie wyjściowej powinien być dodatkowo neuron

odpowiedzialny za odtwarzanie T103, z którego zrezygnowano dla przejrzystości rozważań. Do

uczenia użyto 154 pomiarów. Jako algorytm uaktualniający wartości wag użyto algorytmu opty-

malizacji Levenberg-Marquardt. Na rysunku można zauważyć fragment źle dopasowanej krzywej

objawiający się nagłym skokiem. Ten brak dopasowania jest spowodowany niedostateczną ilością

pomiarów w tych miejscach co skutkuje pogorszeniem aproksymacji.

7.7.2. Dobór parametrów modelu wymiennika

Model wymiennika dany równaniem (7.8) posiada długość jednostkową. Chcąc zastosować ten

model do rzeczywistego wymiennika należy przeskalować mierzone strumienie przepływu υ1 i υ2na prędkość przepływu υ1(t) = f1υ1(t) i υ2(t) = f2υ2(t), uwzględniając powierzchnie przepływu

77

Rys. 7.17. Charakterystyki statyczne wymiennika aproksymowane siecią neuronową.

i długość przepływu.

Wstępne badania i próby doboru parametrów ω1, ω2, f1, f2 wykazały istnienie wielu mi-

nimów w procesie optymalizacji oraz bardzo dużą czasochłonność obliczeń wymiennika danego

równaniem dynamicznym. Dlatego dobór parametrów okazał się trudny i wymagał specjalnego

wieloetapowego podejścia.

Tabela 7.2 przedstawia wartości współczynników parametrów modelu wymiennika cieplnego.

Pierwszy etap doboru parametrów polegał na odczytaniu z tablic fizycznych wartości poszcze-

gólnych współczynników. Jedynym brakującym współczynnikiem okazał się tzw. wewnętrzny

współczynnik przewodności ciepła k. Jego wartość została wstępnie dobrana w trakcie obliczeń

polegających na poszukiwaniu minimum na prostej dla wybranego stanu ustalonego. Jako model

użyte zostało równanie (7.9) opisujące zachowanie wymiennika w stanie ustalonym. Następnie

tak dobrane parametry posłużyły jako parametry startowe w procedurze optymalizacji po pa-

rametrach ω1, ω2 przy ustalonych stałych f1, f2. Również wykorzystano równanie dla stanów

ustalonych wymiennika, co powoduje, że parametry ω1, ω2, f1, f2 dla modelu wymiennika w stanie

78

ustalonym są zależne od siebie. Z tego względu f1, f2 jako stałe. Parametry otrzymane w wyniku

optymalizacji modelu w stanach ustalonych posłużyły jako warunek początkowy w optymalizacji

dynamicznej. Do optymalizacji użyto standardowych procedur pakietu Matlab fminsearch. Wy-

korzystano równanie (7.8) opisujące zachowanie dynamiczne wymiennika. Symulacji dokonano

dzieląc każde z równań różniczkowych cząstkowych układu (7.8) na n = 40:

d

dt

T1( 1n , t)...

T1(nn , t)

T2( 1n , t)...

T2(nn , t)

2n×1

=

ψ ω1

ν. . . . . .

ν ψ ω1

ω2 ζ κ. . . . . . κ

ω2 ζ

T1( 1n , t)...

T1(nn , t)

T2( 1n , t)...

T2(nn , t)

+

ν 0

0...

......

......

... 0

0 κ

T1in

T2in

, (7.13)

gdzie ψ = −nυ1(t) − ω1, ζ = −nυ2(t) − ω2, ν = nυ1(t) i κ = nυ2(t) oraz wyjścia obiektu

T1out(t) = T1(nn , t), T2out(t) = T2(1n, t).

Oznaczenie Opis Wartość JednostkaParametry fizyczne

L Długość zewnętrzna 0.44 [m]φR Średnica rury 10e-3 [m]φZ Średnica spirali 44e-3 [m]φP Średnica płaszcza 54e-3 [m]Z Liczba zwoji 33

C1, C2 Ciepło właściwe wody 4187 [J/(kg*K)]ρ1, ρ1 Gęstość wody w 22� 998 [kg/m3]

Wyliczone parametryz1 = L+ Z ∗ π ∗ (φZ − φR) - długość rury 3.97 [m]z2 = L - długość płaszcza 0.44 [m]A1 = 1/4 ∗ z1 ∗ pi ∗ φ2R - przekrój poprzeczny 7.1e-004 [m2]A2 = 1/4 ∗ π ∗ φ2P −A1 1.6e-3 [m2]At = z1 ∗ π ∗ φR - pole wymiany 0.1246 [m2]k nieznany wew. współczynnik przew. ciepła [W/(m*K)]f1 = z1/(A1 ∗ 1[m]) - skalowanie strumienia rury 5.5915e+003 [1/m2]f1 = z2/(A2 ∗ 1[m]) - skalowanie strumienia płaszcza 275 [1/m2]ω1 = k ∗At2/(C1 ∗ ρ1 ∗A1) 2.2742e− 005 ∗ k [Hz]ω2 = k ∗At2/(C2 ∗ ρ2 ∗A2) 9.4758e− 007 ∗ k [Hz]

Optymalizacja na prostejk wew. współczynnik przew. ciepła 0.6 [W/(m*K)]ω1 k ∗At2/(C1 ∗ ρ1 ∗A1) 2.2742e-005 [Hz]ω2 k ∗At2/(C2 ∗ ρ2 ∗A2) 9.4758e-007 [Hz]

Optymalizacja dynamicznaf1 po optymalizacji dynamicznej wraz ze średnią 4.0684e-003 [1/m2]f2 j.w. 1.6439e-003 [1/m2]ω1 j.w. 3.8699e-002 [Hz]ω2 j.w. 1.7651e-002 [Hz]

Tabela 7.2. Parametry wymiennika

Zastosowane wieloetapowe podejście zamiast bezpośredniej symulacji dynamicznej dało lep-

sze rezultaty, gdyż optymalizacja dynamiczna wykazywała wiele lokalnych minimów. Powodo-

wało to, że parametry dostosowywały się dobrze (zależnie od punktu startowego) dla zbioru

przebiegów uczących, natomiast wykazywały duży błąd dla zbioru przebiegów testowych. Do-

79

datkowo podejście wieloetapowe umożliwiło znalezienie parametrów startowych do kolejnych

optymalizacji już w pobliżu globalnego minimum.

W kolejnym zestawie eksperymentów będą identyfikowane parametry uproszczonego w sto-

sunku do (7.8) liniowego modelu pierwszego rzędu o parametrach stałych w czasie. Do identy-

fikacji tych parametrów zostaną zastosowane algorytmy identyfikajci splotowej i sklejanej prze-

stawione wcześniej. Przyczyną wybrania obiektu pierwszego rzędu była jego prostota, łatwość

interpretacji fizycznej poszczególnych współczynników k i T oraz brak konieczności dostępu do

wielu zmiennych stanu. Jednocześnie model dany transmitancją dobrze przybliża zachowanie

wymiennika ciepła w punkcie pracy. W przeprowadzonym eksperymencie identyfikacji założono

następujący uproszczony model liniowy o parametrach stałych w czasie:

G(s) =k

Ts+ 1(7.14)

Wyniki eksperymentów wielokrotnej identyfikacji metodami identyfikacji splotowej i skleja-

nej parametrów T i k – równanie (7.14) – wykreślono na rys. 7.18. W trakcie eksperymentów

zmienne wejściowe ulegały niewielkim wahaniom i ich wartość średnia wynosiła odpowiednio

F156 = 10 [ml/s], T116 = 50 [�], T101 = 20 [�]. Jako wymuszenie zastosowano pseudolosowy

sygnał binarny o wartości średniej F153 = 10 [ml/s] i amplitudzie 3 [ml/s]. Eksperyment prze-

prowadzono w otwartej pętli sterowania. Podobnie jak dla metody splotowej te same trendy

historyczne poddano identyfikacji metodą funkcji sklejanych i wyniki również przedstawiono na

rys. 7.18. Dodatkowo na wykresach wykreślono krzywą o rozkładzie normalnym. Z wyjątkiem

wzmocnienia k identyfikowanego metodą funkcji sklejanych otrzymane wyniki nie przystają do

rozkładu normalnego. Przyczyną może być zbyt mała liczba przeprowadzonych eksperymentów.

W tabeli 7.3 przedstawiono niepewność parametrów identyfikacji zamieszczając ich własności

średnie i odchylenie standardowe dla wersji parametrów otrzymanych metodą splotową i metodą

funkcji sklejanych z rys.7.18.

Parametr Wartość średnia Odchylenie standardowem. splotowa

T 32.9533 0.98488k -0.61519 0.0090817

m. sklejanaT 38.6447 1.5936k -0.62197 0.0094655

Tabela 7.3. Statystyka parametrów.

Następnie wykonano na wymienniku rzeczywistym 15 eksperymentów. Rysunek 7.19 przed-

stawia przebieg wymuszeń F153 o odpowiedzi T103 i T117 przy ustalonych T101 = 20 [�], T116 =

60 [�] i F156 = 10 [ml/s]. Jako wymuszenie użyto pseudolosowego sygnału binarnego o wartości

średniej równej stanowi ustalonemu. Eksperymenty przeprowadzono dla rożnych punktów pracy

F153. Ze względu na silne nieliniowości obiektu amplitudę sygnału wymuszającego uzależniono od

80

Rys. 7.18. Rozkład stałych T i k dla wielokrotnie przeprowadzonego eksperymentu identyfikacji(7.14) w wybranym punkcie pracy.

punktu pracy. Eksperyment przeprowadzono ze stanu ustalonego do stanu ustalonego w otwartej

pętli sterowania.

Rys. 7.19. Pomiary odpowiedzi wymiennika na różne wymuszenia.

Na rys. 7.20 przedstawiono wyniki identyfikacji parametrów k i T dla równania (7.14) w roż-

nych punktach pracy (F153) dla metody identyfikacji splotowej i sklejanej. Porównanie wyników

identyfikacji otrzymanych na podstawie eksperymentów z symulacją wymiennika – równanie (7.8)

81

– dla różnych punktów pracy F153 wykreślono na rys. 7.20. Dodatkowo zaznaczono wyniki iden-

tyfikacji symulowanego wymiennika danego równaniem (7.8) o parametrach przedstawionych w

tabeli 7.2. Można zauważyć dużą zgodność wyników niezależnie od metody identyfikacji zarówno

dla rzeczywistego, jak i symulowanego obiektu.

Rys. 7.20. Porównanie wyników identyfikacji stałych T i k (7.14).

Aproksymacji zebranych pomiarów dokonano z wykorzystaniem funkcji fit1. Dodatkowo

na wykresach wykreślono krzywe 95% przedziałów ufności dla obserwacji (ang. simultaneous

prediction bounds for observation, SPBO) oraz dla funkcji (ang. simultaneous prediction bounds

for function, SPBF). Jako funkcję aproksymującą pomiary T (F153) i k(F153) użyto:

y = aebx + cedx. (7.15)

i wyniki aproksymacji oznaczono odpowiednio Tmean i kmean. W celu łatwiejszego zobrazowania

na rys. 7.21 przedstawiono krzywe w zależności od jednego wejścia. W rzeczywistości są to

fragmenty hiperpłaszczyzn czteroargumentowych, których fragmenty przedstawiono na rys. 7.22.

W tabeli 7.4 zebrano wartości parametrów (7.15) oraz statystykę dopasowania dla poszczególnych

krzywych.

Rysunek 7.23 przedstawia aproksymację funkcjami sklejanymi zmiany parametruK1 [ml/(s�)]

regulatora w zależności od F153 i T116 dokonanej dla dwóch metod identyfikacji (splotowa i funk-

cjami sklejanymi). Wartość wzmocnienia K2 = 0.1 [ml/(�s2)] pozostaje stała. W rzeczywi-

stości dla rozważanego przypadku dziedzina tej hiperpłaszczyzny jest czteroelementowa. Obie

powierzchnie mają bardzo zbliżony kształt. Takie krzywe można przygotować off-line. W trakcie1Dostarczona w bibliotekach Curve Fitting Toolbox pakietu Matlab

82

T [s] k [�s/ml]Opis m. splotowa m. sklejana m. splotowa m. sklejana

a 130.304503 131.835845 -6.427504 -6.509010b -0.242781 -0.217806 -0.285865 -0.282606c 39.530094 41.563691 -0.304146 -0.289958d -0.013369 -0.010614 -0.025476 -0.024114SSEa 690.108425 686.260447 0.094848 0.094469R-Square 0.953232 0.957556 0.995470 0.995634DFEb 11.000000 11.000000 11.000000 11.000000adjrsquare 0.940477 0.945981 0.994235 0.994443RMSEc 7.920677 7.898564 0.092858 0.092672

aSuma kwadratów błędu (ang. Sum of Squares Due to Error, SSE)bStopnie swobody (ang. Degrees of Freedom Adjusted R-Square, DFE)cBłąd średniokwadratowy (ang. Root Mean Squared Error, RMSE)

Tabela 7.4. Parametry i statystyka dopasowania.

Rys. 7.21. Aproksymacja wyników identyfikacji dla eksperymentów wraz z przedziałami ufności.

pracy on-line regulator może bezpośrednio korzystać z nich na zasadzie regulatora gain schedu-

ling bez konieczności przeprowadzania syntezy wzmocnienia regulatora on-line. Okresowo należy

przeprowadzać procedurę identyfikacji i syntezy regulatora celem aktualizacji kształtu krzywych.

Jak pokazano, w wyniku przeprowadzonych eksperymentów identyfikacji dostajemy całą ro-

dzinę rozkładu zmiany wartości wyniku. Czyni to proces syntezy parametrów trudniejszym.

83

Rys. 7.22. Powierzchnia zmiany parametrów wymiennika bez aproksymacji.

Rys. 7.23. Powierzchnia zmiany wzmocnienia regulatora K1.

Należy bowiem jednoznacznie odpowiedzieć na pytanie, które parametry przyjąć – z wielokrot-

nej identyfikacji czy z przedziałów ufności identyfikacji przeprowadzonych w różnych punktach

pracy (rys. 7.21). Analityczne sposoby uwzględnienia wpływu rozrzutu zidentyfikowanych para-

metrów modelu liniowego na dobór parametrów regulatora zebrano w pracy [5] dla systemów

84

nieliniowych [106]. Innym sposobem uwzględnienia niepewności parametrów T i k zidentyfiko-

wanego modelu jest zastosowanie metody symulacji Monte Carlo dla wygenerowania zestawu

dwóch parametrów z ich potrójnego przedziału ufności (rys. 7.21). Poniżej przedstawimy dwa

zestawy bloków eksperymentów dla regulatora LQR i modeli zidentyfikowanych off-line.

Eksperymenty z doborem odpornego regulatora LQR i identyfikacją off-line

Wykonano ciekawe eksperymenty z zestawem regulatorów LQR syntetyzowanych dla średnich

wartości parametrów modelu k i T , odpowiadających wybranemu przepływowi F153 (rys. 7.21)

ale wspópracujących z modelami o parametrach innych, wybieranych do symulacji metodą losową

z ich przedziałów ufności ksym i Tsym. Dla każdego regulatoraKmean wyliczonego z algebraicznego

równania Riccatiego dla obiektu kmean i Tmean symulowano jego pracę z 10 różnymi modelami

ksym i Tsym (dla wybranego F153). Uzyskano różne wartości wskaźnika jakości i różne efekty sta-

bilizacji. Podjęto próbę syntezy regulatora LQR odpornego poprzez numeryczną minimalizację

symu wszystkich wskaźników jakości w funkcji współczynnika wzmocnienia regulatora K. Otrzy-

many współczynnikKrbst (różny od współczynnikaKmean) gwarantował optymalność przebiegów

stabilizacji w sensie średniej wartości wskaźnika (uśrednionego po 10 eksperymentach z różnymi

modelami). Wyniki optymalnych nastaw regulatora LQR otrzymane jako Kmean i wyniki współ-

czynnika Krbst dobrane numerycznie dla całego konkretnego przedziału ufności współczynników

kmean i Tmean przedstawiono na rys. 7.24.

Rys. 7.24. Wzmocnienia regulatora po optymalizacji metodą Monte Carlo.

W eksperymentach symulowanych dla zagwarantowania zerowego błędu statycznego w ukła-

85

dzie zamkniętym przyjmowano obecność dodatkowego członu całkującego w obiekcie jakim był

w rzeczywistości pracujący zawór na przepływie. Stąd dynamika systemu przyjmowała drugi

rząd. W końcowym efekcie symulowane były dwa współczynniki regulatora K1 i K2 (rys. 7.24).

Należy zauważyć, że na skutek skończonego czasu symulacji T = 3000 [s] niektóre wyniki

dla F153 > 20 [ml/s] dla badanego obiektu wymiennika dawały niezadawalający efekt stabilizacji

mimo mniejszej wartości średniego wskaźnika jakości. Z tych eksperymentów płynie ważny wnio-

sek, że niektóre proste metodologie uodporniania regulatorów na zmiany parametrów modelu

muszą być weryfikowane dodatkowymi metodami.

Eksperymenty identyfikacji z pełnym, nieliniowym modelem wymienika

Następny zestaw eksperymentów przeprowadzono z pełny, nieliniowym modelem wymiennika

o parametrach rozłożonych (7.8) dla różnych wartości sygnału F153. W tabeli 7.5 zebrano wyniki

przeprowadzonych symulacji dla zagadnienia stabilizacji przy założonym dotychczas wskaźniku

jakości. Parametry pracy wymiennika T116 = 60 [�], F156 = 10 [ml/s], T101 = 20 [�]. Ekspe-

ryment przeprowadzono z różnych warunków początkowych PV0 będących w stanie ustalonym.

Dla syntezy regulatora adaptacyjnego typu ”gain scheduling” wartości parametru modelu stałej

czasowej T i wzmocnienia k uzależniono od CV (przepływ F153), SP (zadana wartość temp.

T117) i PV (procesowa wartość temp. T117). Do wyjścia regulatora dodano wartość sterowania

w stanie ustalonym F153 = 13.317 [ml/s]. W trakcie symulacji równania (7.8) rozwiązywano rów-

nanie Riccatiego dla aktualnych wartości parametrów modelu i wybranych macierzy wagowych

wskaźnika Q = [1 0; 0 1], R = [100]. Otrzymane optymalne nastawy regulatora posłużyły do

wyliczenia sterowania CV dla następującego modelu:

x =

− 1T 01 0

x+ − kT0

u (7.16)

W eksperymentach symulowanych układu zamkniętego brały udział dane pochodzące z peł-

nego modelu (7.8). W celu uproszczenia dalszych rozważań założono pomijalny wpływ niemie-

rzalnych zmiennych stanu związanych z opóźnieniem. Założenie jest o tyle słuszne, że wartość

zaobserwowanego opóźnienia była znacznie mniejsza od stałej czasowej. Istnienie opóźnienia

wpływa destabilizująco na układ regulacji. Niemniej jednak dobrze (odpornie) dobrany układ

regulacji powinien być w stanie skompensować wpływ niemierzalnych zmiennych stanu. Podobnie

jak wartość stałej czasowej, wartość opóźnienia silnie zależała od wartości przepływów.

W tabeli 7.5 przedstawiono wartości wskaźnika jakości stabilizacji z wykorzystaniem peł-

nego zakresu zmian parametrów regulacji w regulatorze adaptacyjnym (zgodnie z wykresem

7.23) przy jednoczesnym doborze różnych wariantów uzależnienia parametrów modelu T ik od

punktu pracy (ang. set point, SP), od zmiany wyjścia obiektu (ang. process value, PV) i od

zmiany sterowania (ang. control value, CV). Poszczególne eksperymenty reprezentują wiersze

86

tabeli 7.5. Przykładowo SP i CV w 4-tym eksperymencie oznaczają, że parametr modelu T był

uzależniony od zmiany SP, a współczynnik wzmocnienia modelu k od sterowania CV. Tabela

reprezentuje wyniki dla stałej końcowej wartości PV=SP=40[�] i różnych początkowych warto-

ści PV0. Wszystkie eksperymenty z regulatorem adaptacyjnym i pełnym modelem wymiennika

(7.8) zakończyły się pozytywnie doprowadzając model z jednego punktu pracy do drugiego.

T k J[s] [ ml

s�] PV0 = 56[�] PV0 = 50[�] PV0 = 43[�] PV0 = 37[�] PV0 = 36[�] suma

m. splotowaCV CV 3.1732e+008 2.6400e+008 1.8993e+008 1.6533e+007 2.1267e+009 2.9145e+009CV SP 2.9109e+008 2.4106e+008 9.4544e+007 2.1522e+007 2.4380e+007 6.7259e+008CV PV 2.2013e+008 1.2265e+008 3.7901e+007 1.9971e+007 2.2581e+007 4.2323e+008SP CV 3.2071e+008 2.6706e+008 1.8935e+008 1.8417e+007 2.2190e+009 3.0146e+009SP SP 2.8625e+008 2.4035e+008 9.8581e+007 2.1197e+007 2.4308e+007 6.7069e+008SP PV 2.2162e+008 1.2490e+008 3.8261e+007 1.9795e+007 2.2516e+007 4.2709e+008PV CV 3.2384e+008 2.6660e+008 1.8893e+008 1.9889e+007 2.2567e+009 3.0559e+009PV SP 2.8477e+008 2.4144e+008 1.0803e+008 2.1298e+007 2.4467e+007 6.8000e+008PV PV 2.5113e+008 1.4246e+008 4.1344e+007 1.9889e+007 2.2622e+007 4.7745e+008

m. sklejanaCV CV 3.1696e+008 2.6392e+008 1.8995e+008 1.6951e+007 2.1154e+009 2.9032e+009CV SP 2.9143e+008 2.4187e+008 9.6930e+007 2.1632e+007 2.4484e+007 6.7635e+008CV PV 2.2338e+008 1.2552e+008 3.9206e+007 2.0059e+007 2.2653e+007 4.3082e+008SP CV 3.2009e+008 2.6656e+008 1.8940e+008 1.8387e+007 2.2122e+009 3.0066e+009SP SP 2.8714e+008 2.4121e+008 1.0090e+008 2.1334e+007 2.4420e+007 6.7500e+008SP PV 2.2565e+008 1.2807e+008 3.9595e+007 1.9900e+007 2.2598e+007 4.3581e+008PV CV 3.2278e+008 2.6615e+008 1.8899e+008 1.9557e+007 2.2353e+009 3.0328e+009PV SP 2.8565e+008 2.4214e+008 1.0951e+008 2.1428e+007 2.4567e+007 6.8330e+008PV PV 2.5383e+008 1.4459e+008 4.2388e+007 1.9987e+007 2.2698e+007 4.8349e+008

Tabela 7.5. Porównanie wskaźnika jakości pracy układu zamkniętego dla różnych parametrówmodelu liniowego zależnych od zmiennych procesowych dla symulowanego wymien-nika, SP=40�.

87

Rozdział 8

Wnioski

W pracy przedstawiono najważniejsze wyniki teorii optymalnej identyfikacji parametrów dla

ciągłych i liniowych obiektów z wykorzystaniem funkcji modulujących i sklejanych. Następ-

nie pokazano możliwość jednoczesnej i dokładnej (nieasymptotycznej) obserwacji stanu układu

z wykorzystaniem tych metod. Jednoczesna identyfikacja parametrów i stanu modelu posłużyły

do zbudowania adaptacyjnego regulatora bazującego na klasycznej teorii LQR. Przeprowadzo-

ne testy numeryczne potwierdziły skuteczność stosowania niniejszego adaptacyjnego algorytmu

regulacji dla układów ciągłych.

Zastosowanie bazowych funkcji sklejanych do budowy funkcji modulującej w metodzie splo-

towej umożliwia dogodne kształtowanie charakterystyk czasowo-częstotliwościowych. Takie do-

pasowanie jest szczególnie ważne dla sygnałów niestacjonarnych i znajduje zastosowanie w za-

gadnieniu obserwacji.

W wyniku prac nad przedstawionymi metodami identyfikacji powstała biblioteka o nazwie

Continous Identification Toolbox IDC w języku programowania Matlab. Zrealizowana bibliote-

ka w swoim interfejsie przypomina komercyjną bibliotekę identyfikacji dyskretnej Identyfication

Toolbox i będzie używana do dalszych badań. Biblioteka może być udostępniona osobom zain-

teresowanym.

Możemy określić dokładne właściwości częstotliwościowe (filtracyjne) funkcji modulującej co

powoduje, że metody oparte o nią są bardziej przewidywalne i poddają się analizie. W przypad-

ku użycia funkcji sklejanych w metodzie estymacji pochodnych praktycznie nie mamy możliwo-

ści wpłynięcia na parametry filtracyjne. Dobieramy ilość i rozkład węzłów, stopień wielomianu

bazowego. Jak pokazały przedstawione eksperymenty, funkcje bazowe aproksymujące sygnały

pomiarowe nadają się do zagadnienia identyfikacji i obserwacji.

Potwierdzono słuszność tezy gwarancji optymalnej jakości identyfikacji parametrów dla meto-

dy identyfikacji układów liniowych, ciągłych wykorzystującej splotowy filtr z nośnikiem zwartym

i kwadratowy wskaźnik jakości.

W pracy pokazano możliwość dwojakiego zastosowania funkcji sklejanych. Pierwszym zasto-

88

sowaniem było użycie ich do budowy optymalnych modulujących funkcji filtrujących o nośni-

ku zwartym. Drugim zadaniem była bezpośrednia aproksymacja pochodnych sygnałów wejścia

i wyjścia dla bezsplotowej metody identyfikacji.

W kolejnym etapie prowadzonych badań potwierdzono tezę, że ciągłe adaptacyjne regulatory

LQR wykorzystujące jednoczesną obserwację stanu i identyfikację parametrów obiektu (w opar-

ciu o funkcje modulujące i sklejane) gwarantują wysoką jakość stabilizacji układów o nieznanych

lub zmiennych parametrach.

Niezależnie od osiągniętych wyników przedstawionych w pracy, przeprowadzone analizy i ba-

dania ujawniły szereg interesujących kierunków dalszych prac. Przede wszystkim wydaje się

być celowa implementacja przedstawionych algorytmów w zintegrowanych systemach sterowa-

nia w środowisku czasu rzeczywistego PLC, softPLC. Rozbudowanie algorytmów o arytmety-

kę interwałową. Innym zagadnieniem jest badanie związku algorytmów identyfikacji splotowej

z transformatą falkową.

Podsumowując wyniki pracy można stwierdzić, że postawione w rozdziale 1 tezy naukowe

zostały przebadane. Ich prawdziwość starano się potwierdzić zarówno analitycznie jak i w wy-

niku przeprowadzonych eksperymentów numerycznych. W tych ostatnich wykorzystywano dane

symulowane, jak również dane rzeczywiste, uzyskane z fizycznego modelu.

89

Dodatek – stanowisko laboratoryjne

Na rys. 1 przedstawiono schemat konfiguracji stanowiska laboratoryjnego dwuskładnikowej ko-

lumny destylacyjnej. Pokazano obieg cieczy surowiec-produkt, obieg wody chłodzącej oraz spo-

sób podpięcia stanowiska operatorskiego i badawczego do instalacji. Surowcem jest roztwór wody

z etanolem o niskim stężeniu procentowym.

Przedstawiony schemat został znacznie uproszczony. Rzeczywistych punktów pomiarowych

jest 65. Są to czujniki pomiarowe temperatury, ciśnienia, poziomu i składu. Jako elementów wy-

konawczych użyto na instalacji: zawory, pompy i grzałki. Na schemacie zrezygnowano z przed-

stawienia zaworów rekonfigurujących strukturę stanowiska i jedynie przedstawiono zawory regu-

lacyjne. Pompy pracują ze stałą wydajnością. Regulacja przepływu jest osiągana poprzez zmianę

otwarcia zaworów. Elementem grzejnym jest zespół 9 grzałek elektrycznych umieszczonych w tu-

lejach olejowych o łącznej mocy 13.5 KW.

Praca instalacji nie byłaby możliwa bez obwodów pomiarowo-wykonawczych podpiętych do

sterownika logicznego PLC, który realizuje algorytmy sterowania stosowane w warstwie stero-

wania bezpośredniego. Zainstalowany sterownik logiczny posiada szereg wejść analogowych do

pomiaru ciągłych zmiennych pomiarowych. Wejścia binarne wykorzystane są do realizacji obwo-

dów potwierdzenia i osiągnięcia wartości granicznych zmiennych procesowych. Wejścia szybkich

liczników są połączone z przepływomierzami turbinkowymi. Wyjścia przekaźnikowe sterownika

podpięte są do odpowiednich obwodów wykonawczych.

Surowiec ze zbiornika poprzez pompę jest dostarczany do półkowej kolumny destylacyjnej.

W kolumnie zachodzą procesy wymiany masy pomiędzy cieczą i parą. Skutkuje to wzrostem

stężenia par etanolu, który jest skraplany w skraplaczach. Następnie skropliny gromadzone są

w zbiorniku wyrównawczym refluksu. Poprzez pompę gotowy surowiec przepompowywany jest

do zbiornika produktu. Cześć destylatu - refluks zawracana jest na szczyt kolumny. Wielokrotna

destylacja powoduje wzrost stężenia etanolu w produkcie końcowym.

Woda chłodząca ze zbiornika wyrównawczego jest dostarczana poprzez pompę do skraplaczy,

zbiornika refluksu oraz wymienników ciepła. Następnie ogrzana woda przepływa do chłodnicy

powietrznej z dmuchawą. Schłodzona woda jest buforowana w zbiorniku wyrównawczym. Ewen-

tualne braki wody chłodzącej są uzupełniane z sieci wodociągowej.

Gromadzenie i wizualizacja danych pomiarowych są realizowane na stacji operatorskiej wy-

90

posażonej w wykonane w Katedrze Automatyki oprogramowanie do nadzoru, kontroli i akwizycji

danych SCADA, uzupełnione i poprawione przez autora, rys. 2 i rys. 3. W celu podniesienia bez-

pieczeństwa prowadzonych eksperymentów prace badawcze są realizowane na dodatkowej stacji

roboczej wyposażonej w pakiet do obliczeń Matlab.W wielopoziomowym systemie sterowania zainstalowane są dwa systemy operacyjne QNX

i MS Windows NT. Sterowniki PLC to w większości sterowniki firmy GE Fanuc. Na sprzętkomputerowy składają się komputer przemysłowy firmy Advantech i dwa stacjonarne komputerytypu PC.

Rys. 1. Kolumna destylacyjna.

91

Rys. 2. Widok obwodu chłodzenia w SCADA.

Rys. 3. Widok obwodu wyparki w SCADA.

92

Bibliografia

[1] E. Anderson, Z. Bai, C. Bischof. LAPACK Users’ Guide. Society for Industrial and AppliedMathematics, wydanie III, 1999.

[2] K. J. Astrom, B. Wittenmarka. On self-tuning regulators. Automatica, 9:185-199, 1973.

[3] K. J. Astrom, B. Wittenmarka. Adaptive control. Addison-Wesley Publishing Company, 1989.

[4] K. J. Astrom, B. Wittenmarka. Computer-controlled systems : theory and design. Prentice Hall,1997.

[5] S.P. Bhattacharyya, H. Chapellat, L.H. Keel. Robust control. The parametric approach. PrenticeHall, Upper Saddle River 1995.

[6] A. Bjorck, L. Dahlquist. Metody numeryczne. PWN, Warszawa 1987.

[7] G. E. P. Box, G. M. Jenkins. Analiza szeregów czasowych: prognozowanie i sterowanie. PWN,Warszawa 1983.

[8] I. N. Bronsztejn, K. A. Siemiendiajew. Nowoczesne kompendium matematyki. PWN, Warszawa2004.

[9] C.G. Broyden. The convergence of a class of double-rank minimization algorithms. J. Inst. Maths.Applics, 6:76-90, 1970.

[10] N.P. Buslenko, W.W. Kałasznikow, I.N. Kowalenko. Teoria systemów złożonych. PWN, Warszawa1979.

[11] J. Byrski. Przegląd technologii CORBA ze szczególnym uwzględnieniem zagadnień czasu rzeczy-wistego. Automatyka, 7(3):423-432, 2003.

[12] W. Byrski. Theory and application of the optimal integral state observer. ECC, strona 526-531,1995.

[13] W. Byrski. Dokładna rekonstrukcja stanu - teoria i przykłady zastosowania. Automatyka, 7(3),AGH, Kraków 2003.

[14] W. Byrski. Obserwatory i ich zastosowanie w systemach sterowania adaptacyjnego. Automatyka,65, AGH, Monografie, Kraków 1993.

[15] W. Byrski. Obserwacja i sterowanie w systemach dynamicznych. Wydawnictwo PAN-AGH,Kraków 2007.

[16] W. Byrski, S. Fuksa. Linear quadratic controller for continuous systems with compact support fil-ter for optimal identification and state observation. Second International Symposium on Methodsand Models in Automation and Robotic MMAR, 1995.

93

[17] W. Byrski, S. Fuksa. Optimal identification of continuous systems in l2 space by the use ofcompact support filter. Interational Journal of Modelling and Simulation, 15(4), 1995.

[18] W. Byrski, S. Fuksa. Time variable Gram matrix eigen-problem and its application to optimalidentification of continuous systems. ECC, Karlsruhe 1999.

[19] W. Byrski, S. Fuksa, M. Nowak. The quality of identification for different normalizations of conti-nuous transfer functions. Proceedings of the 22nd IASTED International Conference on Modelling,Identification, and Control, Innsbruck 2003.

[20] W. Byrski, S. Fuksa, M. Nowak. Optymalny filtr splotowy dla jednoczesnej identyfikacji parame-trów i obserwacji stanu. Zastosowanie w regulatorze adaptacyjnym. Seminarium nt.: Przetwarza-nie i analiza sygnałów w systemach wizji i sterowania. Wyd. ACGM Łódź, Słok 2002.

[21] W. Byrski, S. Fuksa, M. Nowak. Optymalizacja funkcji modulującej dla zastosowań w regulatorzeadaptacyjnym. XXXIV OKZM. Komitet Matematyki PAN, Zakopane 2005.

[22] W. Byrski, M. Nowak. Optymalny filtr splotowy dla jednoczesnej identyfikacji parametrów i ob-serwacji stanu. Zastosowanie w regulatorze adaptacyjnym. XV Krajowa Konferencja Automatyki.Instytut Badań Systemowych Polskiej Akademii Nauk, Warszawa 2005.

[23] W. Byrski, M. Nowak. Optymalizacja funkcji modulującej dla zastosowań w regulatorze ad-aptacyjnym. XXXIII Ogólnopolska Konferencja Zastosowań Matematyki. Komitet MatematykiPolskiej Akademii Nauk, Zakopane 2004.

[24] J. Celko. SQL zaawansowane techniki programowania. Wydawnictwo MIKOM, Warszawa 1999.

[25] P. Craven, G. Wahba. Smoothing noisy data with spline functions: Estimation the correct degreeof smoothing by the method of generalized cross-validation. Math, 31:377-403, 1979.

[26] S. Daniel-Berhe, H. Unbehauen. Physical parameters estiamtion of the nonlinear continous-timedynamics of a DC motor using Hartley modulating functions method. Journal of The FranklinInstitute, 336:481-501, 1999.

[27] J. M. Douglas. Dynamika i sterowanie procesów. WNT, Warszawa 1976.

[28] G. Dragffy. The VLSI route for highly reliable ESDs. ISA Transactrions, 38(1):101-119, 1999.

[29] J. T. Duda. Modelowanie i symulacja procesów w systemach komputerowych sterowania nad-rzędnego. Automatyka, 4, 2000.

[30] J. T. Duda. Modele matematyczne, struktury i algorytmy nadrzędnego sterowania komputerowego.Uczelniane Wydawnictwa Naukowo-Dydaktyczne, Kraków 2003.

[31] W. Findeisen. Wielopoziomowe układy sterowania. Biblioteka Naukowa Inżyniera. PWN, War-szawa 1974.

[32] W. Findeisen. Analiza systemowa. Podstawy i metodologia. PWN, Warszawa 1985.

[33] W. Findeisen. Struktury sterowania dla złożonych systemów. Oficyna Wydawnicza PolitechnikiWarszawskiej, Warszawa 1997.

[34] R. Fletcher. A new approach to variable metric algorithms. Computer Journal, 13:317-322, 1970.

[35] Z. Fortuna, B. Macukow, J. Wąsowski. Metody numeryczne. WNT, wydanie V, Warszawa 2001.

94

[36] P. Gaś, M. Nowak, J. Kusiak. Narzędzia wspierające praktyczne zajęcia laboratoryjne we współ-czesnej uczelni technicznej, na przykładzie Akademii Górniczo-Hutniczej. Studium przypadku.Wirtualne Campusy - nowy wymiar edukacji. PTI i KRUN, Warszawa 2005.

[37] M. Gabassi, B. Dupouy. Przetwarzanie rozproszone w systemie Unix. Wydawnictwo LUPUS,Warszawa 1996.

[38] M. Galassi, J. Davies, J. Theiler, B. Gough, G. Jungman, M. Booth, F. Rossi. GNU ScientificLibrary Reference Manual. Free Software Foundation, wydanie 1.7, 2005.

[39] A. Gawdzik, B. Tabiś, W. Figiel. Zasady sterowania procesami technologicznymi i inżynieriichemicznej. Wydawnictwo Politechniki Krakowskiej, Kraków 1991.

[40] D. Goldfarb. A family of variable metric updates derived by variational means. Mathematics ofComputing, 24:23-26, 1970.

[41] T. Goto, J. Miyakura, K. Umeda. A robust spline filter on the basis of L2-norm. PrecisionEngineering, 29(2):157-161, 2005.

[42] P. Grabowski. Abstract model of a heat exchanger and its application. 11th IEEE InternationalConference on Methods and Models in Automation and Robotics, 2005.

[43] A. Górecka-Drzazga. Mikrotas-y (zastosowanie mikrosystemów w medycynie). Ra-port instytutowy, Politechnika Wrocławska, Wydział Elektroniki Mikrosystemów i Fotoniki,http://www.wemif.pwr.wroc.pl/agd/mikroTAS-y.pdf, 2004.

[44] H. Górecki.Wstęp do teorii układów sterowania z uwzględnieniem przypadkowych zakłóceń. Poldexs.c., Kraków 1997.

[45] H. Górecki, S. Fuksa, A. Korytowski, W. Mitkowski. Sterowanie optymalne z kwadratowym wskaź-nikiem jakości. Biblioteka Naukowa Inżyniera. PWN, Warszawa 1983.

[46] W. Grega. Metody i algorytmy sterowania cyfrowego w układach scentralizowanych i rozproszo-nych. Uczelniane Wydawnictwa Naukowo-Dydaktyczne, Kraków 2004.

[47] M.W. Głuszkow. Synteza automatów cyfrowych. WNT, Warszawa 1968.

[48] S. Hasebe. Design and operation of micro-chemical plants–bridging the gap between nano, microand macro technologies. Computers and Chemical Engineering, 29:57-64, 2004.

[49] S. Ibrir, S. Diop. Numerical procedure for filtering and efficient high-order signal differentiation.International Journal of Applied Mathematics And Computer Science, 14(2):201-208, 2004.

[50] R. Isermann, K. Lachmann, D. Matko. Adaptive control. Prentice Hall, N.Y. 1992.

[51] J. Jakubiec. Redukcyjna arytmetyka interwałowa w zastosowaniu do wyznaczania niepewności al-gorytmów przetwarzania danych pomiarowych. Wydawnictwo Politechniki Śląskiej, Gliwice 2002.

[52] K. Janik, M. Nowak. Relacyjna baza danych jako narzędzie przetwarzania danych w systemieczasu rzeczywistego. Systemy Czasu Rzeczywistego (SCR’01), strona 361-369, 2001.

[53] T. Kaczorek. Teoria sterowania i systemów. PWN, Warszawa 1999.

[54] V. Kale. SAP R/3 Przewodnik dla menadżerów. Helion, Gliwice 2001.

[55] R. E. Kalman. A new approach to linear filtering and prediction problems. Transaction of hteASME. Journal of basic engineering, 82(D):35-45, 1960.

95

[56] J. Kasprzyk. Identyfikacja procesów. Wydawnictwo Politechniki Śląskiej, Gliwice 2002.

[57] E. Kącki. Równania różniczkowe cząstkowe. WNT, Warszawa 1989.

[58] P. Kiciak. Podstawy modelowania krzywych i powierzchni. WNT, wydanie II, Warszawa 2000,2005.

[59] A. Kiełbasiński, H. Schwetlick. Numeryczna algebra liniowa: wprowadzenie do obliczeń zautoma-tyzowanych. WNT, Warszawa 1992.

[60] M. Klemiato. Przegląd statystycznych metod detekcji małych zmian w przebiegach procesowych.Pomiary Automatyka Robotyka, 1, 2006.

[61] M. Klemiato. Algorytmiczne nadzorowanie układów regulacji nadrzędnej. Praca doktorska, Aka-demia Górniczo-Hutnicza, Kraków 2001.

[62] L. Kołodziejczyk, M. Rubik. Technika chłodnicza w klimatyzacji. Arkady, Warszawa 1976.

[63] J. Korbicz, J.M. Kościelny, Z. Kowalczuk, W. Cholewa. Diagnostyka procesów przemysłowych:modele, metody sztucznej inteligencji, zastosowania. WNT, Warszawa 2002.

[64] A. Korytowski. Analityczne rozwiązanie liniowo-kwadratowego problemu sterowania optymalnegoz opóźnieniem, wolumen 24. Monografie AGH, Kraków 1995.

[65] A. Korytowski, M. Ziółko. Metody optymalizacji z ćwiczeniami laboratoryjnymi, wolumen 1300.Wydawnictwo AGH, Kraków 1992.

[66] R. Kulikowski. Sterowanie w wielkich systemach. WNT, Warszawa 1974.

[67] P. De Larminat, Y. Thomas. Automatyka układy liniowe. Sygnały i układy. Sterowanie. Identy-fikacja. WNT, Warszawa 1983.

[68] G. Lausen, G. Vossen. Obiektowe bazy danych. Modele danych i języki. WNT, Warszawa 2000.

[69] B. Liptak. Process control and optimization, wolumen 2 serii Instrument Engineers’ Handbook.CRC Press, wydanie IV, 2005.

[70] T. Łuba, M.A. Markowski, B. Zbierzchowski. Komputerowe projektowanie układów cyfrowychw strukturach PLD. Wydawnictwo Komunikacji i Łączności, Warszawa 1993.

[71] D. G. Luenberger. An introduction to observers. IEEE Transaction on Automatic Control,16:596-602, 1971.

[72] W. L. Luyben. Modele, symulacje i sterowanie procesów przemysłu chemicznego. InżynieriaChemiczna. WNT, Warszawa 1976.

[73] K. Mańczak. Metoda identyfikacji wielowymiarowych obiektów sterowania. WNT, Warszawa 1971.

[74] K. Mańczak, Z. Nahorski. Komputerowa identyfikacja obiektów dynamicznych. PWN, Warszawa1983.

[75] S. Maguire. Niezawodność oprogramowania. Techniki tworzenia bezbłędnych programów języku C— rodem z Microsoftu. HELION, Gliwice 2002.

[76] Young-Joon Choi Mal-Rey Lee, Tae-Eyn Kim. An expert-system approach to monitoring thegeneral operating procedures of PWR plant. Engng. Applic. Artif. Intell, 9(3):321-329, 1996.

96

[77] V. Maletynsky. Identification of continous dynamical systems with spline-type modulating func-tions method. IFAC Congr. on Parameter Identification and Parameter Estimation, wolumen 1,strona 275-281, Darmstad 1979.

[78] Mathworks. MATLAB Model Predictive Control Toolbox User’s Guide.

[79] Mathworks. MATLAB Optimization Toolbox User’s Guide.

[80] Mathworks. MATLAB Robust Control Toolbox User’s Guide.

[81] Mathworks. MATLAB Signal Processing Toolbox User’s Guide.

[82] Mathworks. MATLAB Spline Toolbox User’s Guide.

[83] Mathworks. MATLAB The Control System Toolbox User’s Guide.

[84] Mathworks. Stateflow User’s Guide.

[85] G. De Micheli. Synteza i optymalizacja układów cyfrowych. WNT, Warszawa 1998.

[86] W. Mitkowski. Stabilizacja systemów dynamicznych. WNT, Warszawa 1991.

[87] Z. Mrozek. Wybrane, skończenie wymiarowe metody aproksymacji obiektów o parametrach rozło-żonych. Praca doktorska, Akademia Górniczo-Hutnicza, Kraków 1982.

[88] National Instruments Corporation. LabVIEW FPGA Module User Manual, 2004.

[89] A. Niederliński. Systemy komputerowe automatyki przemysłowej. T. 2, Zastosowania. WNT,Warszawa 1985.

[90] A. Niederliński, J. Kasprzyk, J. Figwer. Multi-edip. Analizator wielowymiarowych sygnałówi obiektów. Wydawnictwo Politechniki Śląskiej, Gliwice 1997. Skrypt 2017.

[91] A. Niederliński, J. Mościński, Z. Ogonowski. Regulacja adaptacyjna. PWN, Warszawa 1995.

[92] M. Nowak, A. Adamek, W. Byrski. Zastosowanie funkcji sklejanych w zadaniu optymalnej iden-tyfikacji ciągłego systemu liniowego. XXXIII Ogólnopolska Konferencja Zastosowań Matematyki,Zakopane 2004.

[93] M. Nowak, R. Dudek. Język SCADAML opisu budowy systemów kontroli, nadzoru i akwizycjidanych. Systemy Czasu Rzeczywistego (SCR’05), 2005.

[94] M. Nowak, M. Klemiato, W. Byrski. Remote laboratory Uniboss for distributed real-time andembedded control system. 16th EAEEIE conference, Lappeenranta 2005.

[95] M. Nowak, B. Schmidt. Implementacja rozproszonych aplikacji sterowania i nadzoru w architek-turze CORBA. Systemy Czasu Rzeczywistego (SCR’05), 2005.

[96] A. Patra, H. Unbehauen. Identification of a class of nonlinear continuous-time systems usingHartley modulating functions. Int. J. Control, 62(2):1431-1451, 1995.

[97] A. Peszko. Elementy organizacji i zarządzania przedsiębiorstwem. Wydawnictwa AGH, Kraków1996.

[98] K. Peter, R. Isermann. Parameter-adaptive PID control based on continuous time process models.wolumen 2, strona 495-500, 1989.

97

[99] A. Piłat. Programmable analog hardware for control systems exampled by magnetic suspension.Regular sessions: Computer Methods and Systems, wolumen 2, strona 143-148, Kraków 2005.

[100] J.W. Pietrowski, W.G. Fastowski. Współczesne wysokosprawne wymienniki ciepła. WNT, War-szawa 1964.

[101] P. Piątek. Sterowanie magnetycznym zawieszeniem z wykorzystaniem szybkich sterowników opar-tych na technologii FPGA. XV Konferencja Automatyki, II:111-116, 2005.

[102] H. A. Preisig, D. W. T. Rippin. Theory and application of the modulating function method – I.review and theory of the method and theory of the spline-type modulating functions. ComputersChem. Engng., 17(1):1-16, 1993.

[103] H. A. Preisig, D. W. T. Rippin. Theory and application of the modulating function method –II. algebraic representation of Maletinsky’s spline-type modulating functions. Computers Chem.Engng., 17(1):17-28, 1993.

[104] H. A. Preisig, D. W. T. Rippin. Theory and application of the modulating function method– III. application to iddustrial process, a well-stirred tank reactor. Computers Chem. Engng.,17(1):29-39, 1993.

[105] W. H. Press, S. A. Teukolsky, W. T. Vetterling, B. P. Flannery. Numerical recipes in C. NumericalRecipes Software, wydanie II.

[106] Zhihua Qu. Robust control of nonlinear uncertain systems. A Wiley-Iterscience Publication, 1998.

[107] Ł. Rauch, M. Nowak, M. Paćko, S. Węglarczyk, J. Kusiak. Wirtualne laboratorium dydaktyczneprocesów obróbki skrawaniem. Polska metalurgia w latach 2002-2006, Krynica 2006.

[108] P. Reinermann. The maturation of a technology: Predictive emissions monitoring. ChemicalEngineering, July:50-55, 2006.

[109] D. E. Seborg, T. F. Edgar, D. A. Mellichamp. Process dynamics and control. John Wiley & Sons,1989.

[110] J. Seidler, A. Badach, W. Molisz. Metody rozwiązywania zadań optymalizacji. Podręczniki Aka-demickie. Elektronika-Informatyka-Telekomunikacja. WNT, Warszawa 1980.

[111] D. F. Shanno. Conditioning of quasi-Newton methods for function minimization. Mathematicsof Computing, 24:647-656, 1970.

[112] J. A. Shaw. How critical is your control system? ISA Transactions 34, strona 185-192, 1995.

[113] M. Shinbrot. On the analysis of linear and nonlinear dynamic systems from transient-responsedata. National Advisory Committee for Aeronautics NACA, Washington 1954.

[114] F.G. Shinskey. Process-control systems. Application Design Adjustment. McGraw-Hill BookCompany, 1967.

[115] M. G. Singh, P. Varaiya, M. Aizerman. Identification of continuous systems. Elsevier SciencePublishers B.V., Amsterdam 1987.

[116] S. Skoczowski. Deterministyczna identyfikacja i jej wykorzystanie w odpornej regulacji PID tem-peratury. Wydawnictwo Uczelniane Politechniki Szczecińskiej, Szczecin.

[117] T. Soderstrom, P. Stoica. Identyfikacja systemów. PWN, Warszawa 1997.

98

[118] B. S. Sotskow. Niezawodność elementów i urządzeń automatyki. WNT, Warszawa 1973.

[119] G.G. Stephens, M.R. Mackley. Heat transfer performance for batch oscillatory flow mixing.Experiment Thermal and Fluid Science, 25:583-594, 2002.

[120] W. R. Stevens. Programowanie zastosowań sieciowych w systemie Unix. WNT, Warszawa 1998.

[121] T. Szmuc. Zaawansowane metody tworzenia oprogramowania systemów czasu rzeczywistego. CCA-TIE, Kraków 1998.

[122] R. Tadeusiewicz. Sieci neuronowe. WNT, Warszawa 1997.

[123] P. Tatjewski. Sterowanie zaawansowane obiektów przemysłowych. Struktury i algorytmy. Akade-micka Oficyna Wydawnicza Exit, Warszawa 2002.

[124] M. Tay, M. Macharia. Reducing energy costs with model predictive control solutions. EthanolProducer Magazine, July, 2006.

[125] W. Traczyk. Układy cyfrowe. Podstawy teoretyczne i metody syntezy. WNT, Warszawa 1982.

[126] J. Trzcieniecki. Projektowanie systemów zarządzania. PWN, Warszawa 1980.

[127] K. Warwick, W. Irwin, K.J. Hunt. Neural networks for control and systems. Peter Peregrinus,London 1992.

[128] A. Weiss, T. Gruźlewski. Programowanie współbieżne i rozproszone w przykładach i zadaniach.WNT, Warszawa 1993.

[129] H. Wysocki. Zastosowanie nieklasycznego rachunku operatorów do identyfikacji liniowych układówdynamicznych. AOW Exit, Warszawa 2006.

[130] W. Żakowski, W. Leksiński. Matematyka IV. Podręczniki Akademickie. Elektronika-Informatyka-Telekomunikacja. WNT, Warszawa 1995.

[131] T. P. Zieliński. Od teorii do cyfrowego przetwarzania sygnałów. Wykonano nakładem WEAIiEAkademii Górniczo-Hutniczej, Kraków 2002.

99

Metody identyﬁkacji układów ciągłych z wykorzystaniem...

Documents

Transcript of Metody identyﬁkacji układów ciągłych z wykorzystaniem...