Optymalizacja kształtu cewki
Transcript of Optymalizacja kształtu cewki
Akademia Górniczo-Hutniczaim. Stanisława Staszica w Krakowie
Wydział Elektrotechniki, Automatyki,Informatyki i Inżynierii Biomedycznej
Katedra Elektrotechniki i Elektroenergetyki
Rozprawa doktorska
Kształtowanie rozkładu pola magnetycznegoz wykorzystaniem zaawansowanych metod obliczeniowych
mgr inż. Bartłomiej Garda
Promotor:dr hab. inż. Zbigniew Galias, prof. AGH
Kraków, 2013
Spis treści
Spis treści i
Wykaz ważniejszych skrótów i oznaczeń iv
1 Wstęp 11.1 Cel i teza pracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Zawartość pracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Przedstawienie problemu 42.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2 Synteza pola magnetycznego . . . . . . . . . . . . . . . . . . . . . . 52.3 Pole magnetyczne cewki . . . . . . . . . . . . . . . . . . . . . . . . 62.4 Przypadek liniowy . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.5 Błąd dyskretyzacji . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5.1 Cewka nieskończenie cienka . . . . . . . . . . . . . . . . . . 102.5.2 Cewka o skończonej grubości . . . . . . . . . . . . . . . . . 11
2.6 Definicja funkcji celu . . . . . . . . . . . . . . . . . . . . . . . . . . 122.7 Ocenianie wyników . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Metody optymalizacji 163.1 Podstawowe definicje . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2 Optymalizacja z ograniczeniami . . . . . . . . . . . . . . . . . . . . 173.3 Klasyfikacja metod optymalizacji . . . . . . . . . . . . . . . . . . . 193.4 Zagadnienie najmniejszych kwadratów . . . . . . . . . . . . . . . . 21
3.4.1 Zagadnienie najmniejszych kwadratów bez ograniczeń . . . 213.4.2 Zagadnienie najmniejszych kwadratów z ograniczeniami . . 24
3.5 Metoda regularyzacji . . . . . . . . . . . . . . . . . . . . . . . . . . 303.6 Optymalizacja nieliniowa . . . . . . . . . . . . . . . . . . . . . . . . 32
3.6.1 Metoda sympleksowa Neldera-Meada . . . . . . . . . . . . . 323.6.2 Gradientowe metody optymalizacji bez ograniczeń . . . . . 333.6.3 Metody gradientowe dla optymalizacji z ograniczeniami . . 38
i
ii SPIS TREŚCI
3.6.4 Nieliniowe zagadnienie najmniejszych kwadratów . . . . . . 403.7 Algorytmy niedeterministyczne . . . . . . . . . . . . . . . . . . . . 41
3.7.1 Algorytm symulowanego wyżarzania . . . . . . . . . . . . . 413.7.2 Algorytmy ewolucyjne . . . . . . . . . . . . . . . . . . . . . 42
4 Optymalizacja rozkładu prądu w cewce 484.1 Opis rozważanych problemów . . . . . . . . . . . . . . . . . . . . . 484.2 Optymalizacja pola magnetycznego bez ograniczeń . . . . . . . . . 50
4.2.1 Wybór metody rozwiązania układu równań normalnych . . 504.2.2 Pole magnetyczne kształtowane na osi . . . . . . . . . . . . 524.2.3 Pole magnetyczne kształtowane na powierzchni kuli . . . . 554.2.4 Podsumowanie problemu optymalizacji bez ograniczeń . . . 59
4.3 Regularyzacja Tichonowa . . . . . . . . . . . . . . . . . . . . . . . 624.4 Optymalizacja z ograniczeniami . . . . . . . . . . . . . . . . . . . . 67
4.4.1 Nieujemna metoda najmniejszych kwadratów . . . . . . . . 704.4.2 Zagadnienie najmniejszych kwadratów z ograniczeniami . . 76
4.5 Porównanie wyników . . . . . . . . . . . . . . . . . . . . . . . . . . 814.6 Inne metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.6.1 Metoda quasi-Newtona . . . . . . . . . . . . . . . . . . . . 854.6.2 Metoda sympleksowa Neldera–Meada . . . . . . . . . . . . 874.6.3 Symulowane wyżarzanie . . . . . . . . . . . . . . . . . . . . 874.6.4 Algorytm genetyczny . . . . . . . . . . . . . . . . . . . . . . 884.6.5 Podsumowanie wyników . . . . . . . . . . . . . . . . . . . . 89
4.7 Synteza niejednorodnego pola magnetycznego . . . . . . . . . . . . 90
5 Optymalizacja kształtu cewki 955.1 Przedstawienie problemu . . . . . . . . . . . . . . . . . . . . . . . . 955.2 Funkcja celu dla problemu optymalizacji kształtu . . . . . . . . . . 975.3 Wyniki obliczeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3.1 Pole magnetyczne kształtowane na osi . . . . . . . . . . . . 985.3.2 Podsumowanie wyników . . . . . . . . . . . . . . . . . . . . 1015.3.3 Optymalizacja kształtu cewki z gęstością prądu . . . . . . . 1065.3.4 Inne metody . . . . . . . . . . . . . . . . . . . . . . . . . . 1095.3.5 Pole magnetyczne kształtowane na powierzchni kuli . . . . 1125.3.6 Podsumowanie wyników . . . . . . . . . . . . . . . . . . . . 114
5.4 Synteza niejednorodnego pola magnetycznego . . . . . . . . . . . . 115
6 Analiza rzeczywistej cewki 121
7 Podsumowanie 125
Bibliografia 129
SPIS TREŚCI iii
A Pole magnetyczne zwoju kołowego 135
Wykaz ważniejszych skrótów i oznaczeń
Γ – obszar w którym generowane jest pole magnetyczne o zadanymrozkładzie
Ω – obszar obejmujący przewody cewkim – liczba punktów w obszarze Γn – liczba punktów w obszarze ΩI, x – wektor natężeń prądu elektrycznego w uzwojeniachj – gęstości prądu w uzwojeniu cewkiA – potencjał wektorowy pola magnetycznegoB, Br, Bz – wektor pola magnetycznego oraz jego składowebreq, b – składowa w kierunku z zadanego pola magnetycznegof – funkcja celug – funkcja ograniczeńK(·), E(·) – całki eliptyczne, pierwszego i drugiego rodzajuK(·, ·, ·, ·) – jądro równania całkowego FredholmaL – funkcja Lagrange’aλ, µ – współczynniki Lagrange’a odpowiadające ograniczeniom rów-
nościowym i nierównościowymµ0 = 4π10−7 – przenikalność magnetyczna próżniζ(z) – funkcja opisująca wewnętrzny kształt cewkirc – promień cewki w przypadku cewki jednowymiarowejrcmin – wewnętrzny promień cewki w przypadku dwuwymiarowymrcmax – zewnętrzny promień cewki w przypadku dwuwymiarowymzcmin – współrzędna z początku cewkizcmax – współrzędna z końca cewkirreq – promień sfery z zadanym polem magnetycznymzreqmin – współrzędna z początku obszaru z zadanym polem magnetycz-
nymzreqmax – współrzędna z początku obszaru z zadanym polem magnetycz-
nym
iv
Podziękowania
Serdecznie chciałbym podziękowaćprof. dr. hab. inż Zbigniewowi Galiasowi, mojemu promotorowi
za pomoc, zaangażowanie i mnóstwo cennych wskazówek,bez których z pewnością niniejsza praca nie mogłaby powstać.
Składam również podziękowaniaprof. dr. hab. inż. Antoniemu Cieśli
za wskazanie i wprowadzenie w tak ciekawy temat,jakim jest synteza pola magnetycznego.
Pracę dedykuję moim synom Piotrowi i Michałowi.
v
Rozdział 1
Wstęp
Budowa magnesów wytwarzających pole magnetyczne o zadanym kształcie na-leży do zagadnień syntezy pola magnetycznego. Synteza pola jest przedmiotemintensywnych badań od wielu lat. Już w latach 50. pojawiły się pierwsze pracedotyczące kształtowania pola magnetycznego [6][33]. W latach 60. opublikowa-no ważne prace dotyczące konstrukcji cewek rezystancyjnych i nadprzewodzą-cych [5][31][17][59]. Zastosowano aparat optymalizacji analitycznej wykorzystują-cej pewne uproszczone modele. Ponieważ, w ogólności synteza pola magnetycz-nego jest zagadnieniem źle postawionym w sensie Hadamarda [39], ważną rolęw badaniach nad syntezą pola magnetycznego odegrało wykorzystanie metodregularyzacji, szczególnie regularyzacji Tichonowa [1][23][75][74][67]. Ze względuna fakt liniowej zależności pomiędzy prądem a wytworzonym przez niego po-lem magnetycznym pojawiło się wiele rozwiązań wykorzystujących programowa-nie liniowe oraz metodę najmniejszych kwadratów [41][57][62]. W wielu pracachdotyczących kształtowania pola magnetycznego wykorzystuje się metody niede-terministyczne. Wykorzystane są np. metody Tabu-Search [56] oraz algorytmyewolucyjne i genetyczne [20][50][71].
Jednym z najczęściej pojawiających się problemów syntezy pola magnetycz-nego jest wytworzenie w pewnym zadanym obszarze pola jednorodnego. Problemten znajduje zastosowanie przy budowie urządzeń na potrzeby diagnostyki me-dycznej takich jak rezonans magnetyczny (Magnetic Resonance Imaging, MRI)[46][69], gdzie silne jednorodne pole musi być wzbudzone w założonym obsza-rze. Autor w swojej dotychczasowej pracy zetknął się z problemem kształtowa-nia rozkładu pola w zastosowaniu magnesów do budowy filtrów magnetycznych[14][66]. W tym przypadku wytworzenie jednorodnego pola magnetycznego stwa-rza korzystne warunki do ekstrakcji cząstek z filtrowanej zawiesiny[15]. Zarównow urządzeniach MRI jak i w filtrach magnetycznych wymagane jest wzbudzaniesilnych pól magnetycznych, w obszarach o znacznej objętości. Najczęściej wyko-rzystuje się do tego celu uzwojenia nadprzewodnikowe.
1
2 ROZDZIAŁ 1. WSTĘP
1.1 Cel i teza pracy
W początkowym okresie swojej pracy badawczej autor zetknął się z problememrozpoznania kształtu i parametrów wewnętrznych magnesu nadprzewodnikowegoznajdującego się Laboratorium Kriotechniki Katedry Elektrotechniki i Elekto-renergetyki. Na podstawie pomiarów pośrednich (w tym pomiaru pola magne-tycznego wewnątrz cewki) dokonano zgrubnej analizy kształtu cewki wraz z do-zwojeniami. Następnie autor dokonał próby optymalizacji kształtu pola magne-tycznego z wykorzystaniem algorytmów genetycznych oraz Metody ElementówSkończonych (MES) [28][30]. Podejście takie nie dało zadowalających rezultatówszczególnie dla większych wymiarów problemu. Dlatego w niniejszej dysertacjiautor postawił następującą tezę:
Wykorzystanie odpowiednio dobranych metod obliczeniowych, umoż-liwia dokładniejsze i bardziej efektywne rozwiązanie zagadnienia syn-tezy pola magnetycznego, niż metody dotychczas stosowane.
Teza ta wynikała z pewnych założeń dotyczących analizowanego problemu.Rezygnując w pewnym sensie z ogólności rozwiązania, można konstruować cewkiwytwarzające zadane pole magnetyczne w sposób bardziej dokładny. Strata ogól-ności problemu polega na rezygnacji z metody elementów skończonych i wykorzy-staniu analitycznych zależności pomiędzy rozważanymi wielkościami. Rezygnacjaz metody elementów skończonych była możliwa, gdyż rozważano problem wytwo-rzenia pola magnetycznego w środowisku magnetycznie liniowym (powietrze). Wcelu potwierdzenia postawionej tezy wyznaczono następujący cel pracy:
Celem pracy jest porównanie różnych metod obliczeniowych do roz-wiązania problemu syntezy pola magnetycznego oraz wskazanie naj-bardziej efektywnej metody. Metody będą porównane pod względemjakości rozwiązania oraz złożoności obliczeniowej. Analizowane będąliniowe oraz nieliniowe problemy syntezy pola, tzn. problem doboruwartości prądów przy zadanym kształcie cewki jak i problem doborukształtu cewki przy stałej gęstości prądu.
Pole magnetyczne możemy kształtować za pomocą zmiany wartości prądóww przewodach, których położenie jest ustalone lub poprzez zmianę położeniaprzewodów i ewentualnie również wartości prądów w tych przewodach.Ponieważ w środowiskach magnetycznie liniowych związek pomiędzy warto-
ścią prądu a polem przez niego wytworzonym jest liniowy, to pierwszy przypadekkształtowania pola (dobór wartości prądów przy ustalonym położeniu) jest pro-blemem liniowym. Ponieważ położenie przewodu w sposób nieliniowy wpływa nawartość pola magnetycznego, to drugi przypadek kształtowania pola nazywamy
1.2. ZAWARTOŚĆ PRACY 3
nieliniowym.
1.2 Zawartość pracy
Praca składa się z wykazu najważniejszych oznaczeń, siedmiu rozdziałów, dodat-ku oraz spisu literatury.Pierwszy rozdział stanowi wstęp oraz przegląd literatury. Postawiono w nim
tezę pracy oraz nakreślono jej cel. Streszczono również zawartość pracy.W rozdziale drugim zdefiniowano problem syntezy pola magnetycznego. Do-
konano analizy błędów dyskretyzacji. Zdefiniowano funkcję celu dla problemuoptymalizacyjnego, oraz zdefiniowano wielkości używane do oceny wyników.Rozdział trzeci przedstawia wybrane metody optymalizacji funkcji wielu zmien-
nych. W rozdziale tym dokonano przeglądu metod optymalizacji numerycznej zograniczeniami oraz bez ograniczeń. Opisano metody wykorzystane w niniejszejpracy.W rozdziale czwartym analizowany jest problem syntezy w przypadku linio-
wym, w którym pole magnetyczne kształtowane jest za pomocą zmiany rozkładuprądów w cewce. Dokonano analizy wielu metod dla problemu z ograniczeniamii bez ograniczeń, porównano wyniki i wskazano najlepszą metodę.W rozdziale piątym przedstawiono analizę problemu syntezy pola poprzez
zmianę kształtu cewki przy ustalonej gęstości prądu. Do rozwiązania problemuwykorzystano techniki optymalizacji nieliniowych funkcji wielu zmiennych. Do-konano porównania wyników uzyskanych różnymi metodami oraz przedstawionownioski.W rozdziale szóstym przedstawiono analizę rzeczywistej cewki, wykonanej
wg projektu autora. Dokonano porównania z cewką zaprojektowaną przy użyciumetod analizowanych w niniejszej pracy.Podsumowanie dysertacji zawarto w rozdziale siódmym. Zostały tam przed-
stawione wnioski wyciągnięte na podstawie przeprowadzonych badań. Zawartopodsumowanie zrealizowanych celów oraz ustosunkowanie się autora do posta-wionej tezy pracy.W dodatku przedstawiono wyprowadzenie analitycznych zależności pomiędzy
pojedynczym zwojem prądowym a polem magnetycznym w ustalonym punkcieprzestrzeni.
Rozdział 2
Przedstawienie problemu
W rozdziale tym przedstawiony zostanie problem kształtowania pola w cewcepowietrznej. Problem ten zostanie sformułowany jako problem optymalizacji.
2.1 Wprowadzenie
Problemy współczesnej techniki często dzieli się na problemy analizy oraz pro-blemy syntezy. Analiza polega na wyznaczeniu odpowiedzi układu na zadanewymuszenie. Problemy takie opisane są za pomocą pewnych matematycznychzależności, które w odpowiedni sposób przybliżają (modelują) dane zagadnie-nie. Problemy te opisane są zwykle za pomocą równań algebraicznych i równańróżniczkowych zwyczajnych lub cząstkowych. Równania te konstruuje się wrazz pewnymi warunkami początkowymi lub granicznymi. Dzięki rozwojowi tech-nik komputerowych oraz metod numerycznych rozwiązanie problemów analizyzwykle nie sprawia większych problemów. Niniejsza praca zajmuje się problema-mi odwrotnymi do problemów analizy. Problemy takie nazywamy problemamisyntezy. W zagadnieniach tych poszukiwane jest wymuszenie, które działając nadany układ spowoduje odpowiednią (zadaną z góry) odpowiedź. Ogólnie związekpomiędzy wymuszeniem a odpowiedzią można opisać równaniem:
F x = y (2.1)
Równanie (2.1) z operatorem F przedstawia problem analizy, gdy poszukiwa-na jest odpowiedź układu y, zaś znajdowanie wymuszenia x to problem syntezy.Operator F może być operatorem liniowym lub nieliniowym, stacjonarnym lubniestacjonarnym. Problem syntezy w ogólnym przypadku może nie posiadać roz-wiązania lub może nie mieć własności jednoznaczności rozwiązań. Przykłademwziętym z życia może być problem rekonstrukcji obrazu, gdzie wejściem jest fo-tografowany obiekt, systemem jest układ optyczny aparatu, natomiast wyjściem
4
2.2. SYNTEZA POLA MAGNETYCZNEGO 5
są dane otrzymane przez przetwornik optyczny. Problemem syntezy byłoby od-tworzenie obiektu na podstawie jego zdjęcia. Jest to naturalny przykład sytuacjio niejednoznacznym rozwiązaniu problemu syntezy.
Rysunek 2.1: Problem analizy i syntezy
2.2 Synteza pola magnetycznego
W niniejszej pracy będzie analizowany problem syntezy pola magnetycznego. Po-lega on na znalezieniu takiego rozkładu gęstości prądów w pewnym obszarze, abypole magnetyczne wytworzone przez ten prąd było takie, jak założono. Można tu-taj ”sterować” zarówno wartością prądu jak również rozmieszczeniem przewodóww przestrzeni. W trakcie przeprowadzonych badań nad problemem syntezy polamagnetycznego dokonano pewnych uproszczeń. Analizę ograniczono do statycz-nego pola magnetycznego oraz założono, że pole magnetyczne jest wytworzone wmateriałach o liniowych, jednorodnych i izotropowych właściwościach magnetycz-nych. Założono ponadto, że analizowane obiekty posiadają symetrię obrotową.Analizowany problem został przedstawiony w walcowym układzie współrzęd-
nych (z, r, φ). Prądy w uzwojeniach płyną w kierunku wersora aφ. Rys. 2.2przedstawia przekrój poprzeczny cewki wzdłuż płaszczyzny (r, z). Obszar Ω sta-nowi analizowaną cewkę, w której płynie prąd, zaś Γ jest obszarem z zadanympolem magnetycznym. W obszarze Ω prąd reprezentowany jest przez funkcję gę-stości prądu (j = f(r, z)aφ, ∀(r, z) ⊆ Ω). Zadane prądy generują w obszarze Γpole magnetyczne. Pole magnetyczne jest wektorem, który w rozważanym przy-padku symetrii obrotowej posiada niezerowe składowe w kierunku r i z.W zagadnieniu kształtowania pola magnetycznego możemy wyodrębnić na-
stępujące podproblemy:
X wyznaczenie rozkładu gęstości prądów j(z, r) w uzwojeniach cewki przyustalonej powierzchni obrotowej Ω,
X wyznaczenie kształtu powierzchni Ω przy ustalonym rozkładzie gęstości prą-dów w uzwojeniu,
6 ROZDZIAŁ 2. PRZEDSTAWIENIE PROBLEMU
Rysunek 2.2: Przekrój poprzeczny wzdłuż płaszczyzny (r, z) obrazujący cewkęnawiniętą w obszarze Ω wytwarzającą pole magnetyczne w obszarze Γ.
X dobór zarówno kształtu jak i rozkładu gęstości prądu.
Problemy powyższe można rozpatrywać nakładając ograniczenia na poszuki-wane funkcje. Ograniczenia mogą dotyczyć zarówno kształtu uzwojenia cewki (np.Ω ⊆ [rcmin, rcmax]× [zcmin, zcmax]) jak i gęstości prądu (np. j ∈ [jcmin, jcmax]).
2.3 Pole magnetyczne cewki
W celu rozwiązania problemu syntezy konieczne jest (najczęściej wielokrotne)wyznaczenie pola magnetycznego pochodzącego od zadanego wymuszenia prądo-wego. Pole takie oblicza się w celu porównania go z polem zadanym. Do wyzna-czenia pola magnetycznego można stosować metodę różnic skończonych, metodęelementów brzegowych [53] lub metodę elementów skończonych (MES)[9]. Podej-ście z wykorzystaniem MES jest najbardziej ogólne i pozwala wyznaczać polaelektromagnetyczne w dowolnych środowiskach. Podstawową wadą tej metodyjest długi czas obliczeń. W pracy została zastosowana metoda podziału obsza-ru Ω na pojedyncze zwoje prądowe oraz zastosowanie wzorów analitycznych nawartość pola magnetycznego pochodzącego od przewodu kołowego. Podejście ta-kie pozwala znacznie przyspieszyć obliczenia niezbędne do wyznaczenia pola wobszarze Γ. Metody tej nie można stosować w przypadku gdy pole magnetycznewytworzone jest w środowisku nieliniowym.W dodatku A zostały wyprowadzone zależności określające wartości pola
magnetycznego wytworzonego przez pojedynczy zwój kołowy (zależności (A.29),(A.30)). Przy założeniu, że analiza pola magnetycznego będzie wewnątrz cewkimożna założyć, że składowa pola magnetycznego w kierunku wersora z jest dużo
2.3. POLE MAGNETYCZNE CEWKI 7
większa od składowej pola magnetycznego w kierunku wersora r. Efekt ten jestznacznie silniejszy jeśli zadane pole magnetyczne jest polem jednorodnym. Zjawi-sko to określane jest jako “quadratic suppresion” [31]. Oczywiście w przypadkupola magnetycznego na osi z składowa Br wynosi zero. W niniejszej pracy rozwa-żane będą problemy syntezy pola stacjonarnego dla obszaru Γ położonego na osioraz poza nią. Analizowane będą również problemy syntezy pola niejednorodnego,ale tylko dla obszaru Γ położonego na osi z. Z dyskusji przedstawionej powyżejwynika, że w obu przypadkach wystarczy rozważać składową Bz wektora polamagnetycznego. W celu skrócenia zapisu składową Bz będziemy oznaczać sym-bolem B. Przy tych oznaczeniach na podstawie wzoru (A.29) pole magnetyczneB w punkcie o współrzędnych (r, z) wzbudzane przez prąd I pojedynczego zwojuo symetrii osiowej umiejscowionego w punkcie (r′, z′) jest równe:
B(r′, z′, r, z) =µ0I
2π√(r′ + rj)2 + (z′ − z)2
(K(k) +
(r′)2 − r2 − (z′ − z)2
(r′ − r)2 + (z′ − z)2E(k)
)(2.2)
gdzie k2 = 4r′r(r′+r)2+(z′−z)2 zaś K(k) i E(k) są całkami eliptycznymi pierwszego
i drugiego rodzaju. Przy założeniu, że pole indukowane jest na osi z układuwspółrzędnych (r = 0), równanie (2.2) redukuje się do postaci:
B(r′, z′, 0, z) =µ0I(r′)2
2((r′)2 + (z′ − z)2)32
. (2.3)
W celu analizy pola magnetycznego indukowanego w dowolnym punkcie ob-szaru Γ należy policzyć całkę po wszystkich pojedynczych zwojach znajdującychsię w obszarze Ω. Wówczas kładąc I(r′, z′) = j(z′, r′)dr′dz′, gdzie j jest gęstościąpowierzchniową prądu w obszarze Ω, otrzymujemy:
B(r, z) =∫∫Ωj(r′, z′)K(r′, z′; r, z)dr′dz′ (r′, z′) ⊆ Ω, (r, z) ⊆ Γ (2.4)
gdzie K(r′, z′; r, z) jest funkcją wiążącą geometrycznie rozważany zwój z prądem zpunktem w którym wyznacza się pole magnetyczne. Równanie (2.4) pozwala ob-liczyć pole magnetyczne w dowolnym punkcie płaszczyzny (r, z). Rys. 2.3 przed-stawia przekrój poprzeczny cewki. Cewka ta ograniczona jest przez płaszczyznyz = zmin oraz z = zmax oraz poprzez dwie krzywe obrotowe fl(z) oraz fu(z), którereprezentują ograniczenie od ”dołu” i od ”góry”. W rzeczywistych konstrukcjachnajczęściej poszukuje się kształtu funkcji fl(z) ustalając górne ograniczenie jakostałe (fu(z) = const.). Wówczas korpus cewki otrzymuje zadany kształt natomiastcewka nawinięta jest równomiernie.W liniowej wersji problemu syntezy pola magnetycznego zadany jest obszar Ω
oraz pole magnetyczne breq(r, z) w obszarze Γ i poszukiwany jest rozkład gęstości
8 ROZDZIAŁ 2. PRZEDSTAWIENIE PROBLEMU
Rysunek 2.3: Cewka nawinięta na powierzchni obrotowej ograniczonej z dołuprzez krzywą fl(z) i z góry przez fu(z)
prądów w obszarze Ω. Wówczas równanie (2.4) jest niejednorodnym dwuwymiaro-wym liniowym równaniem całkowym Fredholma pierwszego rodzaju. Natomiastgdy poszukiwany jest kształt cewki wówczas równanie Fredholma pierwszego ro-dzaju traci swój liniowy charakter. Zagadnienie nieliniowe sprowadza się do znale-zienia kształtu powierzchni obrotowej Ω. Problemy opisane równaniami Fredhol-ma pierwszego rodzaju należą do klasy problemów źle postawionych. Głównymimetodami postępowania w przypadku takich problemów są metody regularyza-cji, rozpowszechnione i rozpropagowane poprzez prace Tichonowa [35] [76] orazMorozova [63]. Korzysta się również z innych metod, między innymi algorytmówstochastycznych [51].Minimalizacja błędu średnio kwadratowego pomiędzy otrzymanym polem ma-
gnetycznym a polem zadanym jest równoważne minimalizacji funkcjonału:∫∫Γ
(µ02π
∫∫Ωj(r′, z′)K(r′, z′, r, z)dz′dr′ − breq(r, z)
)2dzdr (2.5)
Często w zagadnieniach syntezy pola magnetycznego rozważa się problemuzyskania stałego pola (breq = const.). Wówczas problem uzyskania zadanegopola magnetycznego w obszarze Γ jest równoważny wyznaczeniu jednorodnegopola magnetycznego na granicy ∂Γ obszaru Γ. Wynika to bezpośrednio z prawGausa i Ampera (brak źródeł pola wewnątrz obszaru Γ).Równanie (2.5) opisuje przypadek ciągły problemu. Jedną z metod numerycz-
nego rozwiązania problemu jest zastosowanie dyskretyzacji przestrzennej. W tymcelu obszar Ω zostaje podzielony na n obszarów, zaś obszar Γ na m obszarów.Przykładowo, gdy obszar Ω jest prostokątem można go podzielić na n = w × kprostokątów. Dyskretyzację obszaru Γ uzyskuje się przez wybór m punktów wobszarze Γ lub w przypadku pola jednorodnego w zbiorze ∂Γ.
2.4. PRZYPADEK LINIOWY 9
Dla uproszczenia obliczeń każdy z elementów podziału zbioru Ω można zastą-pić pojedynczą cewką przez którą płynie prąd całkowity I. Zakładając, że obszarΩ podzielono na n pojedynczych elementów, natomiast obszar Γ na m elementów(najczęściej zakłada się m n) otrzymamy wersję dyskretną problemu opisanegorównaniem (2.5).
m∑j=1
(µ02π
n∑k=1
IkK(rk, zk, rj , zj)− breq(rj , zj))2
(2.6)
Można również całkę∫∫Ω j(r
′, z′)K(r′, z′, r, z)dz′dr′ w równaniu (2.5) liczyćnumerycznie zakładając podział obszaru Ω na pod obszary o stałej gęstości prą-dów. W szczególnych przypadkach przy wykorzystaniu symetrii można nawetwspomnianą całkę podwójną wyznaczyć analitycznie. Podejścia powyższe są rów-noważne.Minimalizując wyrażenie (2.6) otrzymamy rozwiązanie problemu dyskretnego.
Podobnie jak w przypadku ciągłym możemy poszukiwać wartości prądów Ik, mi-nimalizujących problem. Wówczas mamy do czynienia z problemem liniowym. Naposzukiwany rozkład prądów można nałożyć ograniczenia (np. I ∈ [imin, imax]),wówczas problem staje się problemem liniowym z ograniczeniami. Możemy rów-nież poszukiwać kształtu obszaru Ω. Wtedy problem polega na znalezieniu war-tości ri, zi i staje się problemem nieliniowym.
2.4 Przypadek liniowy
W tym podrozdziale zostanie przedstawiony problem dla przypadku gdy poszu-kiwany jest rozkład prądów w cewce, natomiast położenia uzwojeń są ustalone.Załóżmy, że w obszarze Ω umieszczono n zwojów w punktach (rk, zk), gdzie rkoznacza promień zwoju zaś zk jego współrzędną z. Załóżmy ponadto, że w ob-szarze Γ wybrano m > n punktów o współrzędnych (rj , zj). Załóżmy, że wartośćzadanego pola w punkcie o numerze j wynosi bj . Oznaczmy przez xk∗ wartośćnatężenia prądu w zwoju o numerze k. Celem optymalizacji jest dobór wartościxk, tak aby indukowane pole magnetyczne było możliwie bliskie zadanemu polubj w każdym z wybranych punktów obszaru Γ o współrzędnych (rj , zj). Zgodniez zależnościami (2.3) i (2.4) pole magnetyczne od pojedynczego zwoju zależy li-niowo od prądu płynącego w tym zwoju. Można zatem sformułować następującerównanie liniowe:
Ax = b (2.7)
gdzie macierz A ∈ Rm×n jest macierzą współczynników, x ∈ Rn jest wektoremszukanych prądów, zaś wektor b ∈ Rm definuje zadane pole magnetyczne. Warto-
∗ze względu na przejrzystość matematyczną standardowy symbol oznaczający prąd I zostałzamieniony przez symbol x
10 ROZDZIAŁ 2. PRZEDSTAWIENIE PROBLEMU
ści współczynników macierzy A wynikają bezpośrednio z zależności (2.3) i (2.4).
Ak,j =µ0xk
2π√(rk + rj)2 + (zk − zj)2
(K(k) +
r2k − r2j − (zk − zj)2
(rk − rj)2 + (zk − zj)2E(k)
)(2.8)
gdzie k2 = 4rkrj(rk+rj)2+(zk−zj)2 . Jeśli nie nakładamy żadnych ograniczeń na wartości
prądów xk to mamy do czynienia z problemem optymalizacji bez ograniczeń. Wrzeczywistych problemach często w sposób naturalny pojawiają się jednak ograni-czenia. Przykładowo zwykle żąda się, aby prądy płynęły w jednym kierunku (np.xk 0) lub żeby wartości prądów nie przekraczały pewnej wartości maksymalnej(|xk| ¬ xmax). Prowadzi to do problemów z ograniczeniami.
2.5 Błąd dyskretyzacji
W niniejszym podrozdziale dokonamy analizy błędu dyskretyzacji, tzn. różnicypomiędzy polem pochodzącym od cewki punktowej oraz cewki prostokątnej zestałą gęstością prądu. W przypadku pola magnetycznego generowanego w punkciena osi z układu współrzędnych można wyznaczyć zależność analityczną. Wymiarycewki oraz obszar Γ są takie same jak użyte w późniejszych obliczeniach (tabela4.1 w rozdziale 4.1).
2.5.1 Cewka nieskończenie cienka
Rozważmy cewkę walcową nawiniętą nieskończenie cienkim przewodem. Promieńcewki wynosi r. Zakładamy, że cewka jest nawinięta od punktu z1 do punktu z2.W uzwojeniu tej cewki płynie prąd o stałej gęstości liniowej równej j = 1 A ·m−1.Wówczas na podstawie wzoru (2.3) pole magnetyczne w dowolnym punkcie z naosi współrzędnych możemy wyznaczyć z zależności:
b(z) =∫ z2z1
µ0 j r2
2 (r2 + (z − ξ)2)3/2dξ =
µ0 j
2
(z − z1√
r2 + (z − z1)2+
z2 − z√r2 + (z − z2)2
)(2.9)
Dyskretyzacja przestrzeni cewki odpowiada zastąpieniu jej n zwojami. Prądkażdego zwoju wówczas wynosi:
x = jz2 − z1n
(2.10)
W przypadku podziału na n zwojów wartość pola magnetycznego w dowolnympunkcie z na osi opisana jest zależnością:
bn(z) =n∑i=1
µ0 x r2
2 (r2 + (z − ξi)2)3/2(2.11)
2.5. BŁĄD DYSKRETYZACJI 11
100
101
102
103
10−15
10−10
10−5
100
n
δ
r=0.20 mr=0.47 mr=0.73 mr=1.00 m
Rysunek 2.4: Błąd dyskretyzacji dla cienkiej cewki walcowej dla różnych jej pro-mieni.
gdzie ξi = z1 + z2−z1n(i− 12
)dla i = 1, . . . , n jest pozycją zwoju o numerze i.
Poprzez b(z) będziemy rozumieli wektor określający wartość pola w dowolnympunkcie obszaru Γ. Załóżmy, że naszym obszarem Γ będzie odcinek usytuowanyna osi z układu współrzędnych. Odcinek ten został podzielony na m = 1000 rów-nomiernie rozłożonych punktów. Względny błąd dyskretyzacji definiujemy jako
δ =||b(z)− bn(z)||22||b(z)||22
(2.12)
gdzie ∥ · ∥2 oznacza normę euklidesową.Na rys. 2.4 przedstawiono błąd dyskretyzacji w funkcji liczby pojedynczych
zwojów. Wartości pola wyznaczone były dla m = 1000 punktów na osi z. Wykreszostał narysowany w skali logarytmicznej. Łatwo zauważyć, że wraz ze wzrostemliczby zwojów błąd ten szybko maleje i dla n = 10 błąd jest mniejszy niż 10−5. Wzwiązku z powyższym wartość pola reprezentowana przez pojedyncze uzwojeniajest obarczona dość małym błędem już dla niewielkiej liczby uzwojeń. Z wykresumożna również wywnioskować, że im większy jest promień cewki tym błąd jestmniejszy.
2.5.2 Cewka o skończonej grubości
Podobnie można przeprowadzić analizę w przypadku, gdy cewka nie jest idealniecienka, a posiada pewną grubość. W tym wypadku przekrój poprzeczny cewkistanowi prostokąt Ω = [z1, z2] × [r1, r2]. Zakłada się, że w cewce płynie prąd ostałej gęstości powierzchniowej j = 1 A · m−2. Wówczas pole na osi wyraża się
12 ROZDZIAŁ 2. PRZEDSTAWIENIE PROBLEMU
100
101
102
103
10−12
10−10
10−8
10−6
10−4
10−2
100
nz
δ
nr=1
nr=126
nr=251
nr=375
nr=500
Rysunek 2.5: Błąd dyskretyzacji cewki walcowej w funkcji podziału w kierunkuz przy ustalonym podziale w kierunku r.
wzorem
b(z) =∫ r2r1
∫ z2z1
µ0jr2
2 (r2 + (z − ξ)2)3/2dξdr =
µ0j
2
(z logΨ1Ψ2− z1 logΨ1 + z2 logΨ2
)(2.13)
gdzie Ψi =√r22+(z−zi)
2+r2√r21+(z−zi)
2+r1dla i = 1, 2. Na rys. 2.5 i 2.6 przedstawiono błąd
dyskretyzacji dla podziału w kierunkach z i r†. Z przeprowadzonej analizy wy-nika, że już dla podziału cewki na stosunkowo niewielką liczbą elementów błąddyskretyzacji jest niewielki i w obliczeniach praktycznych może zostać pominięty.
2.6 Definicja funkcji celu
W calu sformułowania problemu syntezy pola jako zadania optymalizacyjnegonależy zdefiniować funkcje celu. Najczęściej funkcję celu definiuje się w sposóbnastępujący:
f(x) = ∥b(x)− breq∥ (2.14)
†gdzie nr i nz oznaczają podział cewki na pojedyncze zwoje odpowiednio w kierunku osi ri z
2.6. DEFINICJA FUNKCJI CELU 13
100
101
102
103
10−12
10−10
10−8
10−6
10−4
10−2
100
nr
δ
nz=1
nz=126
nz=251
nz=375
nz=500
Rysunek 2.6: Błąd dyskretyzacji cewki walcowej w funkcji podziału w kierunkur przy ustalonym podziale w kierunku z.
gdzie ∥ · ∥ jest pewną normą zadaną w przestrzeni Rm. Zwykle stosuje się jednąz następujących norm:
||y||1 =m∑i=1
|yi| (norma suma modułów) (2.15)
||y||2 =
√√√√ m∑i=1
y2i (norma euklidesowa) (2.16)
||y||∞ = maxi|yi| (norma maksimum) (2.17)
Rozwiązanie problemu optymalizacji polega na znalezieniu minimum globalnegofunkcji celu. W przypadku stosowania metod gradientowych wygodne jest użycienormy euklidesowej ∥ · ∥2 z uwagi na jej gładkość. W przypadku normy euklide-sowej często w celu uniknięcia nieróżniczkowalnej operacji pierwiastkowania jakofunkcję celu stosuje się równoważne z punktu widzenia problemu optymalizacjiwyrażenie,
f(x) = ∥b(x)− breq∥22 (2.18)
Tak zdefiniowana funkcja celu będzie poddana optymalizacji w całej niniejszejpracy. W przypadku optymalizacji liniowej b(x) = Ax, gdzie macierz A jest opi-sana wzorem (2.8). Zatem w przypadku liniowym problem optymalizacji staje sięzagadnieniem najmniejszych kwadratów.
14 ROZDZIAŁ 2. PRZEDSTAWIENIE PROBLEMU
2.7 Ocenianie wyników
W celu porównania wyników obliczeń niezbędne jest wprowadzenie wielkości do-datkowo oceniających rezultat obliczeń. Wyniki obliczeń można oceniać na dwasposoby. Pierwszy polega na porównaniu rozkładu różnicy pomiędzy polem ma-gnetycznym otrzymanym a polem zadanym. Ocenę taka może spełniać wektorbłędu względnego ε = [ε1, ε2, . . . , εm] zdefiniowany wzorem:
εi = |(bi − bi,req)/bi,req| , i ∈ [1, . . . ,m] (2.19)
gdzie bi jest otrzymaną wartością pola w i – tym punkcie obszaru Γ, natomiastbi,req oznacza zadaną wartość pola w tym punkcie. Wektor ε zawiera pełną infor-mację o błędzie. Ze względów praktycznych wygodniej jest porównywać wielkościskalarne. W związku z tym w niniejszej pracy będziemy dokonywać porównaniawyników na podstawie następujących współczynników:
γ1 = ∥ϵ∥2 (2.20)
γ2 =∥ϵ∥1m
(2.21)
γ3 = ∥ϵ∥∞ (2.22)
W przypadku liniowym i gdy pole zadane jest polem jednorodnym współ-czynnik γ1 =
√f(x), gdzie x jest wyznaczonym rozkładem prądów w cewce.
Współczynnik γ1 określa wartość normy euklidesowej błędu rozwiązania. Nato-miast współczynnik γ2 określa wartość średnią błędu względnego pomiędzy polemotrzymanym a polem zadanym. Z kolei współczynnik γ3 określa maksymalny błądwzględny rozwiązania.W calu porównania własności rozwiązań problemu liniowego będziemy używać
następujących wielkości:
β1 = ∥x∥22 =n∑i=1
x2i . (2.23)
β2 = ∥x∥∞ = maxi∈1,...,n
|xi|. (2.24)
Natomiast w przypadku problemu optymalizacji kształtu cewki będziemy uży-wać współczynnika:
β1 =∫Ωj2dΩ (2.25)
Ze względu na fakt, że w przypadku optymalizacji kształtu cewki wartość gę-stości prądu w całym obszarze Ω pozostaje niezmienna współczynnik β2 jeststały i porównywanie go nie ma sensu. Współczynnik β1 jest proporcjonalny dowartości energii czy to zgromadzonej w uzwojeniu cewki czy to traconej w jejuzwojeniach. W związku z tym, będziemy go nazywali współczynnikiem energe-tycznym. Współczynnik β2 jest równy maksymalnej wartości prądu rozwiązania.
2.7. OCENIANIE WYNIKÓW 15
Posiada on również ważne uzasadnienie konstrukcyjne związane z ewentualnyminaprężeniami mechanicznymi występującymi w uzwojeniu, szczególnie istotnymiw przypadku konstrukcji cewek opartych o uzwojenia wykonane z nadprzewod-nika.Należy podkreślić, że przedstawione współczynniki mają charakter pomocni-
czy i są wykorzystywane wyłącznie do oceny jakości rozwiązań. Nie podlegająone procesowi optymalizacji. W niniejszej pracy nie stosuje się optymalizacji wie-lokryterialnej, która brałaby więcej elementów pod uwagę.
Rozdział 3
Metody optymalizacji
W rozdziale niniejszym przedstawione zostaną wybrane metody optymalizacji,które mogą być zastosowane do rozwiązania problemu syntezy pola magnetycz-nego.
3.1 Podstawowe definicje
Celem optymalizacji jest znalezienie wektora x ∈ Rn, dla którego funkcja celuf(x) : D → R osiąga ekstremum w pewnym ustalonym zbiorze D ⊆ Rn. JeśliD = Rn to mamy do czynienia z optymalizacją bez ograniczeń, w przeciwnymwypadku mówimy o optymalizacji z ograniczeniami. Zbiór D może być zarównoograniczony jak i nieograniczony.Każdy punkt ze zbioru D nazywamy punktem dopuszczalnym. Zbiór D czę-
sto definiowany jest za pomocą pewnego zbioru ograniczeń. Mogą to być zarównoograniczenia równościowe (gi(x) = 0) jak i nierównościowe (gi(x) 0). W do-wolnym punkcie x ∈ D ograniczenia te mogą być podzielone na dwa rozłącznepodzbiory. Pierwszy zawiera ograniczenia równościowe – nazywane aktywnymi,zaś drugi ograniczenia nierównościowe – zwane wolnymi. Jeśli jakieś aktywneograniczenie jest zbyteczne, tzn. otrzymujemy takie same rozwiązanie bez niego,to rozwiązanie takie nazywamy zdegenerowanym.Rozpoczniemy od przypomnienia definicji wybranych pojęć z dziedziny opty-
malizacji używanych w dalszej części pracy. Niech D będzie dowolnym podzbio-rem w przestrzeni Rn, zaś f dowolną funkcją o wartościach rzeczywistych zdefi-niowana na zbiorze D.
f : Rw ⊃ D → R
Będziemy rozważać problem minimalizacji funkcji f na zbiorze D, gdzie:
I. D = Rn – problem optymalizacji bez ograniczeń.
16
3.2. OPTYMALIZACJA Z OGRANICZENIAMI 17
II. D = x ∈ Rn : g1(x) = 0, . . . , gm(x) = 0, gdzie g1, . . . , gm : Rn → R –problem optymalizacji z ograniczeniami równościowymi.
III. D = x ∈ Rn : g1(x) ¬ 0, . . . , gm(x) ¬ 0, gdzie g1, . . . , gm : Rn → R –problem optymalizacji z ograniczeniami nierównościowymi.
W naszym przypadku interesujące problemy zawarte są w podpunktach I orazIII. W szczególności najczęściej będziemy rozważać ograniczenia kostkowe typuxmin ¬ xk ¬ xmax.
Punkt x0 ∈ D nazywamy minimum globalnym funkcji f na zbiorze D jeśli:
∀x ∈ D f(x) f(x0).
Punkt x0 ∈ D nazywamy minimum lokalnym funkcji f jeśli:
∃ε > 0 ∀x ∈ D ∥x− x0∥ < ϵ⇒ f(x) f(x0).
Minimum nazywamy ścisłym, jeżeli w powyższych definicjach zachodzi f(x) >f(x0), dla x = x0. Jeśli zamienimy funkcję f funkcją −f wówczas problem mini-malizacji zamieni się w problem maksymalizacji. W związku z tym analizuje sięzwykle tylko problemy minimalizacji.Niepusty podzbiór D ⊂ Rn nazywamy wypukłym jeśli dla każdego x1, x2 ∈ D
zachodzi λx1 + (1 − λ)x2 : λ ∈ [0, 1] ⊂ D. Funkcję f nazywamy wypukłą nazbiorze D jeśli dla każdego x1, x2 ∈ D oraz λ ∈ [0, 1] spełniona jest nierównośćf(λx1 + (1 − λ)x2) ¬ λf(x1) + (1 − λ)f(x2). Funkcja f jest ściśle wypukła jeślinierówność jest ostra dla λ ∈ (0, 1). Jeżeli mamy do czynienia z ograniczeniamiliniowymi, to zbiór ograniczeń jest zbiorem wypukłym. Jeżeli mamy do czynieniaz minimalizacją funkcji ściśle wypukłej z wypukłym zbiorem ograniczeń to mamydo czynienia z tzw. programowaniem wypukłym. W takim przypadku istniejeminimum i jest on jedyne.Punkt x spełniający zależność ∇f(x) = 0 nazywamy punktem krytycznym.
Wielkość ∇f(x) =[∂f(x)∂x1, . . . , ∂f(x)∂xn
]Tjest gradientem funkcji f w punkcie x.
W przypadku optymalizacji bez ograniczeń, przy założeniu, że funkcja celu jestciągła i dwukrotnie różniczkowalna w punkcie x, warunkiem koniecznym abypunkt x był lokalnym ścisłym minimum jest spełnienie warunku ∇f(x) = 0oraz dodatnia określoność macierzy H(x). Macierz H(x) jest Hessianem funkcjif , tzn. macierzą drugich pochodnych cząstkowych, Hi,j =
∂2f∂xi∂xj
. Dodatkowojeśli funkcja f jest ściśle wypukła to punkt x spełniający powyższe warunki jestminimum globalnym funkcji f .
3.2 Optymalizacja z ograniczeniami
Rozwiązywanie zagadnień optymalizacji związanych z rzeczywistymi problema-mi często wymaga uwzględniania różnorodnych ograniczeń. W niniejszej pracy
18 ROZDZIAŁ 3. METODY OPTYMALIZACJI
ograniczeniami są objęte zarówno wartości prądów w uzwojeniach oraz położenieuzwojeń związane z ograniczeniami konstrukcyjnymi.Uwzględnianie ograniczeń polega na takiej modyfikacji funkcji celu, aby jej
minimalizacja prowadziła do rozwiązania problemu z ograniczeniami. Zdefiniuj-my problem optymalizacji z ograniczeniami, gdzie minimalizuje się funkcję f(x),x ∈ Rn z p ograniczeniami równościowymi hj(x) oraz z m ograniczeniami nierów-nościowymi gi(x).
x = argminx∈Rn
f(x) (3.1)
gi(x) ¬ 0, i = 1, . . . ,mhj(x) = 0, j = 1, . . . , p
Częstą metodą uwzględniania ograniczeń w funkcji celu jest metoda Lagrange’a.W metodzie tej wprowadza się tak zwaną funkcję Lagrange’a, która dla problemu(3.1) ma postać:
L(x, λ, µ) = f(x) +m∑i=1
λigi(x) +p∑j=1
µjhj(x) (3.2)
Liczby λi, µj nazywamy współczynnikami Lagrange’a związanymi z ogranicze-niami nierównościowymi i równościowymi. Twierdzenie Lagrange’a mówi, że jeślifunkcja L ma ciągłe pochodne cząstkowe, a punkt x jest rozwiązaniem opty-malnym problemu z ograniczeniami, to istnieją wektory λ, µ takie, że wszystkiepochodne cząstkowe funkcji Lagrange’a L w punkcie (x, λ, µ) są równe zeru.Rozwinięciem twierdzenie Lagrange’a jest twierdzenie Karusha-Kuhna-Tuckera
[52], które formułuje warunki istnienia globalnego minimum dla problemu pro-gramowania wypukłego, oraz pozwala na rozwiązanie zagadnienia optymalizacjiz ograniczeniami. Twierdzenie to mówi, że punkt x jest globalnym minimumproblemu programowania wypukłego jeśli istnieje λ = (λ1, . . . , λm)T ∈ Rm orazµ = (µ1, . . . , µp)T ∈ Rp takie, że:
1. ∇xL(x, λ, µ) = ∇f(x) + λT∇g(x) + µT∇h(x) = 0
2. gi(x) ¬ 0, i = 1, . . . ,m
3. hj(x) = 0, j = 1, . . . , p
4. λi 0, i = 1, . . . ,m
5. λigi(x) = 0, i = 1, . . . ,m
Powyższe warunki noszą nazwę warunków Karusha-Kuhna-Tuckera (KKT).Inną metodą uwzględniania ograniczeń w problemach optymalizacyjnych jest
metoda funkcji kary. Rozróżnia się metodę kary wewnętrznej i zewnętrznej. Meto-dy polegają na skonstruowaniu dodatkowej funkcji kary S : Rn → R+, której war-tości zależą od analizowanego punktu. Jeśli punkt jest punktem dopuszczalnym
3.3. KLASYFIKACJA METOD OPTYMALIZACJI 19
(mieści się w zbiorze ograniczeń) wówczas funkcja ta przyjmuje małe wartości,natomiast kiedy analizowany punkt nie spełnia warunków ograniczeń wówczas jejwartość znacznie wzrasta. Dodając wspomnianą funkcję do funkcji celu problemuotrzymamy nowy problem optymalizacyjny bez ograniczeń.
F (X) = f(x) + ξS(x)
gdzie F (X) jest nową funkcją celu, f(x) jest funkcją celu problemu bez ograni-czeń, zaś S(x) jest funkcją kary uwzględnioną ze współczynnikiem wagi ξ.W przypadku zewnętrznej funkcji kary wartość jej wynosi zero, gdy punkt x
jest punktem dopuszczalnym, natomiast jest dodatnia w przypadku przeciwnym.Dla wewnętrznej funkcji kary jej wartość jest większa lub równa zero dla punktówdopuszczalnych, natomiast jej wartość znacznie wzrasta gdy punkt zbliża się dogranicy ograniczeń.Zarówno metoda Lagrange’a jak i metoda funkcji kary powodują zastąpienie
problemu z ograniczeniami problemem bez ograniczeń. Metoda Lagrange’a wrazz warunkami KKT jest dużo bardziej odpowiednia w przypadku programowa-nia wypukłego i sprawdza się w przypadku zastosowania metod gradientowychoptymalizacji. Natomiast metody funkcji kary są często stosowane w przypadkualgorytmów niedeterministycznych.
3.3 Klasyfikacja metod optymalizacji
W rozdziale tym zostaną przedstawione metody optymalizacji zastosowane wniniejszej pracy. Klasyfikacja metod optymalizacji jest ściśle związana z rodzajemproblemu, w szczególności zależy od tego, czy problem jest liniowy czy nieliniowy,czy problem jest z ograniczeniami czy bez ograniczeń.Rozpatrzmy problem minimalizacji bez ograniczeń w postaci:
znaleźć takie x aby
f(x) = minx∈Rnf(x)
W metodach tych można wyróżnić następujące przypadki:
1. Dysponujemy jedynie algorytmem wyznaczającym wartość funkcji celu f(x),oraz spodziewamy się, że funkcja f(x) ma bardzo nieregularny charakter i wzwiązku z tym obliczenie gradientu ∇f(x) obarczone będzie dużym błędem.Wówczas należy skorzystać metod bezgradientowych.
2. Dysponujemy zarówno algorytmem wyliczającym wartość funkcji celu f(x)oraz algorytmem wyznaczania jej gradientu ∇f(x). Oznacza to, że dys-ponujemy formułą analityczną wyliczającą pochodne cząstkowe ∂f(x)∂xi
dlai = 1, . . . , n. Wówczas zalecane są metody gradientowe.
20 ROZDZIAŁ 3. METODY OPTYMALIZACJI
3. Dysponujemy jedynie algorytmem wyznaczania wartości funkcji f(x), alewartość gradientu ∇f(x), choć nie jest on dany w postaci formuł analitycz-nych, może być z dużą dokładnością przybliżana przez ilorazy różnicowe.Postępowanie takie nosi nazwę estymacji gradientu. Możliwość estymacjigradientu występuje wtedy, gdy wartości funkcji f są obliczane z dużą do-kładnością. Celowe jest wówczas rozwiązanie tego zadania za pomocą metodgradientowych, wykorzystujących metodę estymacji gradientu.
Ważny jest również podział metod ze względu na kształt funkcji celu. Możemymieć tutaj do czynienia z problemami liniowymi, które prowadzą przy minima-lizacji normy euklidesowej residuum do zagadnienia najmniejszych kwadratów,oraz z problemami nieliniowymi. Wśród problemów nieliniowych ważnym pod-zbiorem jest podzbiór problemów gdy funkcja celu jest funkcją wypukłą.Podsumowując, metody optymalizacji możemy podzielić na metody gradien-
towe, w których wykorzystuje się nie tylko wartości funkcji celu w danym punkcieposzukiwań ale również wartości jej gradientu czy nawet hessjanu. Natomiast wmetodach bezgradientowych korzysta się tylko i wyłącznie z wyliczonej wartościfunkcji celu. Ważną podgrupą metod bezgradientowych są metody losowe, którew trakcie poszukiwań minimum funkcji wykorzystują czynnik losowy.Zadanie optymalizacji staje się bardziej skomplikowane w przypadku analizy
funkcji, która ma więcej niż jedno minimum lokalne. Wówczas stosowanie metodgradientowych może okazać się nieefektywne, ponieważ algorytmy te korzystająz lokalnych własności funkcji. Często otrzymujemy w rozwiązaniu ekstremumlokalne, które nie musi być poszukiwanym ekstremum globalnym. Wówczas możnaskorzystać z metody wielostartowej, która jest połączeniem metody gradientoweji losowej.Metody losowe charakteryzują się tym, że wyznaczenie rozwiązania zagadnie-
nia optymalizacyjnego odbywa się w wyniku iteracji, polegających na przeszuki-waniu otoczenia aktualnego (w k – tej iteracji) punktu przybliżenia x(k). Sposóbtego przeszukiwania zależy od rodzaju metody. Często metody te są mało efek-tywne, ale mogą być stosowane wówczas, gdy metody gradientowe zawodzą.Jako głównych reprezentantów metod gradientowych można wymienić nastę-
pujące metody [36]:
X największego spadku i jej modyfikacje,
X gradientów sprzężonych,
X Newtona
X quasi-Newtona
Natomiast pośród wielu bezgradientowych wymienia się następujące metody:
X Hooka i Jeevesa,
3.4. ZAGADNIENIE NAJMNIEJSZYCH KWADRATÓW 21
X Rosenbrocka,
X sympleksową Neldera i Meada,
X Powella i jej modyfikację,
Do najprostszych metod losowych można zaliczyć metodę Monte Carlo, wktórej dokonuje się wielu losowań punktu z przestrzeni potencjalnych rozwią-zań. Jako rozwiązanie optymalne przyjmuje się najlepsze znalezione rozwiązaniespośród wszystkich wylosowanych. Inną metodą losową jest algorytm błądzeniaprzypadkowego. Bieżące rozwiązanie jest oceniane i na podstawie jego położenialosuje się następny punkt, w taki sposób, że punkt bieżący jest wartością oczeki-waną rozkładu prawdopodobieństwa wykorzystywanego do generowania kolejnegopunktu. Przez cały proces poszukiwań musi być pamiętane najlepsze z dotychczasznalezionych rozwiązań.Natomiast metody niedeterministyczne wyróżniają się zwykle dwiema cecha-
mi: pierwszą z nich jest prostota, drugą zaś duża efektywność działania w prze-strzeniach i problemach, w których klasyczne metody optymalizacji i poszukiwa-nia, nie dają zadowalających wyników. Często problemem może być nieciągłośćfunkcji celu, oraniczenie rozwiązania do zbioru liczb całkowitych itp. Spośródwielu algorytmów niedeterministycznych można wymienić następujące:
X symulowane wyżarzanie,
X algorytmy genetyczne i ewolucyjne,
X algorytmy mrówkowe,
X algorytmy oparte o zastosowanie sztucznych sieci neuronowych.
3.4 Zagadnienie najmniejszych kwadratów
W nienijszym podrozdziale zostanie omówione zagadnienie najmniejszych kwa-dratów, gdyż pojawia się ono naturalnie przy sformułowaniu problemu syntezypola magnetycznego przy użyciu normy euklidesowej w definicji funkcji celu. Za-prezentowane zostanie zagadnienie najmniejszych kwadratów bez ograniczeń, jaki z nałożonymi ograniczeniami.
3.4.1 Zagadnienie najmniejszych kwadratów bez ograniczeń
W podrozdziale 2.4 została przedstawiona liniowa zależność pomiędzy poszu-kiwanymi prądami a zadanym polem magnetycznym (2.7). Ponieważ macierzwspółczynników A jest macierzą prostokątną, to mamy do czynienia z równaniemnadokreślonym. Wówczas o rozwiązaniu problemu mówi się w sensie najmniej-szych kwadratów. Zagadnienie najmniejszych kwadratów polega na znalezieniu
22 ROZDZIAŁ 3. METODY OPTYMALIZACJI
wektora x, który minimalizuje sumę kwadratów elementów wektora residualnegor(x) = b−Ax:
x = argminx∈Rn
||b−Ax||2 (3.3)
Dla problemu najmniejszych kwadratów funkcja celu ma postać
f(x) = ||b−Ax||22 =m∑j=1
(bj −
n∑i=1
Aj,ixi
)2. (3.4)
Funkcja ta osiąga minimum w punkcie w którym wartość jej pochodnej wynosizero.
∂f(x)∂xi
= 2
bj − n∑j=1
Aj,ixi
(−Ai,j) = 0 dla i = 1, 2, . . . , n (3.5)
Po przekształceniach otrzymujemy tzw. układ równań normalnych
m∑j=1
n∑k=1
Aj,iAj,kxk =m∑j=1
Aj,ibj , dla i = 1, 2, . . . , n (3.6)
W zapisie macierzowym układ równań normalnych ma postać(ATA
)x = AT b (3.7)
Równanie (3.7) jest równaniem z kwadratową macierzą ATA. Równanie to możnarozwiązać bezpośrednio x = A†b, gdzie A† = (ATA)−1AT nazywa się macierząpseudoodwrotną (macierzą Moore’a-Penrose’a).Równanie normalne dla problemu najmniejszych kwadratów jest równaniem
liniowym z macierzą kwadratową. Metody rozwiązywania takich równań dzieli sięna:
X Metody bezpośrednie
– eliminacja Gaussa (i jej różne warianty)
– metody dekompozycji (Choleskiego, QR, SVD)
X Metody iteracyjne
– metody iteracji prostej: Jackobiego, Gaussa-Seidla, wersje relaksacyjne
– metody dla macierzy rzadkich.
Trudność rozwiązania układu równań liniowych zależna jest od tzw. uwarunkowa-nia problemu, którą ocenia się obliczając współczynnik uwarunkowania problemu.Współczynnik uwarunkowania dla macierzy kwadratowej A definiuje się jako
κ(A) := ∥A−1∥2 ∥A∥2 =maxi |λi|mini |λi|
(3.8)
3.4. ZAGADNIENIE NAJMNIEJSZYCH KWADRATÓW 23
gdzie λi są wartościami własnymi macierzy A. Natomiast w przypadku, gdy ma-cierz A jest macierzą prostokątną współczynnik uwarunkowania κ definiuje sięjako
κ(A) := ||A†||2 ||A||2 =maxi |σi|mini |σi|
(3.9)
gdzie σ oznacza wartości szczególne macierzy prostokątnej A. Wartości szczegól-ne definiuje się jako pierwiastki wartości własnych kwadratowej macierzy ATA.Jeśli wartość współczynnika uwarunkowania jest wysoka mówimy wówczas o złymuwarunkowaniu macierzy. Wówczas małe zaburzenia danych wejściowych powo-dują duże różnice w rozwiązaniu. W przypadku rozważanych problemów nie makonieczności stosowania metod iteracyjnych, które najczęściej znajdują zastoso-wanie dla dużych układów równań lub macierzy rzadkich.
Bezpośrednie rozwiązanie układu równań normalnych
Jedną z metod rozwiązania zagadnienia najmniejszych kwadratów jest bezpo-średnie rozwiązanie układu równań normalnych t.j. obliczenie ATA, a następnierozwiązania równania liniowego z tą macierzą. Można to zrobić za pomocą me-tody eliminacji Gaussa. Metoda bezpośrednia dobrze działa w przypadku gdywskaźnik uwarunkowania macierzy ATA jest mały. Ponieważ ATA jest macierząsymetryczną można również zastosować rozkład Choleskiego. Wówczas procedurarozwiązania problemu najmniejszych kwadratów ma postać:
C = ATA, d = AT b,RTR = C,RT y = d,Rx = y.
gdzie trójkątną macierz R oblicza się za pomocą rozkładu Choleskiego.Wynik obliczeń zależy od stosowanej reprezentacji zmiennoprzecinkowej liczb.
W standardzie IEEE 754 liczby rzeczywiste podwójnej precyzji przedstawionesą z błędem względnym nie większym niż u = 12β
t−1, β = 2, t = 53 [42]. Takąreprezentację stosowano w obliczeniach opisanych w niniejszej pracy. Rozwiązanieproblemu najmniejszych kwadratów metodą dekompozycji Choleskiego staje sięniestabilne w przypadku gdy wartość wskaźnika uwarunkowania κ(A) jest bliskau−0.5 (dla standardu IEEE754 w wersji podwójnej precyzji ∼ 108)[2].W przypadku gdy wskaźnik uwarunkowania macierzy κ(ATA) jest duży, znacz-
nie lepsze efekty można uzyskać stosując rozkład QR macierzy A do rozwiązaniaukładu równań normalnych.
Dekompozycja macierzy QR
Metoda dekompozycji QR macierzy polega na rozkładzie macierzy A na iloczyndwóch macierzy Q i R.
A = QR, (3.10)
gdzie macierz Q ∈ Rm×n jest macierzą ortogonalną (QTQ = In), natomiast ma-cierz R ∈ Rn×n jest macierzą trójkątną górną. W celu dokonania dekompozycji
24 ROZDZIAŁ 3. METODY OPTYMALIZACJI
macierzy QR najczęściej stosuje się metody wykorzystujące ortogonalizację Gra-ma–Schmidta, obroty Gibsa lub odbicia Hausholdera [47][77]. W naszym przypad-ku metoda Hausholdera jest bardziej stabilna. Dysponując rozkładem A = QRrozwiązanie układu równań normalnych można uzyskać rozwiązując układ z ma-cierzą trójkątną Rx = QT b. Można to zauważyć dokonując przekształcenia ukła-du równań normalnych.
ATAx = AT b, (QR)TQRx = (QR)T b,RTQTQRx = RTQT b,Rx = QT b.
Istotnym elementem tej metody jest fakt uniknięcia wyliczania źle uwarun-kowanej macierzy ATA, co znacznie poprawia stabilność numeryczną problemuw porównaniu do metody opisanej w poprzednim podrozdziale. Mimo większe-go nakładu pracy potrzebnej do przeprowadzenia dekompozycji QR macierzy A,wyniki są bardziej stabilne i w efekcie metoda może być stosowana dla większychwymiarów.
Dekompozycja SVD
Do analizy problemu zastosowano również rozkład macierzy A względem wartościszczególnych (SVD – singular value decomposition) [47]. Rozkład ten polega naprzedstawieniu macierzy A ∈ Rm×n w postaci iloczynu:
A = UΣV T (3.11)
gdzie Σ = diag(σ1, . . . , σr, 0, . . . , 0) ∈ Rm×n, σ1 . . . σr 1, r jest rzędemmacierzy A, natomiast macierze U ∈ Rm×m, V ∈ Rn×n są ortonormalne (UTU =V TV = I oraz ∥U∥2 = ∥V ∥2 = 1). Po dokonaniu dekompozycji można rozwiązaćrównanie normalne rozwiązując równanie:
ΣV Tx = UT b (3.12)
3.4.2 Zagadnienie najmniejszych kwadratów z ograniczeniami
Nieujemne zadanie najmniejszych kwadratów
Celem nieujemnego zadania najmniejszych kwadratów jest wyznaczenie wektorax ∈ Rn o nieujemnych elementach minimalizującego funkcję celu f(x) = ||Ax −b||22 dla zadanych A ∈ Rm×n, b ∈ Rm, co możemy zapisać jako:
x = argminx∈Rn, x0
∥Ax− b∥22, (3.13)
W literaturze angielskojęzycznej powyższy problem określany jest jako “non-negative least square problem” (NNLS). Warunki KKT dla powyższego problemu
3.4. ZAGADNIENIE NAJMNIEJSZYCH KWADRATÓW 25
mają postać
x 0,∇f(x) = AT (Ax− b) 0, (3.14)
∇f(x)Tx =(AT (Ax− b)
)Tx = 0.
W związku z powyższym problem sprowadza się do wyznaczenia nieujemnegowektora x spełniającego równanie (Ax− b)TAx = 0.Metody rozwiązujące nieujemne zadanie najmniejszych kwadratów można po-
dzielić na algorytmy z aktywnym zbiorem ograniczeń (zastosowane w niniejszejpracy), metody gradientowe (projected quasi-Newton NNLSQ, metoda Landwe-bera) oraz inne (metoda punktu wewnętrznego, principal block pivoting method).W przypadku ograniczeń nieujemnych zbiór ograniczeń ma postać g(x) =
g1(x), . . . , gm(x), gdzie gi(x) = −x. Mówimy, że i−te ograniczenie jest aktyw-ne w danym punkcie dopuszczalnym x jeśli gi(x) = 0. W przeciwnym wypadkuograniczenie to nazywamy pasywnym. Zbiór indeksów ograniczeń aktywnych wdanym punkcie x oznaczamy przez A(x). Pozostałe indeksy związane z ogranicze-niami pasywnymi pozostają w zbiorze P(x). Zbiór P jest dopełnieniem A, tzn.A(x) ∪ P(x) = 1, . . . ,m. Algorytmy oparte na aktywnym zbiorze ograniczeńpolegają na rozwiązaniu problemu najmniejszych kwadratów ograniczonego tylkodo zmiennych, dla których ograniczenia są pasywne. Pozostałe zmienne przyjmująwartość ograniczeń równościowych.Algorytm rozwiązujący nieujemne zadanie najmniejszych kwadratów metodą
aktywnego zbioru ograniczeń został zaproponowany przez Lawsona i Hansona[54]. Jest on zaimplementowany w środowisku Matlab R⃝ jako funkcja lsqnonneg[73]. W algorytmie tym rozwiązanie konstruowane jest iteracyjnie, przy czymalgorytm jest zbieżny w skończonej liczbie kroków.Algorytm 1 przedstawia klasyczny algorytm NNLS (Non-negative Least Squ-
ares). Macierz AP oznacza zredukowaną macierz A ograniczoną tylko do kolumnodpowiadających zbiorowi pasywnemu P. Lawson i Henson udowodnili, że algo-rytm znajduje jednoznaczne rozwiązanie po skończonej liczbie iteracji. Niestetynie istnieją metody pozwalające oszacować liczbę iteracji potrzebną do rozwiąza-nia problemu. Czasem warto algorytm przerwać ponieważ im algorytm jest bliżejrozwiązania tym poprawa jest wolniejsza. Podczas działania algorytmu układrównań normalnych [(AP)TAP ]sP = (AP)T b (linia 10 algorytmu) rozwiązuje sięmetodą bezpośrednią. Może to powodować problemy ze stabilnością numeryczną,szczególnie dla macierzy źle uwarunkowanych. W celu uniknięcia tych problemówdo rozwiązania układu równań normalnych zastosowano metodę rozkładu QR.Po tej zmianie linia 10 algorytmu (1) ma postać:
AP = QPRP– dekompozycja QR macierzy AP
sP = (RP)−1(QP)T b
26 ROZDZIAŁ 3. METODY OPTYMALIZACJI
Algorytm 1 Algorytm NNLS (Lawson i Hanson).Input: A ∈ Rm×n, b ∈ Rm, εOutput: x = argminx0 ∥Ax− b∥21: P = ∅,A = 1, 2, . . . , n, x = 0, w = AT (b−Ax)2: while A = ∅ and maxi∈A(wi) > ε do3: j = argmaxi∈A(wi)4: P = P ∪ j, A = A \ j5: sP = [(AP)TAP ]−1(AP)T b6: while min(sP) ¬ 0 do7: α = −mini∈P xi
xi−si8: x := x+ α(s− x)9: Wybierz elementy A oraz P10: sP = [(AP)TAP ]−1(AP)T b11: sR = 012: end while13: x = s14: w = AT (b−Ax)15: end while
Dekompozycja pozwala uniknąć niestabilnych numerycznie operacji kosztemwydłużenia czasu obliczeń. Rozkład macierzy AP stosowany był tylko w wypadkujej dużego wymiaru.
Algorytm 2 Algorytm FNNLS (Bro i de Jung).Input: A ∈ Rm×n, b ∈ RmOutput: x = argminx0 ∥Ax− b∥21: P = ∅,A = 1, 2, . . . , n, x = 0, w = AT b− (ATA)x2: while A = ∅ and maxi∈A(wi) > tolerance do3: j = argmaxi∈A(wi)4: P = P ∪ j, A = A \ j5: sP = [(ATA)P ]−1(AT b)P)6: while min(sP) ¬ 0 do7: α = −mini∈P xi
xi−si8: x := x+ α(s− x)9: Wybierz elementy A oraz P10: sP = [(ATA)P ]−1(AT b)P)11: sA = 012: end while13: x = s14: w = AT (b−Ax)15: end while
Bro i Jong [10] zaprezentowali udoskonalony algorytm nazwany Fast NNLS(FNNLS). Algorytm 2 jest modyfikacją klasycznego algorytmu NNLS zapropono-
3.4. ZAGADNIENIE NAJMNIEJSZYCH KWADRATÓW 27
waną przez Bro i de Junga [10]. Idea polega na wykorzystaniu w każdym krokualgorytmu raz obliczonych pełnych macierzy ATA, AT b. Wersja ta powodujeskrócenie czasu obliczeń szczególnie dla problemów o dużym wymiarze. Z uwa-gi na brak możliwości połączenia tej wersji z metodą rozkładu QR w niniejszejpracy nie była ona stosowana. Następnie pojawiło się jeszcze ulepszenie zwanyfast combinatorial NNLS [7] również skracające czas działania algorytmu poprzezpewne modyfikacje w obliczeniach. Dokładniejszy opis tych metod można znaleźćw [8] [10] [13] [48] [49].
Metoda najmniejszych kwadratów z ograniczeniami kostkowymi
W poprzednim podrozdziale na rozwiązanie problemu najmniejszych kwadratównałożono ograniczenie, aby było ono nieujemne. Inne ograniczenie, często poja-wiające się w zastosowaniach praktycznych, polega na tym, że wynik ma należećdo ustalonego przedziału. Takie ograniczenie nazywać będziemy ograniczeniemkostkowym. Wówczas problem najmniejszych kwadratów z ograniczeniami mapostać:
x = argminx∈Rn, xi∈[li,ui]
∥Ax− b∥22 (3.15)
gdzie −∞ < li < ui <∞, i = 1, . . . , n, A ∈ Rm×n, b ∈ Rm. Ponieważ
||Ax− b||22 = (Ax− b)T (Ax− b) = xTATAx− 2bTAx+ bT b
= 2(12xTATAx− (AT b)Tx+ 1
2bT b
)to wprowadzając oznaczenia Q = ATA ∈ Rn×n oraz q = −AT b ∈ Rn, problem(3.15) można przekształcić do postaci:
x = argminx∈Rn,xi∈[li,ui]
12xTQx+ qTx (3.16)
Równanie powyższe opisuje problemem programowania kwadratowego z ogra-niczeniami kostkowymi [3] [18] [32] [61] [78] [79]. Macierz Q jest macierzą kwa-dratową dodatnio półokreśloną. Jeśli, co zwykle ma miejsce, macierz Q jest ma-cierzą dodatnio określoną, to przy liniowych ograniczeniach mamy zagwaran-towane istnienie i jednoznaczność rozwiązania (na podstawie własności progra-mowania wypukłego opisanej w rozdziale 3.1). Ograniczenia kostkowe możnaprzedstawić jako ograniczenia nierównościowe opisane za pomocą liniowej funk-cji G(x) = Cx − d gdzie macierz C ∈ R2n×2n jest macierzą blokową diagonalnącii = 1 dla i ∈ 1, . . . , n, cii = −1 dla i ∈ w + 1, . . . , 2n natomiast wektor d określagórne i dolne ograniczenia: di = li, di+w = −ui dla i ∈ 1, . . . , n. Korzystając z
oznaczeń C =
[I 00 −I
], d =
[l
−u
]problem (3.16) można opisać jako problem
28 ROZDZIAŁ 3. METODY OPTYMALIZACJI
programowania kwadratowego z ograniczeniami nierównościowymi:
x = argminx∈Rn
12xTQx+ qTx, (3.17)
Cx d.
Do rozwiązania powyższych zagadnień, w przypadku niedużych wymiarówproblemu często stosuje się metody oparte na aktywnym zbiorze (active set me-thods). Natomiast stosuje się również inne metody takie jak: metody punktu we-wnętrznego (interior-point methods), projekcyjne metody gradientowe (projectedgradient methods).Podobnie jak przy problemie nieujemnym zagadnieniu najmniejszych kwadra-
tów, w niniejszej pracy użyto metod opartych na aktywnym zbiorze. Dla problemu(3.17) funkcja Lagrange’a ma postać:
L(x, λ, µ) =12xTQx+ xT q − λT (x− l) + µT (x− u) (3.18)
Gdzie λ, µ są współczynnikami Lagrange’a reprezentującymi ograniczenia dol-ne i górne. Warunki KKT (Karusha-Kuhna-Tuckera) konieczne aby x, λ, µ byłyrozwiązaniem problemu, mają postać:
Qx+ q − λ+ µ = 0λ 0, µ 0λ(x− l) = 0 (3.19)
µ(u− x) = 0l ¬ x ¬ u
Wykorzystując warunki (3.19) można zastosować metodę aktywnego zbiorudo rozwiązania problemu. Algorytm 3 przedstawia procedurę rozwiązania proble-mu najmniejszych kwadratów przy ograniczeniach kostkowych [78].W odróżnieniu od algorytmów rozwiązujących nieujemne zadanie najmniej-
szych kwadratów mamy do czynienia z dwoma zbiorami aktywnymi (L i U).Zbiory te zawierają indeksy niewiadomych x, które nie mieszczą się w zbiorzeograniczeń (odpowiednio dolnym i górnym). Wówczas nadaje im się wartości gra-niczne (odpowiednio li lub ui) i poszukuje rozwiązania operując tylko na zbiorzepasywnym S. W każdej iteracji zachodzi związek L∪U∪S = 1, . . . , n. Algorytmkończy działanie, gdy wektory x, µ, λ spełniają warunki KKT, czyli są rozwią-zaniem problemu (linia 13 algorytmu). Zakończenie działania następuje równieżpo przekroczeniu maksymalnej liczby iteracji kmax. W linii 9 przedstawionegoalgorytmu, rozwiązywany jest układ równań liniowych:
n∑j=1
Qi,jxk+1j + qi = λ
(k+1)i − µ(k+1)i , dla i ∈ 1, . . . , n (3.20)
3.4. ZAGADNIENIE NAJMNIEJSZYCH KWADRATÓW 29
Algorytm 3 Algorytm aktywnego zbioru dla problemu programowania kwadra-towego z ograniczeniami kostkowymiInput: Q ∈ Rn×n, q ∈ Rn, l ∈ Rn, u ∈ Rn, kmaxOutput: x = minx 12x
TQx+ qTx oraz li ¬ xi ¬ ui, ∀i ∈ 1, . . . , n1: k = 0, λ(0) = 0, µ(0) = 0, x(0) = −Q−1q.2: for k = 0 to kmax do3: L(k) =
i : x(k)i < li lub x
(k)i = li oraz λ
(k)i 0
4: U (k) =
i : x(k)i > ui lub x
(k)i = ui oraz µ
(k)i 0
5: S(k) =
1, 2, . . . , n\(L(k) ∪ U (k))
6: x
(k+1)i = li, µ
(k+1)i = 0, ∀i ∈ L(k)
7: x(k+1)i = ui, λ
(k+1)i = 0, ∀i ∈ U (k)
8: λ(k+1)i = 0, µ(k+1)i = 0, ∀i ∈ S(k)
9: rozwiąż Qx(k+1) + q = λ(k+1)i − µ(k+1)i ze względu na n niewiadomych10: x
(k+1)i ,∀i ∈ S(k)
11: λ(k+1)i , ∀i ∈ L(k)
12: µ(k+1)i , ∀i ∈ U (k)
13: if li ¬ xi ¬ ui, ∀i ∈ S(k) oraz µ(k+1)i 0, ∀i ∈ U (k) oraz λ(k+1)i 0, ∀i ∈L(k) then
14: STOP x = x(k+1).15: else16: k ← k + 117: end if18: end for
Ponieważ dla i ∈ S(k) mamy λ(k+1)i = µ(k+1)i = 0, równanie (3.20) możemy łatworozwiązać ze względu na x(k+1)i , dla i ∈ S(k) biorąc pod uwagę aktywne zbioryokreślone w liniach 3 i 4 algorytmu:
∑j∈S(k)
Qi,jx(k+1)j = −
∑j∈L(k)
Qi,jlj −∑j∈U(k)
Qi,juj − qi, dla i ∈ S(k) (3.21)
Natomiast współczynniki Lagrange’a λ(k+1)i , dla i ∈ L(k) oraz µ(k+1)i , dla i ∈U (k) można wyznaczyć bezpośrednio z następujących wzorów:
λ(k+1)i =
∑j∈1,...,n
Qi,jx(k+1)j + qi, dla i ∈ L(k) (3.22)
µ(k+1)i = −
∑j∈1,...,n
Qi,jx(k+1)j − qi, dla i ∈ U (k) (3.23)
Opisaną powyżej metodę zastosowano do rozwiązania problemów z ograniczenia-mi kostkowymi rozważanych w niniejszej pracy.
30 ROZDZIAŁ 3. METODY OPTYMALIZACJI
3.5 Metoda regularyzacji
Popularną metodą rozwiązywania źle uwarunkowanych równań liniowych jest me-toda regularyzacji [24][72]. Metoda ta pozwala otrzymać bardziej stabilne i przedewszystkim gładkie rozwiązania. Często przy zwiększaniu wymiaru rozpatrywane-go problemu obserwowane są następujące własności macierzy A:
1. wartości własne macierzy A zanikają stopniowo do zera, oraz pojawia sięcoraz więcej wartości własnych bliskich zeru,
2. stosunek największej wartości własnej do najmniejszej wartości własnej jestbardzo duży.
Świadczą one o złym uwarunkowaniu problemu, czyli o dużej czułości rozwią-zania na wartość wektora b. Małe zmiany wartości wektora b (np. błąd reprezen-tacji zmiennoprzecinkowej) powodują duże różnice w rozwiązaniu.Metoda regularyzacji jest metodą rozwiązania problemu polegającą na zmia-
nie funkcji celu, tak aby uzyskać wymagane własności rozwiązania. W odróżnieniuod metod podanych poprzednio głównym celem jest otrzymanie bardziej gładkichi stabilnych rozwiązań.Najbardziej znaną metodą regularyzacji jest regularyzacja Tichonowa [76][63].
Ideą tej metody jest modyfikacja funkcji celu przez dodanie członu regularyzu-jącego. W przypadku zadania najmniejszych kwadratów zmodyfikowana funkcjacelu ma postać:
xλ = argminx
(∥Ax− b∥22 + λ2∥L(x− x∗)∥22
), (3.24)
gdzie L jest macierzą Tichonowa (najczęściej jest to macierz jednostkowa) kon-trolującą gładkość rozwiązania, x∗ jest przypuszczalnym (oczekiwanym) rozwią-zaniem problemu, natomiast parametr regularyzacyjny λ jest współczynnikiemkontrolującym wpływ regularyzacji na rozwiązanie. Jeśli współczynnik λ jest du-ży to informacja o oryginalnym problemie staje się mniej istotna, natomiast małeλ oznacza, że składnik regularyzacyjny ma mniejsze znaczenie.Przy założeniu L = I oraz x∗ = 0, stosując podobne przekształcenia jak w
przypadku metody najmniejszych kwadratów, otrzymujemy układ równań nor-malnych: (
ATA+ λ2I)x = AT b (3.25)
Powyższe równanie najczęściej rozwiązuje się za pomocą rozkładu SVD ma-cierzy A lub za pomocą metod iteracyjnych [40]. Głównym problemem jest wy-znaczenie optymalnej wartości parametru regularyzacji λ. Spośród wielu metodwyznaczania parametru λ, jedną z najczęściej stosowanych metod jest wykorzy-stanie wykresu przedstawiającego normę ∥Lxλ∥2 w funkcji normy ∥Axλ − b∥2.Rys. 3.1 przedstawia przykładowy wykres takiej krzywej. Krzywa ta często na-zywana jest krzywą L (ang. ”L-curve”) ze względu na jej kształt przypominający
3.5. METODA REGULARYZACJI 31
log
x 2
log A x-b 2
wiksze , rozwizanie bardziej gadkie
mniejsze ,mniejszy wpyw regularyzacji
Rysunek 3.1: Przykładowy wykres dla metody krzywej L wyboru wartości para-metru λ.
literę L. Optymalnego parametru λ oczekuje się w narożniku krzywej. Miejsce tojest kompromisem pomiędzy oczekiwanymi własnościami rozwiązania, a błędemrozwiązania problemu wprowadzonym przez obecność składnika regularyzujące-go.
Jak zostanie pokazane w dalszej części pracy zastosowanie metody krzywej Lw odniesieniu do rozważanych problemów nie przynosi zadowalających wyników.Jest to przede wszystkim związane z faktem, że konstruowane wykresy nie majątypowego kształtu krzywej L.
W związku z tym zaproponowano inną metodę doboru optymalnej wartościparametru regularyzacyjnego λ. Jako parametr optymalny uznano taką najmniej-szą wartość λ, dla której rozwiązanie problemu (3.24) jest nieujemne dla każdejwspółrzędnej, co można formalnie opisać jako:
λopt = minλ : argminx
(∥Ax− b∥22 + λ2∥x∥22
) 0. (3.26)
Zastosowanie tej metody powoduje automatyczne spełnienie warunku, że otrzy-mane rozwiązanie jest nieujemne (tak jak w nieujemnej metodzie najmniejszychkwadratów). Obecność członu regularyzacyjnego zwiększa gładkość i stabilnośćrozwiązania.
W celu wyznaczenia wartości optymalnej λopt zastosowano metodę bisekcji(Algorytm 4). Algorytm ten dla ustalonej macierzy A oraz wektora b znajdujeoptymalną wartość współczynnika regularyzacji λopt z założonym z góry błędemε. Algorytm rozpoczyna poszukiwanie optymalnego współczynnika od zadanejwartości początkowej λ0 (zakłada się, że λ0 > λopt, tzn. rozwiązanie uzyskane dlaλ0 jest nieujemne).
32 ROZDZIAŁ 3. METODY OPTYMALIZACJI
Algorytm 4 Algorytm obliczający optymalny współczynnik regularyzacji Ticho-nowa λoptInput: A ∈ Rm×w, b ∈ Rm, λ0, εOutput: λopt1: k = 0, λmin = 0, λmax = λ02: while |λmax − λmin| > ε do3: λtemp = (λmax + λmin) /2
4: x = argminx∥Ax− b∥2 + (λtemp)2 ∥x∥2
5: if x 0 then6: λmax = λtemp7: else8: λmin = λtemp9: end if10: end while11: λopt = λmax
3.6 Optymalizacja nieliniowa
W przypadku gdy optymalizowana funkcja lub jedno z ograniczeń (równościowelub nierównościowe) jest opisane funkcją nieliniową wówczas mamy do czynieniaz optymalizacją nieliniową. Do rozwiązania problemów optymalizacji nieliniowejstosuje się zarówno gradientowe i bez gradientowe metody optymalizacyjne.
3.6.1 Metoda sympleksowa Neldera-Meada
Metoda sympleksowa Neldera-Meada [65] jest bezgradientową metodą poszuki-wania minimum funkcji f wielu zmiennych [36]. W trakcie działania algorytmunie jest obliczana pochodna funkcji celu. W związku z tym metoda ta znajdujezastosowanie głownie wtedy gdy:
1. koszt obliczenia wartości pochodych funkcji celu jest wysoki
2. dokładne wartości pochodnych funkcji celu są trudne do obliczenia lub funk-cja jest nieciągła
3. wartości funkcji są obarczone dużym błędem
Sympleksem S w Rn będziemy nazywali zbiór składający się z n + 1 punktówx1, x2, . . . , xn+1 ∈ Rn, taki że zbiór wektorów xk − x1 : k ∈ 2, . . . , n + 1jest zbiorem liniowo niezależnym. Elementy zbioru S nazywamy wierzchołkamisympleksu.Algorytm Neldera-Meada poszukuje minimum funkcji poprzez porównanie jej
wartości w wierzchołkach sympleksu. Niech Sk oznacza sympleks w k−tej iteracji
3.6. OPTYMALIZACJA NIELINIOWA 33
algorytmu. Załóżmy, że wierzchołki x(k)1 , x(k)2 , . . . , x
(k)n+1 są ponumerowane w taki
sposób, że:f(x(k)1 ) ¬ f(x
(k)2 ) ¬ . . . ¬ f(x
(k)n+1)
Celem algorytmu jest zachowanie warunku zbieżności:n+1∑i=1
f(x(k)i ) >n+1∑i=1
f(x(k+1)i ).
W trakcie działania algorytmu sympleks ulega przekształceniom. Przekształce-nia te polegają na takim wyborze wierzchołków sympleksu, aby wartości funkcjiminimalizowanej ulegały zmniejszeniu. Osiąga się to poprzez następujące ope-racje: odbicie, rozszerzenie (ekspansja), zmniejszenie (kontrakcja) oraz redukcjasympleksu S.Jedną z możliwych realizacji algorytmu Neldera-Meada jest algorytm 5. Al-
gorytm ten znajduje rozwiązanie optymalne z zadanym z góry błędem ε > 0.W początkowej fazie należy dokonać wyboru parametrów algorytmu, Nealder iMead proponują aby w praktycznych obliczeniach jako wartości współczynnikówstosować wartości ρ = 1, χ = 2, γ = 0.5, σ = 0.5.
3.6.2 Gradientowe metody optymalizacji bez ograniczeń
W tym podrozdziale zostaną przedstawione metody optymalizacji funkcji korzy-stające z pochodnych tej funkcji. Metody te działają zarówno dla problemu opty-malizacji z ograniczeniami jak i bez nich. Metody gradientowe często prowadządo znalezienia minimum lokalnego funkcji celu. Ich rozszerzeniem są metody wie-lostartowe, które mogą pomóc w znalezieniu minimum globalnego. Metody tedziałają przy założeniu, że potrafimy obliczyć gradient funkcji celu, tzn. minima-lizowana funkcja jest funkcją różniczkowalna.
Metoda największego spadku
Metoda największego spadku, jest jedną z najprostszych metod rozwiązywaniazagadnień optymalizacji. Stanowi podstawę, na której rozwinęły się inne metody.Ponieważ gradient∇f(x) jest kierunkiem najszybszego wzrostu wartości funk-
cji f w punkcie x, to −∇f(x) będzie kierunkiem najszybszego spadku wartościfunkcji. Wykorzystując ten fakt, można stworzyć iteracyjny algorytm szukają-cy minimum funkcji f . Niech x(0) ∈ Rn będzie punktem startowym. Rozważmypunkt x(0)−α ∇f
(x(0)
). Z rozwinięcia funkcji w szereg Taylora pierwszego rzędu
otrzymujemy:
f(x(0) − α ∇f
(x(0)
))= f
(x(0)
)− α
∥∥∥∇f (x(0))∥∥∥2Jeżeli ∇f
(x(0)
)= 0, to dla odpowiednio małego α > 0 otrzymujemy:
f(x(0) − α ∇f
(x(0)
))< f
(x(0)
)(3.27)
34 ROZDZIAŁ 3. METODY OPTYMALIZACJI
Algorytm 5 Algorytm Neldera-Meada1: k := 02: inicjacja Sk3: wybór ε > 0, ϱ > 0, χ > 1 (χ > ϱ), 0 < γ < 1, 0 < ς < 14: KROK 1:5: if
√1n
∑n+1i=1 (x
(k)i − x(k)) ¬ ε then
6: KONIEC - x(k)1 – punkt optymalny7: end if8: uporządkuj S(k) tak, żeby x(k)1 ¬ x
(k)2 ¬ . . . ¬ x
(k)n+1
9: k ← k + 110: KROK 2: Odbicie11: x(k) = 1n
∑ni=1 x
(k)i – środek ciężkości n− 1 wymiarowego sympleksu
12: x(k)r = x(k) + ϱ
(x(k) − x(k)n+1
)– odbicie
13: if f(x(k)1
)¬ f
(x(k)r
)¬ f
(x(k)n
)then
14: x(k)n+1 = x
(k)r
15: goto KROK116: end if17: KROK3: Ekspansja18: if f
(x(k)r
)< f
(x(k)1
)then
19: x(k)e = x(k) + χ
(x(k)r − x(k)
)20: if f
(x(k)e
)< f
(x(k)r
)then
21: x(k)n+1 = x
(k)e
22: else23: x
(k)n+1 = x
(k)r
24: end if25: goto KROK126: end if27: KROK 4: Kontrakcja28: if f
(x(k)r
) f
(x(k)n
)then
29: x(k)c = x(k) + γ
(x(k)r − x(k)
)30: if f
(x(k)c
)< f
(x(k)r
)then
31: x(k)n+1 = x
(k)e
32: goto KROK133: else34: x
(k)n+1 = x
(k)r
35: goto KROK136: end if37: end if38: KROK 5: Redukcja39: ∀i = 1 x(k)i = x
(k)1 + ς
(x(k)i − x
(k)1
)40: goto KROK1
3.6. OPTYMALIZACJA NIELINIOWA 35
Oznacza to, że nowy punkt x(1) = f(x(0) − α ∇f
(x(0)
))jest lepszy od punk-
tu f(x(0)
)(minimalizowana funkcja ma w tym punkcie mniejszą wartość).
Zastosowanie tego pomysłu prowadzi do algorytmu iteracyjnego:
x(k+1) = x(k) − αk ∇f(x(k)
).
gdzie wartośc αk jest dobrana tak aby był spełniony warunek (3.27).Metoda gradientu prostego została przedstawiona jako Algorytm 6. Para-
metr α określa początkową długość kroku w kierunku największego spadku, βjest współczynnikiem korekcyjnym zmniejszającym długość kroku, natomiast σokreśla najmniejszą długość kroku. Współczynnik ε definiuje kryterium stopu.Jeżeli w danej iteracji k spełniona jest nierówność ∥∇f
(x(k)
)∥ ¬ ε, to algorytm
zatrzymuje się.
Algorytm 6 Algorytm gradientu prostego
Input: x(0), α > 0, 0 < β < 1, ε > 1, σ > 0, fOutput: x – minimum funkcji f1: k := 02: αk = α3: if ∥∇f
(x(k)
)∥2 ¬ ε then
4: STOP x = x(k)
5: end if6: x = x(k) − α ∇f
(x(k)
)7: if f(x) < f
(x(k)
)then
8: GOTO 179: else10: αk = βαk11: end if12: if αk > σ then13: GOTO 314: else15: STOP x = x(k)
16: end if17: x(k+1) = x, k = k + 1, αk = α18: GOTO 3
Niekiedy stosowaną wersją metody najmniejszego spadku jest wersja pole-gająca na minimalizacji w każdym kroku funkcji celu w kierunku największegospadku. Różnica polega na metodzie wyboru współczynnika α. Współczynnik tendobiera się w taki sposób aby uzyskać wartość minimalną funkcji f w kierunkugradientu. To znaczy, że w każdej iteracji k należy znaleźć takie αk:
αk = argminα>0
f(x(k) − α ∇f
(x(k)
))(3.28)
36 ROZDZIAŁ 3. METODY OPTYMALIZACJI
Ta wersja metody największego spadku jest zwykle wolniejsza niż poprzedniai dlatego jest rzadziej stosowana.Metoda największego spadku, ze względu na prostotę oraz dużą szybkość
działania jest często stosowana w obliczeniach inżynierskich. Metoda ta możeprowadzić do długich czasów obliczeń, szczególnie gdy minimalizowana funkcjajest kształtu ”wydłużonej rynny”, to znaczy gdy poziomice funkcji celu są prawierównoległe do prostej przechodzącej przez aktualny punkt x(k) i przez rzeczywisteminimum funkcji.
Metoda gradientów sprzężonych
W tej metodzie w każdej iteracji dokonuje się wyboru kierunku optymalizacji wtaki sposób, aby optymalizacja w tym kierunku nie popsuła optymalizacji w kie-runkach rozważanych w poprzednich krokach. Prowadzi to do pojęcia kierunkówsprzężonych [19]. Procedura poszukiwania minimum za pomocą metody gradien-tów sprzężonych przedstawia algorytm 7. W pierwszej iteracji wybiera się kieru-nek największego spadku d(0) = −∇f
(x(0)
). W kolejnych iteracjach, po wyborze
kierunku d(k) oblicza się kolejny punkt według wzoru:
x(k+1) = x(k) + αkd(k) (3.29)
gdzie współczynnik αk wyznaczany jest wg wzoru (3.28). Przedstawiony algo-rytm przedstawia podstawową realizację metody gradientów sprzężonych (me-toda Fletchera-Reevesa). Znane są również inne realizacje metody gradientówsprzężonych. Na przykład metoda Polak-Ribierego, charakteryzująca się zwykleszybszą zbieżnością, różni się punktem 6 algorytmu, w którym współczynnik βkokreśla się wzorem:
βk := max
0,(g(k+1)
)T (g(k+1) − g(k)
)(g(k)
)Tg(k)
(3.30)
Metoda Gradientów sprzężonych jest często wykorzystywana do rozwiązańdużych układów równań liniowych, szczególnie w przypadku macierzy rzadkich.Jest również często stosowana w przypadku optymalizacji nieliniowej. Z regu-ły znajduje ona rozwiązania optymalne w mniejszej liczbie iteracji niż metodanajwiększego spadku.
Metoda Newtona
Metoda Newtona wykorzystuje macierz drugich pochodnych (hesjan). W meto-dzie tej stosuje się algorytm Newtona do znajdowania zer równania ∇f(x) = 0,które określa warunek konieczny istnienia ekstremum dla funkcji różniczkowal-nych. k-ty krok metody Newtona ma postać:
x(k+1) = x(k) −(H(x(k))
)−1∇f(x(k))
3.6. OPTYMALIZACJA NIELINIOWA 37
Algorytm 7 Metoda gradientów sprzężonych
Input: x(0) ∈ Rn, 0 < β < 1, ε > 0Output: x1: k := 0, g(0) = ∇f(x(0)), d(0) = −g(0)
2: while ∥∇f(x(k)
)∥2 ε do
3: αk := argminα>0 f(x(k) + α d(k)
)4: x(k+1) := x(k) + αkd(k)
5: g(k+1) := ∇f(x(k+1))
6: βk :=(g(k+1))T g(k+1)
(g(k))T g(k)
7: d(k+1) := −g(k+1) + βkd(k)8: k:=k+19: end while10: x = x(k)
gdzie H(x) jest hesjanem w punkcie x, tzn. Hij =∂2f∂xi∂xj
(x). Aby algorytm można
było zastosować, w każdym kroku macierz H(x(k)) musi być macierzą odwracal-ną. Algorytm wymaga wyliczenia w każdym kroku gradientu ∇f(x(k)), macierzydrugich pochodnych, oraz poprawki d(k) = x(k+1) − x(k) poprzez rozwiązanieukładu równań: H
(x(k)
)d(k) = −∇f
(x(k)
).
Jeśli punkt startowy znajduje się odpowiednio blisko minimum, to metoda tajest znacznie szybsza od metody gradientu prostego czy gradientów sprzężonych,np. dla funkcji kwadratowej z dodatnio określonym hesjanem znajduje jej mini-mum w jednym kroku. Ogólnie metoda ta ma zbieżność kwadratową, co oznaczaże odpowiednio blisko minimum liczba poprawnych liczb znaczących wyniku po-dwaja się w każdej iteracji.k-ty krok metody Newtona jest wykonywany w kierunku
d(k) = −(H(x(k))
)−1∇f(x(k)). (3.31)
Długość kroku jest ustalona (x(k+1) − x(k) = d(k)), zatem jeśli x(k) nie jestodpowiednio blisko minimum, to może się zdarzyć, iż f(x(k+1)) > f(x(k)). Wcelu uzyskania własności monotoniczności f(x(k+1)) < f(x(k)) stosuje się zmo-dyfikowaną metodę Newtona x(k+1) = x(k) − αkd(k). Współczynnik αk możnawyznaczyć jak w metodzie najmniejszego spadku szukając minimum w kierunku−d(k). Częściej jednak stosuje się przeszukiwanie w postaci: αk = 2−j , gdzie j > 0jest minimalną liczbą całkowita dla której f
(x(k) − 2−jd(k)
)< f(x(k)).
Innym podejściem jest zastosowanie metod zwanych metodami quasi-Newtona,w literaturze również nazywane metodami zmiennej metryki. W metodach tychnie jest wymagane obliczenie hesjanu.Algorytm 8 przedstawia jedną z możliwych realizacji metody quasi-Newtona.
Macierz B(k) reprezentuje odwrotność hesjanu. Najczęściej podczas inicjacji al-
38 ROZDZIAŁ 3. METODY OPTYMALIZACJI
Algorytm 8 Algorytm quasi-Newtona
Input: x(0), B(0), α, ε > 0Output: x1: k := 02: while ∥∇f
(x(k)
)∥ ϵ do
3: d(k) := −B(k)∇f(x(k))4: x(k+1) := x(k) − α d(k)5: q(k) := x(k+1) − x(k)
6: y(k) := ∇f(x(k+1)
)−∇f(x(k))
7: B(k+1) := B(k) +y(k)(y(k))T
(y(k))T q(k)− B
(k)q(k)(B(k)q(k))T
(q(k))TB(k)q(k)– (tutaj BFGS)
8: k := k + 19: end while10: x := x(k)
Tabela 3.1: Zestawienie najważniejszych wzorów do obliczenia macierzy poprawyodwrotności hessianu B(k)
metoda B(k+1)
DFP(I − y
(k)(q(k))T
(y(k))T q(k)
)B(k)
(I − q
(k)(y(k))T
(y(k))T q(k)
)+y(k)(y(k))T
(y(k))T q(k)
BFGS B(k) +y(k)(y(k))T
(y(k))T q(k)− B
(k)q(k)(B(k)q(k))T
(q(k))TB(k)q(k)
BROYDEN B(k) + y(k)−B(k)q(k)
(q(k))T q(k)
(q(k)
)T
gorytmu używa się macierzy jednostkowej B(0) = I. Poszczególne wersje metodyquasi-Newtona różnią się sposobem obliczenia macierzy B(k+1) [11], [21]. Od-powiednie wyrażenia dla metody Broyden–Fletcher–Goldfarb–Shanno (BFGS),Davidon–Fletcher–Powell (DFP), Broyden zostały przedstawione w tabeli 3.1.Dla przejrzystości, przedstawionym algorytmie parametr α, korygujący długośćkroku w danej iteracji, jest stały. Oczywiście może on również ulegać zmianiew każdej iteracji podobnie jak w przypadku algorytmów Newtona, gradientówsprzężonych czy największego spadku.
3.6.3 Metody gradientowe dla optymalizacji z ograniczeniami
Metody gradientowe dla optymalizacji z ograniczeniami wykorzystują gradient,a czasem hessian funkcji Lagrange’a zdefiniowanej wzorem (3.2). Proces optyma-lizacji prowadzi do spełnienia warunków KKT na minimum globalne problemu zograniczeniami. W pierwszym kroku optymalizacji wyznacza się aktywne zbioryograniczeń. Optymalizacja w danym punkcie dotyczy tylko przestrzeni ograniczo-nej do zbioru pasywnego.
3.6. OPTYMALIZACJA NIELINIOWA 39
Rozważmy następujący problem optymalizacyjny:
minx∈D⊂Rn
f(x) (3.32)
Załóżmy, że zbiór D opisuje ograniczenia kostkowe, tzn.:
D = x ∈ Rn : l ¬ x ¬ u
W stosunku do zagadnienia (3.1) problem (3.32) został pozbawiony ograni-czeń równościowych, które nie będą wykorzystywane w niniejszej pracy. Metodygradientowe z ograniczeniami dokonują poszukiwania punktu minimalnego bez-pośrednio w zbiorze rozwiązań dopuszczalnych x ∈ D ⊂ Rn, przy czym każdygenerowany przez te algorytmy punkt należy do zbioru D. Każdy krok składa sięz dwóch etapów. W pierwszym dokonuje się wyboru kierunku poszukiwań d(k), aw drugim przeprowadza się minimalizację w kierunku d(k+1) i wyznacza kolejnypunkt x(k+1). Kierunki d(k) konstruowane przez te algorytmy są dopuszczalnymikierunkami poprawy. Są one tak wybierane aby x(k+1) ∈ D. Do metod tych zali-czamy między innymi metodę gradientu sprzężonego z rzutowaniem oraz metodęquasi-Newtona z rzutowaniem [19].
Metoda gradientów sprzężonych z rzutowaniem
W metodzie gradientów sprzężonych z rzutowaniem w pierwszej iteracji znajdo-wany jest punkt x(0) należący do zbioru rozwiązań dopuszczalnych D. Dalszeiteracje metody polegają na tym, że mając punkt x(k) ∈ D generuje się do-puszczalny kierunek poprawy d(k), a następnie, w wyniku minimalizacji w tymkierunku uwzględniającej ograniczenie x(k) + αkd(k) ∈ D, otrzymuje się punktx(k+1) ∈ D.W celu utworzenia dopuszczalnego kierunku poprawy d(k) rzutujemy kierunek
−∇f(x(k)) na ścianę zbioru D, na której znajduje się punkt x(k). Tak otrzyma-ny kierunek −g(k) jest kierunkiem dopuszczalnym, dzięki temu, że ograniczeniasą liniowe, a ponadto jest to kierunek największego spadku spośród kierunkówdopuszczalnych. Następnie kierunek −g(k) jest wykorzystywany do konstrukcjikierunku d(k), w sposób analogiczny, jak w metodzie gradientu sprzężonego. Do-kładny opis tej metody można znaleźć w pracy [12].
Metoda quasi-Newtona z rzutowaniem
Idea metody quasi-Newtona z rzutowaniem jest zbliżona do koncepcji metodygradientu sprzężonego z rzutowaniem. Różnica polega na innym sposobie two-rzenia dopuszczalnego kierunku poprawy d(k). Kierunek ten otrzymujemy tutajw wyniku rzutowania na ścianę zbioru D nie kierunku −∇f
(x(k)
), lecz kierunku
−B(k)∇f(x(k)
), gdzie B(k) jest symetryczną macierzą o wymiarach n× n. Ciąg
40 ROZDZIAŁ 3. METODY OPTYMALIZACJI
macierzy B(k) konstruowany jest w identyczny sposób jak w klasycznej meto-dzie quasi-Newtona (tabela 3.1). W pierwszym kroku przyjmuje się B(0) = I. Nawstępie wyznacza się zbiór ograniczeń aktywnych A(x(k)). Następnie wyznaczasię wektor mnożników Lagrange’a:
λ(k) = −(A(x(k))B(k)A(x(k))T
)−1A(x(k))B(k)∇f
(x(k)
).
oraz określa się tzw. macierz rzutowania jako:
P (k) = B(k) −B(k)A(x(k))T(A(x(k))B(k)A(x(k))T
)−1A(x(k))B(k).
Dopuszczalny kierunek poprawy obliczamy według wzoru:
d(k) = −P (k)∇f(x(k)
).
Następnie wyznacza się kolejny punk dopuszczalny x(k+1) jako:
x(k+1) = x(k) + αk d(k).
Algorytm jest powtarzany aż zostanie spełniony jeden z warunków stopu.Jako kryterium stopu można przyjąć warunek ∥d(k)∥2 < ε, gdzie ε > 0 jestdokładnością obliczeń.Istnieje wiele metod wykorzystujących koncepcję quasi-Newtona, czyli itera-
cyjnego wyznaczania odwrotności hessianu. Należy do nich metoda Sekwencyjne-go Programowania Kwadratowego [34] [64] [82]. W metodzie tej w każdej itera-cji tworzy się podproblemy, które w zadanym otoczeniu punktu x(k) linearyzująfunkcję celu, czy w przypadku optymalizacji z ograniczeniami funkcję Lagrange’a.Kolejny kierunek d(k+1) otrzymuje się rozwiązując podproblem jak problem pro-gramowania kwadratowego. Działanie tej metody będzie badane w dalszej częścipracy.
3.6.4 Nieliniowe zagadnienie najmniejszych kwadratów z ogranicze-niami
Nieliniowe zagadnienie najmniejszych kwadratów polega na znalezieniu wektorax = (x1, x2, . . . , xn) minimalizującego wyrażenie:
f(x) =m∑j=1
(Fj(x)− yj)2
Podstawowym algorytmem wykorzystywanym do rozwiązania problemu opty-malizacji za pomocą nieliniowej metody najmniejszych kwadratów jest metodaGaussa-Newtona. Metoda ta polega na iteracyjnym procesie rozwiązywania linio-wego zagadnienia najmniejszych kwadratów powstałego przez linearyzację funkcjiF = (F1, F2, ..., Fm) w otoczeniu kolejnych punktów.
3.7. ALGORYTMY NIEDETERMINISTYCZNE 41
Algorytm rozpoczyna poszukiwanie optimum startując z punktu x(0) ∈ Rn.Następnie w k–tej iteracji, za pomocą rozwinięcia funkcji w szereg Taylora, line-aryzuje się funkcję F (x) w otoczeniu punktu x(k).
∥F (x)− y∥22 ≈ ∥F (x(k)) + F ′(x(k))d(k) − y∥22
Wprowadzając oznaczenia b = y − F (x(k)) i J = F ′(x(k)), gdzie J jest macierząJakobianową F w punkcie x(k), zaś d(k) = x(k+1) − x(k), możemy zapisać:
f(x(k+1)) = f(x(k) + d(k)) ≈ ∥Jd(k) − b∥22 (3.33)
Problem minimalizacji wyrażenia (3.33) jest liniowym zagadnieniem najmniej-szych kwadratów, które rozwiązujemy stosując standardowe metody opisane wpodrozdziale 3.4.1. W wyniku rozwiązania problemu otrzymujemy poprawkę d(k),dzięki której możemy wyznaczyć następny punkt roboczy x(k+1) = x(k) + d(k).Operację powtarzamy aż algorytm osiągnie pewne kryterium stopu.Istnieje wiele wariantów opisanej metody. Najbardziej popularną jest metoda
Levenberg-Marquardta (metoda LM) [58] oraz metoda zaufanych obszarów (ang.trust region method) [60]. W pracy wykorzystano metodę zaufanych obszarów zograniczeniami kostkowymi [16].
3.7 Algorytmy niedeterministyczne
3.7.1 Algorytm symulowanego wyżarzania
Algorytm symulowanego wyżarzania jest rozwinięciem algorytmu błądzenia przy-padkowego, który polega na wykonywaniu losowych modyfikacji rozwiązania opewną niewielką wartość, w celu znalezienia lepszego rozwiązania niż dotych-czasowe. Wadą algorytmu błądzenia przypadkowego jest możliwość “utknięcia”w minimum lokalnym. Algorytm symulowanego wyżarzania daje możliwość wyj-ścia z lokalnego minimum dzięki akceptacji z niezerowym prawdopodobieństwemrozwiązania gorszego. Gdy algorytm wygeneruje nowy punkt z przestrzeni po-tencjalnych rozwiązań nie zawsze staje się on punktem roboczym. Dzieje się takzawsze, gdy poprawia on wartość funkcji celu, natomiast w przeciwnym przypad-ku akceptacja następuje z prawdopodobieństwem równym:
pa =
[1 + exp
(f(x(k))− f(x(k−1))
T
)]−1(3.34)
gdzie: T = T (k) > 0 – jest parametrem nazywanym temperaturą. Im tempe-ratura jest wyższa, tym prawdopodobieństwo wyboru gorszego rozwiązania jestwiększe. Parametr ten jest zmniejszany w trakcie działania algorytmu. Nazwametody bierze się z analogii do procesu wyżarzania materiału, stosowanego wcelu minimalizacji jego energii wewnętrznej (w stanie równowagi).
42 ROZDZIAŁ 3. METODY OPTYMALIZACJI
Podczas stosowania tej metody należy uważanie dobierać sposób obniżaniatemperatury w kolejnych krokach procesu optymalizacyjnego. Zbyt szybkie jej ob-niżenie może prowadzić do przedwczesnej zbieżności, zbyt zaś powolne – wydłużaczas obliczeń i sprawia, że łatwo można wyjść z obszaru przyciągania ekstremumglobalnego. Najczęściej stosuje się jeden z trzech schematów chłodzenia:
1. schemat logarytmiczny (Boltzmanna): T (k) ∼= T0 1log(k) ,
2. schemat liniowy (Cauchy’ego): T (k) ∼= T0 1k ,
3. schemat geometryczny: T (k) ∼= T0 αk, gdzie 0 < α < 1.
T0 oznacza temperaturę początkową, natomiast k jest numerem iteracji. Działa-nie algorytmu polega na schładzaniu (zmniejszaniu temperatury) wg. zapropo-nowanych schematów i proces ten może być powtarzany wielokrotnie w trakciepojedynczej symulacji. Zatrzymanie algorytmu podyktowane jest ustalonym wa-runkiem stopu, np. warunek stagnacji rozwiązania, polegający na małej zmianie(mniejszej od ustalonej tolerancji) wartości funkcji w trakcie działania algorytmu.
3.7.2 Algorytmy ewolucyjne
Techniki ewolucyjne w rozwiązywaniu zagadnień optymalizacji globalnej są dziśbardzo często używanymi metodami obliczeniowymi. Dzieje się tak, pomimo te-go, że nie mają one ciągle ”solidnych podstaw matematycznych”. Techniki temają bardzo istotną zaletę - pozwalają uzyskać rozwiązania niezwykle złożonychproblemów w dość łatwy sposób. Liczba udanych aplikacji tych technik oblicze-niowych przyczyniła się do akceptacji ich przez środowiska naukowe i inżynierskie.Początki algorytmów ewolucyjnych sięgają lat 60-tych. Pierwsze prace mówiąceo niedeterministycznym podejściu do zagadnień optymalizacji to przede wszyst-kim prace Hollanda [43], Fogela [22], Rechengerga [68] czy Schwefela [70]. Jed-nak powszechny sceptycyzm towarzyszący tym probabilistycznym podejściem dozagadnień optymalizacji, powodował, że były one lekceważone aż do końca lat80-tych. Prace wspomnianych autorów ustaliły podstawy dla trzech podejść doobliczeń ewolucyjnych, którymi są:
X algorytmy genetyczne (J.H. Holland)
X programowanie ewolucyjne (L.J. Fogel)
X strategie ewolucyjne (I. Rechenberg i H.P. Schwefel)
Schemat algorytmu ewolucyjnego
Realizacja algorytmu ewolucyjnego sprowadza się do iteracyjnego przekształca-nia populacji osobników, reprezentujących zbiór (bieżących) rozwiązań danego
3.7. ALGORYTMY NIEDETERMINISTYCZNE 43
zadania. Ewolucyjny charakter tego procesu jest widoczny w sposobie genero-wania kolejnych populacji, w którym stosujemy tzw. operatory genetyczne orazproces selekcji. Operatory genetyczne wprowadzają do systemu losową modyfi-kację oraz wymianę materiału genetycznego osobników, co pozwala na uzyskiwa-nie nowych rozwiązań. Selekcja natomiast steruje procesem tak, aby promowaćnajlepsze osobniki, które są wyłaniane w oparciu o badanie stopnia ich przysto-sowania. Proces ewolucyjny działający według tego modelu powinien zapewnićpojawianie się w kolejnych populacjach osobników coraz lepiej przystosowanych,tzn. przybliżających coraz dokładniej rozwiązanie zadania (ekstremum globalne).
Rysunek 3.2: Ogólny przebieg algorytmu ewolucyjnego
Rys. 3.2 przedstawia przebieg algorytmu ewolucyjnego. Algorytm 9 przed-stawia ogólny schemat algorytmu ewolucyjnego [4]. Różni się on od schematuprzedstawionego na rysunku warunkiem stopu definiującym moment przerwaniaewolucji. Z reguły algorytm zostaje przerwany po wykonaniu ustalonej liczby ite-racji lub gdy nastąpi stagnacja procesu ewolucji (brak zmiany wartości funkcjicelu) czy osiągnięcia oczekiwanego rozwiązania (z założonym wcześniej błędem).W przedstawionym algorytmie P k oznacza populację osobników z przestrzenipotencjalnych rozwiązań, T k oznacza część populacji wybraną metodą selekcjibezpośrednio z populacji P k, natomiast Qk oznacza zbiór osobników utowrzo-nych w wyniku działania operacji ewolucyjnych (np. mutacji, krzyżowania) naelementach zbioru T k. Populacja składa się z µ osobników. Populacja początko-wa, powstająca w trakcie inicjacji algorytmu, najczęściej składa się z osobnikówlosowo wybranych z przestrzeni potencjalnych rozwiązań. W kroku k generowa-nych jest λ osobników potomnych, tworzących tzw. populację pośrednią (ozna-czoną jako Qk). Następnie przeprowadzana jest selekcja, która polega na wyborzeµ osobników tworzących kolejną populację P k+1 z populacji pośredniej Qk orazdodatkowego zbioru osobników P k. Liczba osobników zbioru T k może być równa
44 ROZDZIAŁ 3. METODY OPTYMALIZACJI
lub mniejsza od liczby osobników populacji P k.
Algorytm 9 Ogólny schemat algorytmu ewolucyjnego1: k:=02: inicjacja P 0
3: ocena P 0
4: repeat5: T k := selekcja ze zbioru P k
6: Qk := operacje ewolucyjne na P k
7: ocena Qk
8: P k+1 := selekcja ze zbioru P k ∪Qk9: k := k + 110: until warunek stopu
Przedstawiony algorytm 9 obrazujący ogólny schemat algorytmu ewolucyj-nego jest obecnie adaptowany w wielu różnych wariantach. Różnice polegają nasposobie selekcji, krzyżowania i mutacji osobników. Szczegółowy opis różnorod-nych operatorów krzyżowania i mutacji można znaleźć w [37], [38].Istotnym parametrem algorytmów ewolucyjnych jest sposób kodowania osob-
ników. W przypadku algorytmów genetycznych często stosuje się reprezentacjębinarną. W algorytmach genetycznych dominującym operatorem genetycznymjest krzyżowanie. Polega ono na wymianie między osobnikami rodzicielskimi frag-mentów łańcuchów kodowych. Obecnie stosowanych jest bardzo wiele odmianoperatora krzyżowania, ale najprostszą i najczęściej stosowaną formą jest tzw.krzyżowanie jednopunktowe. Sposób ten jest wzorowany na obserwowanym wprzyrodzie procesie przemian w DNA, zachodzących podczas rozmnażania gene-ratywnego. Chromosomy rodzicielskie są rozcinane na dwa fragmenty. Następniepierwszy fragment pierwszego chromosomu jest sklejany z drugim fragmentemdrugiego chromosomu; podobnie pierwszy fragment drugiego chromosomu jestsklejany z drugim fragmentem pierwszego. Powstałe w ten sposób łańcuchy two-rzą chromosomy osobników potomnych (rysunek 3.3). Wszystkie chromosomyzawierają jednakową liczbę genów, dlatego też rozcięcie musi być wykonane wtym samym miejscu w obu chromosomach. Miejsce rozcięcia jest zwykle wybiera-ne losowo z rozkładem równomiernym. Podobnie można zastosować krzyżowaniedwupunktowe, gdzie zamiast jednego punktu rozcięcia losuje się dwa takie punktyi następnie wymienia odpowiednie części chromosomów.Kolejnym operatorem genetycznym jest mutacja, która jest wykonywana dla
każdego genu osobno. Podczas mutacji, która jest wykonywana z prawdopodo-bieństwem pm, wartość genu zmienia się na przeciwną (z 0 na 1 lub 1 na 0). Wostatnich latach pojawiły się prace pokazujące, że zastosowanie na większą skalęmutacji w początkowych fazach działania algorytmu genetycznego, może miećbardzo korzystny wpływ na jego zbieżność [55].W algorytmach genetycznych stosowana jest zwykle tzw. selekcja miękka, któ-
3.7. ALGORYTMY NIEDETERMINISTYCZNE 45
Rysunek 3.3: Krzyżowanie jednopunktowe w kodowaniu binarnym
ra jest operatorem stochastycznym. Wybór osobników tworzących kolejne popu-lacje, polega na ich wylosowaniu z prawdopodobieństwem zależnym od wartościfunkcji przystosowania.W przypadku gdy celem optymalizacji jest wyznaczenie optymalnych wartości
parametrów ze zbioru R kodowanie binarne może prowadzić do nieefektywnychalgorytmów. Poprawę jakości działania można uzyskać dzięki zastosowaniu kodo-wania liczbami rzeczywistymi. W przypadku takich algorytmów główna strukturai przebieg samego algorytmu jest identyczna, natomiast znacznej zmianie ulegająoperatory ewolucyjne - krzyżowanie i mutacja.Krzyżowanie może odbywać się na dwa sposoby. Pierwszy podobny jak przy
krzyżowaniu jedno lub dwupunktowym polega na wymianie wartości (liczb rze-czywistych, nie bitów) w poszczególnych chromosomach. Drugi sposób zwanykrzyżowaniem uśredniającym jest opisany równaniem:
x′i = xi + λi(yi − xi)y′i = yi + λi(xi − yi)
(3.35)
gdzie λi jest liczbą rzeczywistą wylosowaną z rozkładem równomiernym z prze-działu [0, 1].Wybór odpowiedniego osobnika w celu przeprowadzenia krzyżowania jest wy-
konany z pewnym prawdopodobieństwem. Prawdopodobieństwo to jest tym więk-sze im lepsze jest przystosowanie danego osobnika (mniejsza wartość funkcji celu).Często stosowaną metodą selekcji jest metoda rankingowa. Poniżej zostanie opi-sana wersja metoda rankingowej zastosowana w niniejszej pracy. Osobniki z danejpopulacji zostają posortowane od najlepszego do najgorszego. Następnie losuje-my zgodnie z rozkładem równomiernym liczbę naturalną s z przedziału od 1 doµ(µ + 1)/2, gdzie µ jest liczebnością populacji. Korzystając z zaproponowanegoprzez autora wzoru (3.36) losuje się osobnika w celu poddania go krzyżowaniu.Na rys. 3.4 przedstawiono wykres opisywanej funkcji dla populacji składającejsię z µ = 7 osobników. Łatwo zauważyć, że osobnik o większej wartości funkcjiprzystosowania ma większe szanse zostać wybranym do dalszej selekcji.
1 + Floor(12+ µ− 1
2
√(2µ+ 1)2 − 8s+ 8
)(3.36)
46 ROZDZIAŁ 3. METODY OPTYMALIZACJI
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 280
1
2
3
4
5
6
7
8
s
nr o
sobn
ika
Rysunek 3.4: Wykres funkcji na podstawie której dokonywano selekcji dla przy-kładowej populacji składającej się z µ = 7 osobników
Mutacja polega na zaburzeniu wartości wylosowanego genu danego chromo-somu. Wybrany gen zi poddany procesowi mutacji przyjmuje wartość:
z′i = zi +∆zi
gdzie ∆zi jest wartością perturbacji genu zi.Zastosowano sposób mutacji pojedynczych genów w chromosomie zaczerpnię-
ty z klasy algorytmów genetycznych Breeder Genetic Algorithm:
∆zi = (zi max − zi min)2−βbλi , (3.37)
gdzie zi max oraz zi min oznaczają maksymalne wartości parametrów z przestrze-ni poszukiwań, βb jest parametrem określającym zakres mutacji. Im wspomnianyparametr jest większy tym zakres mutacji jest mniejszy.
0 50 100 150 200 250 300 350 4000
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
k
pm
Rysunek 3.5: Zmienne prawdopodobieństwo mutacji (pmax = 0.8, pmin = 0.2,kmax = 400, β = 0.5)
3.7. ALGORYTMY NIEDETERMINISTYCZNE 47
Decyzja czy dany osobnik (chromosom) z populacji zostanie poddany muta-cji jest podejmowana z prawdopodobieństwem pm. Poprzez zmianę parametru pmmamy możliwość wpływania na intensywność procesu mutacji w zależności od nu-meru generacji czy wartości funkcji przystosowania. Autor zaproponował funkcję,która uzależniała wartość prawdopodobieństwa mutacji od numeru generacji:
pm(k) = pmin + (pmax − pmin) exp(−β
(k
pminkmax
)2)(3.38)
gdzie: pm(k) jest wartością prawdopodobieństwa mutacji w k-tej generacji, pmin,pmax są odpowiednio prawdopodobieństwem mutacji w początkowej i końcowejfazie działania algorytmu, kmax jest liczbą określającą liczbę iteracji kończącądziałanie algorytmu oraz β jest parametrem określającym prędkość zmniejszaniawartości parametru pm wraz z numerem generacji. Rys. 3.5 przedstawia wykreszaproponowanej funkcji dal wybranych wartości parametrów pmin, pmax oraz β.
Rozdział 4
Optymalizacja rozkładu prądu w cewce
W tym rozdziale przedstawione zostaną wyniki obliczeń problemu syntezy po-la magnetycznego przedstawionego jako problem optymalizacji rozkładu prądóww cewce. Poszukiwany będzie taki rozkład prądów, który wytworzy pole magne-tyczne o zadanym z góry kształcie. Zostaną przedstawione oraz porównane wynikiobliczeń wykorzystujące metody optymalizacji przedstawione w rozdziałach po-przednich.
4.1 Opis rozważanych problemów
Rys. 4.1 przedstawia przekrój cewki w symetrii walcowej. Cewka ta składa się zw × k = n pojedynczych zwojów (w oznacza liczbę zwojów w kierunku z, na-tomiast k liczbę zwojów w kierunku r). Przypadek k = 1 będziemy nazywaćprzypadkiem jednowymiarowym (1D), zaś k > 1 przypadkiem dwuwymiarowym(2D). Założymy, że pole magnetyczne jest indukowane w środowisku magnetycz-nie liniowym, co oznacza, że przenikalność magnetyczna tego środowiska nie zale-ży od wartości pola. Zatem do wyznaczenia pola magnetycznego można stosowaćzasadę superpozycji. Zgodnie z tą zasadą, wypadkowe pole magnetyczne jest su-mą pól wytworzonych przez każdy ze zwojów. Będziemy rozważali dwa przypadkiobszarów Γ, w których ma być wytworzone zadane pole magnetyczne. Pierwszymz nich jest kula umieszczona w środku układu współrzędnych. Promień kuli wy-nosi rreq. Natomiast w drugim przypadku obszarem tym jest odcinek leżący na osiz układu współrzędnych rozciągający się od punktu zreqmin do punktu zreqmax.Dla obszarów, gdzie ma być wytworzone zadane pole magnetyczne stosowanybędzie indeks ”req”, natomiast indeksem ”c” oznaczono wszystkie parametry do-tyczące cewki. Cewka ma długość określoną przez współrzędne zcmin oraz zcmax.Będziemy zakładać, że środek cewki oraz obszaru, w którym ma być wytworzonezadane pole magnetyczne pokrywają się z początkiem układu współrzędnych, tzn.zcmin = −zcmax, zreqmin = −zreqmax. W przypadku 1D uzwojenia mają promień
48
4.1. OPIS ROZWAŻANYCH PROBLEMÓW 49
rc = rcmin, zaś w przypadku 2D uzwojenia są równomiernie rozłożone pomiędzyrcmin a rcmax.
Rysunek 4.1: Przekrój poprzeczny cewki walcowej składającej się z pojedynczychzwojów oraz obszaru Γ.
Najczęściej rozważanym problemem jest wyznaczenie takiego rozkładu prą-dów w cewce, aby otrzymać pole jednorodne. Bez straty ogólności można wtedyzałożyć, że breq = µ0 T (µ0 – przenikalność magnetyczna próżni). Przeskalowaniewartości prądów umożliwia uzyskanie pól o dowolnych wartościach. Problem wy-tworzenia jednorodnego pola magnetycznego w pewnym zadanym obszarze jestważnym problemem aplikacyjnym, wykorzystywanym na przykład do konstrukcjiurządzeń rezonansu magnetycznego, czy urządzeń wykorzystywanych w separacjimagnetycznej. Parametry problemu optymalizacyjnego rozważanego w niniejszejpracy odpowiadają typowym wymiarom konstrukcyjnym dla urządzeń rezonan-su magnetycznego [81]. W pracy [80] została przedstawiona zależność wiążącawymiary cewki z średnicą obszaru w którym generowane jest pole.
zcoil = 0.8dcoil + 1.2dreq (4.1)
gdzie zcoil = zcmax−zcmin jest długością cewki, dcoil = 2rcmin średnicą wewnętrznącewki, natomiast dreq = 2rreq jest średnicą obszaru, w którym generowane jestpole. Zależność (4.1) została wskazana jako optymalne rozwiązanie dla osiągnię-cia jednorodnego pola przy minimalizacji powierzchni przekroju cewki. Tabela
50 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
4.1 przedstawia parametry rozważanych problemów. Cewka ma długość 1.02 m,średnicę wewnętrzną 60 cm, w przypadku 2D jej grubość wynosi 10 cm. ObszarΓ jest kulą o średnicy 45 cm lub odcinkiem o długości 90 cm. Użyte wymiary sąstandardowymi w przypadku urządzeń rezonansu magnetycznego do obrazowaniacałego ciała człowieka.
Tabela 4.1: Parametry cewki oraz obszaru Γ analizowanych problemów
Wymiary cewki
rc = rcmin 30 cmrcmax 40 cmzcmax = −zcmin 51 cmObszar Γ będący kulą
rreq 22.5 cmObszar Γ będący odcinkiemzreqmax = −zreqmin 45 cm
4.2 Optymalizacja pola magnetycznego bez ograniczeń
W tym podrozdziale zostaną przedstawione wyniki obliczeń w przypadku, gdy narozwiązanie nie nakłada się żadnych ograniczeń. Mamy tutaj do czynienia z kla-sycznym zagadnieniem najmniejszych kwadratów bez ograniczeń. Poszukuje siętakiego rozkładu prądów który minimalizuje (w sensie najmniejszych kwadratów)różnicę pomiędzy polem zadanym a otrzymanym przy założeniu, że położenieuzwojeń jest ustalone.
4.2.1 Wybór metody rozwiązania układu równań normalnych
Ponieważ zależność między szukanymi wielkościami a polem magnetycznym jestliniowa, to problem optymalizacyjny ma postać zadania najmniejszych kwadra-tów (2.7).Na rys. 4.2 przedstawiono wykres uwarunkowania macierzy A ∈ R1000×n w
funkcji jej rozmiaru n. Rozważono przypadek m = 1000 punktów w obszarze Γ.Współczynnik uwarunkowania macierzy rośnie bardzo szybko wraz z jej wymia-rem, co oznacza, że dla dużych n rozważane problemy są źle uwarunkowane.Uwarunkowanie problemu gdy pole jest generowane na okręgu jest lepsze niżw przypadku problemu pola na osi z. Obszar wykresu, w którym κ(A) ∼ 1017
przedstawia błąd reprezentacji zmiennoprzecinkowej i nie powinien być brany poduwagę. Dzieje się tak powyżej wymiaru n = 40 dla pola na osi współrzędnychi powyżej n = 50 dla pola magnetycznego na okręgu. Warto przypomnieć fakt,że rozwiązanie jest opisane równaniem normalnym (3.7). W równaniu tym wy-stępuje macierz ATA, której współczynnik uwarunkowania jest równy kwadrato-
4.2. OPTYMALIZACJA POLA MAGNETYCZNEGO BEZ OGRANICZEŃ 51
wi współczynnika uwarunkowania macierzy A. Przedstawiony wykres potwierdzakonieczność stosowania metod pozwalających na uniknięcie obliczania macierzyATA.
0 10 20 30 40 50 60 7010
0
103
106
109
1012
1015
κ(A
)
n
b
req na osi z
breq
na kuli
Rysunek 4.2: Współczynnik uwarunkowania κ(A) macierzy A ∈ R1000×n w funkcjiwymiaru problemu n.
W związku z problemem złego uwarunkowania problemu istotny jest wybórodpowiedniej metody, która będzie stabilna numerycznie dla problemów o jak naj-większym wymiarze. Rys. 4.3 przedstawia porównanie metod stosowanych do roz-wiązania problemu najmniejszych kwadratów. Rozważono jako przykład problemkształtowania pola magnetycznego na osi układu współrzędnych. Przedstawionowartość funkcji celu w funkcji wymiaru problemu n dla różnych metod. Zastoso-wano następujące metody: rozkład QR (wersja bez i z wykorzystaniem symetriiproblemu), rozkład względem wartości szczególnych (SVD), oraz metodę rozwią-zywania zagadnienia najmniejszych kwadratów bez ograniczeń zaimplementowa-ną w środowisku Matlab R⃝. Z wyników można wywnioskować, że rozwiązaniepoprawia się znacznie wraz ze wzrostem wymiaru (zmiana n z 5 do 50 powodujezmniejszenie wartości funkcji celu 10−14 razy!). Najlepsze wyniki osiąga się stosu-jąc metodę rozkładu QR. Często w literaturze wskazuje się, że metoda SVD jestnajbardziej stabilna. Tego efektu nie zauważono w rozważanym przypadku, dlaktórego metoda dekompozycji QR daje lepsze wyniki. Może to wynikać z faktu,że problem jest źle uwarunkowany a wykonanie rozkładu SVD macierzy wymagaznacznie więcej operacji niż rozkład QR, co przy złym uwarunkowaniu problemupowoduje generowanie dużych błędów numerycznych. Wynik testu mówi również,że redukcja wymiaru problemu wykorzystująca jego symetrie powoduję poprawęwyników (QR symetria). Metoda najmniejszych kwadratów bez ograniczeń wbu-dowana bezpośrednio w Matlab’a R⃝ znajduje rozwiązanie o kilka rzędów wielkościgorsze. Dla n > 100 osiąga się zero funkcji celu z dokładnością rzędu dokładności
52 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
maszynowej. Poszukiwanie lepszego rozwiązania przy standardowej precyzji obli-czeń nie ma sensu. Ze względu na fakt, że metoda rozkładu QR dawała najlepszewyniki rozwiązań, została ona użyta do rozwiązania zagadnienia najmniejszychkwadratów bez ograniczeń.
4.2.2 Pole magnetyczne kształtowane na osi układu współrzędnych
Rys. 4.4 przedstawia rozwiązanie problemu bez ograniczeń dla przypadku, gdycewka składa się z n = 6 zwojów, oraz obszar Γ jest odcinkiem. Rozwiązanieto otrzymano stosując metodę rozkładu QR. Otrzymane pole magnetyczne od-biega od oczekiwanego. Względny błąd pomiędzy polem wyznaczonym a polemoczekiwanym został przedstawiony na rys. 4.4(c). Maksymalny błąd γ3 wyno-si 5, 5%, natomiast błąd średni γ2 jest na poziomie 1%. Wynik jest symetrycznyoraz wszystkie prądy mają wartości dodatnie. Współczynnik uwarunkowania ma-cierzy wynosi κ(A) = 31.2, w związku z tym możemy powiedzieć, że macierz Ajest dość dobrze uwarunkowana. Wartość funkcji celu dla tego problemu wynosif(x) = 0.19692. Dla n > 6 pojawiają się prądy płynące w przeciwnym kierunku.Rys. 4.5 przedstawia rozwiązanie dla przypadku n = 25. Mimo relatywnie niskie-go wymiaru wartości prądów wzrosły ponad stukrotnie w stosunku do wymiarun = 6. W sąsiednich uzwojeniach prądy płyną w przeciwnych kierunkach. Rozwią-
0 50 100 150 200 25010
−20
10−18
10−16
10−14
10−12
10−10
10−8
10−6
10−4
n
||Ax−
b||2 2
QRSVDmatlab − lsqQR symetria
Rysunek 4.3: Porównanie metod stosowanych do rozwiązania problemu najmniej-szych kwadratów bez ograniczeń.
4.2. OPTYMALIZACJA POLA MAGNETYCZNEGO BEZ OGRANICZEŃ 53
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.50
0.1
0.2
0.3
0.4
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0.96
0.98
1
1.02
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.4: Rozwiązanie problemu o wymiarze n ×m = 6 × 1000. (a) rozkładprądów w uzwojeniach cewki, (b) odpowiadający im rozkład pola magnetycznegona osi układu współrzędnych, (c) rozkład błędu względnego. β1 = 0.464, β2 =0.42671, γ1 = 0.4438, γ2 = 1.1084 · 10−2, γ3 = 5.5045 · 10−2.
54 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
zanie jest symetryczne, co wskazuje, na pewną stabilność numeryczną rozwiąza-nia. Wraz ze wzrostem wartości prądów wzrosła o kilka rzędów wielkości wartośćwspółczynnika energetycznego, a co za tym idzie energii traconej w uzwojeniachcewki. Wartość funkcji celu f(x) = 1.2713 · 10−9 jest o kilka rzędów wielkościmniejsza niż dla n = 6. Jakość rozwiązania ze względu na pole magnetyczne jestbardzo dobra i różni się od pola zadanego dopiero na szóstym miejscu po prze-cinku. Rys. 4.5(c) przedstawia rozkład błędu względnego. Wartość średnia błęduwynosi γ2 = 8.97 · 10−7, maksymalny błąd γ3 jest mniejszy niż 7.1 · 10−6.
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5−50
−25
0
25
50
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40,999996
0,999998
1
1,000002
1,000004
z [m]
b/breq max
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−10
10−9
10−8
10−7
10−6
10−5
z [m]
ε
Rysunek 4.5: Rozwiązanie problemu o wymiarze n×m = 25× 1000. (a) rozkładprądów w uzwojeniach cewki, (b) odpowiadający im rozkład pola magnetycznegona osi układu współrzędnych, (c) rozkład błędu względnego. β1 = 43778, β2 =50.04, γ1 = 3.57 · 10−5, γ2 = 8.97 · 10−7, γ3 = 7.10 · 10−6.
4.2. OPTYMALIZACJA POLA MAGNETYCZNEGO BEZ OGRANICZEŃ 55
Rys. 4.6 przedstawia rozwiązanie uzyskane dla cewki podzielonej na n = 100pojedynczych uzwojeń. Znalezione rozwiązanie posiada kilka wad z praktycznegopunktu widzenia. Prądy w poszczególnych uzwojeniach osiągają wartości rzędu2.5·104 A, oraz typowo mają przeciwne znaki w sąsiadujących uzwojeniach. Takieduże wartości prądów oczywiście powodują znaczny wzrost czynnika energetycz-nego, który dla tego przypadku wynosi β1 = 3.5·109. Rozwiązanie jest o wiele lep-sze niż to dla przypadku n = 6, wartość funkcji celu wynosi f(x) = 8.1873 ·10−19.Maksymalny błąd względny jest mniejszy niż 5.5 · 10−10. Wykres rozkładu błęduwzględnego został przedstawiony na rys. 4.6(c). Natomiast rozwiązanie nie jestsymetryczne, a takiego należało się spodziewać. Oznacza to, że mimo dobrej ja-kości dopasowania pola wyznaczonego do pola zadanego o czym świadczą niskiewartości współczynników γ należy takie rozwiązania odrzucić, jako kompletniepozbawionych charakteru aplikacyjnego.Dzięki wykorzystaniu symetrii problemu można zmniejszyć wymiar proble-
mu dwukrotnie. Na przykład rozwiązanie problemu n ×m = 100 × 1000 możnazastąpić równoważnym problemem n × m = 50 × 500. Dzięki redukcji wymia-ru osiąga się poza skróceniem czasu obliczeń (co w naszym przypadku nie jestkluczowe) poprawę stabilności numerycznej problemu. Na rys. 4.7 przedstawionorozwiązanie problemu n×m = 100×1000 uzyskane przy wykorzystaniu symetrii.Rozwiązanie jest bardziej stabilne numerycznie a wartość funkcji celu jest o rządwielkości mniejsza niż dla rozwiązania nie korzystającego z symetrii. Nieznaczniezmniejszyła się wartość prądów, a co za tym idzie zmniejszył się również wskaźnikenergetyczny.Rys. 4.8 przedstawia rozwiązanie problemu w przypadku 2D (w× k = 6× 3).
Wartość funkcji celu wynosi f(x) = 3.23 · 10−8. Maksymalny błąd względnypola wynosi γ3 = 3.16 · 10−5. Rozkład prądów w uzwojeniach jest symetryczny.Wartość prądu zmienia się w zakresie od −43.6 do 43.6 A. Rys. 4.9 przedstawiarozwiązanie problemu bez ograniczeń w przypadku, gdy cewka jest podzielonana n = w × k = 20 × 10 = 200 pojedynczych zwojów. Wartość funkcji celuwynosi f(x) = 2.61 · 10−24. Rozwiązanie straciło swój symetryczny charakter.Maksymalny błąd rozwiązania nie przekracza wartości γ3 = 3.97 ·10−13. Rozkładbłędu względnego został przedstawiony na rys. 4.9(b).
4.2.3 Pole magnetyczne kształtowane na powierzchni kuli
W niniejszym podrozdziale zostaną przedstawione wyniki rozwiązania problemuoptymalizacji bez ograniczeń dla przypadku obszaru Γ będącego kulą. Rys. 4.10przedstawia rozwiązanie problemu dla wymiaru n × m = 6 × 1000 oraz odpo-wiadający mu rozkład pola magnetycznego na powierzchni kuli. Rozkład błę-du względnego został przedstawiony na rys. 4.10(c). Maksymalny błąd wynosiγ3 = 7.8% natomiast średni błąd jest na poziomie γ2 = 1.55%. Błędy te są nie-znacznie większe niż dla przypadku pola na osi. W przypadku pola generowanego
56 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
−1
0
1
2
x 104
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0.9999999997
0.9999999996
0.9999999998
0.9999999999
1
1.0000000001
z [m]
b/breq max
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−14
10−13
10−12
10−11
10−10
10−9
z [m]
ε
Rysunek 4.6: Rozwiązanie problemu o wymiarze n×m = 100×1000. (a) rozkładprądów w uzwojeniach cewki, (b) odpowiadający im rozkład pola magnetycznegona osi układu współrzędnych, (c) rozkład błędu względnego. β1 = 3.45 · 109,β2 = 23026, γ1 = 9.05 · 10−10, γ2 = 1.27 · 10−11, γ3 = 5.42 · 10−10.
4.2. OPTYMALIZACJA POLA MAGNETYCZNEGO BEZ OGRANICZEŃ 57
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
−1.5
−1
−0.5
0
0.5
1
1.5
x 104
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−13
10−12
10−11
10−10
z [m]
ε
Rysunek 4.7: Rozwiązanie problemu o wymiarze n × m = 100 × 1000 zreduko-wanego do problemu n ×m = 50 × 500 z wykorzystaniem symetrii. (a) rozkładprądów w uzwojeniach cewki, (b) rozkład błędu względnego. β1 = 3.067 · 109,β2 = 17906, γ1 = 2.82 · 10−10, γ2 = 7.04 · 10−12, γ3 = 4.98 · 10−11.
na powierzchni kuli, dla n > 10 w rozwiązaniu pojawiają się prądy płynące wprzeciwnych kierunkach. Rys. 4.11 przedstawia rozwiązanie problemu w przypad-ku n×m = 25×1000. W porównaniu do problemu pola generowanego dla osi dlatakiego samego wymiaru wartość funkcji celu jest prawie pięciokrotnie mniejsza iwynosi f(x) = 6.4786·10−10. W porównaniu do problemu n = 6 siedemdziesięcio-krotnie wzrosła wartość prądu maksymalnego, w związku z czym o cztery rzędywielkości powiększył się współczynnik energetyczny. W przypadku zwiększeniawymiaru n zauważono, że przy wzroście do n = 37 wartości maksymalne prądówznacznie wzrastały (β2 = 6540 A). Natomiast dla n = 38 prąd maksymalny zma-lał do β2 = 66.3 A, co w pewnym stopniu odróżnia wyniki od wyników dla polagenerowanego na osi. Dla n = 100 otrzymano wynik niesymetryczny (podobniejak w przypadku pola generowanego na osi). Wartości prądów utrzymywały się napoziomie 70 A. Prądy w sąsiednich przewodach płyną w przeciwnych kierunkach.Otrzymane rozwiązanie jest bezużyteczne z praktycznego punktu widzenia.
58 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
3033.336.7 40
−51−38.3−25.5−12.8 0 12.8 25.5 38.3 51
−60
−40
−20
0
20
40
r[cm]z[cm]
x[A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0,99998
0,99999
1
1,00001
z [m]
b/breq max
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−8
10−7
10−6
10−5
10−4
z [m]
ε
Rysunek 4.8: Rozwiązanie problemu 2D o wymiarze w × k ×m = 6 × 3 × 1000.(a) rozkład prądów w uzwojeniach cewki, (b) odpowiadający im rozkład polamagnetycznego na osi układu współrzędnych, (c) rozkład błędu względnego. β1 =7571.8, β2 = 43.59, γ1 = 1.80 · 10−4, γ2 = 4.59 · 10−6, γ3 = 3.16 · 10−5.
4.2. OPTYMALIZACJA POLA MAGNETYCZNEGO BEZ OGRANICZEŃ 59
(a)
3033.3
36.7 40 −51−38.3−25.5−12.8 0 12.8 25.5 38.3 51
−10
−5
0
5
10
r[cm]z[cm]
x[A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−16
10−15
10−14
10−13
10−12
z [m]
ε
Rysunek 4.9: Rozwiązanie problemu 2D o wymiarze w× k×m = 20× 10× 1000.(a) rozkład prądów w uzwojeniach cewki, (b) rozkład błędu względnego. β1 =2207.49, β2 = 12.8294, γ1 = 1.615 · 10−12, γ2 = 3.79 · 10−14, γ3 = 3.97 · 10−13.
4.2.4 Podsumowanie problemu optymalizacji bez ograniczeń
Rys. 4.12 przedstawia wykresy zależności maksymalnego prądu (współczynnikβ1) oraz sumy kwadratów prądów (współczynnik β2) w funkcji wymiaru proble-mu. Wartości prądów wzrastają do wartości rzędu 105 A w przypadku obszaruΓ będącego odcinkiem i do wartości rzędu ·104 A dla obszaru Γ będącego kulą.Ciekawą własnością w przypadku gdy pole generowane było na kuli jest fakt,że dla n = 37 prądy w cewce osiągają maksymalną wartość i w miarę wzro-stu n maleją on do wartości rzędu 100 A. Dla n > 50 problem staje się bardzoźle uwarunkowany i rozwiązanie traci symetrię. Rozkład prądów w cewce jestbardzo niejednorodny. Decydujące znaczenie zaczynają odgrywać błędy zaokrą-gleń. Rozwiązanie problemów dla większego n przy ustalonej precyzji obliczeń
60 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.50
0.05
0.1
0.15
0.2
0.25
0.3
0.35
z [m]
x [A
]
(b)
0 π/4 π/2 3π/4 π0.92
0.94
0.96
0.98
1
1.02
1.04
α [rad]
b/b re
q m
ax
(c)
0 π/4 π/2 3π/4 π10
−5
10−4
10−3
10−2
10−1
α [rad]
ε
Rysunek 4.10: Rozwiązanie problemu o wymiarze n×m = 6× 1000. (a) rozkładprądów w uzwojeniach cewki, (b) odpowiadający im rozkład pola magnetycznegona powierzchni obszaru Γ, (c) rozkład błędu względnego. β1 = 0.3342, β2 =0.3236, γ1 = 0.2540, γ2 = 1.5546 · 10−2, γ3 = 7.7996 · 10−2.
4.2. OPTYMALIZACJA POLA MAGNETYCZNEGO BEZ OGRANICZEŃ 61
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
−20
−10
0
10
20
z [m]
x [A
]
(b)
0 π/4 π/2 3π/4 π 0,99999
0,999995
1
1,000005
1,00001
α [rad]
b/b re
q m
ax
(c)
0 π/4 π/2 3π/4 π
10−9
10−8
10−7
10−6
10−5
α [rad]
ε
Rysunek 4.11: Rozwiązanie problemu o wymiarze n × m = 25 × 1000. (a) roz-kład prądów w uzwojeniach cewki, (b) odpowiadający im rozkład pola magne-tycznego na powierzchni kuli umiejscowionej w początku układu współrzędnych,(c) rozkład błędu względnego. β1 = 2327.64, β2 = 22.9367, γ1 = 2.5453 · 10−5,γ2 = 1.3842 · 10−6, γ3 = 1.077 · 10−5.
62 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
nie ma sensu. Efekt złego uwarunkowania problemu można również zauważyćna wykresach przedstawionych na rys. 4.13. Wykresy te przedstawiają zależnośćwspółczynników γ1, γ2 i γ3 określających jakość rozwiązania w funkcji wymiaruproblemu n. Wraz ze wzrostem n błąd maleje, natomiast podobnie jak poprzed-nio od ok. n = 50 można zauważyć brak poprawy. Dalsze zwiększanie wymiarun nie skutkuje poprawą współczynników γ ani funkcji celu. Porównując wykresymożna zauważyć, że w przypadku obszaru Γ będącego kulą rozwiązania są lepszejjakości ze względu zarówno na współczynniki β jak i γ.
0 20 40 60 80 100
100
102
104
106
108
1010
n
β
β
1 − odcinek
β2 − odcinek
β1 − kula
β2 − kula
Rysunek 4.12: Zależność wartości maksymalnej prądu (β2) oraz współczynnikaenergetycznego (β1) dla danego rozwiązania metodą QR w funkcji wymiaru pro-blemu n. Wykresy wykonano zarówno dla obszaru Γ który jest odcinkiem orazkulą.
W przypadku problemów bez ograniczeń, bardzo duże wartości natężenia prą-du oraz ich zmienny kierunek w poszczególnych uzwojeniach powoduje bezuży-teczność takich rozwiązań ze względu na zastosowania praktyczne. W związku ztym konieczne jest zastosowanie metod, które pozwolą ograniczyć wartości prą-dów w uzwojeniach oraz ewentualnie wymusić jeden kierunek przepływu prądów.W takich przypadkach stosuje się metody regularyzacyjne (modyfikacja funkcjicelu) lub stosuje się metody optymalizacji z ograniczeniami.
4.3 Regularyzacja Tichonowa
Często przy syntezie pola magnetycznego stosuje się opisaną w podrozdziale 3.5metodę regularyzacji Tichonowa. Metoda ta powoduje wygładzenie rozwiąza-nia oraz pozwala na otrzymanie rozwiązań bardziej przydatnych z aplikacyjnegopunktu widzenia. Na początek przedstawione zostaną wyniki otrzymane za po-mocą metody regularyzacji Tichonowa, gdy wartość współczynnika regularyzacjiλ wyznaczona jest metodą krzywej L. Rys. 4.14 przedstawia krzywą L dla pro-
4.3. REGULARYZACJA TICHONOWA 63
(a)
0 20 40 60 80 100
10−10
10−8
10−6
10−4
10−2
100
n
γ1
γ2
γ3
(b)
0 20 40 60 80 10010
−15
10−10
10−5
100
n
γ1
γ2
γ3
Rysunek 4.13: Wykresy współczynników γ1, γ2, γ3 oceniających rozwiązanieotrzymane metodą QR w funkcji wymiaru n. (a) obszar Γ będący odcinkiem,(b) obszar Γ będący kulą.
blemu o wymiarze n × m = 100 × 1000, gdy obszar Γ jest odcinkiem. Metodakrzywej L jest powszechnie stosowana, ponieważ zapewnia kompromis pomiędzyjakością rozwiązania oraz wpływem członu regularyzującego. Oczekuje się, żew narożniku tej krzywej znajduje się poszukiwana wartość współczynnika λopt.Na rysunku łatwo zauważyć, że w przypadku rozważanych problemów wykresnie ma charakterystycznego kształtu litery ’L’. Rys. 4.15 przedstawia rozwią-zanie problemu kształtowania pola magnetycznego na odcinku zlokalizowanegona osi z układu współrzędnych znalezione przy wykorzystaniu metody regula-ryzacji Tichonowa. Zastosowano współczynnik regularyzacji λ wybrany metodąkrzywej L (porównaj rys. 4.14). Wartość funkcji celu wynosi f(x) = 9.9 · 10−4,co oznacza wielokrotnie większą wartość niż dla rozwiązania bez regularyzacji,f(x) = 7.97 · 10−20 (porównaj rys. 4.6). Jest to cena za wygładzenie rozwiązania.Natomiast znacznie poprawiły się dwa inne wskaźniki. Maksymalna wartość prą-du zmalała do 0.139 A, a wartość współczynnika energetycznego wynosi 0.13 A2
(dla problemu bez ograniczeń było to odpowiednio 1.8 · 103 A i 3.07 · 109 A2). Narys. 4.15(c) przedstawiono rozkład błędu względnego dla rozpatrywanego przy-
64 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
padku. Porównując wartości błędów z wynikami dla rozwiązania bez ograniczeń,można zauważyć, że zarówno wartość średnia jak i maksymalna błędu są większeo kilka rzędów wielkości.
10−10
10−8
10−6
10−4
10−2
100
102
10−2
10−1
100
101
102
103
104
10.3930.367
1.295⋅10−24.572⋅10−4
1.614⋅10−5
5.698⋅10−7
2.012⋅10−8
7.101⋅10−102.507⋅10−11
8.849⋅10−13
|| A x − b ||2
||x|| 2
Rysunek 4.14: Wykres L-krzywej dla wyznaczenia optymalnego współczynnikaregularyzacji Tichonowa λopt dla problemu o wymiarze n×m = 100×1000. Polekształtowane na osi układu współrzędnych. Wybrany współczynnik regularyzacjiλopt = 0.131.
Ponieważ, dla rozważanego problemu metoda L-krzywej nie jest skutecznymnarzędziem do wyznaczania optymalnego współczynnika regularyzacji, zastoso-wano metodę opisaną w rozdziale 3.5 (Algorytm 4), w której za pomocą algorytmubisekcji dobiera się współczynnik regularyzacji λ tak, aby wartości prądów miałyten sam znak. Po 36 iteracjach algorytm bisekcji znalazł optymalny współczynnikregularyzacji λopt = 1.98495 z założonym błędem ε = 10−8.Rys. 4.16 przedstawia rozwiązanie problemu metodą regularyzacji Tichono-
wa przy współczynniku regularyzacji gwarantującym zgodny kierunek przepływuprądów w uzwojeniach. Wartości prądów są niskie (β2 = 0.05 A) w porównaniu zwartościami prądów dla metody bez ograniczeń. Rys. 4.16(c) przedstawia rozkładbłędu względnego dla przedstawionego problemu. Maksymalny błąd względny nieprzekracza wartości γ3 = 3%.Rys. 4.17 przedstawia rozwiązanie uzyskane metodą regularyzacji Tichonowa
dla przypadku 2D (w × k × m = 20 × 10 × 1000), pole było kształtowane naosi układu współrzędnych. Współczynnik regularyzacji dla tej sytuacji wynosiłλopt = 8.261. Wartość funkcji celu wynosi f(x) = 0.2018 i jest o kilka rzędówwielkości większa niż w przypadku metody bez ograniczeń. Ważnym efektem re-gularyzacji jest znaczne ograniczenie wartości prądów, z β2 = 12.82 A dla proble-mu bez ograniczeń do β2 = 2 · 10−2 A dla metody regularyzacji. W konsekwencjiwspółczynnik energetyczny β1 maleje o kilka rzędów wielkości. Rozwiązanie jest
4.3. REGULARYZACJA TICHONOWA 65
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5−0.05
0
0.05
0.1
0.15
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.994
0.996
0.998
1
1.002
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−6
10−5
10−4
10−3
10−2
z [m]
ε
Rysunek 4.15: Rozwiązanie problemu o wymiarze n × m = 100 × 1000 z wy-korzystaniem regularyzacji Tichonowa. Zastosowano współczynnik regularyzacjiλ = 0.131 otrzymany metodą krzywej L (porównaj rys. 4.14) (a) rozkład prą-dów w uzwojeniach cewki, (b) odpowiadający im rozkład pola magnetycznegodla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względnego. β1 = 0.1303,β2 = 0.1391, γ1 = 3.146 · 10−2, γ2 = 6.719 · 10−4, γ3 = 5.675 · 10−3.
66 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.01
0.02
0.03
0.04
0.05
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0.98
0.99
1
1.01
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−6
10−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.16: Rozwiązanie problemu o wymiarze n × m = 100 × 1000 z wy-korzystaniem regularyzacji Tichonowa. Zastosowano współczynnik regularyza-cji λopt = 1.985 dobrany tak, aby wartości prądów miały ten sam znak. (a) -rozkład prądów w uzwojeniach cewki, (b) odpowiadający im rozkład pola ma-gnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względne-go. β1 = 3.894 · 10−2, β2 = 4.969 · 10−2, γ1 = 0.1874, γ2 = 3.6455 · 10−3,γ3 = 2.9597 · 10−2.
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 67
symetryczne.
Podsumowując, metoda regularyzacji Tichonowa może być stosowana w za-gadnieniach syntezy pola magnetycznego. Jej cechą jest duża stabilność oraz gład-kość rozwiązania. Stosowanie tej metody powoduje znaczne ograniczenie wartościprądów oraz współczynnika energetycznego. Właściwość tę potwierdzają wykresyprzedstawione na rys. 4.18 oraz 4.19. Rys. 4.18 przedstawia wykres współczynni-ków β1, β2 w funkcji n, natomiast rys. 4.19 przedstawia wykres współczynnikówβ1 oraz β2 przeskalowanych odpowiednio czynnikiem czynnik δ oraz δ2 gdzie:
δ =zcmax − zcmin
n
Współczynnik ten ma na celu przeliczenie prądu na gęstość liniową. Dzię-ki temu wynik staje się niezależny od liczby pojedynczych zwojów n, z którychzbudowana jest cewka. Porównując rys. 4.12 oraz rys. 4.19 można zauważyć, żezastosowanie regularyzacji Tichonowa powoduje stabilizacje problemu. Wraz zewzrostem wymiaru gęstość prądu ustala się, natomiast przeskalowany współczyn-nik energetyczny rośnie liniowo. Liniowy wzrost współczynnika energetycznegosugeruje, że w celu znalezienia optymalnego rozkładu gęstości prądów w cewcenie powinno się bardzo zwiększać jej podziału. W przeciwieństwie do rozwią-zań wynikających z rozwiązania równań normalnych dla metody najmniejszychkwadratów zwiększanie podziału cewki nie powoduje znacznego niezmniejszeniabłędów rozwiązania. Błędy rozwiązania stabilizują się na pewnej wartości. Efektten można zauważyć na rys. 4.20. Porównując rozwiązania dla obszaru Γ będącegokulą i odcinkiem, można wysunąć wniosek, że dla kuli otrzymuje się rozwiązaniao lepszych parametrach niż dla odcinka. Dotyczy to zarówno współczynników γjak i β.
4.4 Optymalizacja z ograniczeniami
W rozdziale 4.2 pokazano, że przy zastosowaniu optymalizacji bez ograniczeń roz-wiązania są nieprzydatne z praktycznego punktu widzenia. Pojawiają się prądy oznacznych wartościach, prądy te płyną w przeciwnych kierunkach. W celu ustabi-lizowania problemu w rozdziale 4.3 zastosowano metodę regularyzacji Tichonowa.Alternatywnym podejściem jest nałożenie ograniczeń na rozwiązanie problemu,co prowadzi w naturalny sposób do optymalizacji z ograniczeniami. Pierwsze zrozważanych ograniczeń zapewnia, że prądy płyną w jednym kierunku, co sfor-mułować można jako nieujemne zadanie najmniejszych kwadratów. Następniedodane zostanie ograniczenie na wartość maksymalną prądu, co doprowadzi doproblemu optymalizacji z ograniczeniami kostkowymi.
68 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
3033.3
36.7 40
−51−38.3
−25.5−12.8
0 12.8
25.5 38.3
51
0
0.005
0.01
0.015
0.02
r[cm]z[cm]
x[A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.94
0.96
0.98
1
1.02
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.17: Rozwiązanie problemu o wymiarze w × k ×m = 20 × 10 × 1000z wykorzystaniem regularyzacji Tichonowa. Zastosowano współczynnik regula-ryzacji λopt = 8.261 dobrany tak, aby wartości prądów miały ten sam znak.(a) rozkład prądów w uzwojeniach cewki, (b) odpowiadający im rozkład polamagnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względ-nego. β1 = 1.6213 · 10−2, β2 = 2.006 · 10−2, γ1 = 0.4492, γ2 = 8.937 · 10−3,γ3 = 6.1073 · 10−2.
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 69
0 20 40 60 80 10010
−2
10−1
100
n
β
β
2 − odcinek
β1 − odcinek
β2 − kula
β1 − kula
Rysunek 4.18: Zależność wartości maksymalnej prądu (β2) oraz współczynnikaenergetycznego (β1) dla rozwiązania znalezionego za pomocą metody regularyza-cji Tichonowa w funkcji wymiaru problemu n.
0 20 40 60 80 10010
0
101
102
n
β
β1* − kula
β2* − kula
β1* − odcinek
β2* − odcinek
Rysunek 4.19: Zależność wartości maksymalnej gęstości prądu (β∗2 = δ−1 β2)
oraz przeskalowanego współczynnika energetycznego (β∗1 = δ−2 β1) dla rozwiąza-
nia znalezionego za pomocą metody regularyzacji Tichonowa w funkcji wymiaruproblemu n.
70 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
0 20 40 60 80 100
10−2
10−1
100
n
γ1
γ2
γ3
(b)
0 20 40 60 80 10010
−5
10−4
10−3
10−2
10−1
100
n
γ1
γ2
γ3
Rysunek 4.20: Wykresy współczynników γ1, γ2, γ3 oceniające rozwiązanie uzy-skane z wykorzystaniem regularyzacji Tichonowa w funkcji wymiaru n. (a) obszarΓ będący odcinkiem, (b) obszar Γ będący kulą.
4.4.1 Nieujemna metoda najmniejszych kwadratów
W przypadku metody regularyzacji Tichonowa, jedynym parametrem wygładza-jącym rozwiązanie był współczynnik regularyzacji λ. Współczynnik ten był takdobrany, aby wszystkie prądy płynęły w jednym kierunku. Wymuszenie tej wła-sności rozwiązania można również uzyskać rozwiązując nieujemne zadanie naj-mniejszych kwadratów:
x = argminx0
∥Ax− b∥22
Rys 4.21 przedstawia rozwiązanie nieujemnego zadania najmniejszych kwa-dratów dla problemu, gdy pole magnetyczne było kształtowane na osi z układuwspółrzędnych. Zastosowano algorytm NNLSQ Lawsona i Hansona z dekompo-zycją QR opisany w podrozdziale 3.4.2. Ceną za ograniczenie rozwiązania tylkodo liczb nieujemnych jest wzrost wartości funkcji celu (porównaj rys. 4.5) orazwspółczynników γ. Jakkolwiek wskazana wartość funkcji celu jest mniejsza niżprzy zastosowaniu regularyzacji Tichonowa (NNLSQ: f(x) = 3 · 10−3, regulary-zacja Tichonowa: f(x) = 3.3 · 10−2). Ciekawą własnością rozwiązań otrzymanych
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 71
przy rozwiązaniu nieujemnego zagadnienia najmniejszych kwadratów jest faktmałej liczby aktywnych uzwojeń cewki, to znaczy uzwojeń w których płyną prą-dy. Np. dla przypadku n = 25 tylko 10 z uzwojeń jest aktywnych. Konsekwencjąjest prawie dwuipółkrotny wzrost wartości maksymalnej prądu w porównaniu zrozwiązaniami uzyskanymi metodą regularyzacji Tichonowa. Rys. 4.21(c) przed-stawia rozkład błędu względnego rozwiązania. Maksymalny błąd względny jestmniejszy niż 1% (dla metody regularyzacji wynosił 3%).
Rys. 4.22 przedstawia rozwiązanie problemu dla n = 100. Można zauważyć, żew przeciwieństwie do metody najmniejszych kwadratów bez ograniczeń (rys. 4.6)wynik jest stabilny oraz symetryczny. Szczególnie należy zwrócić uwagę na faktmałej liczby aktywnych uzwojeń. Tylko w 10 uzwojeniach płynie prąd. Wartośćfunkcji celu jest ok. trzykrotnie mniejsza niż w przypadku rozwiązania metodą re-gularyzacji Tichonowa (porównaj rys. 4.16) Na rys. 4.22(c) przestawiono rozkładbłędu względnego dla tego rozwiązania. Wartość błędu w porównaniu z wynikiemdla n = 25 zmalała ok. dwukrotnie.
Rys. 4.23 przedstawia rozwiązanie problemu dwuwymiarowego dla wymiaruw × k ×m = 20 × 10 × 1000. Podobnie jak w poprzednich przykładach pojawiasię tylko kilka uzwojeń o niezerowych wartościach. Fakt ten znacząco wpływa nastabilność rozwiązania. W wypadku metody najmniejszych kwadratów bez ogra-niczeń dla n > 35 w rozwiązaniu pojawiają się prądy rzędu 103 A oraz rozwiązanietraci symetrię. Stabilne rozwiązania w przypadku nieujemnej metody najmniej-szych kwadratów są efektem zastosowania metod opartych na aktywnych zbiorachograniczeń. Wmetodzie tej poszukuje się rozwiązania metodą najmniejszych kwa-dratów bez ograniczeń podproblemów związanych tylko ze zbiorem pasywnym,przy ustalonych wartościach pozostałych prądów (tutaj równych zero). W koń-cowej fazie działania algorytmu zbiór pasywny zawiera znacznie mniejszą liczbęelementów niż wymiar problemu. Ta własność podnosi stabilność metody orazznacznie redukuje problem optymalizacyjny redukując również czas obliczeń.
Przedstawiony na rys. 4.24 wykres przedstawia zależność współczynników oce-niających jakość rozwiązania w funkcji wymiaru n. Warto zwrócić uwagę na faktmałej zmienności wartości maksymalnej prądów oraz współczynnika energetycz-nego. Również należy zwrócić uwagę na pewien problem, gdy pole było genero-wane na kuli. Dla wymiaru n = 96 nagle pojawiła się pewna osobliwość którapowodowała, że wartość prądu wzrosła ok. dziesięciokrotnie. Wartości n, w któ-rych następuje znaczny spadek maksymalnego prądu (linia zielona) odpowiadazmniejszeniu zbioru aktywnego o dwa elementy. Rys. 4.25 przedstawia przeskalo-wane współczynniki β w funkcji wymiaru problemu n. Wraz ze wzrostem wymiarun obserwuje się stabilizację wartości maksymalnej gęstości prądu (współczynnikβ∗2) oraz współczynnika energetycznego (β
∗1). Natomiast z rys. 4.26 można wnio-
skować, że wraz ze wzrostem wymiaru n, wartości błędów pola się stabilizują. Wpraktycznych zagadnieniach oznacza to, że zwiększanie n powyżej pewnej war-
72 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.50
0.1
0.2
0.3
0.4
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.992
0.994
0.996
0.998
1
1.002
1.004
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−5
10−4
10−3
10−2
z [m]
ε
Rysunek 4.21: Rozwiązanie problemu o wymiarze n×m = 25× 1000 znalezioneza pomocą metody NNLSQ. (a) rozkład prądów w uzwojeniach cewki, (b) odpo-wiadający im rozkład pola magnetycznego dla obszaru Γ stanowiącego odcinek,(c) rozkład błędu względnego. β1 = 0.4653, β2 = 0.4175, γ1 = 5.507 · 10−2,γ2 = 1.214 · 10−3, γ3 = 9.209 · 10−3.
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 73
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.50
0.1
0.2
0.3
0.4
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0.996
0.998
1
1.002
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−6
10−5
10−4
10−3
10−2
z [m]
ε
Rysunek 4.22: Rozwiązanie problemu o wymiarze n×m = 100× 1000 znalezioneza pomocą metody NNLSQ. (a) rozkład prądów w uzwojeniach cewki, (b) odpo-wiadający im rozkład pola magnetycznego dla obszaru Γ stanowiącego odcinek,(c) rozkład błędu względnego. β1 = 0.4218, β2 = 0.4107, γ1 = 3.2242 · 10−2,γ2 = 6.8962 · 10−4, γ3 = 5.6876 · 10−3.
74 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
3033.3
36.7 40
−51−38.3−25.5−12.8 0 12.8 25.5 38.3 51
0
0.2
0.4
0.6
r[cm]z[cm]
x[A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.99
0.995
1
1.005
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−5
10−4
10−3
10−2
z [m]
ε
Rysunek 4.23: Rozkład prądów (a) oraz odpowiadający im rozkład pola ma-gnetycznego (b) na na osi układu współrzędnych dla problemu 2D o wymiarzew×k×m = 20×10×1000. (c) rozkład błędu względnego rozwiązania. β1 = 0.6326,β2 = 0.5271, γ1 = 6.6535 · 10−2, γ2 = 1.5041 · 10−3, γ3 = 1.0240 · 10−2.
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 75
0 20 40 60 80 1000
0.1
0.2
0.3
0.4
0.5
0.6
0.7
n
β
β1 − odcinek β
2 − odcinek β
2 − kula β
1 − kula
Rysunek 4.24: Zależność wartości maksymalnej prądu (β2) oraz współczynnikaenergetycznego (β1) dla rozwiązania otrzymanego za pomocą nieujemnej metodynajmniejszych kwadratów w funkcji wymiaru problemu n.
0 20 40 60 80 10010
0
101
102
103
104
105
n
β*
β1* − odcinek β
2* − odcinek β
1* − kula β
2* − kula
Rysunek 4.25: Zależność wartości maksymalnej gęstości prądu (β∗2 = δ−1 β2) oraz
przeskalowanego współczynnika energetycznego (β∗1 = δ−2 β1) dla rozwiązania
otrzymanego za pomocą nieujemnej metody najmniejszych kwadratów w funkcjiwymiaru problemu n.
76 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
0 20 40 60 80 100
10−3
10−2
10−1
100
n
γ1
γ2
γ3
(b)
0 20 40 60 80 10010
−7
10−5
10−3
10−1
101
n
γ1
γ2
γ3
Rysunek 4.26: Wykresy współczynników błędów oceniające rozwiązanie otrzyma-nego za pomocą nieujemnej metody najmniejszych kwadratów w funkcji wymiarun. (a) – obszar Γ który jest odcinkiem, (b) – obszar Γ który jest kulą.
tości nie powoduje dalszej poprawy wyniku. Podobnie jak przy regularyzacji Ti-chonowa błędy dla obszaru Γ będącego kulą są mniejsze niż dla obszaru będącegoodcinkiem.
4.4.2 Zagadnienie najmniejszych kwadratów z ograniczeniami kostko-wymi
W nieujemnej metodzie najmniejszych kwadratów poszukiwane prądy były ogra-niczone tylko z dołu (∀i xi 0), w związku z tym wartości prądów dość znaczniewzrastały przy wzroście n.
Obecnie rozważymy problem syntezy pola magnetycznego przy ograniczeniachkostkowych na prądy w poszczególnych uzwojeniach. Ograniczenia takie poja-wiają się w sposób naturalny przy projektowaniu cewek. Ograniczenie wartościprądów może bezpośrednio wynikać na przykład z wydajności prądowej źródła
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 77
prądu. W rozdziale 3.4.2 wykazano, że problem powyższy jest równoważny pro-blemowi programowania kwadratowego z ograniczeniami nierównościowymi.
Rozważymy ograniczenia kostkowe postaci xi ∈ [0, xmax] gdzie xmax jest mak-symalną wartością prądu w rozwiązaniu uzyskanym metodą regularyzacji. Takąwartość xmax dobrano w celu możliwości porównania wyników z wynikami uzy-skanymi metodą regularyzacji. Wyniki uzyskane dla n×m = 100×1000, xmax =4.97 · 10−2 A za pomocą algorytmu programowania kwadratowego wykorzystują-cego metodę zbioru aktywnego (algorytm 3, rozdział 3.4.2) przedstawiono na rys.4.27. W algorytmie tym mamy dwa zbiory aktywne; jeden przechowujący indeksyprądów, którym przypisano wartości dolnego ograniczenia i drugi przechowują-cy indeksy prądów z ustalonymi wartościami górnego ograniczenia. Na rys. 4.27widać, że zbiory te są znacznie liczniejsze od zbioru pasywnego. W związku ztym rozwiązanie problemu jako problemu bez ograniczeń tylko na zbiorze pa-sywnym jest dość proste. W znalezionym rozwiązaniu aktywny zbiór ograniczeńdolnych (xi = 0) składał się z 66 elementów, natomiast zbiór ograniczeń górnych(xi = xmax) z 26 elementów. Tylko 8 elementów ze 100–elementowego zbioru nie-wiadomych uczestniczyło w ostatnim kroku algorytmu w procesie optymalizacji.Wartość funkcji celu jest 2, 33 razy mniejsza niż w przypadku regularyzacji Ticho-nowa, przy takim samym prądzie maksymalnym. Inną ważną cechą powyższegorozwiązania jest mniej skomplikowany rozkład prądów. Na rys. 4.27(c) przedsta-wiono rozkład błędu. Maksymalny błąd nie przekracza 2% natomiast i jest o 1/3mniejszy niż w przypadku regularyzacji Tichonowa (porównaj rys. 4.15(c)).
Wyniki uzyskane dla przypadku (w× k×m = 20× 10× 1000) przedstawionona rys. 4.28. Prądy zostały ograniczone do wartości xmax = 20.057 mA. Wartośćta jest największą wartością prądu uzyskaną w wyniku zastosowania regularyza-cji Tichonowa (porównaj rys. 4.17). Otrzymana wartość funkcji celu jest prawieczterokrotnie mniejsza niż w przypadku regularyzacji Tichonowa. Należy zwrócićuwagę, że w rozwiązaniu tylko 6 z 200 uzwojeń należy do zbioru pasywnego. 74uzwojenia przewodziły prąd maksymalny xmax. Rys. 4.28(c) przedstawia rozkładbłędu dla przedstawionego rozwiązania. W stosunku do rozwiązania tylko ograni-czonego “od dołu”, górne ograniczenie spowodowało zwiększenie wartości funkcjicelu od wartości f(x) = 4.43 · 10−3 do wartości f(x) = 5.27 · 10−2. Maksymalnybłąd względny rozwiązania wzrósł trzykrotnie do 3.32%. Natomiast rozwiązanieto jest prawie czterokrotnie lepsze od rozwiązania uzyskanego metodą regulary-zacji Tichonowa (f(x) = 0.2). Błąd maksymalny jak i średni jest o 50% mniejszy,przy takiej samej maksymalnej wartości prądu (porównaj rys. 4.17(c)).
Na podstawie przeprowadzonych obliczeń można wywnioskować, że zastoso-wanie metody programowania kwadratowego dla problemów syntezy jest zasad-ne. Metoda ta umożliwia ograniczenie wartości prądów w uzwojeniach zarówno“z dołu” jak i “od góry”. Podobne efekty otrzymujemy wykorzystując metodęregularyzacji Tichonowa, gdzie jednak niema możliwości bezpośredniego zadania
78 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.50
0.01
0.02
0.03
0.04
0.05
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.98
0.985
0.99
0.995
1
1.005
1.01
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.27: Rozwiązanie problemu o wymiarze n×m = 100× 1000 znalezioneza pomocą metody programowania kwadratowego z ograniczeniami kostkowymi.(a) rozkład prądów w uzwojeniach cewki, (b) odpowiadający im rozkład polamagnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względ-nego. β1 = 7.13 · 10−2, β2 = 4.969 · 10−2, γ1 = 4.36 · 10−2, γ2 = 2.747 · 10−3,γ3 = 1.978 · 10−2.
4.4. OPTYMALIZACJA Z OGRANICZENIAMI 79
(a) 30
33.3
36.7
40
−51−38.3−25.5−12.8 0 12.8 25.5 38.3 51
z[cm]
r[cm
]
0 0.005 0.01 0.015 0.02
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.97
0.98
0.99
1
1.01
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.28: Rozkład prądów (a) oraz odpowiadający im rozkład pola ma-gnetycznego (b) na na osi układu współrzędnych dla problemu 2D o wymia-rze w × k × m = 20 × 10 × 1000 znalezione metodą programowania kwadrato-wego z ograniczeniami kostkowymi. (c) rozkład błędu względnego rozwiązania.β1 = 3.122·10−2, β2 = 2.006·10−2, γ1 = 0.276, γ2 = 5.295·10−3, γ3 = 2.286·10−2.
80 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
ograniczenia “od góry”. Rozwiązania uzyskane metodą programowania kwadrato-wego z ograniczeniami kostkowymi charakteryzują się mniejszą wartością funkcjicelu, mniejszymi współczynnikami γ1, γ2, γ3, oraz mniejszą zmiennością (mniej-szą liczbą wartości prądów potrzebnych do ich zrealizowania). Ostatni fakt jestważny w kontekście możliwych zastosowań. Na rys. 4.29 przedstawiono wykresmaksymalnej wartości prądu β2 oraz współczynnika energetycznego β1 w funkcjiwymiaru problemu n. Z powodu przyjętych założeń wykresy współczynników β2są takie same jak dla regularyzacji Tichonowa. Wartości współczynnika energe-tycznego są natomiast mniejsze niż w przypadku rozwiązania uzyskanego meto-dą regularyzacji. Jest to kolejna przewaga metody programowania kwadratowe-go z ograniczeniami nad metodą regularyzacji Tichonowa. Mniejszy współczyn-nik energetyczny oznacza, że przy takim samym maksymalnym prądzie w cewceotrzymujemy uzwojenie z mniejszą ilością zgromadzonej energii. Wykresy prze-skalowanych współczynników β∗1 oraz β
∗2 przedstawiono na rys. 4.30. Wykresy te
wskazują na mniejszą wartość energii przy tak samo ustabilizowanej maksymalnejgęstości prądów w porównaniu do metody z regularyzacji Tichonowa.
0 20 40 60 80 100
10−1
100
n
β
β1 − odcinek
β2 − odcinek
β2 − kula
β1 − kula
Rysunek 4.29: Zależność wartości maksymalnej prądu (β2) oraz współczynnikaenergetycznego (β1) dla rozwiązania otrzymanego za pomocą metody programo-wania kwadratowego z ograniczeniami w funkcji wymiaru problemu n.
Na rys. 4.31 przedstawiono rozkład błędów. Wykresy te są bardzo podobnedo wykresów dla rozwiązania z regularyzacją. Porównując je z wykresem spo-rządzonym dla nieujemnej metody najmniejszych kwadratów (rys. 4.26) możnazauważyć, że wartości współczynników błędu są mniejsze dla nieujemnej metodynajmniejszych kwadratów.
4.5. PORÓWNANIE WYNIKÓW 81
0 20 40 60 80 10010
0
101
102
103
n
β*
β1* − kula
β2* − kula
β1* − odcinek
β2* − odcinek
Rysunek 4.30: Zależność wartości maksymalnej gęstości prądu (β∗2 = δ−1 β2) oraz
przeskalowanego współczynnika energetycznego (β∗1 = δ−2 β1) dla rozwiązania
otrzymanego za pomocą metody programowania kwadratowego z ograniczeniamiw funkcji wymiaru problemu n.
4.5 Porównanie wyników
Tabele 4.2 oraz 4.3 przedstawiają zestawienie wyników symulacji dla różnych roz-miarów problemów z wykorzystaniem metod algebry liniowej. Metoda najmniej-szych kwadratów bez ograniczeń daje najlepsze wyniki w sensie wartości współ-czynników błędów (γ1, γ2, γ3). Oznacza to, że rozkład pola magnetycznego jestbardzo bliski polu zadanemu. Z tego punktu widzenia należałoby uznać tę meto-dę jako optymalną. Natomiast wartości współczynników energetycznego (β1) orazmaksymalnego prądu (β2) przedstawionych w tabeli 4.2 są znacznie odbiegająceod możliwych do osiągnięcia w rzeczywistości. Szczególnie, biorąc dodatkowo faktdużej niejednorodności rozkładu prądu w uzwojeniu należy tę metodę odrzucić,jako dającą wyniki nienadające się do praktycznych zastosowań. Należy jednakpodkreślić, że takie wyniki są efektem niewłaściwego, z punktu widzenia zasto-sowań praktycznych, postawienia problemu (brak ograniczeń wartości prądów).Sformułowanie problemu jako nieujemnego zadania najmniejszych kwadratów po-woduje znaczne ograniczenie maksymalnej wartości prądu w rozwiązaniu. Dodat-kowo, metoda ta wskazuje precyzyjnie gdzie należy umieścić przewody z prądem,aby uzyskać pole o zadanym kształcie. Można uznać, że rozwiązanie nieujemnąmetodą najmniejszych kwadratów jest rozwiązaniem najlepszym z punktu widze-nia zarówno dopasowania pola do pola zadanego, dużej stabilności rozwiązań orazograniczenia wartości prądów.
Spośród metod w których zastosowano ograniczenie wartości prądów, metodaregularyzacji daje najgorsze wyniki pod względem dostosowania pola otrzyma-nego do pola zadanego. Jest to efektem próby wymuszenia ograniczeń na roz-
82 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
0 20 40 60 80 100
10−2
10−1
100
n
γ1
γ2
γ3
(b)
0 20 40 60 80 100
10−4
10−3
10−2
10−1
100
n
γ1
γ2
γ3
Rysunek 4.31: Wykresy współczynników błędów oceniające rozwiązanie otrzy-manego za pomocą metody programowania kwadratowego z ograniczeniami wfunkcji wymiaru n. (a) – obszar Γ który jest odcinkiem, (b) – obszar Γ który jestkulą.
wiązanie przez modyfikację funkcji celu. Takie podejście prowadzi do rozwiązańsuboptymalnych. Metodę regularyzacji przewyższa metoda programowania kwa-dratowego z ograniczeniami. Rozwiązania znalezione przez tę metodę są zawszelepsze (w sensie minimalizacji funkcji celu) niż rozwiązania uzyskane metodą re-gularyzacji z tak dobranym współczynnikiem regularyzacji, aby rozwiązania byłynieujemne, mimo że prąd maksymalny jest tej samej wartości co przy metodziez regularyzacją [27].
4.6 Inne metody
W celach porównania zastosowano również inne metody optymalizacyjne. Przed-stawione zostaną wyniki otrzymane za pomocą gradientowej metody quasi-Newtona,
4.6. INNE METODY 83
w×k
LSQ
RegularyzacjaTichonowa
NNLSQ
QPzograniczeniami
β1
β2
β1
β2
λopt
β1
β2
β1
β2
1D,ObszarΓbędącyodcinkiem
6×1
0.464
0.427
0.464
0.427
0.0100.4640.427
0.464
0.427
10×1
1.126
0.566
0.433
0.420
0.4580.4620.428
0.443
0.420
25×1
43780
50.04
0.158
0.191
0.9560.4650.418
0.236
0.191
50×14.038·1010768407.787·10−29.777·10−21.4040.4370.413
0.134
9.777·10−2
100×13.451·109
230303.894·10−24.969·10−21.9850.4220.4117.130·10−24.969·10−2
150×11.414·109
128302.599·10−23.334·10−22.4220.4440.4104.959·10−23.334·10−2
200×11.528·109
185101.947·10−22.503·10−22.8070.4360.4103.688·10−22.503·10−2
250×11.062·109
153501.558·10−22.005·10−23.1380.4230.4092.965·10−22.005·10−2
500×11.489·109
157507.788·10−31.005·10−24.4380.4250.4091.509·10−21.005·10−2
1D,ObszarΓbędącykulą
6×1
0.3342
0.3236
0.3342
0.3236
0.0100.33420.3236
0.3342
0.3236
10×1
0.3245
0.3510
0.3204
0.3480
0.0100.32450.3510
0.3205
0.3480
25×12.328·103
22.94
0.1147
0.1322
0.0100.29340.3569
0.1292
0.1322
50×15.980·109
436505.953·10−26.988·10−20.0100.30190.36238.006·10−26.988·10−2
100×18.388·102
11.113.028·10−23.579·10−20.0130.29670.36284.632·10−23.579·10−2
150×16.560·102
10.492.018·10−22.386·10−20.0150.30230.36293.206·10−22.386·10−2
200×15.512·102
9.7331.515·10−21.791·10−20.0180.29920.36292.496·10−21.791·10−2
250×15.593·102
10.721.212·10−21.434·10−20.0201.3030.78731.995·10−21.434·10−2
500×14.722·102
8.0476.056·10−37.160·10−30.0280.97040.66941.014·10−27.160·10−3
2D,ObszarΓbędącyodcinkiem
6×3
7572
0.436
0.187
0.175
1.8280.7870.605
0.250
0.175
10×4
542400
319.38.474·10−29.666·10−23.0890.4460.401
0.140
9.666·10−2
15×10
3677
21.802.246·10−22.776·10−26.1690.3870.3634.317·10−22.776·10−2
20×10
2207
12.831.621·10−22.006·10−28.2610.6330.5273.122·10−22.006·10−2
25×7
1880
14.471.884·10−22.333·10−27.2920.3800.2533.620·10−22.333·10−2
25×10
1169
12.241.302·10−21.620·10−29.1320.3840.2692.522·10−21.620·10−2
50×5
520.5
7.1741.348·10−21.678·10−28.0390.3620.2622.611·10−21.678·10−2
50×10
365.0
4.1716.493·10−38.118·10−313.059
0.3730.3051.265·10−28.118·10−3
2D,ObszarΓbędącykulą
6×3
262.3
8.631
0.1342
0.1230
0.8330.30150.2946
0.1584
0.1230
10×4
16670
69.567.757·10−29.657·10−20.0680.24680.2342
0.1373
9.657·10−2
15×10
107.1
3.2651.645·10−21.927·10−20.5080.33770.35582.795·10−21.927·10−2
20×10
52.36
2.9841.273·10−21.516·10−20.4680.29440.35442.220·10−21.516·10−2
25×7
52.04
2.8911.371·10−21.578·10−20.7320.31570.36722.287·10−21.578·10−2
25×10
41.19
2.5189.477·10−31.101·10−20.9780.30550.36361.620·10−21.101·10−2
50×5
18.72
1.6219.881·10−31.133·10−20.6880.31630.37451.660·10−21.133·10−2
50×10
14.73
0.99374.701·10−35.432·10−31.5010.31280.36868.028·10−35.432·10−3
Tabela4.2:Zestawieniewynikówzwykorzystaniemalgorytmówalgebryliniowej,m=1000,β1–współczynnikenergetyczny,β2
–maksymalnyprądwuzwojeniu,λopt–optymalnywspółczynnikregularyzacjigwarantującynieujemnewartościprądów,LSQ–
metodanajmniejszychkwadratów,NNLSQ–nieujemnametodanajmniejszychkwadratów,QP–programowaniekwadratowe
84 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
w×k
LSQ
RegularyzacjaTichonowa
NNLSQ
QPzograniczeniami
γ1
γ2
γ3
γ1
γ2·10−5γ3·10−5
γ1
γ2
γ3
γ1
γ2·10−5γ3·10−4
1D,ObszarΓbędącyodcinkiem
6×1
1.501·10−11.152·10−25.504·10−2
0.1501
1149
5505
0.1503
1.149·10−25.504·10−2
0.150
1149
550.5
10×12.203·10−21.655·10−39.318·10−3
0.0584
356.0
2645
0.0545
3.953·10−32.268·10−2
0.0573
382.4
253.4
25×11.460·10−51.001·10−67.096·10−6
0.0650
382.6
2917
0.0198
1.298·10−39.209·10−3
0.0485
311.3
218.1
50×11.102·10−96.170·10−118.268·10−10
0.0662
390.8
2966
0.0140
9.185·10−46.635·10−3
0.0452
286.6
204.3
100×15.703·10−101.753·10−115.417·10−10
0.0661
389.9
2960
0.0118
7.418·10−45.688·10−3
0.0436
274.7
197.8
150×12.928·10−101.017·10−112.650·10−10
0.0659
388.7
2952
0.0111
6.966·10−45.348·10−3
0.0431
269.3
196.6
200×13.963·10−101.176·10−113.729·10−10
0.0660
389.7
2958
0.0107
6.672·10−45.223·10−3
0.0430
270.8
195.7
250×12.259·10−107.170·10−122.138·10−10
0.0660
389.7
2958
0.0105
6.561·10−45.119·10−3
0.0429
270.1
195.2
500×12.335·10−106.982·10−122.244·10−10
0.0660
389.6
2958
0.0101
6.264·10−44.952·10−3
0.0427
269.0
194.4
1D,ObszarΓbędącykulą
6×1
0.2540
1.555·10−27.800·10−2
0.2540
1555
7800
0.2540
1.555·10−27.800·10−2
0.2540
1555
780.0
10×13.448·10−21.845·10−31.250·10−23.448·10−2
183.5
1251
3.448·10−21.845·10−31.250·10−23.448·10−2
183.6
125.1
25×12.545·10−51.384·10−61.077·10−52.871·10−4
2.179
6.650
2.815·10−51.954·10−61.061·10−51.598·10−4
1.346
0.3200
50×11.601·10−101.234·10−115.423·10−112.163·10−4
1.602
4.979
2.519·10−61.992·10−75.615·10−79.176·10−50.6569
0.2158
100×13.474·10−142.894·10−157.994·10−151.945·10−4
1.433
4.478
1.472·10−61.084·10−73.383·10−77.876·10−50.5818
0.1815
150×13.550·10−142.941·10−158.882·10−151.948·10−4
1.435
4.484
1.240·10−69.255·10−82.820·10−77.799·10−50.5782
0.1786
200×12.605·10−142.074·10−157.661·10−151.941·10−4
1.430
4.468
1.153·10−68.486·10−82.635·10−77.725·10−50.5731
0.1773
250×13.141·10−142.294·10−151.155·10−141.933·10−4
1.425
4.449
1.088·10−68.202·10−82.447·10−77.712·10−50.5723
0.1768
500×13.131·10−142.438·10−159.770·10−151.945·10−4
1.433
4.478
1.009·10−67.518·10−82.286·10−77.748·10−50.5766
0.1770
2D,ObszarΓbędącyodcinkiem
6×3
2.342·10−35.736·10−55.582·10−4
0.2675
559.8
5224
0.2558
5.408·10−35.040·10−2
0.258
553.3
499.1
10×48.916·10−72.408·10−89.259·10−8
0.3055
623.7
5560
0.2355
4.167·10−35.367·10−2
0.268
525.9
532.6
15×104.622·10−129.640·10−142.018·10−12
0.3570
725.8
5917
0.2312
4.433·10−34.900·10−2
0.272
513.1
527.9
20×102.851·10−126.168·10−141.166·10−12
0.3771
776.7
6063
0.2280
4.004·10−35.163·10−2
0.276
529.5
528.6
25×71.000·10−122.455·10−142.194·10−13
0.3534
716.8
5892
0.2297
4.057·10−35.157·10−2
0.268
522.9
523.2
25×101.080·10−122.327·10−143.344·10−13
0.3627
740.4
5959
0.2286
4.037·10−35.118·10−2
0.269
521.3
524.0
50×51.268·10−122.677·10−146.539·10−13
0.3572
727.3
5920
0.2296
4.187·10−35.081·10−2
0.273
534.7
525.3
50×101.189·10−122.936·10−141.696·10−13
0.3778
778.5
6068
0.2271
4.123·10−35.032·10−2
0.274
534.7
526.1
2D,ObszarΓbędącykulą
6×3
4.174·10−51.101·10−62.299·10−68.973·10−2
229.6
743.5
4.003·10−21.081·10−32.836·10−37.122·10−2
179.1
58.33
10×43.207·10−118.832·10−131.863·10−127.566·10−3
20.80
45.13
5.024·10−41.399·10−52.873·10−52.062·10−3
5.479
1.414
15×109.007·10−142.216·10−151.088·10−141.762·10−2
45.23
121.4
1.992·10−45.309·10−61.253·10−53.491·10−3
9.174
2.241
20×106.909·10−141.646·10−158.438·10−151.375·10−2
33.81
98.02
7.720·10−51.872·10−65.239·10−63.108·10−3
7.530
2.194
25×77.501·10−141.791·10−159.326·10−152.159·10−2
52.20
154.1
3.508·10−58.684·10−72.319·10−64.355·10−3
10.97
2.984
25×105.488·10−141.364·10−156.439·10−152.379·10−2
57.28
170.0
3.307·10−58.405·10−72.172·10−64.398·10−3
11.09
3.010
50×53.719·10−149.409·10−164.219·10−151.754·10−2
42.64
125.0
1.505·10−53.614·10−71.108·10−63.880·10−3
9.319
2.732
50×104.393·10−141.102·10−154.885·10−152.558·10−2
61.44
182.8
1.056·10−52.510·10−77.588·10−74.667·10−3
11.38
3.249
Tabela4.3:Zestawieniewynikówzwykorzystaniemalgorytmówalgebryliniowej.m=1000.LSQ–metodanajmniejszychkwadra-
tów,NNLSQ–nieujemnametodanajmniejszychkwadratów,QP–programowaniekwadratowe
4.6. INNE METODY 85
bez-gradientowej metody Neldera–Meada oraz dwóch metod stochastycznych tj.symulowanego wyżarzania oraz algorytmów genetycznych. W przeciwieństwie dowyników otrzymanych za pomocą metod algebry liniowej w przypadku rozwa-żanych obecnie metod czas obliczeń jest parametrem bardzo istotnym. Szczegól-nie można to zauważyć w przypadku metod stochastycznych. Wynika to przedewszystkim z konieczności wielokrotnego obliczania wartości funkcji celu. W ce-lu skrócenia całkowitego czasu obliczeń zastosowano obliczenia równoległe. Pre-zentację wyników ograniczono tylko do problemów bez ograniczeń. Ewentualnenarzucenie ograniczeń powodowałoby znaczne wydłużenie czasu potrzebnego doobliczenia wartości funkcji celu w danym punkcie poszukiwań, a to dodatkowowydłużyłoby czas potrzebny do wyznaczenia rozwiązania. Wymienione wyżej me-tody zostaną porównane z wynikami otrzymanymi przy zastosowaniu rozkładuQR przy rozwiązaniu zagadnienia najmniejszych kwadratów (porównaj podroz-dział 4.2.2). W celu porównania wyników wprowadza się wielkość zwaną błędemwzględnym rozwiązania:
η =
∣∣∣∣∣f(x)− f(x)f(x)
∣∣∣∣∣gdzie: f(x) – wartość funkcji celu w punkcie będącym rozwiązaniem otrzyma-nym testowaną metodą, f(x) – wartość funkcji celu dla rozwiązania problemuotrzymanego metodą rozkładu QR, które uznajemy za wartość dokładną.
4.6.1 Metoda quasi-Newtona
Funkcja celu określona równaniem (2.18) może zostać przedstawiona jako formakwadratowa:
f(x) = ||Ax− b||22 = (Ax− b)T (Ax− b) = xTATAx− 2bTAx+ bT b
= 2(12xTATAx− (AT b)Tx+ 1
2bT b
)Ponieważ macierz ATA jest dodatnio określona to funkcja posiada globalne mini-mum. Teoretycznie algorytm quasi-Newtona powinien zawsze znajdować to mini-mum. Jednakże, wraz ze wzrostem wymiaru problemu funkcja celu w otoczeniuminimum staje się coraz bardziej płaska, wartość gradientu znacznie maleje, comoże prowadzić do niepoprawnego działania metody.Na rys. 4.32 zostało przedstawione rozwiązanie metodą quasi-Newtona dla
problemu bez ograniczeń o wymiarze n×m = 25× 1000. Punkt startowy wybra-no losowo ze zbioru [−50, 50]n. Przedstawione rozwiązanie jest najlepszym wśród10 różnych rozwiązań testowych. Algorytm quasi-Newtona znalazł rozwiązaniedla którego wartość funkcji celu wynosi f(x) = 5.3702 · 10−3. Wartość ta jestponad 4 miliony razy gorsza niż dla bezpośredniego rozwiązania równania nor-malnego metodą rozkładu QR (por. rys. 4.5). Algorytm po około 1975 s osiągnął
86 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
przedstawiony wynik, w którym gradient wynosił mniej niż 10−12. Rozwiązanienie posiada symetrii, a prądy w sąsiednich uzwojeniach mają zwykle przeciwnekierunki. Rys. 4.32(c) przedstawia rozkład błędu względnego dla wyznaczonegorozwiązania (porównaj rys. 4.5(c)).
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
−40
−20
0
20
40
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.99
0.995
1
1.005
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−6
10−4
10−2
z [m]
ε
Rysunek 4.32: Rozwiązanie problemu o wymiarze n × m = 25 × 1000 metodąquasi Newtona. (a) rozkład prądów w uzwojeniach cewki, (b) odpowiadający imrozkład pola magnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkładbłędu względnego. β1 = 13453, β2 = 45.22, γ1 = 7.328 · 10−2, γ2 = 0.201 · 10−3,γ3 = 8.266 · 10−3.
Na wykresie 4.33 został przedstawiony błąd względny funkcji celu η rozwią-zania metodą quasi-Newtona dla różnych wartości podziału cewki n. Algorytmquasi-Newtona startował z losowo wygenerowanego punktu oraz zatrzymywał
4.6. INNE METODY 87
0 5 10 15 20 25 30 35 40 45 50
10−15
10−10
10−5
100
105
1010
n
blad
wzg
ledn
y
pole gnerowane na okregupole gnerowane na osi
Rysunek 4.33: Wykres błędu względnego pomiędzy rozwiązaniem za pomocą me-tody quasi-Newtona oraz metodą rozkładu QR.
swoje działanie gdy wartość gradientu była mniejsza niż 10−12. Dla n 20 algo-rytm nie potrafił znaleźć rozwiązania; wyniki działania algorytmu quasi-Newtonastawały się przypadkowe. Pewną poprawę można uzyskać stosując metodę wie-lostartową. Należy zwrócić uwagę, że metody algebry liniowej znacznie szybciejznajdowały poprawne rozwiązanie.
4.6.2 Metoda sympleksowa Neldera–Meada
Metoda sympleksowa Neldera–Meada działa poprawnie dla niskiego wymiaru pro-blemu. Tabela 4.4 przedstawia wyniki działania algorytmu Neldera–Meada orazjego porównanie z rozwiązaniem metodą dekompozycji QR. Dla n ¬ 10 wynikipokrywają się z wynikami uzyskanymi za pomocą metody referencyjnej, a roz-wiązanie jest znajdowane w stosunkowo krótkim czasie. Dla wymiaru n > 10czas obliczeń był bardzo długi. Wyznaczenie rozwiązania dla n = 11 wymaga-ło wywołania funkcji celu około 108 razy. Otrzymanie wyników zbliżonych dotych otrzymanych metodą najmniejszych kwadratów wymagało zmniejszenia to-lerancji zmian funkcji celu do rzędu 10−20, co oczywiście powodowało znacznewydłużenie czasu potrzebnego do rozwiązania problemu. Na podstawie przedsta-wionych wyników można wyciągnąć wniosek, że stosowanie tej metody dla n > 10nie ma sensu.
4.6.3 Symulowane wyżarzanie
W tabeli 4.5 przedstawiono efekty działania algorytmu symulowanego wyżarza-nia. Porównując wyniki z wynikami z poprzedniego podrozdziału można zauwa-żyć, że algorytm symulowanego wyżarzania wymaga znacznie większego czasu
88 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
Tabela 4.4: Działanie algorytmu Neldera-Meada dla różnych wymiarów podziałucewki n dla problemu o wymiarze R1000×n oraz jego porównanie z wynikiemuzyskanym metodą rozkładu QR.
nLiczba Liczba wywołań Czas
ηiteracji funkcji celu obliczeń [s]
6 847 1304 0.061 4.37 · 10−127 828 1273 0.060 6.56 · 10−118 2196 3226 0.154 1.26 · 10−129 3590 5699 0.266 2.33 · 10−1510 6282 9087 0.433 011 7.7 · 106 108 3056 6 · 10−1512 2 · 107 8.7 · 108 3246 1.69 · 10−1413 2.9 · 107 1.1 · 109 3835 8.52 · 10−5
obliczeń. Istotnym czynnikiem wpływającym na efekt obliczeń jest wybór para-metrów metody. Temperatura była resetowana co 50 iteracji, schładzanie byłowykonywane wg. schematu logarytmicznego (Boltzmanna), algorytm przerywałdziałanie jeśli różnica pomiędzy wartościami funkcji celu była mniejsza niż 10−20
(podobnie jak w metodzie Neldera–Meada). W związku z tym, że wraz ze wzro-stem wymiaru n znacznie wydłużał się czas obliczeń autor zaprzestał symulacjidla wymiarów większych niż n = 9. Dla wymiaru n = 9 błąd względny byłznaczny i wynosił 1.3 · 10−3.
Tabela 4.5: Działanie algorytmu symulowanego wyżarzania dla różnych wymia-rów podziału cewki n dla problemu o wymiarze R1000×n oraz jego porównanie zwynikiem tożsamego problemu najmniejszych kwadratów
nLiczba Liczba wywołań Czas
ηiteracji funkcji celu obliczeń [s]
6 107439 108838 48.2 2.95 · 10−147 556954 564487 253 1.22 · 10−128 2358904 2.4 · 106 1074 4.14 · 10−79 3530601 3.6 · 106 1638 1.34 · 10−3
4.6.4 Algorytm genetyczny
Algorytm genetyczny jest kolejną metodą oparta na losowym przeszukiwaniuprzestrzeni potencjalnych rozwiązań. Algorytm genetyczny okazał się najmniejefektywny spośród wszystkich przedstawionych dotychczas.W przypadku algorytmu genetycznego, należało przeprowadzić wiele symu-
lacji, aby otrzymać wynik bliski rozwiązaniu dokładnemu. I tak dla problemu owymiarze n = 6zastosowano metodę krzyżowania dwupunktowego oraz zapro-
4.6. INNE METODY 89
Tabela 4.6: Działanie algorytmu genetycznego dla różnych wymiarów podziałucewki n dla problemu o wymiarze R1000×n oraz jego porównanie z wynikiemtożsamego problemu najmniejszych kwadratów
nLiczba Liczba wywołań Czas
ηgeneracji funkcji celu obliczeń [s]
6 1855 278400 18.63 8.633 · 10−67 6296 944550 67.29 5.07 · 10−58 40272 2.4 · 106 425.6 3.68 · 10−49 95945 1.44 · 107 1033 8.81 · 10−3
ponowaną w podrozdziale funkcję zmniejszającą wartość prawdopodobieństwamutacji w trakcie trwania działania algorytmu od wartości 0.9 do wartości 0.1.Dla populacji 50 osobników, kodowanej liczbami rzeczywistymi otrzymano roz-wiązanie o wartości funkcji celu f(x) = 0.1969217. Rozwiązanie to nie odbiega odrozwiązania dokładnego. Należy zwrócić uwagę na różnice w wartościach przy-stosowania pojedynczych osobników. Często różnią się one o nie więcej niż 10−7
i taką założono wartość tolerancji funkcji celu.
W tabeli 4.6 przedstawiono porównania wyniki działania algorytmu genetycz-nego z referencyjną metodą rozkładu macierzy QR. Można zauważyć, że już przywymiarze n = 9 problem stawał się zbytnio skomplikowany. Po czasie 17 minalgorytm znalazł rozwiązanie które różniło się od rozwiązania referencyjnego oprawie 1%.
4.6.5 Podsumowanie wyników
Reasumując, metody bezpośrednio korzystające z algebry liniowej w znaczny spo-sób przewyższają inne metody przedstawione w niniejszym rozdziale [25] [29] [26].Pozostałe metody wymagają wielokrotnego wyznaczenia funkcji celu. Na przy-kład metoda Neldera–Meada dla przypadku n = 12 przeszukała przestrzeń poten-cjalnych rozwiązań prawie 9 ·108 razy i znalazła rozwiązanie 9 ·105 razy gorsze odrozwiązania dokładnego. Jedyną metodą która do wymiaru ok. n = 20 potrafiłaznaleźć rozwiązanie bliskie dokładnemu jest metoda quasi-Newtona. Natomiastw przypadku metody rozkładu QR rozwiązania równania normalnego oblicze-nia można prowadzić do wymiaru ok. n = 50 uzyskując stabilne i symetrycznerozwiązania. Dla problemów z ograniczeniami zastosowanie metod NNLSQ, re-gularyzacji i programowania kwadratowego prowadziło do uzyskania stabilnychrozwiązań również dla znacznie większego wymiaru problemu. Przy zastosowaniutych metod rozwiązanie problemu o wymiarze n = 1000 można uzyskać w czasiekilku sekund. Uzyskanie takich wyników umożliwiło zastosowanie metody zbio-rów aktywnych, która znacznie ogranicza przestrzeń poszukiwań potencjalnychrozwiązań, a co za tym idzie czas obliczeń. W związku z ograniczeniami opisany-
90 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
mi powyżej zrezygnowano z testowania innych metod w przypadku problemów zograniczeniami.
4.7 Synteza niejednorodnego pola magnetycznego
W związku z najbardziej aplikacyjnym charakterem problemu, w pracy skupio-no się na poszukiwaniu rozwiązań problemu syntezy jednorodnego pola. W tympodrozdziale zostaną przedstawione wyniki dla sytuacji, gdy zadane pole jestniejednorodne. Rozważone zostaną dwa przykłady. W pierwszym zadane pole ro-śnie liniowo wzdłuż osi z, a w drugim będzie miało kształt paraboli. Rozważaneprzykłady będą dotyczyły syntezy pola niesymetrycznego.
Rys. 4.34 przedstawia rozwiązanie, gdy zadane pole rośnie liniowo, a problemma wymiar n×m = 25× 1000. Rozwiązanie uzyskano wykorzystując nieujemnąmetodę najmniejszych kwadratów. Średni błąd rozwiązania wynosi 1.1% nato-miast maksymalny ok. 8.8%. Zastosowany algorytm aktywnych zbiorów wskazuje,że umiejscowienie uzwojeń tylko w czterech punktach pozwala uzyskać najlepszywynik. Zwiększenie długości cewki nie wpływa znacząco na zmniejszenie błędówrozwiązania. Dwukrotne zwiększenie długości cewki skutkuje zmniejszeniem błę-du maksymalnego do 8.5%. Jest to wynikiem ograniczenia, że prądy muszą byćnieujemne. Dopuszczenie ujemnych wartości prądu powoduje znaczną poprawęuzyskanego pola. Na rys. 4.35 przedstawiono wynik optymalizacji uzyskanej me-todą programowania kwadratowego z ograniczeniami kostkowymi. Wartość mak-symalną prądu xmax ustalono na poziomie równym maksymalnej wartości prądurozwiązania nieujemnego zagadnienia najmniejszych kwadratów, a wartość mini-malną ustalono na −0.1 · xmax (ponad dziesięciokrotnie mniej).Jako drugi przypadek rozważano pole o kształcie paraboli ułożonej niesyme-
trycznie względem początku układu współrzędnych. Pole magnetyczne o war-tościach mniejszych w pobliżu środka cewki jest trudne do uzyskania, zwłasz-cza przy założeniu, że prądy są nieujemne. W przypadku nieujemnej metodynajmniejszych kwadratów błędy rozwiązania były duże i wynosiły odpowiednioγ2 = 22.7% i γ2 = 72.8%. W celu zmniejszenia błędów konieczne jest dopuszcze-nie prądów płynących w przeciwnych kierunkach. Podobnie jak dla problemu zfunkcją liniową zastosowano metodę programowania kwadratowego dopuszczającprądy o wartościach ujemnych. Założono, że ograniczenia kostkowe są postaci[−xmax, xmax], gdzie xmax jest maksymalną wartością prądu otrzymaną za pomo-cą nieujemnej metody najmniejszych kwadratów. Otrzymane rozwiązanie przed-stawiono na rys. 4.36. Dopuszczenie prądów płynących w różnych kierunkachpozwoliło osiągnąć błąd średni na poziomie 0.9% i maksymalny 6.13%. Maksy-malny błąd osiągany jest na krańcach przedziału.
Przedstawione przykłady pokazują, że metoda programowania kwadratowegoz ograniczeniami kostkowymi pozwala na rozwiązywanie problemów syntezy pola
4.7. SYNTEZA NIEJEDNORODNEGO POLA MAGNETYCZNEGO 91
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.50
0.1
0.2
0.3
0.4
0.5
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40
0.2
0.4
0.6
0.8
1
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.34: Rozwiązanie problemu o wymiarze n×m = 25× 1000 za pomocąnieujemnej metody najmniejszych kwadratów. (a) rozkład prądów w uzwojeniachcewki, (b) odpowiadający im rozkład pola magnetycznego dla obszaru Γ stano-wiącego odcinek, (c) rozkład błędu. β1 = 0.271793, β2 = 0.492022, γ1 = 0.646463,γ2 = 1.11855 · 10−2 , γ3 = 8.7834 · 10−2.
92 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0
0.1
0.2
0.3
0.4
0.5
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40
0.2
0.4
0.6
0.8
1
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−6
10−5
10−4
10−3
10−2
z [m]
ε
Rysunek 4.35: Rozwiązanie problemu o wymiarze n × m = 25 × 1000 meto-dą programowania kwadratowego. (a) rozkład prądów w uzwojeniach cewki, (b)odpowiadający im rozkład pola magnetycznego dla obszaru Γ stanowiącego od-cinek, (c) rozkład błędu. β1 = 0.493968, β2 = 0.492022, γ1 = 5.3595 · 10−2,γ2 = 9.83776 · 10−4 , γ3 = 1.243978 · 10−2.
4.7. SYNTEZA NIEJEDNORODNEGO POLA MAGNETYCZNEGO 93
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
−1
−0.5
0
0.5
1
z [m]
x [A
]
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40
0.2
0.4
0.6
0.8
1
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−6
10−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 4.36: Rozwiązanie problemu o wymiarze n × m = 25 × 1000 metodąprogramowania kwadratowego. (a) rozkład prądów w uzwojeniach cewki, (b) od-powiadający im rozkład pola magnetycznego dla obszaru Γ stanowiącego od-cinek, (c) rozkład błędu. β1 = 23.5698, β2 = 1.08166, γ1 = 9.6786 · 10−2,γ2 = 8.93847 · 10−3 , γ3 = 6.135478 · 10−2.
94 ROZDZIAŁ 4. OPTYMALIZACJA ROZKŁADU PRĄDU W CEWCE
o dowolnym profilu.Należy zwrócić uwagę, że wymaganie, aby wszystkie prądy płynęły w jed-
nym kierunku, które w przypadku pól jednorodnych nie powodowało istotnegopogorszenia jakości pola, w przypadku pól niejednorodnych może prowadzić dorozwiązań nieakceptowalnych. Dopuszczenie możliwości przepływu prądów w róż-nych kierunkach znacząco poprawia jakość uzyskanego pola.
Rozdział 5
Optymalizacja kształtu cewki
W niniejszym rozdziale zostaną przedstawione wyniki rozwiązania problemu syn-tezy pola magnetycznego. Problem ten zostanie rozwiązany przy założeniu, żewartości prądów w poszczególnych uzwojeniach cewki są znane (ustalone) na-tomiast będzie poszukiwany kształt uzwojenia. Założenie jednolitych wartościprądów w uzwojeniach jest oczywiście tożsame z założeniem jednorodnej gęstościprądu w uzwojeniu. Jest to podejście odmienne to zaprezentowanego w rozdzialepoprzednim. Ze względu na brak liniowej zależności pomiędzy położeniem uzwo-jenia a polem przez nie generowanym nie da się korzystać z wykorzystywanych wpoprzednim rozdziale metod rozwiązywania liniowego zagadnienia najmniejszychkwadratów. Konieczne staje się rozważenie metod optymalizacji problemów nie-liniowych.
5.1 Przedstawienie problemu
Na rys. 5.1 przedstawiono przekrój poprzeczny cewki w walcowym układzie współ-rzędnych. Cewka ograniczona jest od góry powierzchnią walcową, natomiast odwewnątrz krzywą obrotową opisaną funkcją ζ(z). Zakłada się, że wartość gęsto-ści prądu na całej powierzchni przekroju jest stała i wynosi j. Wymiary cewkito długość zc = zmax − zmin, natomiast zewnętrzny promień wynosi rmax. Za-gadaniem syntezy pola jest znalezienie funkcji ζ(z), która definiuje wewnętrznykształt cewki na całej jej długości, tak aby otrzymać wymagany rozkład pola wzadanym obszarze. Zakłada się, że wartości funkcji ζ są ograniczone do przedziałuζ(z) ∈ [rmin, rmax].W rozdziale 2 przedstawiono zależność (2.2) pomiędzy pojedynczym zwojem
przewodzącym prąd I umiejscowionym w punkcie o współrzędnych (ρ, ξ) i polemmagnetycznym w puncie o współrzędnych (r, z). Na tej podstawie możemy zapisaćrównanie:
B(r, z; ρ, ξ) = b(r, z; ρ, ξ) · I (5.1)
95
96 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(c)
Rysunek 5.1: Przekrój poprzeczny cewki w walcowym układzie współrzędnychwalcowych, kształtowanej przez krzywą obrotową ζ.
gdzie:
b(r, z; ρ, ξ) =µ0
2π√(r + ρ)2 + (ξ − z)2
·(K(k)− r
2 + ρ2 + (ξ − z)2
(ρ− r)2 + (ξ − z)2E(k)
),
k2 = 4rρ/((r + ρ)2 + (ξ − z)2) oraz K(·), E(·) oznaczają całki eliptyczne odpo-wiednio pierwszego i drugiego rodzaju.
W celu dyskretyzacji problemu założymy, że funkcja ζ(z) jest na odcinkustała, tzn. ζ(z) = xi dla z ∈ [zi, zi+1], gdzie zi = zmin + (i + 1) · h dla i =1, 2, . . . , n + 1, oraz h = (zmax − zmin)/n. Innymi słowy zakładamy, że funkcjaζ(z) jest stała na n odcinkach o równej długości. Przy tych założeniach całkowitepole magnetyczne w dowolnym punkcie (r, z) można wyznaczyć z zależności:
B(r, z) =n∑i=1
∫ rmaxxi
∫ zi+1zi
j · b(r, z; ρ, ξ)dξdρ (5.2)
W celu wyznaczenia pola magnetycznego w punktach obszaru Γ należy m ·n –krotnie obliczyć całkę podwójną. Mając na uwadze fakt, że funkcja podcałkowazawiera całki eliptyczne, zagadnienie staje się wymagające obliczeniowo. W związ-ku z tym w obliczeniach będą stosowane mniejsze wartości parametrów n i m niżw poprzednim rozdziale. W przypadku gdy pole magnetyczne wyliczane jest naosi współrzędnych z (r = 0) znikają całki eliptyczne i równanie (5.2) upraszczasię do postaci:
b(0, z; ρ, ξ) =12µ0ρ2(ρ2 + (ξ − z)2)−
32 (5.3)
Całkę podwójną w równaniu (5.2) można wyznaczyć symbolicznie i równanie to
5.2. FUNKCJA CELU DLA PROBLEMU OPTYMALIZACJI KSZTAŁTU 97
redukuje się do wzoru:
B(0, z) =n∑i=1
∫ rmaxxi
∫ zi+1zi
µ0jρ2
2 (ρ2 + (z − ξ)2)3/2dξdρ
=n∑i=1
µ0j
2
(z log
Ψi,iΨi,i+1
− zi logΨi,i + zi+1 logΨi,i+1
)(5.4)
gdzie Ψi,k =√r2max+(z−zk)
2+rmax√x2i+(z−zk)
2+xi. Wykorzystanie wzoru (5.4) znacznie przyspie-
sza czas obliczeń. W związku z tym analiza problemu zostanie podzielona nadwa przypadki. W pierwszym przypadku założymy, że obszar Γ jest odcinkiempołożonym na osi z układu współrzędnych. Wówczas w celu wyznaczenia pola ma-gnetycznego można stosować uproszczoną zależność (5.4). W drugim przypadkuobszar Γ będzie kulą o środku w początku układu współrzędnych. W tym przy-padku do obliczeń należy wykorzystywać zależność (5.2), zgodnie z którą całkiobliczane są numerycznie.W przypadku problemów analizowanych w niniejszym rozdziale zakładamy,
że pole oczekiwane posiada stałą indukcję Breq = 1 T. Rozważano dwa przypadkiwartości gęstości prądu w uzwojeniu cewki (j = 17·107 A·m−2 oraz j = 35·107 A·m−2). Wymiary cewki zostały określone w identyczny sposób jak w podrozdziale4.1 zgodnie z tabelą 4.1.
5.2 Funkcja celu dla problemu optymalizacji kształtu
Celem optymalizacji jest wyznaczenie wartości funkcji ζ(z) = xi w każdym z prze-działów [zi, zi+1] dla i = 1, 2, . . . , n, tak aby cewka o takim kształcie wytworzyławymagane pole magnetyczne w obszarze Γ. Niech x = (x1, x2, . . . , xm) ∈ Rn bę-dzie szukanym wektorem reprezentującym funkcję kształtu ζ(z) i niech breq ∈ Rm
będzie wektorem określającym wymagane pole w każdym punkcie obszaru Γ.Przez b(x) oznaczymy wektor wartości pola magnetycznego w punktach obsza-ru Γ wywołanego przez cewkę o kształcie opisanym wektorem x. Funkcję celudefiniujemy jako:
f(x) = ∥b(x)− breq∥22 (5.5)
Wówczas problem optymalizacji nieliniowej można zapisać w postaci:
x = argminx : rmin¬xi¬rmax
f(x). (5.6)
Ze względu na nieliniowy charakter funkcji f(x), problem opisany zależnością(5.6) należy do klasy problemów optymalizacji nieliniowej przy ograniczeniachkostkowych.
98 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
Podobnie jak w przypadku liniowym wyniki będą oceniane za pomocą błędówporównujących pole otrzymane z polem zadanym. Współczynniki te oznaczonesymbolami γ1, γ2 oraz γ3 zostały zdefiniowane w podrozdziale 2.7. W celu po-równania wyników przy obliczaniu współczynników γi będziemy wyznaczali polemagnetyczne w m = 1000 punktach obszaru Γ bez względu na to jakie m byłowykorzystane w procesie optymalizacji.
5.3 Wyniki obliczeń
W tym podrozdziale zostaną przedstawione wyniki rozwiązania problemu. W od-różnieniu od wyników rozwiązania problemu syntezy z rozdziału poprzedniegow przypadku optymalizacji kształtu cewki mamy do czynienia z optymalizacjąnieliniową. W związku z tym nie można zastosować metod znanych z algebryliniowej. Należy zastosować metody optymalizacji nieliniowej z ograniczeniami.Ponieważ minimalizowana funkcja celu jest kwadratem normy euklidesowej z błę-du pomiędzy polem zadanym a otrzymanym, metody gradientowe powinny daćzadowalający efekt. Dlatego w niniejszym podrozdziale zostaną użyte i porówna-ne dwie metody: metoda quasi-Newtona oraz nieliniowa metoda najmniejszychkwadratów. Zostaną również przedstawione wyniki uzyskane za pomocą metodbezgradientowych i stochastycznych. Ze względu na fakt, że funkcja celu możemieć wiele minimów lokalnych optymalizacja z wykorzystaniem metod gradien-towych może również nie przynieś spodziewanych efektów.Ustalono, że problemy będą analizowane dla dwóch przypadków gęstości prą-
du j = 17 A · mm−2 oraz j = 35 A · mm−2. Gdy gęstość prądu jest mniejszaniż j = 10.246825 A ·mm−2 rozwiązaniem jest pełna cewka walcowa, tzn. algo-rytm zatrzymuje się w punkcie na granicy ograniczenia dolnego xi = rc min dlai = 1, . . . , n.
5.3.1 Pole magnetyczne kształtowane na osi układu współrzędnych
W tym podrozdziale zostaną przedstawione wyniki symulacji gdy obszar Γ sta-nowił odcinek ulokowany na osi układu współrzędnych. Problem ten jest mniejzłożony ze względu na fakt uniknięcia obliczania numerycznie całek, co przedewszystkim przekłada się na zwiększoną szybkość obliczeń. W celu uzyskania wy-ników dla dużych wartości n i m zastosowano metodę polegającą na rozwiązywa-niu kolejno problemów o coraz wyższym wymiarze. Jako pierwszy rozwiązuje sięsubproblem o relatywnie niskim wymiarze n. Algorytm startuje z punktu x(0)i =rc min dla i = 1, . . . , n. Zastosowanie punktu startowego x(0) = [x
(0)1 , . . . , x
(0)n ] jako
losowo wybranych liczb z przedziału x(0)i = [rc min, rc max] dla i = 1, . . . , n powo-dowało znacznie pogorszenie zbieżności algorytmów, szczególnie w jego począt-kowej fazie działania. Następnie uzyskane rozwiązanie zostaje użyte jako punktstartowy dla problemu o wymiarze dwa razy większym 2n. Takie podejście jest
5.3. WYNIKI OBLICZEŃ 99
powtarzane, aż uzyskamy rozwiązanie o oczekiwanym wymiarze. Metoda iteracyj-nego podwajania wymiaru jest bardziej efektywna niż rozwiązanie bezpośrednioproblemu o zadanym dużym wymiarze, z uwagi na brak konieczności szukania odrazu rozwiązania w przestrzeni wysokowymiarowej. Można oczekiwać, że rozwią-zania subproblemów są rozwiązaniami bliskimi optimum globalnego.
Rys. 5.2 przedstawia rozwiązanie problemu o wymiarze n ×m = 512 × 1000dla gęstości prądu j = 17 A · mm−2. Rozwiązanie to otrzymano metodą quasi-Newtona z ograniczeniami kostkowymi. Wykorzystano metodę iteracyjnego po-dwajania wymiaru. Algorytm rozpoczął działanie dla problemu n×m = 32×100,rozwiązanie tego subproblemu zostało przedstawione na rys. 5.3. Następnie wy-miar n problemu został zwiększony dwukrotnie, natomiast algorytm startował jużz punktu, który był rozwiązaniem w problemu poprzedniego. W sumie algorytmwywołał funkcję celu ok. 31000 razy w czasie ok. 10 min. Rys. 5.2(c) przedstawiarozkład błędu względnego rozwiązania. Średni błąd względny wynosi γ2 = 1.8%,zaś błąd maksymalny jest mniejszy niż 10%. Wynik jest symetryczny, co sugeruje,że znalezione rozwiązanie jest minimum globalnym.
Ten sam problem został również rozwiązany za pomocą algorytmu quasi-Newtona, nie wykorzystującego metody iteracyjnego podwajania wyników, leczrozwiązującego bezpośrednio problem o wymiarze n×m = 512× 1000. Po ok. 18minutach algorytm znalazł to samo rozwiązanie co w przypadku pierwszej meto-dy. Zarówno czas jak i liczba wywołań funkcji celu były większe, co świadczy oprzewadze metody iteracyjnego podwajania wymiaru.
Dla porównania rozważany problem rozwiązano za pomocą nieliniowej meto-dy najmniejszych kwadratów. Stosując metodę podwajania wymiaru, otrzymanopraktycznie identyczne wyniki. Natomiast w przypadku metody bezpośredniej,niewykorzystującej metody podwajania n nieliniowa metoda najmniejszych kwa-dratów znalazła rozwiązanie podobne, lecz nieco gorsze z punktu widzenia war-tości funkcji celu oraz gładkości rozwiązania. Rozwiązanie to przedstawiono narys. 5.4.Ten przykład również pokazuje zalety iteracyjnego podwajania wymiaru.
Rys. 5.5 oraz 5.6 przedstawiają rozwiązanie problemu o wymiarze n ×m =512 × 1000 dla zwiększonej gęstości prądu do j = 35 A · mm−2. Pierwszy znich przedstawia rozwiązanie za pomocą metody quasi-Newtona. Metoda ta jestdość stabilna i przedstawione rozwiązanie jest bliskie optymalnemu. Jedynie rys.5.5(c) przedstawiający rozkład błędu względnego rozwiązania, wskazuje na pe-wien brak symetrii. Natomiast rozwiązanie otrzymane nieliniową metodą naj-mniejszych kwadratów nie ma już cech symetrii. Wartości współczynników błędusą większe niż w przypadku metody quasi-Newtona. Oba rozwiązania korzystały zmetody iteracyjnego podwajania wymiaru. Czas obliczeń nieliniową metodą naj-mniejszych kwadratów był ponad dwukrotnie dłuższy. Na rys. 5.7 przedstawionorozwiązanie pierwszego subproblemu n ×m = 32 × 100 nieliniową metodą naj-mniejszych kwadratów. Rozwiązanie to jest pozbawione symetrii. W przypadku
100 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.9
0.92
0.94
0.96
0.98
1
1.02
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−1
10−2
10−3
10−4
z [m]
ε
Rysunek 5.2: Rozwiązanie problemu o wymiarze n × m = 512 × 1000 znale-zione za pomocą metody quasi-Newtona z wykorzystaniem metody iteracyjnegopodwajania wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola ma-gnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względnego.j = 17 A ·mm−2, γ1 = 0.833749, γ2 = 1.77312 · 10−2, γ3 = 0.1005
5.3. WYNIKI OBLICZEŃ 101
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
Rysunek 5.3: Rozwiązanie pierwszego subproblemu o wymiarze n×m = 32×100.j = 17 A ·mm−2, γ1 = 0.837615, γ2 = 1.82415 · 10−2, γ3 = 9.96239 · 10−2
metody quasi-Newtona otrzymano rozwiązanie symetryczne.
Wraz ze wzrostem gęstości prądu nieliniowa metoda najmniejszych kwadra-tów coraz bardziej nie radziła sobie ze znalezieniem rozwiązania globalnego, szcze-gólnie gdy wyliczenie dotyczyło metody bezpośredniej. Na przykład na rys. 5.8przedstawiono rozwiązanie problemu po 232 iteracjach, po 120555 obliczeniachfunkcji celu i po prawie 210 minutach. Niestety mimo tak długiego czasu obliczeńalgorytm nie potrafił znaleźć rozwiązania bliskiego optimum.
5.3.2 Podsumowanie wyników
W tabeli 5.1 przedstawiono wyniki dla nieliniowej metody najmniejszych kwa-dratów i quasi-Newtona. Tabela zawiera wyniki dla gęstości prądu w cewce j =17 A · mm−2 oraz j = 35 A · mm−2. Każdy zestaw dla danej metody i gęstościprądu przedstawia kolejno wyniki dla metody iteracyjnego podwajania wymiaru.Następny wiersz przedstawia sumaryczną liczbę iteracji, liczbę wywołań funk-cji celu oraz czasu dla wszystkich poprzednich obliczeń subproblemów. Ostatniwiersz przedstawia wynik dla metody bezpośredniej.
Ogólnie można zauważyć, że w przypadku metody quasi-Newtona pomysł zwykorzystaniem metody iteracyjnego podwajania wymiaru poprawia działaniemetody. Rozwiązania o zadanym wymiarze znajdowane są w czasie krótszymniż w przypadku obliczeń bezpośrednich. Również mniejsza jest liczba wywołańfunkcji celu. Natomiast, w przypadku nieliniowej metody najmniejszych kwadra-tów, algorytm w wersji z podwajaniem wymiaru znajdował lepsze rozwiązania(mniejsza wartość współczynnika γ1), ale tutaj czas obliczeń był dłuższy. Ogól-nie, metoda quasi-Newtona była metodą lepszą zarówno jeśli chodzi o wynik jak iczas obliczeń. Ciekawym jest fakt,że przy większej wartości gęstości prądu zarów-no maksymalny jak i średni błąd rozwiązania były mniejsze. Jest to spowodowaneuwarunkowaniami fizycznymi.
102 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.9
0.92
0.94
0.96
0.98
1
1.02
z [m]
b/br
eq m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−6
10−4
10−2
z [m]
ε
Rysunek 5.4: Rozwiązanie problemu o wymiarze n ×m = 512 × 1000 znalezio-ne za pomocą nieliniowej metody najmniejszych kwadratów. (a) kształt cewki,(b) odpowiadający im rozkład pola magnetycznego dla obszaru Γ stanowiące-go odcinek, (c) rozkład błędu względnego. j = 17 A · mm−2, γ1 = 0.836064,γ2 = 1.78688 · 10−2, γ3 = 1.0061 · 10−1
5.3. WYNIKI OBLICZEŃ 103
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0.98
0.99
1
1.01
z [m]
b/br
eq m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−6
10−5
10−4
10−3
10−2
z [m]
ε
Rysunek 5.5: Rozwiązanie problemu o wymiarze n × m = 512 × 1000 znale-zione za pomocą metody quasi-Newtona z wykorzystaniem metody iteracyjnegopodwajania wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola ma-gnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względnego.j = 35 A ·mm−2, γ1 = 0.1868, γ2 = 3.85173 · 10−3, γ3 = 2.82869 · 10−2
104 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
0.98
0.99
1
1.01
z [m]
b/br
eq m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−4
10−3
10−2
z [m]
ε
Rysunek 5.6: Rozwiązanie problemu o wymiarze n ×m = 512 × 1000 znalezio-ne za pomocą nieliniowej metody najmniejszych kwadratów z wykorzystaniemmetody iteracyjnego podwajania wymiaru. (a) kształt cewki, (b) odpowiadającyim rozkład pola magnetycznego dla obszaru Γ stanowiącego odcinek, (c) roz-kład błędu względnego. j = 35 A · mm−2, γ1 = 0.19086, γ2 = 4.01812 · 10−3,γ3 = 2.83021 · 10−2
5.3. WYNIKI OBLICZEŃ 105
n×m
γ1(x0)·10−1γ2(x0)·10−1γ3(x0)·10−1γ1(x)·10−1γ2(x)·10−2γ3(x)(x)·10−2liczbaliczbawywołań
t[s]
iteracji
funkcjicelu
quasi–Newton,j=17A·mm−2
32×100
191.988
5.82903
7.61313
8.37615
1.82415
9.96239
341135
2.76
64×128
8.37773
0.185057
0.994783
8.34776
1.80905
9.96255
211377
2.66
128×256
8.34907
0.182125
0.995373
8.34038
1.78774
10.0117
263365
9.96
256×512
8.34015
0.179177
1.00083
8.33778
1.77733
10.036
276957
58.66
512×1000
8.33791
0.178057
1.00329
8.33749
1.77312
10.0472
3517973
506.2
512×1000
——
—8.33749
1.77312
10.0472
Σ143
Σ30807
Σ580.3
512×1000
191.988
5.82903
7.61313
8.33749
1.77312
10.0472
6734390
1055.4
nieliniowametodanajmniejszychkwadratów,j=17A·mm−2
32×100
191.988
5.82903
7.61313
8.37615
1.82415
9.96239
388
12837
23.36
64×128
8.37773
0.185057
0.994783
8.34777
1.80901
9.96265
384
25025
74.10
128×256
8.34907
0.182121
0.995384
8.34056
1.78735
10.0136
193
25026
217.62
256×512
8.34022
0.17914
1.00101
8.33848
1.7782
10.0342
9725186
729.33
512×1000
8.33848
0.178026
1.00323
8.3381
1.77396
10.0465
4825137
2566.57
512×1000
——
—8.3381
1.77396
10.0465
Σ1110
Σ113211
Σ3610.99
512×1000
191.988
5.82903
7.61313
8.36064
1.78688
10.061
4825137
2586.14
quasi–Newton,j=35A·mm−2
32×100
722.832
22.5892
26.2623
1.925
0.402416
2.78935
105
3486
8.63
64×128
26.8641
0.0765954
0.274315
1.89419
0.395879
2.79669
513342
10.19
128×256
2.04581
0.0508321
0.277396
1.87636
0.392328
2.81212
395063
26.36
256×512
1.94154
0.0448878
0.276662
1.87105
0.384169
2.80615
6215968
239.04
512×1000
1.88654
0.0389643
0.278139
1.868
0.385173
2.79925
8342607
1119.73
512×1000
——
—1.868
0.385173
2.79925
Σ340
Σ70466
Σ1403.94
512×1000
722.832
22.5892
26.2623
1.87157
0.385819
2.82869
153
78505
2318.15
nieliniowametodanajmniejszychkwadratów,j=35A·mm−2
32×100
722.832
22.5892
26.2623
1.94136
0.42584
2.78701
335
11088
19.48
64×128
3.47815
0.099396
0.261471
2.57079
0.719488
2.60589
401
26130
76.02
128×256
2.57079
0.0719488
0.260589
1.89664
0.40054
2.7758
250
32379
281.83
256×512
1.99245
0.046881
0.272259
1.90835
0.402228
2.81807
136
35209
1018.97
512×1000
1.91443
0.0401371
0.280708
1.9086
0.401812
2.83021
6533858
3470.85
512×1000
——
—1.9086
0.401812
2.83021
Σ1187
Σ138664
Σ4867.14
512×1000
722.832
22.5892
26.2623
2.16521
0.492791
3.04885
232
120555
12371
Tabela5.1:Zestawieniewynikówrozwiązaniaproblemukształtowaniapolamagnetycznegonaosiukładuwspółrzędnych.t–czas
obliczeńwsekundach,γ(x0)–wartościwspółczynnikówbłęduwpunkciestartowymdlam=1000,γ(x)—wartościwspółczynników
błędudlarozwiązaniam=1000
106 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
Rysunek 5.7: Rozwiązanie pierwszego subproblemu o wymiarze n × m = 32 ×100 dla nieliniowej metody najmniejszych kwadratów. j = 35 A · mm−2, γ1 =0.194136, γ2 = 4.2584 · 10−3, γ3 = 2.7870 · 10−2
5.3.3 Optymalizacja kształtu cewki z gęstością prądu
W poprzednich podrozdziałach przeprowadzono analizę rozwiązania problemówznalezienia optymalnego kształtu cewki przy ustalonej gęstości prądu. Rys. 5.9przedstawia rozwiązanie problemu o wymiarze n × m = (32 + 1) × 1000 gdydodatkową zmienną poszukiwanego optymalnego wektora x jest gęstość prądu.Zastosowano metodę quasi-Newtona. Optymalna gęstość prądu wynosi j = 119 A·mm−2. Rozwiązanie można porównać z rozwiązaniem dla stałej wartości gęstościprądu w cewce j = 17 A ·mm−2 przedstawionym na rys. 5.3. Zwiększenie gęstościprądu spowodowało znaczne zmniejszenie powierzchni przekroju cewki. Wartościwspółczynników błędu γ1, γ2, γ3 zmniejszyły się dziesięciokrotnie.
Podczas optymalizacji z gęstością prądu algorytm quasi-Newtona znajdujerozwiązania, dla których gęstość prądu znacznie wzrasta, równocześnie maleje po-wierzchnia przekroju cewki. Efekt ten jest coraz bardziej zauważalny, gdy wzrastawartość n. Dla n > 30 występuje dużą niestabilność rozwiązań. Znalezione roz-wiązania są niesymetryczne a powierzchnia cewki znacznie maleje. Maleją błędyrozwiązania. Ze względu na fakt, że algorytm quasi-Newtona znajduje rozwiąza-nia o dużej gęstości prądu oraz małej powierzchni przekroju cewki, rozwiązaniatakie są mało atrakcyjne ze względu na zastosowania praktyczne. Należy zatemoptymalizować kształt cewki dla ustalonej wartości gęstości, przy czym powin-no się projektować cewki przy maksymalnej dopuszczalnej gęstości prądu. Dziękitemu rozwiązania są obarczone najmniejszymi błędami, powierzchnia przekrojujest mała, a co za tym idzie ilość materiału potrzebnego do wykonania uzwojeniacewki jest również mała.
5.3. WYNIKI OBLICZEŃ 107
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.97
0.98
0.99
1
1.01
z [m]
b/br
eq m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−4
10−3
10−2
z [m]
ε
Rysunek 5.8: Rozwiązanie problemu o wymiarze n ×m = 512 × 1000 znalezio-ne za pomocą nieliniowej metody najmniejszych kwadratów. (a) kształt cewki,(b) odpowiadający im rozkład pola magnetycznego dla obszaru Γ stanowiące-go odcinek, (c) rozkład błędu względnego. j = 35 A · mm−2, γ1 = 0.216521,γ2 = 4.92791 · 10−3, γ3 = 3.04885 · 10−2
108 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.32
0.34
0.36
0.38
0.4
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.985
0.99
0.995
1
1.005
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−6
10−5
10−4
10−3
10−2
z [m]
ε
Rysunek 5.9: Rozwiązanie problemu o wymiarze n×m = (32+1)×1000 znalezio-ne za pomocą metody quasi-Newtona. (a) kształt cewki, (b) odpowiadający imrozkład pola magnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błę-du względnego. j = 119.000831 A ·mm−2, γ1 = 6.84818 ·10−2, γ2 = 1.68262 ·10−3,γ3 = 1.00846 · 10−2
5.3. WYNIKI OBLICZEŃ 109
5.3.4 Inne metody
Przeprowadzono również próby rozwiązania problemu rozważane w poprzednichpodrozdziałach z wykorzystaniem metody symulowanego wyżarzania i algorytmugenetycznego. Zrezygnowano z metody sympleksu Neldera-Meada. Metoda ta jestbezgradientową metodą rozwiązywania problemów optymalizacji bez ograniczeń.Próba zaadaptowania jej do rozwiązania rozważanego problemu przez dodaniefunkcji kary, nie prowadziło do znalezienia akceptowalnego wyniku. Ze względuna duża liczbę wywołań funkcji celu, problem syntezy pola został ograniczonydo wymiaru n ×m = 32 × 100. Wykorzystano wskazaną wcześniej metodę me-todę iteracyjnego podwajania wymiaru. Uzyskane wyniki porównano z wynikiemotrzymanym za pomocą metody quasi-Newtona uznanym za wynik referencyjny.
Symulowane wyżarzanie
Rys. 5.10 przedstawia rozwiązanie problemu n ×m = 32 × 100 metodą symulo-wanego wyżarzania. Rozwiązanie to uzyskano stosując metodę iteracyjnego po-dwajania wymiaru, rozwiązując kolejno problemy o wymiarach n×m = 8× 100,16× 100 i w końcu 32× 100. Rozwiązanie nie jest symetryczne ale można powie-dzieć, że zbliżone do znalezionego metodą quasi-Newtona. Całkowity czas obliczeńwyniósł ponad 20 min. W celu znalezienia przedstawionego rozwiązania algorytmsymulowanego wyżarzania wymagał wyliczenia wartości funkcji celu ok. 300000razy. Algorytm quasi-Newtona znalazł rozwiązanie w czasie poniżej 3 s wyliczającfunkcję celu 1135 razy. Współczynniki błędu γ1, γ2, γ3 dla metody quasi-Newtonabyły odpowiednio o 1.6%, 4.5% oraz 0.3% mniejsze.
Algorytm genetyczny
W przypadku algorytmu genetycznego aby otrzymać akceptowalne rozwiązania,należało najpierw znaleźć najlepsze parametry samego algorytmu. Najlepszą me-todą krzyżowania osobników okazała się metoda dwupunktowej wymiany warto-ści. Zarówno metoda krzyżowania algebraicznego czy uśredniające nie prowadzi-ły do znalezienia rozwiązania. Podobnie prawdopodobieństwo mutacji i wielkośćzaburzeń musiały mieć duże wartości, aby algorytm mógł znaleźć rozwiązaniebliskie optymalnemu. Populacja składała się z 125 osobników, każdy kodowanyza pomocą liczb rzeczywistych. Niestety, mimo wykonania wielu prób, znalezienierozwiązania podobnego do rozwiązania uzyskanego metodą quasi-Newtona byłotrudne. Najlepsze uzyskane rozwiązanie przedstawiono na rys. 5.11. Zastosowa-no metodę iteracyjnego podwajania wymiaru. Rozwiązanie znacznie odbiega odoptymalnego. Mimo, że poszukiwanie trwało 32 min, a algorytm wyliczył wartośćfunkcji celu 736974 razy, to uzyskano najgorsze rozwiązanie spośród wszystkichmetod. Rozwiązanie problemu było najgorsze. Wartości współczynników błęduγi były największe, ze wszystkich metod stosowanych dotychczas.
110 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.9
0.92
0.94
0.96
0.98
1
1.02
z [m]
b/br
eq m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
10−3
10−2
10−1
z [m]
ε
Rysunek 5.10: Rozwiązanie problemu o wymiarze n×m = 32×100 znalezione zapomocą metody symulowanego wyżarzania z wykorzystaniem metody iteracyjne-go podwajania wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład polamagnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względne-go. j = 17 A ·mm−2, γ1 = 0.850661, γ2 = 1.90535 · 10−2, γ3 = 9.97042 · 10−2
5.3. WYNIKI OBLICZEŃ 111
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.9
0.95
1
1.05
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−5
10−4
10−3
10−2
10−1
z [m]
ε
Rysunek 5.11: Rozwiązanie problemu o wymiarze n × m = 32 × 100 znalezio-ne za pomocą algorytmu genetycznego z wykorzystaniem metody iteracyjnegopodwajania wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola ma-gnetycznego dla obszaru Γ stanowiącego odcinek, (c) rozkład błędu względnego.j = 17 A ·mm−2, γ1 = 0.850419, γ2 = 1.89943 · 10−2, γ3 = 9.98972 · 10−2
112 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
5.3.5 Pole magnetyczne kształtowane na powierzchni kuli
W tym podrozdziale zostaną przedstawione wyniki obliczeń problemu syntezyw przypadku, gdy powierzchnią Γ była kula umiejscowiona w początku układuwspółrzędnych. Rozkład pola magnetycznego na powierzchni Γ należy wyznaczyćz zależności (5.2). W odróżnieniu od sytuacji opisanej w poprzednim podrozdzia-le nie ma możliwości wyznaczenie całki podwójnej w sposób symboliczny. Należyprzeprowadzać całkowanie metodami numerycznymi. Ograniczenie to w znacznysposób wydłużyło czas obliczenia wartości funkcji celu. W konsekwencji uniemoż-liwiło to wyznaczenie rozwiązania dla dużych wartości n i m. Przeprowadzonotesty z wykorzystaniem metody quasi-Newtona oraz nieliniowej metody najmniej-szych kwadratów. Ze względu na długi czas obliczeń zrezygnowano z testów zapomocą innych metod, które jak wykazano w rozdziale 5.3.4 są znacznie wolniej-sze.
Rys. 5.12 przedstawia rozwiązanie problemu o wymiarze n×m = 64×100 przyzałożeniu, że gęstość prądu wynosi j = 17 A ·mm−2. Wartości współczynnikówγi obliczone są dla m = 1000. O dużym czasie obliczeń świadczy fakt, że samowyznaczenie wartości współczynników dla wymiaru n × m = 64 × 1000 trwałoponad 420 s. Przedstawione rozwiązanie otrzymano metodą iterowanego podwa-jania wymiaru rozwiązując kolejno problemy o wymiarach 8×12, 16×20, 32×100oraz 64 × 100. Całkowity czas potrzebny do rozwiązania problemu wyniósł ok.17 godzin. Algorytm w sumie wywołał funkcję celu 5715 razy. Rozwiązanie jestw zasadzie symetryczne. Pewne odstępstwa od pełnej symetrii widać tylko nawykresie rozkładu błędu względnego (rys. 5.12(c)). W celu porównania metod,ten sam problem został rozwiązany za pomocą nieliniowej metody najmniejszychkwadratów. Wyniki okazały się bardzo podobne, w związku z tym nie przedsta-wiono wykresów. Jednak różnicę można zauważyć analizując wartości współczyn-ników błędu. Współczynnik γ1 był nieznacznie większy niż w przypadku metodyquasi-Newtona, natomiast czas obliczeń ponad dwukrotnie większy zarówno wwersji z podwajaniem wymiaru jak i dla metody bezpośredniej.
Wynik działania algorytmu quasi-Newtona, gdy gęstość prądu wzrosła do war-tości j = 35 A·mm−2, został przedstawiony na rys. 5.13. Wraz ze wzrostem prądumaleje powierzchnia przekroju cewki. Przedstawiony wynik otrzymano stosującmetodę iteracyjnego podwajanie wymiaru. Bardzo istotnym problemem staje sięczas obliczeń. Rozwiązanie problemu zajęło ok. 25 godzin. Przebieg zbieżnościalgorytmu dla subproblemu o wymiarze n×m = 64× 100 przedstawiono na rys.5.14. Dzięki wykorzystaniu metody podwajania wymiaru algorytm startował z ni-skiej wartości funkcji celu. Po wywołaniu 4648 razy funkcji celu algorytm znalazłrozwiązanie, dla którego funkcja celu była o 3.05 · 10−4 mniejsza. Przy wzrościewartości gęstości prądu w cewce wzrasta również czas obliczeń. Może wynikaćto z faktu, że algorytm korzysta z metody aktywnych zbiorów ograniczeń. Przywzroście wartości gęstości prądu wzrasta liczba ograniczeń znajdujących się w
5.3. WYNIKI OBLICZEŃ 113
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
0 π/4 π/2 3π/4 π
0.96
0.98
1
α [rad]
b/b re
q m
ax
(c)
0 π/4 π/2 3π/4 π
10−4
10−5
10−3
10−2
10−1
α [rad]
ε
Rysunek 5.12: Rozwiązanie problemu o wymiarze n×m = 64×100 znalezione zapomocą metody quasi-Newtona z wykorzystaniem metody iteracyjnego podwaja-nia wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola magnetyczne-go dla obszaru Γ będącego kulą, (c) rozkład błędu względnego. j = 17 A ·mm−2,γ1 = 2.95828, γ2 = 6.2685 · 10−3, γ3 = 5.22314 · 10−2
114 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
zbiorze pasywnym, co wydłuża proces optymalizacji.W przypadku nieliniowej metody najmniejszych kwadratów otrzymano niere-
gularne rozwiązania pozbawione symetrii. Przykład przedstawiono na rys. 5.15.
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
0 π/4 π/2 3π/4 π
0.96
0.98
1
α [rad]
b/b re
q m
ax
(c)
0 π/4 π/2 3π/4 π
10−4
10−3
10−2
10−1
α [rad]
ε
Rysunek 5.13: Rozwiązanie problemu o wymiarze n×m = 64×100 znalezione zapomocą metody quasi-Newtona z wykorzystaniem metody iteracyjnego podwaja-nia wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola magnetyczne-go dla obszaru Γ będącego kulą, (c) rozkład błędu względnego. j = 35 A ·mm−2,γ1 = 0.244613, γ2 = 4.90727 · 10−3, γ3 = 4.92647 · 10−2
5.3.6 Podsumowanie wyników
Podsumowując, w problem optymalizacji kształtu cewki jest dużo bardziej zło-żony obliczeniowo niż to miało miejsce w przypadku liniowym. Szczególnie gdy
5.4. SYNTEZA NIEJEDNORODNEGO POLA MAGNETYCZNEGO 115
0 1000 2000 3000 4000 50009
9.05
9.1
9.15
9.2
9.25
9.3
9.35x 10
−3
liczba wywolan funkcji celu
f(x)
Rysunek 5.14: Przebieg zbieżności algorytmu quasiNewtona dla problemu o wy-miarze n×m = 64× 100.
kształtowano pole poza osią układu współrzędnych. W tabeli 5.2 przedstawionowyniki dla tego przypadku. Ostatnia kolumna pokazuje czas obliczeń. W przypad-ku nieliniowej metody najmniejszych kwadratów dla przypadku n×m = 64×100obliczenia trwały ponad 56 godzin (ostatni wiersz tabeli), a mimo to nie otrzyma-no wyniku jak w przypadku metody quasi-Newtona. Reasumując metoda quasi-Newtona lepiej radziła sobie z rozważanymi problemami. W krótszym czasie znaj-dowała lepsze wyniki, wywołując funkcję celu mniej razy. Również należy pod-kreślić, że zaproponowana metoda iterowanego podwajania wymiaru pozwalałaskrócić czas obliczeń, a niekiedy znajdowała lepsze rozwiązania.
5.4 Synteza niejednorodnego pola magnetycznego
W tym podrozdziale zostanie przeanalizowane rozwiązanie problemu, gdy zadanepole jest niejednorodne. Podobnie jak w podrozdziale 4.7 rozważone zostaną dwaniejednorodne rozkłady pola magnetycznego w obszarze Γ. Jednym z nich jestpole narastająco liniowo, a drugim pole o kształcie paraboli. Zostanie zastosowa-na metoda quasi-Newtona z ograniczeniami wykorzystująca algorytm aktywnychzbiorów. W poprzednim podrozdziale wykazano, że metoda ta najlepiej nadajesię do rozwiązywania przedstawionych problemów. Wymiary cewki są identycznejak w poprzednich podrozdziałach.Rys. 5.16(a) przedstawia rozwiązanie problemu z liniowo narastającym polem
dla wymiaru n×m = 512×1000. Wykorzystano metodę iteracyjnego podwajaniawymiaru, startując z problemu o wymiarze n×m = 32× 100. Pole zadane orazpole uzyskane przedstawiono na rys. 5.16(b). Rys. 5.16(c) przedstawia rozkładbłędu. W tym przypadku współczynniki γi oceniające znalezione rozwiązanie są
116 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
0.42
z [m]
ζ(z)
(b)
0 π/4 π/2 3π/4 π
0.96
0.97
0.98
0.99
1
1.01
α [rad]
b/b re
q m
ax
(c)
0 π/4 π/2 3π/4 π 10
−5
10−4
10−3
10−2
α [rad]
ε
Rysunek 5.15: Rozwiązanie problemu o wymiarze n ×m = 64 × 100 znalezioneza pomocą nieliniowej metody najmniejszych kwadratów. (a) kształt cewki, (b)odpowiadający im rozkład pola magnetycznego dla obszaru Γ będącego kulą, (c)rozkład błędu względnego. j = 35 A ·mm−2, γ1 = 0.257284, γ2 = 5.37822 · 10−3,γ3 = 4.9919 · 10−2
5.4. SYNTEZA NIEJEDNORODNEGO POLA MAGNETYCZNEGO 117
n×m
γ1(x0)·10−1γ2(x0)·10−1γ3(x0)·10−1γ1(x)·10−1γ2(x)·10−2γ3(x)(x)·10−2liczbaliczbawywołań
t[s]
iteracji
funkcjicelu
quasiNewton,j=17A·mm−2
8×12
271.848
8.54903
9.63555
4.44537
1.16322
3.96127
17164
5716×20
4.24194
0.107114
0.418112
3.41328
0.793778
4.64909
21370
317
32×100
3.30592
0.0819129
0.497226
2.95627
0.598016
5.27619
411378
10162
64×100
3.16525
0.0702281
0.545968
2.95828
0.62685
5.22314
583803
50655
64×100
271.848
8.54903
9.63555
2.95828
0.62685
5.22314
Σ137
Σ5715
Σ61190
64×100
271.848
8.54903
9.63555
2.95828
0.626871
5.22386
694497
59220
nieliniowametodanajmniejszychkwadratów,j=17A·mm−2
8×12
271.848
8.54903
9.63555
4.44513
1.16316
3.96111
15144
9116×20
4.24188
0.107112
0.418115
3.41334
0.793825
4.64894
20357
737
32×100
3.30554
0.0818989
0.496707
2.95594
0.597449
5.27891
441485
31158
64×100
3.08321
0.0623254
0.545265
2.95912
0.612541
5.23612
784215
114969
64×100
271.848
8.54903
9.63555
2.95912
0.612541
5.23612
Σ287
Σ6201
Σ146955
64×100
271.848
8.54903
9.63555
2.95981
0.612354
5.22011
965920
161584
quasiNewton,j=35A·mm−2
8×12
893.357
28.1892
30.4261
4.11415
1.02089
3.56907
28263
6816×20
7.53284
0.215648
0.382846
3.08243
0.71621
4.17101
39687
535
32×100
3.05663
0.0782578
0.438309
2.46007
0.496663
4.97558
591976
13468
64×100
2.47328
0.0508415
0.508319
2.44613
0.490727
4.92647
714648
74473
64×100
893.357
28.1892
30.4261
2.44613
0.490727
4.92647
Σ197
Σ7574
Σ88543
64×100
893.357
28.1892
30.4261
2.44614
0.490734
4.92656
190
12370
158903
nieliniowametodanajmniejszychkwadratów,j=35A·mm−2
8×12
893.357
28.1892
30.4261
4.11409
1.02091
3.56899
16153
9416×20
7.53252
0.215635
0.382834
3.1162
0.728581
4.1518
21374
757
32×100
3.14157
0.0740989
0.420981
2.58981
0.55145
4.86607
7264
5397
64×100
2.62312
0.0561021
0.493121
2.51232
0.52012
4.89763
893270
130781
64×100
893.357
28.1892
30.4261
2.51232
0.52012
4.89763
Σ133
Σ4061
Σ137029
64×100
893.357
28.1892
30.4261
2.57284
0.537822
4.9919
775070
202757
Tabela5.2:Zestawieniewynikówrozwiązaniaproblemukształtowaniapolanakulizlokalizowanejwśrodkuukładuwspółrzędnych.
t–czasobliczeńwsekundach,γ(x0)–wartościwspółczynnikówbłęduwpunkciestartowym,γ(x)—wartościwspółczynników
błędudlarozwiązania
118 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
większe niż dla przypadku z polem jednorodnym (porównaj rys. 5.2). Średni błądwynosi ok. 3% natomiast maksymalny wynosi aż 18% i jest osiągany na krańcachobszaru Γ. Rozwiązanie to sugeruje, że w celu zmniejszenia błędów rozwiązanianależy albo zmniejszyć przedział, w którym zadajemy pole magnetyczne lub, cojest równoważne, zwiększyć długość cewki.Rys. 5.17 przedstawia rozwiązanie problemu o wymiarze n×m = 512× 1000,
gdy zadane pole magnetyczne opisane jest parabolą o ramionach skierowanychku górze (zielona linia na rys. 5.17(b)). Ciekawym jest fakt, że znalezione rozwią-zanie składa się tylko ze zbioru aktywnego. Zbiór pasywny był zbiorem pustym.Cewka składa się z dwóch cewek walcowych. Uzyskane pole znacznie różni się odpola zadanego. Błąd średni wynosi prawie 5%, a maksymalny sięga aż 31%. Wcelu uzyskania pola lepszej jakości należy zwiększyć długość cewki lub zmniejszyćobszar Γ. Przykładowo, dla tego samego pola zadanego i cewki o długości dwu-krotnie większej otrzymujemy rozwiązanie z błędem maksymalnym mniejszym niż1.1% i błędem średnim na poziomie 0.28%, czyli ponad dziesięciokrotnie lepiejniż dla cewki krótszej.Pokazane przykłady pokazują, że algorytm quasi-Newtona z powodzeniem
może być wykorzystywany również do rozwiązywania problemów syntezy z nie-jednorodnym polem magnetycznym. Algorytm ten w stosunkowo krótkim czasieznajduje optymalne rozwiązania spełniające założenia konstrukcyjne (wymiarycewki, gęstość prądu). W przypadku, gdy znalezione rozwiązanie nie generujepola magnetycznego o wymaganej jakości, to należy osłabić zbyt rygorystycz-ne założenia konstrukcyjne, tak aby umożliwić syntezę pola z zadanym błędemmaksymalnym. W rozważanych przykładach, zgodnie z oczekiwaniami zwiększe-nie długości cewki doprowadziło do znacznej poprawy jakości generowanego pola.
5.4. SYNTEZA NIEJEDNORODNEGO POLA MAGNETYCZNEGO 119
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40
0.2
0.4
0.6
0.8
1
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−5
10−4
10−3
10−2
10−1
100
z [m]
ε
Rysunek 5.16: Rozwiązanie problemu o wymiarze n×m = 512× 1000 znalezioneza pomocą metody quasi-Newtona z wykorzystaniem metody iteracyjnego po-dwajania wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola magne-tycznego dla obszaru Γ będącego odcinkiem, (c) rozkład błędu. j = 17 A ·mm−2,γ1 = 1.44662, γ2 = 3.21104 · 10−2, γ3 = 0.185891
120 ROZDZIAŁ 5. OPTYMALIZACJA KSZTAŁTU CEWKI
(a)
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
0.3
0.32
0.34
0.36
0.38
0.4
z [m]
ζ(z)
(b)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.40.2
0.4
0.6
0.8
1
z [m]
b/b re
q m
ax
(c)
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.410
−4
10−3
10−2
10−1
100
z [m]
ε
Rysunek 5.17: Rozwiązanie problemu o wymiarze n×m = 512× 1000 znalezioneza pomocą metody quasi-Newtona z wykorzystaniem metody iteracyjnego po-dwajania wymiaru. (a) kształt cewki, (b) odpowiadający im rozkład pola magne-tycznego dla obszaru Γ będącego odcinkiem, (c) rozkład błędu. j = 17 A ·mm−2,γ1 = 2.24834, γ2 = 4.95422 · 10−2, γ3 = 0.308653
Rozdział 6
Analiza rzeczywistej cewki
W tym rozdziale zostanie przedstawione porównanie rzeczywistej konstrukcjiz cewką zoptymalizowaną za pomocą metod opisanych w rozdziale 5. Wspomnia-na cewka została zbudowana w warsztacie Wydziału EAIiIB (dawniej EAIiE)Akademii Górniczo-Hutniczej, na podstawie projektu wykonanego przez autora.Projekt ten jest wynikiem początkowej fazy pracy badawczej autora nad proble-mem syntezy pola magnetycznego [30].
Rysunek 6.1: Fotografia przedstawiająca korpus cewki wykonanej w warsztacieWydziału EAIiIB (dawniej EAIiE) Akademii Górniczo-Hutniczej.
Na rys. 6.1 przedstawiono korpus rzeczywistej cewki otrzymany w wynikuoptymalizacji. Problem polegał na znalezieniu takiego kształtu cewki o długości120 mm, która na swojej osi wytworzy jak najbardziej jednorodne pole magne-
121
122 ROZDZIAŁ 6. ANALIZA RZECZYWISTEJ CEWKI
tyczne. Uzwojenie cewki stanowił drut miedziany o średnicy 0.6 mm, założonowspółczynnik gęstości upakowania na poziomie 0.8. Minimalna średnica uzwo-jenia dmin = 30 mm, a maksymalna wynosiła dmax = 90 mm. Zadane polemagnetyczne było zlokalizowane na odcinku o długości równej długości cewkizlokalizowanym na osi układu współrzędnych.
6
-6
3
-3
0
Rysunek 6.2: Widok rozwiązania problemu syntezy pola, wykorzystane do kon-strukcji cewki przedstawionej na rys. 6.1.
Optymalizacja została przeprowadzona za pomocą algorytmów genetycznych.Wartość funkcji celu wyliczono stosując metodę elementów skończonych dla za-danego pola breq = 30 mT. Wykorzystano program FlexPDE R⃝, służący do roz-wiązywania równań różniczkowych cząstkowych metodą elementów skończonych[44]. Poszukiwana była lokalizacja siedmiu punktów. Z tym, że dwa skrajne mia-ły ustaloną składową z i poszukiwano tylko składowej r, natomiast dla pięciupunktów “wewnętrznych” optymalizacja dotyczyła obu współrzędnych (r i z). Wzwiązku z tym poszukiwano rozwiązanie w przestrzeni R12. Wynik optymaliza-cji ze wskazanymi punktami rozwiązania przedstawia rys. 6.2. Znalezione punktyzostały połączone za pomocą funkcji typu spline, tworząc obszar graniczny uzwo-jenia cewki. Rys. 6.2 przedstawia podział obszaru na element skończone służącedo wyznaczenia rozkładu pola. Wartości współrzędnych punktów zostały przed-stawione w tabeli 6.1.
123
Tabela 6.1: Wartości współrzędnych punktów otrzymanych w procesie optymali-zacji.
Punkt r [mm] z[mm]
P1 15.00 -60.00P2 35.98 -24.02P3 30.55 -5.03P4 28.52 0P5 30.58 5.99P6 35.43 24.88P7 15.01 60.00
Na podstawie znalezionych punktów za pomocą interpolacji typu spline zna-leziono przebieg funkcji ζ(z) dla cewki rzeczywistej. Następnie, korzystając z me-tody opisanej w rozdziale 5, wyznaczono rozkład pola oraz współczynniki ocenyrozwiązania γ. Dokonano pomiaru pola magnetycznego cewki za pomocą mier-nika pola magnetycznego wyposażonego w sondę zakończoną czujnikiem Halla.W trakcie pomiaru poprzez uzwojenia cewki przepływał prąd stały o natężeniuok. 1.12 A. Przy założonym współczynniku wypełnienia oraz powierzchni cewkidaje to gęstość prądu na poziomie 2.33 A · mm−2. W celu porównania otrzy-manych wyników z wynikami metod rozważanych w niniejszej pracy dokonanooptymalizacji kształtu cewki metodą quasi-Newtona z ograniczeniami. Wymiarproblemu ustalona na n ×m = 640 × 1000. Rys. 6.3(a) przedstawia porównaniekształtów cewek optymalnej i rzeczywistej. Natomiast rys. 6.3(b) przedstawia od-powiadające im rozkłady pola magnetycznego. Na rysunku zaznaczono też danewynikające z pomiaru pola wewnątrz cewki. W tabeli 6.2 przedstawiono zesta-wienie współczynników γi. Błąd średni (γ2) jest prawie trzykrotnie mniejszy dlacewki optymalnej. Podobne różnice obserwuje się dla błędu maksymalnego (γ3)i średniokwadratowego (γ1).Na podstawie uzyskanych wyników widać, że metody rozważane w niniejszej
pracy, a w szczególności metoda quasi-Newtona daje zdecydowanie lepsze wynikii może być zastosowana do rozwiązania praktycznych problemów.
Tabela 6.2: Wartości współczynników γ dla cewki rzeczywistej i optymalnej
γ1 γ2 γ3
Cewka rzeczywista 4.62403 · 10−3 1.02603 · 10−4 5.42462 · 10−4
Cewka optymalna 1.99772 · 10−3 3.54704 · 10−5 3.17775 · 10−4
124 ROZDZIAŁ 6. ANALIZA RZECZYWISTEJ CEWKI
(a)
−0.06 −0.04 −0.02 0 0.02 0.04 0.06
0.015
0.02
0.025
0.03
0.035
0.04
0.045
z [m]
ζ(z)
cewka optymalnacewka rzeczywista
(b)
−0.06 −0.04 −0.02 0 0.02 0.04 0.062.4
2.6
2.8
3.0
3.2
2.4
z [m]
B [m
T]
cewka optymalnapole wymaganecewka rzeczywistadane pomiarowe
Rysunek 6.3: Porównanie kształtów cewki rzeczywistej i optymalnej (n × m =640×1000) (a) oraz odpowiadający im rozkład pola magnetycznego na osi układuwspółrzędnych (b).
Rozdział 7
Podsumowanie
W dysertacji dokonano analizy problemu syntezy pola magnetycznego wewnątrzcewki powietrznej. Dokonano analizy problemu w dwóch przypadkach. W pierw-szym przypadku kształtowanie pola magnetycznego odbywało się za pomocązmiany rozkładu prądów w pojedynczych cewkach uzwojenia o ustalonym po-łożeniu. Taki przypadek nazwano przypadkiem liniowym. W drugim przypad-ku analizowano problem kształtowania pola magnetycznego za pomocą zmianykształtu uzwojenia cewki zakładając stałą gęstość prądu w uzwojeniu. Przypa-dek ten nazwano nieliniowym. Problem syntezy pola przedstawiono jako problemoptymalizacyjny. Zdefiniowano funkcję celu, którą następnie poddano optymali-zacji. Przedstawiono porównanie wielu metod optymalizacyjnych. Na podstawieuzyskanych wyników wyciągnięto następujące wnioski:
X Rozwiązanie problemu najmniejszych kwadratów bez ograniczeń dla kształ-towania pola w cewce jest stabilne numerycznie dla wymiaru n ¬ 50. Wprzypadku gdy wymiar jest większy rozwiązania są niesymetryczne, orazwartości prądów rosną do bardzo dużych wartości. Szczególną własnościąrozwiązań jest istnienie prądów o dużych wartościach płynących w przeciw-nych kierunkach.
X W celu “ustabilizowania” rozwiązania problemu liniowego oraz spełnieniawymagań praktycznych należy nałożyć na rozwiązanie ograniczenia. Jed-ną z możliwości jest zastosowanie metody regularyzacji Tichonowa z takdobraną wartością parametru regularyzacji, aby wymusić jednolity kieru-nek przepływu prądu w uzwojeniach. Wykorzystując metodę regularyzacjiotrzymujemy gładkie i stabilne rozwiązania. Alternatywnym rozwiązaniemjest zastosowanie nieujemnej metody najmniejszych kwadratów, która po-zwala otrzymać rozwiązania stabilne nawet dla bardzo dużych wymiarówproblemu. Wykorzystany algorytm Lawsona i Hansona oparty na metodziezbiorów aktywnych jest algorytmem bardzo skutecznym. Uzyskane rozwią-
125
126 ROZDZIAŁ 7. PODSUMOWANIE
zania wskazują, że najlepsze efekty kształtowania pola magnetycznego wcewce osiąga się, gdy wykorzystuje się tylko kilka odpowiednio zlokalizowa-nych pojedynczych uzwojeń. Dzięki wykorzystaniu algorytmu programowa-nia kwadratowego z ograniczeniami kostkowymi możemy, oprócz gwaran-cji otrzymania jednakowego kierunku przepływu prądu, ograniczyć mak-symalną wartość prądu. Wykorzystana metoda zbiorów aktywnych, dziękiniewielkiemu wymiarowi zbioru pasywnego pozwala na rozwiązanie proble-mów wysokowymiarowych,
X Stworzony toolbox w środowisku Matlab R⃝ umożliwia szybką analizę pro-blemów kształtowania pola magnetycznego. Mimo, że w pracy położononacisk na otrzymywanie pola jednorodnego, stworzone narzędzie umożliwiawyznaczanie rozkładu prądów dla dowolnego rozkładu pola magnetycznegow zadanym obszarze.
X Metody niedeterministyczne oparte na stochastycznym przeszukiwaniu prze-strzeni potencjalnych rozwiązań nie prowadzą do zadowalających rozwią-zań problemów syntezy pola magnetycznego, szczególnie dla problemów owiększym wymiarze. Wymagają one dużego nakładu obliczeń i mimo to niepozwalają otrzymać rezultatów podobnych do wyników otrzymanych meto-dami programowania kwadratowego czy nieujemnej metody najmniejszychkwadratów.
X Rozwiązanie problemu kształtowania pola magnetycznego za pomocą zmia-ny kształtu uzwojenia przy ustalonej gęstości prądu w uzwojeniu jest du-żo bardziej złożone obliczeniowo. Wynika to z faktu nieliniowej zależnościpomiędzy położeniem przewodu a wygenerowanym przez nie polem ma-gnetycznym. Zaproponowana funkcja celu, dzięki gładkości pozwala wyko-rzystać metody gradientowe. Metoda quasi-Newtona okazała się metodąnajbardziej skuteczną.
X Kształtowanie pola magnetycznego na osi z cewki jest zadaniem prost-szym, ze względu na wyprowadzone zależności analityczne. Gdy pole mabyć kształtowane poza osią, należy wyliczać numerycznie całki powierzch-niowe, w których funkcja podcałkowa zawiera całki eliptyczne pierwszego idrugiego rodzaju. Fakt ten powoduje, że do rozwiązania problemu optyma-lizacji wymagana jest znacznie większa moc obliczeniowa.
X Zaproponowana metoda iteracyjnego podwajania wymiaru pozwala w znacz-ny sposób skrócić czas obliczeń i otrzymać lepsze wyniki, tzn. obarczonemniejszymi błędami.
X Metoda aktywnych zbiorów zarówno dla problemów liniowych i nieliniowychprowadzi w praktyce do redukcji wymiaru problemu, co w konsekwencjiznacznie przyspiesza czas obliczeń.
127
X Zastosowane metody dają znacznie lepsze wyniki niż metoda hybrydowałącząca algorytmy ewolucyjne oraz metodę elementów skończonych. Zosta-ło to wykazane przez porównanie wyników otrzymanych dla cewki rzeczy-wistej zaprojektowanej metodą hybrydową oraz wyników otrzymanych zapomocą metody quasi-Newtona. Należy podkreślić, że algorytmy rozważanew niniejszej pracy mogą być stosowane wyłącznie w przypadku środowiskmagnetycznie liniowych, natomiast użycie metody elementów skończonychpozwala na kształtowanie pola w dowolnych środowiskach.
W ramach prac badawczych związanych z powstaniem niniejszej dysertacjiautor zrealizował następujące zadania:
X Zdefiniował funkcje celu dla problemu liniowego i nieliniowego. W ten spo-sób przedstawił problem syntezy pola magnetycznego jako problem opty-malizacyjny.
X Zdefiniował wielkości, które pozwalają na ocenę uzyskanych rozwiązań zpraktycznego punktu widzenia.
X Przeanalizował możliwości rozwiązania problemów syntezy pola magnetycz-nego zarówno dla zadanych pól jednorodnych jak i niejednorodnych.
X Zaimplementował i przeanalizował wiele metod optymalizacji zarówno de-terministycznych jak i stochastycznych oraz wskazał najlepiej działającemetody. Analiza działania tych metod dokonana była na kilkuset przykła-dach.
X Przeprowadził analizę możliwości metody krzywej L wyboru parametru re-gularyzacji w metodzie regularyzacji Tichonowa i wykazał, że metoda tanie daje zadowalających rezultatów dla rozważanych problemów. Zapropo-nował własną metodę doboru parametru regularyzacji i pokazał na przy-kładach jej skuteczność.
X Zaproponował metodę iteracyjnego podwajania wymiaru, co pozwoliło naprzyspieszenie obliczeń w przypadku optymalizacji kształtu cewki.
X Skonstruował cewkę według własnego projektu. Dokonał pomiarów polamagnetycznego i porównał z wynikami otrzymanymi za pomocą metod uży-tych w niniejszej pracy.
X Dokonał przeglądu literatury.
Na podstawie powyższych wniosków autor stwierdza, że postawiony cel pracyzostał spełniony. Porównano wiele metod obliczeniowych. Porównano je zarównoze względu na jakość rozwiązania jak i złożoność obliczeniową. Postawiona tezapracy została pozytywnie zweryfikowana. Wykazano, że metody programowania
128 ROZDZIAŁ 7. PODSUMOWANIE
kwadratowego z ograniczeniami kostkowymi dla problemu liniowego oraz metodaquasi-Newtona dla problemu optymalizacji kształtu cewki znacznie przewyższająinne metody deterministyczne oraz metody stochastyczne, często stosowane dorozwiązania problemów syntezy pola magnetycznego.
Bibliografia
[1] K. Adamiak. Method of the magnetic field sythesis on the axis of cilinder coil. J.of Applied Physics, 16:pp.417–423, 1978.
[2] M. Adler. Sparse Least Squares Problems with Box Constraints. PhD thesis, Linko-pings Univeristet, 1988.
[3] P. L. De Angelis, P. M. Pardalos, and G. Toraldo. Quadratic programming with boxconstraints. In I. M. Bomze, editor, Developments in Global optimization, pages str.73–93. Kluwer Academic Publishers, 1997.
[4] J. Arabas. Wykłady z algorytmów ewolucyjnych. WNT, Warszawa, 2001.
[5] D. Atherton. Optimum shapes of superconducting solenoids. J. of Applied Physics,40(5):str. 2246–2247, 1969.
[6] J. R. Baker. An improved tree-coil system for producing a uniform magnetic field.J. Sci. Instrum., 27(2):str. 197–208, 1950.
[7] M. H. Van Benthem and M. R. Keenan. Fast algorithm for the solution of large-scale non-negativity-constrained least squares problems. Journal of Chemometrics,18(10):str. 441–450, 2004.
[8] M. Bierlaire, Ph.L. Toint, and D. Tuyttens. On iterative algorithms for linear leastsquares problems with bound constraints, 1995.
[9] S. Bolkowski, M. Stabrowski, J. Skoczylas, J. Sikora, J. Sikora, and S. Wincenciak.Komputerowe metody analizy pola elektromagnetycznego. WNT, Warszawa, 1993.
[10] R. Bro and S. De Jong. A fast non-negativity-constrained least squares algorithm.Journal of Chemometrics, 11(5):str. 393—-401, 1997.
[11] C. G. Broyden. The convergence of a class of double-rank minimization algorithms.Journal Inst. Math. Applic., 6:str. 76–90, 1970.
[12] P. H. Calamai and J. J. More. Projected gradient methods for linearly constrainedproblems. Mathematical Programming, 1(39):str. 93–116, 1987.
[13] D. Chen and R. Plemmons. Nonnegativity constraints in numerical analysis. In TheBirth of Numerical Analysis, World Scientic Press, pages str. 109–140, 2009.
129
130 BIBLIOGRAFIA
[14] A. Cieśla and B. Garda. Analysis of the force acting on the matrix of a super-conducting filter in high magnetic field. Studies in Applied Electromagnetics andMechanics, 22:str. 369—-372, 2001.
[15] A. Cieśla and B. Garda. Shaping of magnetic field distribution in a high gradientmagnetic filter. Archives of Electrical Engineering, LI(4):str. 403–415, 2002.
[16] T. F. Coleman and Y. Li. An interior, trust region approach for nonlinear minimi-zation subject to bounds. SIAM J. Optimization, 6(1):str. 418–445, 1996.
[17] D. de Klerk. The Construction of High-field Electromagnets. Newport Instruments,1965.
[18] D. den Hertog. Interior point approach to linear, quadratic, and convex programming: algorithms and complexity. Kluwer Academic Publishers, 1994.
[19] W. Findeisen, J. Szymanowski, and A. Wierzbicki. Teoria i metody obliczenioweoptymalizacji. PWN, Warszawa, 1980.
[20] B. J. Fisher, N. Dillon, T. A. Carpenter, and L. D. Hall. Design of a biplanargradient coil using a genetic algorithm. Magnetic Resonance Imaging, 15(3):str.369–376, 1997.
[21] R. Fletcher and M.J.D. Powell. A rapidly convergent descent method for minimiza-tion,. Computer Journal, 6:str. 163–168, 1963.
[22] L. J. Fogel. Autonomous automata. Industrial Research, 4, 1962.
[23] L.K. Forbes, M. Brideson, and S. Crozier. Novel target-field method for designingshielded biplanar shim and gradient coils. IEEE Trans. on Magnetics, 40(4):str.1929–1938, 2005.
[24] L.K. Forbes and S. Crozier. A target-field method to design circular biplanar coilsfor asymmetric shim and gradient fields. IEEE Trans. on Magnetics, 41(6):str.2134–2144, 2005.
[25] Z. Galias and B. Garda. Comparison of the linear algebra approach and the evo-lutionary computing for magnetic field shaping in linear coils. In Proceedings ofInternational Symposium on Nonlinear Theory and its Applications, NOLTA, pagesstr. 508—-511, 2010.
[26] Z. Galias and B. Garda. Non-negative least squares and the tikhonov regularizationmethods for coil design problems. In Proceedings of International Conference onSignals and Electronic Systems, ICSES, 2012.
[27] Z. Galias and B. Garda. Tichonov regularization and constrained quadratic pro-gramming for magnetic coil design problems. International Journal of Applied Ma-thematics and Computer Science (AMCS), 2013. praca zaakceptowana do druku.
[28] B. Garda. Construction of magnets exciting homogeneous magnetic field using evo-lution algorithm. In Proceedings of XXVIII Międzynarodowa Konferencja z Podstawelektrotechniki i teorii obwodów SPETO, Ustroń, Polska, pages str. 55—-58, 2005.
BIBLIOGRAFIA 131
[29] B. Garda. Linear algebra approach and the quasi-newton algorithm for the optimalcoil design problem. Przegląd Elektrotechniczny, 7a:str. 261–264, 2012.
[30] B. Garda and P. Schmidt. Constructing of magnets exciting the specific field di-stribution. evolutionary computation application and its practical verification. InProceedings of the 12th IGTE Symposium on Numerical Field Calculation in Elec-trical Engineering, Graz, Austria, pages str. 218—-223, 2006.
[31] M. W. Garret. Thick cylindrical coil systems for strong magnetic fields with fieldgradient homogeneities of the 6th to 20th order. J. of Applied Physics, 38(6):str.2563–2586, 1967.
[32] S. I. Gass. Programowanie liniowe. Metody i zastosowania. Państwowe wydawnictwonaukowe, 1973.
[33] M. J. E. Golay. Field homogenizing coils for nuclear spin resonance instrumentation.Rev. Sci. Instrum., 29(3):str. 313–321, 1958.
[34] M. J. Goldsmith. Sequental Quadratic Programming Methods Based on IndefniteHessian Approximations. Stanford Univeristy, 1999.
[35] C. W. Groetsch. The Theory of Tikhonov Regularization for Fredholm Equations ofthe First Kind. Longman Sc Tech, Boston, 1984.
[36] R. Grzymkowski, K. Kaczmarek, S. Kiełtyka, and I. Nowak. Wybrane algorytmyoptymalizacji. Algorytmy Genetyczne. Algorytmy mrówkowe, volume 6 of Wykła-dy z Modelowania Matematycznego. Wydawnictwo Pracowni Komputerowej JackaSalmierskiego, Gliwice, 2008.
[37] T. D. Gwiazda. Algorytmy Genetyczne Kompendium – Operator krzyżowania dlaproblemów numerycznych, volume I. Wydawnictwa Naukowe PWN, 2007.
[38] T. D. Gwiazda. Algorytmy Genetyczne Kompendium – Operator mutacji dla pro-blemów numerycznych, volume II. Wydawnictwa Naukowe PWN, 2007.
[39] J. Hadamard. Lectures on Cauchy’s Problem in Linear Partial Differential Equ-ations. Yale University Press, New Haven, 1923.
[40] P. Ch. Hansen. Regularization tools: A matlab package for analysis and solution ofdiscrete ill-posed problems. Journal of Numerical Algorithms, 6(1):str. 1–35, 1994.
[41] Xu. Hao, S. M. Conolly, G. C. Scott, and A. Macovski. Homogeneous magnet designusing linear programming. IEEE Trans. on Magnetics, 36(2):str. 476–483, 2000.
[42] N. J. Higham. Accuracy and Stability of Numerical Algorythms. Society for Indu-strial and Applied Mathematics, Philadelphia, PA, USA, 1966.
[43] J. H. Holland. Outline for a logical theory of adaptive systems. Journal of Assocfor Computing Machinery, 1962.
[44] PDE Solutions Inc. http://www.pdesolutions.com/.
[45] A. Jeffrey and D. Zwillinger. Table of Integrals, Series, and Products. AcademicPress, 6th edition, 2000.
132 BIBLIOGRAFIA
[46] J. Jin. Electromagnetuc Analysis and Design in Magnet Resonance Imaging. CRCPress LCC, 1999.
[47] A. Kiełbasiński and H. Schwetlick. Numeryczna algebra liniowa. WydawnictwaNaukowo-Techniczne, 1992.
[48] D. Kim, S. Sra, and I. S. Dhillon. A new projected quasi-newton approach for solvingthe nonnegative least-squares problem. Tech-Report TR-06-54, Computer Sciences,The Univ. of Texas at Austin, 2007.
[49] D. Kim, S. Sra, and I. S. Dhillon. Fast newton-type methods for the least squaresnonnegative matrix approximation problem. Statistical Analysis and Data Mining,pages str. 38–51, 2008.
[50] W. Kitagawa, Y. Ishihara, T. Todaka, and K. Hirata. Optimization technique ofmodified genetic algorithm using finite element methods. In Proceedings of 13thConference on Computattion of Electromagnetic Fields, Evian, France, pages str.III 26–27, 2001.
[51] P. Kowalczyk, L. Solarz, A. P. Terzyk, P. A. Gauden, and V. M. Gun’Ko. Solvingthe unstable linear fredholm integral equation of the first kind by means of a newstochastic algorithm. Scheda Informaticae (Zeszyty naukowe UJ. Prace Informa-tyczne), 11, 2002.
[52] H. W. Kuhn and A. W. Tucker. Nonlinear programming. Proc. Second BerkeleySymp. on Math. Statist. and Prob. Univ. of Calif. Press,, pages str. 481–492, 1951.
[53] E. Kurgan. Analiza pola magnetostatycznego w środowisku niejednorodnym meto-dą elementów brzegowych. Uczelniane wydawnictwa naukowo-dydaktyczne, AGH,Kraków, 1999.
[54] C.L. Lawson and R.J. Hanson. Solving least squares problems. Prentice-Hall seriesin automatic computation. Prentice-Hall, 1987.
[55] J. P. B. Leite and B. H. V. Topping. Improved genetic operators for structuralengineering optimization. Advances in Engineering Sofware, 29(7–9):str. 529–562,1998.
[56] P. J. Leonard and A. M. Connor. Pole shape optimization using a tabu searchscheme. Magnetic Resonance in Medicine, 36(4):str. 1115–1118, 2000.
[57] H. S. López, C.G . Salmon, C. C. Mirabal, and H. Saint-Jalmes. Designing an effi-cient resistive magnet for magnetic resonance imaging. IEEE Trans. on Magnetics,40(5):str. 3378–3381, 2004.
[58] D. Marquardt. An algorithm for least-squares estimation of nonlinear parameters.SIAM J. Appl. Math., 11:str. 431–441, 1963.
[59] D. B. Montgomery. Solenoid Magnet Design: the magnetic and mechanical aspectsof resistive and superconducting systems. John Wiley and Sons, New York, 1969.
[60] J. J. More. Recent developments in algorithms and software for trust region methods.Mathematical Programming The State of the Art, pages str. 258–287, 1983.
BIBLIOGRAFIA 133
[61] J. J. More and G. Toraldo. Algorithms for bound constrained quadratic programmingproblems, volume 55 of Numerische Mathematik. Springer-Verlag, 1989. str. 377–400.
[62] P. N. Morgan, , S. M. Conolly, G. C. Scott, and A. Macovski. Resistive homogeneousmri magnet design by matrix subset selection. Magnetic Resonance in Medicine,41:str. 1221–1229, 1999.
[63] V.A. Morozov. Methods for Solving Incorrectly Posed Problems. Springer, Berlin,1984.
[64] W. Murray and F. J. Prieto. A sequental quadratic programming algorithms useingan incomplete solution of the subproblem. SIAM J. Optimization, 5(3):str. 590–640,1995.
[65] J. A. Nelder and R. Mead. A simplex method for function minimization. ComputerJournal, 7(4):str. 308–313, 1965.
[66] T. Ohara and K. Kaihoand T. Kiyoshi. Optimization of a superconducting solenoidfor high gradient magnetic separation systems. IEEE Trans. on Magnetics, 32(5):str.5103–5105, 1996.
[67] R. Pałka. Synteza i Identyfikacja Pewnych Przypadków Pól Stacjonarnych w Oparciuo Metodę Regularyzacji, volume 135. Prace Instytutu Elektrotechniki PolitechnikiSzczecińskiej, 1985.
[68] I. Rechengerg. Evolutionsstrategie: Optimierung technischer Systeme nach Prinzi-plien der bilogischen Evolution. Frommann-Holzoog Verlag, Stuttgart, 1973.
[69] T. Schild, G. Aubert, C. Berriaud, P. Bredy, F. P. Juster, C. Meuris, F. Nunio,L. Quettier, J. M. Rey, and P. Vedrine. The iseult/inumac whole body 11.7 t mrimagnet design. IEEE Trans. on Applied Superconductivity, 18(2):str. 904–907, 2008.
[70] H. P. Schwefel. Evolutionsstrategie und numerische Optimerung. PhD thesis, Tech-nische Universitat Berlin, Berlin, 1975.
[71] N. R. Shaw and R. E. Ansorge. Genetic algorithms for mri magnet design. IEEETrans. on Applied Superconductivity, 12(1):str. 733–736, 2002.
[72] G. Shou, L. Xia, F. Liu, M. Zhu, Y. Li, and S. Crozier. Mri coil design usingboundary-element method with regularization technique: A numerical calculationstudy. IEEE Trans. on Magnetics, 46(4):str. 1052–1059, 2010.
[73] L. Shure. Brief history of nonnegative least squares in matlab.http://blogs.mathworks.com/loren/2006/, Grudzień 2006. blog.
[74] R. Sikora, P. Krasoń, and M. Gramz. Magnetic field synthesis at the plane perpen-dicular to the axis of a solenoid. Archiv f”r Elektrotechnik, 62:pp 153–156, 1980.
[75] R. Sikora and R. Pałka. Synthesis of magnetic fields. IEEE Trans. on Magnetics,18(2):str. 385–389, 1982.
[76] A. N. Tichonow and W. J. Arsjenin. Solutions of Ill-posted Problems. Wiley, NewYork, 1977.
134 BIBLIOGRAFIA
[77] L. N. Trefethen and III D. Bau. Numerical Linear Algebra. Society for Industrialand Applied Mathematics, 1997.
[78] C. Voglis and I. E. Lagaris. Boxcqp: An algorithm for bound constrained convexquadratic problems. 1st International Conference ’From scientific Computing toComputational Engineering’, Wrzesień 2004.
[79] Z. L. Wei. Subspace search method for quadratic programming with box constraints.Journal of Computational Mathematics, 17(3):str. 307–314, 1999.
[80] H. Xu, S. M. Conolly, G. C. Scott, and A. Macovski. Fundamental scaling rela-tions for homogeneous magnets. In ISMRM 7th Scientyfic Meeting, page str. 475,Philadelphia, PA, 1999. IC-SCCE.
[81] B. Zhang, C. Gazdzinski, B. A. Chronik, H. Xu, S. M. Conolly, and B. K. Rutt.Simple design guidelines for short mri systems. Concepts in Magnetic ResonancePart B: Magnetic Resonance Engineering, 25B(1):str. 53–59, 2005.
[82] Z. Zhu. An efficient sequential quadratic programming algorithm for nonlinear pro-gramming. Journal of Computational and Applied Mathematics, 1(175):str. 447–464,2005.
Dodatek A
Pole magnetyczne pojedynczego zwojukołowego
W dodatku zostanie wyprowadzone równanie określające wartość wektora indukcji ma-gnetycznej B(r, z) wokół pojedynczego zwoju kołowego o promieniu a przewodzącegoprąd I.
Stały prąd elektryczny wytwarza stałe pole magnetyczne. Pole magnetyczne określanejest za pomocą wektora indukcji magnetycznej B [T]. Pole to spełnia dwa równania:∮
S
B· ds = 0 (Prawo Gaussa), (A.1)
∮C
B· dl = µ0I (Prawo Ampera), (A.2)
gdzie S jest dowolną powierzchnią zamkniętą, ds = ands, an jest jednostkowym wektoremprostopadłym do powierzchni S, C jest dowolnym zamkniętym konturem, dl = atdl atjest wektorem jednostkowym stycznym do konturu C, µ0 = 4π10−7 [H/m] jest przenikal-nością magnetyczną próżni, natomiast I jest całkowitym prądem przepływającym przezpowierzchnię ograniczoną konturem C. Powyższe równania są podstawowymi równania-mi opisującymi zjawiska dotyczące magenetostatyki. Stosując twierdzenie Gaussa orazStokesa odpowiednio do równań (A.1) i (A.2) otrzymamy ich różniczkowy odpowiednik:
∇·B = 0 (Prawo Gaussa), (A.3)
∇×B = µ0J (Prawo Ampera), (A.4)
gdzie J [A/m2] oznacza gęstość prądu elektrycznego. Dla każdego wektora V zachodząnastępujące tożsamości:
∇· (∇×V) = 0 (A.5)
∇×∇×V = ∇∇·V−∇2V (A.6)
135
136 DODATEK A. POLE MAGNETYCZNE ZWOJU KOŁOWEGO
Obliczając dywergencję równania (A.4) oraz stosując tożsamość (A.5) otrzymamy rów-nanie ciągłości prądu:
∇·J = 0 (A.7)
Natomiast korzystając z zależności (A.5) i (A.3) możemy wprowadzić wektor A zwanypotencjałem magnetycznym:
B = ∇×A. (A.8)
Równanie (A.3) możemy zapisać jako:
∇×∇×A = µ0J (A.9)
które z wykorzystaniem zależność wektorowej (A.6), zapiszemy w postaci:
∇∇·A−∇2A = µ0J (A.10)
Twierdzenie Helmholtza mówi, że dowolne ciągłe pole wektorowe (F ) zanikające w nie-skończoności można przedstawić - i to w jeden tylko sposób - w postaci sumy gradientupewnej funkcji skalarnej φ i rotacji pewnej funkcji wektorowej A, której dywergencja jestrówna zero. Fakt zerowej dywergencji pozwala nam założyć, że
∇·A = 0 (A.11)
Wówczas równanie (A.10) przybierze postać równania Poissona:
∇2A = −µ0J (A.12)
Rozwiązanie powyższego równania daje nam możliwość wyznaczenia funkcji potencjałuwektorowego, i później wektorowej funkcji pola magnetycznego. Równanie (A.12) posiadaogólne rozwiązanie w postaci:
A(r) =µ04π
∫∫∫V
J(r′)Rdv′ (A.13)
gdzie R = |r − r′|, natomiast r jest wektorem wodzącym określającym położenie wktórym wyznaczamy wartość potencjału wektorowego A z powodu prądu w punkcie r′.Całkowanie odbywa się po całej objętości V , w której płynie prąd o gęstości J.Ponieważ często mamy do czynienia z przewodami przewodzącymi prąd I, zakładamy,
że zamiast gęstości prądów analizowali będziemy elementy prądu I dl rozmieszczonerównomiernie na konturze C. Wówczas rozwiązanie ogólne (A.13) można przedstawić wpostaci:
A =µ0I
4π
∫C
dl′
R. (A.14)
Korzystając z zależności (A.14) zostanie wyprowadzona zależność na potencjał wektoro-wy A(r, z) od pojedynczego zwoju z prądem I, następnie zostanie obliczone pole magne-tyczne B jako rotacja otrzymanego wektora A, zgodnie z zależnością (A.8).Załóżmy, że wspomniany zwój o promieniu a ma oś symetrii ułożoną na osi z układu
współrzędnych i jest usytuowany równolegle do płaszczyzny x, y, w odległości h od osix. Sytuacja taka została przedstawiona na rys. A.1. Zostanie wyprowadzona zależnośćokreślająca wektor A w punkcie P znajdującym się na płaszczyźnie xz o współrzędnych
137
x
y
z
R=|r-r'|
P(r,0,z)
a hdl
a
I
r
r'
Rysunek A.1: Pojedynczy zwój z prądem
(r, 0, z). Jeśli φ jest kątem pomiędzy osią x a rzutem wybranego punku zwoju na płaszczy-znę x, y, wówczas współrzędne punktu wynoszą (a cosφ, a sinφ, h). Odległość pomiędzypunktem P a wybranym punktem zwoju wynosi:
R =√(r − a cosφ)2 + a2 sin2 φ+ (z − h)2
=√r2 − 2ar cosφ+ a2 cos2 φ+ a2 sin2 φ+ (z − h)2 (A.15)
=√r2 + a2 + (z − h)2 − 2ar cosφ
Ponieważ dl = −a sinφdφax + a cosφdφay, z zależności (A.14) otrzymujemy:
A =µ0I
4π
[∫ 2π0
−a sinφdφ√r2 + a2 + (z − h)2 − 2ar cosφ
ax+
∫ 2π0
a cosφdφ√r2 + a2 + (z − h)2 − 2ar cosφ
ay
]. (A.16)
Z symetrii problemu wynika, że pierwszy człon w równaniu (A.16) równy jest zeru,oraz że składnik wektora A w kierunku y może zostać wyznaczony przez obliczenie całkiw granicach od 0 do π i pomnożenie wyniku przez dwa. Przechodząc do współrzędnychcylindrycznych równanie (A.16) przybierze następującą postać
A =µ0Ia
2π
∫ π0
cosφdφ√r2 + a2 + (z − h)2 − 2ar cosφ
aφ. (A.17)
138 DODATEK A. POLE MAGNETYCZNE ZWOJU KOŁOWEGO
Mianownik w równaniu (A.17) może zostać napisany w następującej postaci:√(r + a)2 + (z − h)2 − 2ar(1 + cosφ) =√(r + a)2 + (z − h)2 − 4ar(1 + cosφ
2). (A.18)
Jeśli wprowadzimy nową zmienną α = (π − φ)/2, wówczas cosφ = − cos 2α. Ponieważcos 2α = 1 − 2 sin2 α,
( 1+cosφ2
)= sin2 α. Wyłączając czynnik (r + a)2 + (z − h)2 w
równaniu (A.18) otrzymamy√(r + a)2 + (z − h)2
√1− k2 sin2 α.
gdzie:
k =
√4ar
(r + a)2 + (z − h)2(A.19)
Mianownik można zatem napisać w postaci 2√ark
√1− k2 sin2 α. Natomiast licznik we-
wnątrz całki w równaniu (A.17) może zostać przedstawiony jako −(1 − 2 sin2 α). Wy-korzystując dodatkowo fakt, że dφ = −2dα i zmieniając granice całkowania równanie(A.17) przyjmie postać:
A =µ0Ia
2π
∫ 0π2
2(1− 2 sin2 α)dα2√ark
√1− k2 sin2 α
aφ =
µ0Ik
2π
√a
r
[∫ π2
0
−dα√1− k2 sin2 α
+∫ π
2
0
2 sin2 αdα√1− k2 sin2 α
]aφ. (A.20)
Pierwszy człon równania (A.20) jest całką eliptyczną pierwszego rodzaju K(k). Nato-miast dokonując przekształcenia:
sin2 α√1− k2 sin2 α
=1k2
(1√
1− k2 sin2 α−√1− k2 sin2 α
)
drugi człon w równaniu (A.20) można zapisać w postaci
2k2
[∫ π2
0
dα√1− k2 sin2 α
−∫ π
2
0
√1− k2 sin2 αdα
]=2k2(K(k)− E(k))
gdzie E(k) jest całką eliptyczną drugiego rodzaju. Ogólne równanie na potencjał wekto-rowy w punkcie P (r, 0, z) ma zatem postać
A =µ0Ia
2π
√a
r
[(2k− k)K(k)− 2
kE(k)
]aφ. (A.21)
W celu wyznaczenia wektora indukcji pola magnetycznego B należy skorzystać z zależ-ności (A.8). Dla dowolnego wektora V = vrar + vφaφ + vzaz w cylindrycznym układziewspółrzędnych rotacja wynosi
∇×V =(1r
∂vz∂φ− ∂vφ∂z
)ar +
(∂vr∂z− ∂vz∂r
)aφ +
1r
(∂rvφ∂r− ∂vr∂φ
)az
139
Ponieważ wektorA posiada tylko składową φ, to wektorB będzie zawierał tylko składower i z.
∇×A = −∂A∂zar +
1r
∂rA
∂raz. (A.22)
Obliczmy pochodne cząstkowe występujące w równaniu (A.22). Z równania (A.19) wy-nika, że
∂k
∂z=12
√(r + a)2 + (z − h)2
4ar· −8ar(z − h)((r + a)2 + (z − h)2)2
= − 4ar(z − h)2
((r + a)2 + (z − h)2)2 k= − k(z − h)(r + a)2 + (z − h)2
= −k3(z − h)4ar
(A.23)
oraz
∂k
∂r=12
√(r + a)2 + (z − h)2
4ar·4a((r + a)2 + (z − h)2
)− 8ar(z − h)
((r + a)2 + (z − h)2)2
=2a
((r + a)2 + (z − h)2)2 k− 4ar(r + a)
((r + a)2 + (z − h)2)2 k(A.24)
=2ak4ar− k(r + a)(r + a)2 + (z − h)2
=k
2r− k
3(r + a)4ar
.
Pochodne całek eliptycznych pierwszego i drugiego rodzaju są równe [45]:
dK(k)dk
=E(k)k(1− k2)
− K(k)k
dE(k)dk
=E(k)k− K(k)k
(A.25)
Ze wzorów (A.23), (A.24), (A.25) wynika, że:
−∂A∂z= −µ0I2π
√a
r×[(
− 2k2− 1)∂k
∂zK(k) +
(2k− k)dK(k)dk∂k
∂z+2k2∂k
∂zE(k)− 2
k
dE(k)dk∂k
∂z
]=
= −µ0I2π
√a
r
[(2k2+ 1)k3(z − h)4ar
K(k)− 2k(z − h)4ar
E(k)−(E(k)k+K(k)k
)2k2(z − h)4ar
]=
−µ0Ik(z − h)4π√ar3
[K(k)− 2− k2
2(1− k2)E(k)
].(A.26)
Korzystając ze wzorów (A.24), (A.25) otrzymamy:
1r
∂rA
∂r=µ0Ia
4π√ar3
[(2k− k)− 2k
]+µ0I√ar
2π
[(− 2k2− 1)∂k
∂rK(k)+(
2k− k)dK(k)dk∂k
∂r+2k2∂k
∂rE(k)− 2
k
dE(k)dk∂k
∂r
]= (A.27)
=µ0Ikr
4π√ar3
[K(k)− k
2(r + a)− 2r2r(1− k2)
E(k)].
140 DODATEK A. POLE MAGNETYCZNE ZWOJU KOŁOWEGO
Rysunek A.2: Pojedynczy zwój cewki w którym płynie prąd Ii usytuowany wpunkcie (ri, zi) wytwarzający pole magnetyczne Bj w punkcie (rj , zj)
Ostatecznie podstawiając do (A.22) wyrażenia (A.26) oraz (A.27) otrzymujemy
B(r, z) =µ0Ik
4π√ar3
[−(z − h)
(K(k)− 2− k2
2(1− k2)E(k)
)ar+
r
(K(k) +
k2(r + a)− 2r2r(1− k2)
E(k))az
]. (A.28)
Na rys. (A.2) przedstawiono pojedynczy zwój wytwarzający pole magnetyczne. Rów-nanie (A.28) można napisać w postaci
Bj(r, z) =µ0Ii
2π√(ri + rj)2 + (zj − zi)2
[(zi − zj)rj(
K(k)−r2i + r
2j + (zj − zi)2
(ri − rj)2 + (zi − zj)2E(k)
)ar +
(K(k) +
r2i − r2j − (zj − zi)2
(ri − rj)2 + (zi − zj)2E(k)
)az
].
(A.29)
gdzie
k =
√4rirj
(ri + rj)2 + (zi − zj)2
Z równania (A.29) widać, że wartość pola magnetycznego od pojedynczego zwoju zprądem zależy liniowo od wartości prądu oraz nieliniowo od położenia punktu, w którymwyznaczamy pole względem rozważanego zwoju.W pewnych szczególnych przypadkach ogólna zależność opisująca pole magnetycz-
ne od pojedynczego zwoju znacznie się upraszcza. W szczególności gdy obliczamy polemagnetyczne na osi z (tzn. r = 0), to równanie (A.29) upraszcza się do postaci:
B(0, z) =µ0Ia
2
2(a2 + (z − h)2) 32az. (A.30)
Warto zauważyć brak składowej wektora pola magnetycznego w kierunku osi r. Zależność(A.30) można łatwo wyznaczyć stosując bezpośrednio prawo Biota-Savarta.