Intelligens rendszerfelügyelet

51
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Intelligens rendszerfelügyelet Kocsis Imre, Micskei Zoltán, Tóth Dániel Intelligens rendszerfelügyelet

description

Intelligens rendszerfelügyelet. Intelligens rendszerfelügyelet. Kocsis Imre, Micskei Zoltán, Tóth Dániel. Tartalom. Ipari és akadémiai kezdeményezések IBM Autonomic Computing , Microsoft DSI Modellvezérelt tervezés és felügyelet Diagnosztika Rekonfiguráció Merre tovább?. - PowerPoint PPT Presentation

Transcript of Intelligens rendszerfelügyelet

Page 1: Intelligens rendszerfelügyelet

Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék

Intelligens rendszerfelügyelet

Kocsis Imre, Micskei Zoltán, Tóth Dániel

Intelligens rendszerfelügyelet

Page 2: Intelligens rendszerfelügyelet

Tartalom

Ipari és akadémiai kezdeményezéseko IBM Autonomic Computing, Microsoft DSI

Modellvezérelt tervezés és felügyeleto Diagnosztikao Rekonfiguráció

Merre tovább?

Page 3: Intelligens rendszerfelügyelet

IBM Autonomic Computing IBM Research kezdeményezés 2001-ből

(vision for the future, grand challenge)

Minta: autonóm idegrendszer

„A computing environment with the ability to manage itself and dynamically adapt to change in accordance with business policies and objectives.”

Page 4: Intelligens rendszerfelügyelet

Self-managing rendszer Self-configure: To adapt to dynamically changing

environments. Self-heal: To discover, diagnose, and act to prevent

disruptions. Self-optimize: To tune resources and balance

workloads to maximize the use of information technology resources.

Self-protect: To anticipate, detect, identify, and protect against threats.

Page 5: Intelligens rendszerfelügyelet

Autonomic Manager

Page 6: Intelligens rendszerfelügyelet

A vízió aprópénzre váltása AC jellegű funkciók beépítése termékekbe Autonomic Computing Toolkit

o Solution installation and deployment technologieso Problem determinationo Provisioning and orchestrationo Policy-based managemento…

Folyamatosan változó, fejlődő technológiákoWeb Services Distributed Management (WSDM), Build

to Manage Toolkit, SDD, Eclipse COSMOS…

Page 7: Intelligens rendszerfelügyelet

Példa: Tivoli Intelligent Orchestrator

Page 8: Intelligens rendszerfelügyelet

MS Dynamic Systems Initiative (DSI) ~2003: bejelentés, sajtóközlemény…

~2005:o Üzemeltetésre készített

szoftvero Visual Studio támogatáso SDM modellezési nyelv

Page 9: Intelligens rendszerfelügyelet

MS Dynamic Systems Initiative (DSI) ~2006:

o Tudás, modell beépítése a Management Packekbeo Vitualizáció megjelento SDM -> SML

Page 10: Intelligens rendszerfelügyelet

Service Modeling Language Service Modeling Language, Version 1.1

oW3C Proposed Recommendation 12 February 2009o http://www.w3.org/TR/sml/

Models represent a powerful mechanism for validating changes before applying the changes to a service/system.

The actual service/system and its model together enable a self-healing service/system ― the ultimate objective.

Page 11: Intelligens rendszerfelügyelet

Common Model Library 2008: Ipari összefogás

(11 partner cég) SML-re épül Sajtóközlemény,

white paper, szép ábra De: ma már a

weboldal se él

Page 12: Intelligens rendszerfelügyelet

MS Dynamic Systems Initiative (DSI) ~2009:

o ???

Ami megy tovább:o Design for Operations, Knowledge Driven Mgmgt,

Virtualized Infrastructure Példa:

o PRO – Performance and Resource Optimizationo Virtuális gép átmozgatása a monitorozó rendszer

mérése alapján

Page 13: Intelligens rendszerfelügyelet

Tartalom

Ipari és akadémiai kezdeményezéseko IBM Autonomic Computing, Microsoft DSI

Modellvezérelt tervezés és felügyeleto Rekonfigurációo Diagnosztika

Merre tovább?

Page 14: Intelligens rendszerfelügyelet

Modellvezérelt…

CMDB

Valóság Mérnöki/üzemeltetőimodell

Felderítés,követés

Modelltranszformáció

Matematikai,analízis modell

Mi idáig főleg ilyenekkel találkoztunk.

A valóságot viszonylag konkrétan ábrázolja.

Valamilyen vizsgálat elvégzéséhez használt

matematikai reprezentáció. Általában absztrakt.

Pl. gráf, hálózati elérhetőségi vizsgálathoz

Page 15: Intelligens rendszerfelügyelet

Statikus architektúrák

CentOSApache

Tomcat DB2HW

elemek

A Rendszer

Ha egyszer végre áll csak akkor nyúlunk hozzá, ha tényleg kell

(akkor is megfontoltan)

Page 16: Intelligens rendszerfelügyelet

Dinamikus architektúrák Fő ösztönző faktor: erőforráshatékonyság

o Kapacitástervezés: szolgáltatásonként „worst case”?o Hibatűrés: szolgáltatásonként dedikált redundancia?o Energiagazdálkodás?

• Hűtés!

Különböző helyzetekben különböző konfigurációk optimálisak. Példák:o Virtuális gépek erőforrás-allokációjao Gépek megosztása fürtök közötto „utility computing” szolgáltatások bevonásao … 1. Strukturális konfiguráció – de mi az a „struktúra”?

2. Parametrikus konfiguráció

Page 17: Intelligens rendszerfelügyelet

Dinamikus architektúrák A szükséges technológiák megvannak

o Virtualizáció (számítási kapacitás, tárhely, hálózat)o Nagysebességű hálózatoko „utility computing”oMenet közben átkonfigurálható terhelésmegosztó

fürtöko Ha már itt tartunk: menet közben átkonfigurálható

kiszolgáló-rendszereko… „Apróbb problémák”:

1. Konfiguráció nem megfelelőségének meghatározása2. Optimális célkonfiguráció meghatározása

3. Újrakonfiguráció folyamatának meghatározása

Page 18: Intelligens rendszerfelügyelet

Rekonfiguráció Aktív reagálás a belső és külső környezeti

változásokraoMeghibásodáso Terhelés változása (QoS vs. energiatakarékosság)o Támadások stb.

Kétféle alapeset:o Parametrikus rekonfigurációo Strukturális rekonfiguráció

Page 19: Intelligens rendszerfelügyelet

Parametrikus Rekonfiguráció Valamilyen skalár érték beállítás megváltoztatása

o Pl. CPU idő allokáció virtuális gépek között Autonóm megoldása: szabályozástechnikai

problémao A szolgáltatásoknak adott QoS értéke, mint célértéko Külső terhelés, mint zavaró bemenő jelo Valamilyen (zűrös) összefüggés az alkalmazásnak allokált

erőforrások mennyisége és a szolgáltatási szint értékek között (rendszer identifikáció)

Page 20: Intelligens rendszerfelügyelet

Parametrikus Rekonfiguráció

Megfigyelés (monitoring)Beavatkozás

Szabályozott rendszer

QoS célérték

Mért QoS érték

Szabályozási döntés

Nehézségek:- Sokféle szabályozható jellemző- Nehezen identifikálható rendszer

Szabályozott rendszermodellje

Page 21: Intelligens rendszerfelügyelet

Strukturális Rekonfiguráció A szolgáltatásban résztvevő erőforrások és

szolgáltató elemek kapcsolatainak átrendezéseo virtuális gépek mozgatása hostok közötto feladat-átvételi fürtök

Autonóm megoldási lehetőségeko Statikus rekonfiguráció: előredefiniált konfigurációs

alapesetek (a fürtök tipikusan ilyenek)o Dinamikus rekonfiguráció: találja ki a gép a

konfigurációt • klasszikus mesterséges intelligencia problémák:

optimalizálás, keresések, játékelmélet

Page 22: Intelligens rendszerfelügyelet

Strukturális Rekonfiguráció Miért kell dinamikus rekonfiguráció?

o A statikus módszerek pazarlóan bánnak az erőforrásokkal (minden duplázott, stb.)

o A statikus módszerek bizonyos hibákkal nem tudnak mit kezdeni

oMegosztott redundancia kívánatos lenne• Mit csinálna a rendszergazda, ha kiesik egy szolgáltatás?• Keresne épen maradt részeket az infrastruktúrában és arra

telepítené a szolgáltatást• Megpróbálná megjavítani az elromlott részeket• Hova tenne redundanciát?• Oda, ahol „el szokott romlani”

Page 23: Intelligens rendszerfelügyelet

Strukturális Rekonfiguráció

Megfigyelés, FelderítésBeavatkozás

Futó konfiguráció

QoS célérték

Mért QoS érték

Keresés

Lehetséges rendszerkonfigurációkmodelljei

CMDBNehézségek:

- Sokkal bonyolultabb modell kell- Egy teljesen más konfiguráció teljesítménye nehezen előrejelezhető- Átkonfigurálási tranziensjelenségek modellezése

What-if analízis,hibadiagnosztika

Page 24: Intelligens rendszerfelügyelet

Az IT menedzsment mint szabályozási probléma

Managed system

System management

Monitoring

Control policy

Workflowexecution

Faults & attacksQoS & dependabilityconstraints

Servicesprovided

Page 25: Intelligens rendszerfelügyelet

Gondolatébresztő: egyszerű kiszolgáló vezérlése

Egyszerű HTTP szolgáltatás Változó terhelés Adott válaszidőt szeretnénk biztosítani…

o… de nem jobbat Beavatkozás: CPU frekvencia állítása

Elég-e valamelyik Linux CPU governor? Elég-e: f(terhelés) frekvencia?

o N.B. általában nem túl sok diszkrét érték van Elővettük a szabályozástechnika könyvet. Ez elég?

Page 26: Intelligens rendszerfelügyelet

Gondolatébresztő: egyszerű kiszolgáló vezérlése

Tfh. A kiszolgálónk M/M/1-ként modellezhetőo Legtöbbször persze nem

Érkezési ráta (Poisson folyamatot feltételezve)

Feldolgozási ráta (exponenciális eloszlást

feltételezve)

1T

Sha, Liu, Lu, Abdelzaher: „Queueing Model Based Network Server Performance Control”, RTSS02, 2002.

Page 27: Intelligens rendszerfelügyelet

Gondolatébresztő: egyszerű kiszolgáló vezérlése

Az egyensúlyi késleltetés kis

paraméterváltozásokra jól(?) linearizálható

Kis perturbációk: visszacsatolt szabályozásNagyok: „feed forward” vezérlés

1T

Page 28: Intelligens rendszerfelügyelet

Gondolatébresztő: egyszerű kiszolgáló vezérlése

Egyszerű szabályozás?o Reflex: P/I/D…o ... amit lehet empirikusan is (Ziegler-Nichols)

paraméterezni,omeg szakasz-modell alapján.

A lehető legegyszerűbb (P):o u(t) = Kp * e(t)o f(t) = Kp * edelay(t)

Page 29: Intelligens rendszerfelügyelet

Gondolatébresztő: egyszerű kiszolgáló vezérlése Szakaszmodell (elsőrendű ARX):

Vezérlés célja:

Ezért:

)1k(c)k(edelay

)1k(e)k(e delaydelay

)n(ec1)n( delay

Az érintő meredeksége

Ez még persze nem a frekvencia.

Figyelem: gyakorlati alkalmazásra nem mindenképp elég finom ez a modell. (pl. csak

egy feldolgozóegység).

Page 30: Intelligens rendszerfelügyelet

IT rendszerek diagnosztikája A szolgáltatási szintű hibákat (failure) tudni kell…

o Detektálnio Az okokat meghatároznio Javításokat eszközölnio Előre jelezni?

Alkalmas eszközök Megfelelő folyamatok Beépített intelligencia?

Page 31: Intelligens rendszerfelügyelet

ITIL folyamatok

Eseményfeldolgozás

IT rendszerek diagnosztikája

Monitorozás

CMDB

Historikus adatgyűjtés

Page 32: Intelligens rendszerfelügyelet

ITIL folyamatok

Eseményfeldolgozás

IT rendszerek diagnosztikája

Monitorozás

CMDB

Historikus adatgyűjtés

Mit mérjünk?Határértékek?

…?

Mit gyűjtsünk? Mit kezdjünk vele?

A támogató folyamatoknak is van „konfigurációja”…

Page 33: Intelligens rendszerfelügyelet

Rendszerszintű diagnosztika Több évtizedes terület

o Repülő eszközök, katonai eszközök, repülő katonai eszközök…o Simpson, Sheppard: System Test and Diagnosis

Alapfogalom: teszto Ütemezetto „active probing”

Diagnosztika stratégiák céljai:o Hibadetektáláso Hibalokalizáláso Hibaizoláláso …optimális javító akció kiválasztása

Page 34: Intelligens rendszerfelügyelet

Rendszerszintű diagnosztika Diagnosztika: a javító akciók granularitásáig

o Klasszikusan: komponens csere / újraindításoModern IT: + parametrikus/strukturális rekonfiguráció

Általánosan jellemző: a diagnosztikai probléma formális kezeléseo Diagnosztikai stratégia megfelelőségének vizsgálatao Diagnosztikai/javítási logika szintézise

Page 35: Intelligens rendszerfelügyelet

Hardware resourcesSoftware Elements

Service Architecture

Függőségeko erőforráshasználato adatcsere

Hibaterjedés:o erőforrás-állapoto adato … vagy hiánya

Statikus hibaterjedés-analízis

Page 36: Intelligens rendszerfelügyelet

generic infrastructure

element

Inputs and outputs: behavior

v0, v0, v3, v2, v0, … reference

v1, v0, v4, v2, v0, … actual

E1, E0, E2, E0, E0, …

Kapcsolatok: protokoll-automata saját abc-vel

Adathiba: egy olyan érték egy adott pillanatban egy kapcsolaton, mely a referencia-rendszerben nem megengedett

Klasszifikáció: „mérnöki tapasztalat”

Statikus hibaterjedés-analízis

Page 37: Intelligens rendszerfelügyelet

Error-sorozatok időbeli absztrakciója

PR_UP /OS_OK /NFS_OK

Good_req / [Good_rsp / no_log]Bad_req / [Error_code / req_log]

No_req / [No_rsp / no_log]

PR_DOWN /OS_OK

Good_req / [TCP_denial / no_log]Bad_req / [TCP_denial /no_log]

No_req / [No_rsp / no_log]

OS_DOWN

X / [No_rsp / no_log]

Ami számít: Ha egyáltalán nincs válasz, akkor OS_DOWN(Diagnózis)

Hasonlóan: Ha OS_DOWN, akkor egyáltalán nincs válasz(Hatásanalízis)

Page 38: Intelligens rendszerfelügyelet

Ez egy reláció (input, fault_mode, output)!

{„any_input”, „OS_DOWN”, „no_answer”}{„good_requests”, „OK”, „good_answers”}{„any_request”, „PR_DOWN”, „TCP_deny”}…

Hasonlóan: Ha OS_DOWN, akkor egyáltalán nincs válasz(Hatásanalízis)

Error-sorozatok időbeli absztrakciója

Ami számít: Ha egyáltalán nincs válasz, akkor OS_DOWN(Diagnózis)

Bármely bemeneti error-szekvencia

(Véges prefix után) no_rsp error-szekvencia

Belső hibamód állapotsorozat: {OK}*.OS_DOWN

Page 39: Intelligens rendszerfelügyelet

E1, E0, E2, E2, E0, …

S5

Rendszerfutás: hibák sorozatai a kapcsolatokon

o „no error” error

Lehetséges hiba-futások halmazának particionálása: szindrómáko Időbeli absztrakcióo Példa: vegyük a legsúlyosabbat ( „súlyossági” reláció!)

Aszinkron és szinkron rendszerekre ugyanaz

Statikus hibaterjedés-analízis

Page 40: Intelligens rendszerfelügyelet

Példa: switch, belső hibaok nélkülhiányzó csomag hiányzó csomag

késő csomag késő csomag

rosszul formált csomag hiányzó csomag

adathiba az üzenettörzsben

adathiba az üzenettörzsben

Page 41: Intelligens rendszerfelügyelet

Analízis statikus hibaterjedési leírásokkal

Analízis: mik a lehetséges, a leírásokkal és a megfigyelésekkel konzisztens változólekötések?

A diagnózis és a hatásanalízis ugyanaz a probléma!

APPLICATION PROCESS

OS + HW OS + HWNETWORK

WEB SERVER PROCESSCONNECTION CLIENT

I1F I2 O

f1i1

i2

i2

f2

Finite Domain Constraint Satisfaction

Problem (CSP)

Page 42: Intelligens rendszerfelügyelet

Diagnosztika statikus hibaterjedési leírásokkal

Page 43: Intelligens rendszerfelügyelet

Tartalom

Ipari és akadémiai kezdeményezéseko IBM Autonomic Computing, Microsoft DSI

Modellvezérelt tervezés és felügyeleto Diagnosztikao Rekonfiguráció

Merre tovább?

Page 44: Intelligens rendszerfelügyelet

Cloud Computing Cloud computing az új „buzzword” Alapötlet: számítástechnikai erőforrások

szolgáltatásként való eladásaoMegfontolás: a legtöbb cég valójában nem akar IT-vel

foglalkozni, de mégis szüksége van ráo Piaci lehetőség: ne hardvert/szoftvert adjunk el az

ügyfeleknek, hanem szolgáltatásto Hagyományos megoldás: teljes IT infrastruktúra

telepítési/üzemeltetési szerződés külső céggelo Cloud Computing: Interneten keresztül bérbevehető

szolgáltatások

Page 45: Intelligens rendszerfelügyelet

Cloud Computing Jellegzetes 6-os besorolás:

Infrastruktúra

Platform

Tárolás

Alkalmazás

Szolgáltatás

Kliensek

- Platform virtualizáció, mint

szolgáltatás- Grid Computing

- Alkalmazás futtatókörnyezet

(.net)- Web hosting

- Hálózati tárhelyek

- Web alkalmazások

- Online irodai szoftverek…

- Keresés- Térinformatika- Pénzügyek…

- Mobil eszközök- Böngészőbe

épülő szolgáltatások

Sok modern, divatos üzleti modellt húztak be

a „cloud” fogalomkör alá…

Page 46: Intelligens rendszerfelügyelet

Cloud Computing Mi kerüljön alá? Nyilvánvaló, hogy az erőforrás szolgáltató

cégeknek…o… hatalmas hardverparkra van szüksége

• Komoly költség és energia-hatékonysági megfontolások!o… nagyon jó menedzsment megoldásokat kell

alkalmazniuk• Szisztematikus eljárásrend minden esetre• Automatizálás ahol csak lehet

Page 47: Intelligens rendszerfelügyelet

Hardver a „Cloud” alá Hatalmas hardverpark rendel:

o Érdekes új termékfajta: Modular Datacenter pl. Sun S20 (aka. Black Box)

Specifikáció:

- Kívül: szabvány méretű konténer (8-15 t tömeg)- Belül: 8 db szabványos 42 egység magas rack- Áramellátás: 200kW- Hűtés vízzel (25kW/rack kapacitással)- teljes beépített hálózat- földrengésbiztos kivitel mag. 6,5-ig

Forrás: http://www.sun.com/products/sunmd/s20/

Page 48: Intelligens rendszerfelügyelet

Hardver a „Cloud” alá

A Microsoft datacenter víziója:

Page 49: Intelligens rendszerfelügyelet

Hardver a „Cloud” alá Google saját szerver építőeleme:

o Gigabyte GA-9IVDP alaplap (saját rendelésre készült, kereskedelmi forgalomban nem kapható)

o Csak egyetlen 12V-os tápellátáso És egy jó nagy akkumulátor… UPS helyett

Page 50: Intelligens rendszerfelügyelet

Autonóm menedzsment megoldások Trend: inkább olcsó hardverből sokat, mint

drágából keveseto A hibatűrést szoftverből kell megoldanio Ember számára kezelhetetlen méretű rendszer,

automatizálni kell (emberi munkaerő túl drága)

Energiatakarékosság, költségkímélés: o Csak annyi redundancia legyen, amennyi feltétlen kello Okosan kell kihasználni ezt a redundanciáto Takarékoskodni az energiával, amikor csak lehet