IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH … · ALGORYTM DJIKSTRY (gdy nie ma wag...

IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH

Michał Podstawski

Praca dyplomowa napisanapod kierunkiemProf. WSTI dr hab. inż. Jarosława Śmieiw roku akademickim 2016/2017

Szablon prezentacji - SlidesCarnival

1.Wstępnezałożenia

Problemy grafowe i HPC – część 1

◎implementacje uczenia maszynowego (machine learning)

◎analiza struktur sieci społecznościowych (social networks)

◎rozwój inżynierii obliczeniowej (computational science)

◎Big Data

W świecie współczesnej informatyki - ze względu na rosnącą ilość i złożoność przetwarzanych danych - poszukiwanie skutecznych rozwiązań dla klasycznych problemów grafowych stało się jednym z głównych zagadnień. Jest to związane z faktem, że rozwiązania takie są niezbędne w wielu dynamicznie rozwijających się dziedzinach, takich jak:

Problemy grafowe i HPC – część 2

Rozwój tej dziedziny związany jest także z gwałtownym postępem w zakresie HPC (High Performance Computing), i na zwiększaniu wydajności nowoczesnych komputerów polegającym nie na dodawaniu mocyobliczeniowej pojedynczego procesora, ale na mnożeniu ilości takich jednostek i udostępnianiu możliwości współbieżnego przetwarzania informacji.

Właśnie to sprawia, że wiele tradycyjnych rozwiązań dla problemów grafowych przestało być przydatnych – gdyż nie da się ich wykorzystać w wypadku przetwarzania równoległego.

Cel pracy

Właśnie te powody stały się motywacją mojego projektu inżynierskiego.

Za cel postawiłem sobie implementację czterech ważnych algorytmów grafowych w ten sposób, by dało się je wykorzystać w przetwarzaniu współbieżnym w środowiskach HPC.

Do sprawdzenia, w jakim stopniu cel udało się osiągnąć, wykorzystałem kilka szczegółowych metryk, które pozwoliły na bardziej drobiazgową ocenę wydajności i skalowalności przedstawianych rozwiązań.

Główne problemy

Ze względu na programowanie współbieżne dostosowane do potrzeb HPC napotkałem podczas projektu kilka problemów, które nie występują w tradycyjnym procesowaniu synchronicznym. Do elementów, które mają największy wpływ na wydajność w wypadku algorytmów na superkomputerach, i które mogą stanowić poważny problem podczas projektowania implementacji, należą głównie:

◎PRZETWARZANIE WIELOWĄTKOWE

◎SYNCHRONIZACJA WĄTKÓW

◎ZASTOSOWANIE BLOKAD I SEKCJI KRYTYCZNYCH

◎ILOŚĆ OPERACJI „Z” i „DO” PAMIĘCI

Warianty push i pull

W trakcie teoretycznego przygotowania pracy okazało się, że w różnych algorytmach korzystnym może okazać się aktualizowanie wartości wierzchołków w dwóch kierunkach:

◎PUSH – kiedy aktualizujemy wartości sąsiadów

procesowanego wierzchołka

◎PULL – kiedy aktualizujemy wartość procesowanego

wierzchołka

W każdym wypadku dokonałem implementacji obu wariantów, żeby porównać wydajność i zdecydować, który z nich jest bardziej optymalny w danym grafie.

2.Wykorzystanenarzędzia

Język i biblioteki

◎ C++

◎ OpenMP 4.5

◎ igraph 0.7.1

◎ Metis 5.1.0

◎ Intel Threading Building Blocks 2017 Update 1

◎ FoMPI

◎ LibSciBench

Testowe grafy

TYP ID n m

Social network (orc)

orc 3.07M 117M

Social network (pok)

pok 1.63M 30.6M

Ground-truth community

ljn 3.99M 34.6M

Purchase network

am 262k 1.23M

Road network rca 1.96M 2.76M

R-MAT rmat 33M-268M 66M-4.28B

Hardware

- CSCS Piz Daint (Daint) - Cray XC30: każda jednostka składowa posiada 8-rdzeniowy procesor Intel E5-2670 Sandy Bridge CPU z 32 GB DDR3-1600 RAM i NVIDIA Tesla K20X z 6 GB GDDR5 RAM.

- CSCS Piz Dora (Dora) - Cray XC40: każda jednostka składowa posiada dwa 2-rdzeniowe procesory Intel Haswells E5-2690 i 64 GB DDR4 RAM; połączenia takie same jak w Daint.

- Trivium V70.05 (Trivium) - posiada procesor Intel Core i7-4770, zawierający cztery 3.4 GHz Haswell z 2 wielowątkowymi rdzeniami, zapewniając sprzętowo 8 wątków; każdy rdzeń ma 32 KB cache L1 i 256 KB cache L2; procesor posiada 8 MB łączonego L3 cache i 8 GB RAM.

3.Algorytmy i implementacja

SSSP – Single Source Shortest Path

Problem znajdowania najkrótszej ścieżki jest jednym z najbardziej klasycznych problemów grafowych. Chodzi o znalezienie takiej ścieżki łączącej dwa wierzchołki, której koszt przejścia byłby możliwe najniższy.

W implementowanym wariancie interesowało nas wyznaczenie najkrótszych ścieżek dojścia z zadanego wierzchołka startowego – do każdego wierzchołka w grafie.

Rys. https://en.wikipedia.org/wiki/Shortest_path_problem#/media/File:Shortest_path_with_direct_weights.svg [Data dostępu 11-04-2017]

Istnieją dwa tradycyjne algorytmy stanowiące rozwiązanie tego problemu:

◎ ALGORYTM DJIKSTRY (gdy nie ma wag ujemnych)

◎ ALGORYTM BELLMANA-FORDA

Ich wadą jest fakt, że oba (szczególnie Djikstry) nie w pełni dają się wykorzystać w warunkach obliczeń równoległych. Stąd dla potrzeb projektu dokonałem implementacji ALGORYTMU DELTA-STEPPING, który został zaproponowany nie tylko jako połączenie obu wymienionych algorytmów, ale także jako algorytm, który stworzony jest z myślą o środowiskach rozproszonych.

Algorytm DELTA-STEPPING opiera się na założeniu, że graf można podzielić na mniejsze podgrafy – kubełki (buckets), które mogą być procesowane równolegle.

Dzięki podziale krawędzi na lekkie i ciężkie udaje się także uzyskać optymalizację płynącą z faktu, że krawędzie lekkie, jako te, które mają większą szanse uczestnictwa w finalnym rozwiązaniu, procesuje się kilkukrotnie, a krawędzie ciężkie – tylko raz.

SSSP – wyniki

Wydajniejszy w tym wypadku jest wariant PUSH.

GC – Graph Coloring

Kolorowanie grafu jest problemem polegającym na takim pokolorowaniu wierzchołków grafu najmniejszą możliwą ilością kolorów, by dwa wierzchołki o tym samym kolorze ze sobą nie graniczyły.To problem o tyle ważny, że jego rozwiązanie stanowi istotną metrykę dla grafu, mówiącą o jego gęstości i stopniu komplikacji.

Rys. https://plus.maths.org/issue8/features/phones/fig2.jpg [data dostępu: 6/11/2016]

GC – Graph Coloring

W przetwarzaniu równoległym najpowszechniej za standard uznawane jest rozwiązanie zaproponowane przez Erika Bomana – i to ono stało się podstawą mojej implementacji.

Polega na podzieleniu grafu na mniejsze podgrafy, przeprocesowaniu każdego równolegle za pomocą któregoś ze znanych algorytmów synchronicznych (w moim wypadku – kolorowanie zachłanne), a następnie rozwiązaniu konfliktów na granicach podgrafów.

Dodatkowo zaproponowałem rozwiązanie oparte o koncepcję kubełków (podobnie, jak w SSSP), która okazała się wyjątkowo szybkim wariantem.

GC – wyniki

Wydajniejszy w tym wypadku jest wariant PUSH – i wariant z kubełkami GrS.

TC – Triangle Counting

Zliczanie trójkątów jest algorytmem mniej znanym, ale

zyskującym coraz większe znaczenie, przede wszystkim

ze względu na fakt, że pozwala łatwo ocenić stopień

komplikacji grafu i znaleźć punkty jego zgęszczenia.

Polega na policzeniu wszystkich trójkątów,

tworzonych przez wierzchołki grafu, przy czym o

trójkącie możemy mówić, gdy w zbiorze trzech

wierzchołków każdy z nich posiada wspólną

krawędź z dwoma pozostałymi.

TC – wyniki

Wydajniejszy w tym wypadku jest wariant PULL

MST – Minimum Spanning Tree

Problem minimalnego drzewa rozpinającego również

należy do klasycznych problemów grafowych. Dotyczy

głównie grafów o krawędziach o przyporządkowanych

wagach.

Polega na znalezieniu takiego drzewa

rozpinającego grafu (czyli zestawu krawędzi łączącego

między sobą wszystkie wierzchołki), którego waga jest

najmniejsza.

MST – Minimum Spanning Tree

Problem ten ma trzy tradycyjne rozwiązania:

- algorytm Prima (Prima – Dijkstry)

- algorytm Kruskala

- algorytm Borůvki (Sollina)

W przetwarzaniu równoległym zazwyczaj przyjmuje się,

że tak algorytm Prima, jak i Kruskala, w zasadzie nie dają

się paralelizować. Z tego względu w trakcie

przygotowania projektu używałem algorytmu

Borůvki (Sollina).

MST – wyniki

Wydajniejszy w tym wypadku jest wariant PUSH

4.Podsumowanie projektu

Podsumowanie

W trakcie pracy nad projektem udało się zrealizować jego teoretyczne założenia. Dokonano implementacji wszystkich wskazanych algorytmów grafowych, osiągającsatysfakcjonujące wyniki. Wykonane implementacje pozwoliły także na lepsze zrozumienie, gdzie i dlaczego algorytmy dają się zrównoleglać, a gdzie konieczne jest wykorzystanie sekcji krytycznych i operacji atomowych.

Otrzymane wyniki pozwalają stwierdzić, że zidentyfikowane i zaimplementowane warianty rozwiązania algorytmów grafowych dobrze sprawdziły się w rzeczywistym środowisku rozproszonym. Wszystkie zebrane wyniki posiadają wydajność, która pozwala traktować je jako propozycje możliwe do faktycznego wykorzystania w praktyce.

Dziękuję za uwagę!

IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH … · ALGORYTM DJIKSTRY (gdy nie ma wag...

Documents

Transcript of IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH … · ALGORYTM DJIKSTRY (gdy nie ma wag...

zaproszenie - konferencja ALGORYTMszybinski.cieszyn.pl/algorytm/files/zaproszenie_konferencja_zak.pdf · 10:30 Algorytm sukcesu w zawodzie – prezentacja projektu współfinansowanego

Algorytmy, Podstawy oprogramowana Systemy operacyjne · 2013. 3. 7. · ALGORYTMY I ICH OPIS Co to jest algorytm? Algorytm to schemat postępowania dla rozwiązania jakiegoś zadania.

Algorytm wstępnej oceny skuteczności ruchów w grze w szachy

5 - Algorytm Zaawansowanych Zabiegów Resuscytacyjnych ALS

Algorytm Euklidesa

Grafy hamiltonowskie, problem komiwojaera – algorytm optymalnyhanna/grafy/04_kom_opt.pdf · 71 Problem komiwojaera – algorytm optymalny • nie jest znany aden wielomianowy optymalny

Algorithm in abdominal trauma Algorytm w obrażeniach jamy ...

Wykład II Algorytm, podstawowe notacje, typy danych ...kcir.pwr.edu.pl/~mucha/PProg/wyklad02_folie.pdf · Algorytm, podstawowe notacje, typy danych, wyrażenia i instrukcje 1 Algorytm

Algorytmy i Struktury Danych. - Grafywozna.org/students/2014-2015/asd/asd09.pdf · Plan wykładu Scie´ zka Eulera˙ Cykle Eulera Algorytm Bellmana-Forda Algorytm Dijkstry Bo˙zena

Algorytm na zarabianie - inqbe.pl · Algorytm na zarabianie (bez człowieka) Z Maciejem Hazubskim, prezesem ICPartners, rozmawia Paweł Perka „miesięcznik KAPITAŁOWY": Aplikacje

Algorytm Google – ranking parametrów SEO

Wykłady z Matematyki Dyskretnejamarsz/dydaktyka/dyskretna/...Algorytm Kruskala Algorytm Kruskala generowania MST Dane:Graf spójny G z wagami. Szukane:Zbiór krawędzi minimalnego

Algorytm postępowania w cukrzycy typu 2...) nie wywołuje hipoglikemii, ponieważ stężenie insuliny jest małe a hormonów kontrregulacyjnych duże, dlatego duży wysiłek w porze

Disk Wiper™ 15 Professional - Paragon Software...Russian GOST R 50739-95 Peter Gutmann's algorithm Bruce Schneier's algorithm Algorytm firmy Paragon Algorytm niestandardowy Obsługiwane

Algorytm wyznaczania strefy ściskanej w zagadnieniu ...

Algorytm szyfrowania – szyfr Cezaracode.kopernik-leszno.pl/data/files/133/Algorytm...Algorytm szyfrowania – szyfr Cezara W tej pracy postanowiliśmy rozważyć twierdzenie Alberta

Natalia Nehrebecka - Ekonometria 14.01...a więc nie mają tendencji do gromadzenia się np. wokół dodatnich lub ujemnych (lub naprzemiennie dodatnich i ujemnych) wartości Hi Hj

Podstawowe struktury danychstefanek/zfj/AiSD_Wyklad5_dzienne2012_struktury_danych.pdfPrima i algorytm Kruskala. Drzewa wyszukiwania binarnego ( i ich optymalizacja) Opracowujemy algorytm

Grafy c.d. --- cykl Eulera, algorytm Dijkstry i Bellmana ... · Grafy c.d. — cykl Eulera, algorytm Dijkstry i Bellmana-Forda Cykl Eulera Wstep˛ Istnienie Wyznaczanie Najkrótsze

Algorytm dopasowania obszarów zainteresowania z kolejnych ...€¦ · 1 Temat projektu/pracy dyplomowej magisterskiej (j ęz. pol.) Algorytm dopasowania obszarów zainteresowania