Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

14
Drugdiscovery@home – projekt ochotniczego przetwarzania rozproszonego w zakresie raka, starzenia się i komórek macierzystych. Andrey Voronkov* and John Shultz *[email protected]

description

Drugdiscovery@home – projekt ochotniczego przetwarzania rozproszonego w zakresie raka, starzenia się i komórek macierzystych. Andrey Voronkov* and John Shultz *[email protected]. Jednostki obliczeniowe przesyłane są do lokalnych lub globalnie rozproszonych - PowerPoint PPT Presentation

Transcript of Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Page 1: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Drugdiscovery@home – projekt ochotniczego przetwarzania rozproszonego w zakresie raka,

starzenia się i komórek macierzystych.

Andrey Voronkov* and John Shultz

*[email protected]

Page 2: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Czym jest VCSC I przetwarzanie rozproszone?

Jednostki obliczeniowe przesyłane są do lokalnych lub globalnie rozproszonych komputerów, a wyniki obliczeń są odsyłane do serwera.

Internetowe – ochotnicze Przetwarzanie

ProjectsOchotnicy

Pomaga nauce

Angażuje zwykłych ludzi w naukęhttp://boinc.berkeley.edu/trac/wiki/BoincPapers

Lokalna sieć – VCSC

Serwer BOINC

Page 3: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

DRUGDISCOVERY@HOME PROJECT WORKFLOW

Page 4: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Metody projektu:• Przetwarzanie rozproszone, Przetwarzanie GPU• Virtualne obrazowanie z użyciem giętkich aminokwasów• Schemat odprężonych kompleksów dla dokowania• Dynamika molekularna z konkretnymi modelami rozpuszczalników

dla oceny stabilności kompleksów białko-ligand• Mapowanie interaktywne dróg z dynamicznym modelowaniem

zmianZakres badań:

• Biocele zaangażowane w drogach sygnałowych nisz komórek macierzystych

• Które są powiązane lecz nie ograniczone z rakiem i chorobami neurodegradacyjnymi. Biocele pasujące do regulacji raka/starzenia się zgodnie z hipotezą na rys. A

• Przykłady biocelów: Białka związane z ścieżkami sygnałowymi Wnt, Shh i Notch.

• Inne cele biologiczne, związane z rakiem, chorobami degeneratywnymi I biologią komórek macierzystych moga zostać rozpatrzone we współpracy z grupami biologów experymentalnych.

Page 5: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Robocza hipoteza raka/degeneracji oraz symetrycznego/niesymetrycznego podziału komórek macierzystych

Page 6: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Dokonania:– Wstępna integracja strony internetowej projektu z Drupal– Molekularne dokowanie CPU wysokiej przepustowości

• Dystrybuuje Python• Dystrybuuje niektóre pakiety narzędzi MGL• Zarządzane przez BOINC Wrapper

– Integracja GROMACS z wrapperem BOINC dla CPU• Symuluje 100 ps w 2.5 godziny• Zakres plików trajektorii od 10-40MB • Rezultaty kompresowane w formacie 7zip

– Integracja Autodock 4.0 z Wrapperem BOINC dla CPU– Dokowanie białko-ligand ->MD workflow setup (acpypi)– Integracja głównych platform

• Windows• Mac PPC i Intel• Linux

Page 7: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Drużyna:• Andrey Voronkov, doktor, uniwersytet moskiewski,

wydział chemii – szef projektu, modelowanie molekularne, projektowanie leków, setup serwera BOINC

• John Shultz, Narodowa akademia nauk, Washington D.C., IT, kodowanie, setup serwera BOINC

• Jorden van der Elst, główny tester oprogramowania• Współpracujemy także z wieloma ludźmi z

przemysłu, którzy opracowywują cześć systemów biologicznych, i którzy nie chcą na razie ujawniać swoich danych osobowych.

Page 8: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

WSPÓŁPRACA

Page 9: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Opcja 1: Współpraca z biologami eksperymentalnymi

Page 10: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Opcja 2: Virtual Campus Super Computing dla uniwersytetów i organizacji

Zalety w stusunku do przetwarzania klastrowego:• Nowy zbiór mocy obliczeniowej w bardzo niskiej cenie• Podwyższona stabilnośc w porównaniu do klastrów I

superkomputerów• Aplikacja nie musi być dostosowywana do potrzeb środowiska

klastrowego• Pozytywny PR dla uniwersytetów

 Zalety w stosunku do przetwarzania ochotniczego:• Czyste VCSC, brak ochotników na zewnątrz sieci

o Brak systemu kredytowego, brak oszustw, Tylko jeden rezultat per próbka (Lepsza wydajność per CPU), lepsze bezpieczeństwo, bardziej elastyczne jeśli chodzi o licencje oprogramowania

• Projekt ochotniczyo Trzeba zapobiegać cheatowaniu, walidować rezultaty, więcej

ograniczeń przy redystrybucji licencjonowanego oprogramowania

 

Page 11: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Przykłady aplikacji do projektowania leków

1 średni CPU Dynamika cząsteczkowa 100 aminokwasów kompleksów białek z małocząsteczkowym ligandem z konkretną wodą I solami podczas 2 dni

100 picosekund

VCSC

z 200 CPU

100 trajektorii na 100 ps dla jednego kompleksu lub 100 odmiennych kompleksów białko-ligand na jedną 100ps trajektorję

VCSC zwiększa zasoby przetwarzania o kilka rzędów i umożliwia zastosowanie istniejącego oprogramowania w stosunku do większej liczby obiektów.

Przykład 1. Wirtualne ekranowanie - dokowanie organicznych elementów do biocelów.

Przykład 2. molekularna dynamika kompleksów białko-ligand z wyszczególnionym modelem cząsteczek wody

1 średni CPU ~1 000 000 elementów ekranowanych przez model dokowania sztywnego białka z użyciem Autodock 4.0

100 dni

VCSC

z 200 CPU

~ 1 000 000 elementów Autodock 4.0. dokowanie do sztywnego modelu białka lub ~ 50 000 elementów dokujących do modelu elastycznego białka

1 dzień

Użycie GPU może zwiększyć zasoby obliczeniowe od 10 do 50 w stosunku do CPU

Page 12: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

I. Stawianie serwera centrum Campus virtual supercomputing• I.1 Ocena potencjalnych zasobów obliczeniowych i wymagań dla serwera• I.2 Stawianie serwera BOINC

II. Komunikacja z właścicielami komputerów i administratorami systemu

III. Komunikacja z naukowcami obliczeniowymi• Rozpoznanie naukowców z wymagającymi-obliczeniowo aplikacjami które dobrze pasują do przetwarzania ochotniczego.• Portowanie aplikacji do BOINC• Kompilacja aplikacji dla CPU Windows/Linux• Kompilacja aplikacji dla GPU Nvidia/ATI AMD• Ustawianie opcji BOINC (system priorytetów, limity zadań) IV. Utrzymanie VCSC

Całkowity czas na VCSC: 2-3 osobo-miesięcy

Tworzenie centrum Virtual Campus Supercomputing

Page 13: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

PLANY (2 lata):1) Programowanie GPU dla aplikacji I klienta BOINC – znaczący

wzrost mocy obliczeniowej dla ekranowania wirtualnego I dynamiki molekularnej z wyszczególnionymi modelami rozpuszczaliników.

2) Implikacje wielu metod elastyczności białka takich jak schemar odprężonego kompleksu I dynamika białek Monte Carlo.

3) Dynamiczne modelowanie sieci ścieżek sygnałowych które musi dac wynik w postaci interaktywnego mapowania I przewidywania najbardziej obiecujących biocelów dla zadanych chorób.

4) Projektowanie leków I testowanie elementów biologicznych dla obiecujących biocelów ze ścieżki sygnałowej Wnt (pierwszy rok) ~8-10 biocelów, i Shh, Notch oraz innych białek regulujących nisze komórek macierzystych w drugim roku (10-15 biocelów).

Wymaganie finansowanie 150 000$/rok:-Pensja na pełny etat dla 4 osób, hosting, cześć licencji na

oprogramowanie

Alternatywne źródła finansowania rozpatrywane teraz: - Granty dla małych jednostek – wymaga wykonania projektu jako

niekomercyjny (we współpracy z uniwersytetami)- Sprzedaż I usługi (Ochotnicze dzielenie zysków, wstępny ogólny

business plan dostępny na życzenie), Wymagane biuro, najlepiej w Maryland w USA

Page 14: Andrey Voronkov* and John Shultz *av@drugdiscoveryathome

Dziękujemy za uwagę!