20170928 why r_r jako główna platforma do zaawansowanej analityki w enterprise
-
Upload
wit-jakuczun -
Category
Data & Analytics
-
view
68 -
download
2
Transcript of 20170928 why r_r jako główna platforma do zaawansowanej analityki w enterprise
R jako główna platforma do zaawansowanej analityki w
EnterpriseWit Jakuczun,
WLOG Solutions2017-09-28
Copyright (c) WLOG Solutions 2
Biznes nie rozmawia o zaawansowanej analityce.
Copyright (c) WLOG Solutions 3
Biznes nie rozmawia o platformie analitycznej.
Copyright (c) WLOG Solutions 4
Biznes rozmawia o tym jak sprawnie zarabiać pieniądze.
Copyright (c) WLOG Solutions 5
Elastyczność
Czy mogę rozwiązać ten konkretny
problem?
Jakość
Na ile wiarygodna/pewna jest
informacja?
Wydajność
Jak długo muszę czekać na informację?
Społeczność!
Jak szybko mogę dostać wsparcie?
Copyright (c) WLOG Solutions 6
4000x5 modeli (CV-5) elastic-net dla danych wymiaru 45Kx10K w 1,5 minuty!
Copyright (c) WLOG Solutions 7
A ile czasu Twój biznes czeka na wsparcie decyzji?
R jako platforma analityczna w EnterpriseJak to sprzedać swojemu szefowi oraz zaplanować wdrożenie?
8
Copyright (c) WLOG Solutions 9
Obietnica dla Szefa
Copyright (c) WLOG Solutions 10
Będziemy w stanie szybciej dać lepszej jakości odpowiedź na
więcej pytań biznesu jednocześnie obniżając tzw.
licence footprint.
Copyright (c) WLOG Solutions 11
Jak to osiągnąć?
12
Ewolucja a nie Rewolucja*
*R i tak się obroni wynikami :)
13
LudzieKompetencje
NarzędziaIntegracja
ProcesyDostosowanie
Zarządzanie zmianą!
14
Idź na najbliższy uniwersytet
Zafunduj szkolenia dla
zespołu
Wdrażaj na realnych
problemach
Pokaż korzyści i wytłumacz
Znajdź wsparcie zewnętrzne
Dostosuj projekty i
architekturę
Platforma analityczna w EnterpriseKomponenty oraz rola R
15
Copyright (c) WLOG Solutions 16
Elastyczność
Czy mogę rozwiązać ten konkretny
problem?
Jakość
Na ile wiarygodna/pewna jest
informacja?
Wydajność
Jak długo muszę czekać na informację?
Wymagania
Copyright (c) WLOG Solutions
Komponenty platformy analitycznej
Feature management
Batch processing
Predictive model factory
BI
Scheduler/W
orkflow
ma
nagem
ent
Stream processing
Storage
Data ingest
ML, Opt, Sim (Auto, GPU)
Copyright (c) WLOG Solutions 18
R jest językiem do pisania logiki przetwarzania w ramach
platformy.
Rola i miejsce R (I)
Copyright (c) WLOG Solutions 19
Predictive model factory
Data Quality management
Machine Learning
Rola i miejsce R (II)
Analizy ad-hoc Raporty powtarzalne
Automatyzacja procesów
Copyright (c) WLOG Solutions 20
System dokumentacji
pakietów
System zależności
między pakietami
Dostęp do najlepszych technologii
Dlaczego R?
“Język-klej”Szybkie
prototypowanie w dużej skali
Dostęp do wiedzy i
kompetencji
Platforma analityczna w EnterpriseJak zarządzać środowiskiem R?
21
Copyright (c) WLOG Solutions 22
R “z pudełka” nie ma bezpośredniego wsparcia
dla rozwiązań wielkiej skali w środowisku Enterprise.
Copyright (c) WLOG Solutions 23
Dev
Version controlContinuous
Integration & Deployment
Prod
Proces developerski
Copyright (c) WLOG Solutions 25
Enkapsulacja środowisk
rozwojowych
Struktura projektu
Logika w pakietach
Testy Brak dostępu do internetu
Best practices by WLOG
Copyright (c) WLOG Solutions 26
CRAN (MRAN) Github Other
R environment
Installed packages
Local CRANSource code repo
Co jest blokerem?
Copyright (c) WLOG Solutions 27
Co jest blokerem?
CRAN (MRAN) Github Other
R environment
Installed packages
Local CRANSource code repo
Copyright (c) WLOG Solutions 28
data.table
Platforma analityczna w EnterprisePrzykłady z życia
29
Copyright (c) WLOG Solutions 30
Serwer produkcyjny
Serwer developerski
Continuousintegration
Version control
R Studio Server
Copyright (c) WLOG Solutions 31
Version control
Serwer developerski
Local CRAN
Serwer produkcyjny
Copyright (c) WLOG Solutions 32
Baza analityczna
(kolumnowa)
Baza analityczna
(kolumnowa)
deploy
Model = UDF
Budowa modelu
Platforma analityczna w EnterprisePodsumowanie
33
Platforma R w środowisku Enterprise
34
Zintegrowana z infrastrukturą
Procesy wytwórcze
zgodne z polityką firmy
Szybki cykl wytwórczy
Continuous Integration & Deployment
Procesy utrzymaniowe i
backupowe
Repozytoria - modeli, buildów, kodu, zależności,
konfiguracji
Monitoring zasobów
Bezpieczeństwo i audytowalność
Copyright (c) WLOG Solutions 35
Środowisko R pozwala stworzyć platformę analityczną, która
wspiera biznes sprawnie zarabiać pieniądze.
Wit Jakuczun, PhD
Field tested R ecosystem for Enterprise
http://rsuite.io
36