Post on 21-Sep-2020
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
5
NARZĘDZIA ANALIZY DANYCH W MEDYCYNIE
StatSoft Polska Sp. z o.o.
Wprowadzenie
Analiza danych odgrywa ogromną rolę w medycynie. We wszystkich publikacjach i rapor-
tach prezentujących wyniki badań medycznych stosowane są metody statystycznej analizy
danych: od etapu planowania badań (np. doboru liczności próby), po budowę modeli opisu-
jących złożone zależności. Coraz większy jest też nacisk, aby podejmować decyzje w opar-
ciu o wyniki analiz statystycznych. Zmiana standardów leczenia, stosowanie nowej terapii
czy leku muszą być w odpowiedni sposób uzasadnione badaniami empirycznymi i potwier-
dzone wynikami analiz. Wymaga się dowodów potwierdzających stawiane hipotezy i zaob-
serwowane prawidłowości (np. koncepcja Evidence Based Medicine).
Jednocześnie dane mają coraz większą wartość, dlatego gromadzimy ich coraz większą
ilość, niezależnie od tego, czy mówimy o lekarzach zbierających informacje dotyczące
zapisów podstawowej opieki zdrowotnej czy też nowoczesnych klinikach gromadzących
duże wolumeny danych, zawierające kompletne, szczegółowe informacje dotyczące symp-
tomów chorób, wyników testów medycznych, czy sposobu wyboru i przebiegu zastosowa-
nych terapii. Te ogromne ilości danych wymagają z kolei rozwoju specjalistycznych narzę-
dzi analizy danych, w celu zawężenie rosnącej przepaści pomiędzy zbieraniem danych
a ich zrozumieniem.
Z jednej strony istnieje zatem zapotrzebowanie na wszechstronne i łatwe w obsłudze narzę-
dzie statystyczne, pozwalające indywidualnemu badaczowi uzyskać możliwie jak najpeł-
niejsze odpowiedzi na podstawie gromadzonych przez niego danych, z drugiej strony stale
rośnie zainteresowanie szpitali i klinik kompleksowymi systemami analitycznymi pozwala-
jącymi uzyskiwać odpowiedzi na pytania z wielu różnych obszarów, m.in.: decyzji
medycznych, efektywności wykorzystania zgromadzonych zasobów, prognozowania wy-
konania kontraktów etc.
StatSoft Polska od wielu lat rozwija swoją ofertę w zakresie analizy danych – nie tylko
stale rozszerza funkcjonalność oprogramowania STATISTICA, aby jak najpełniej spełniało
oczekiwania osób zajmujących się przetwarzaniem danych w medycynie, ale również
zapewnia kompleksowy pakiet usług: szkoleniowych, konsultingowych i wdrożeniowych
zapewniających szybkie i efektywne wykorzystanie oprogramowania.
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
6
Obszary zastosowań analizy danych w medycynie
Statystyka i data mining to dziedziny nauki, które przy wykorzystaniu odpowiednich narzę-
dzi informatycznych uwalniających od żmudnego, ręcznego przetwarzania danych, stają
się potężnym instrumentem do lepszego poznawania badanych zjawisk i znajdują zasto-
sowanie w wielu obszarach:
Projektowanie badań. Zaprojektowanie badania jest niezwykle ważnym etapem, ponie-
waż nawet najbardziej zaawansowane metody statystyczne nie są w stanie wyeliminować
błędów popełnionych na etapie planowania badań. W tym przypadku narzędzia dostępne
w programach STATISTICA mogą pomóc w doborze grupy kontrolnej czy liczności próby.
Wspomaganie decyzji diagnostycznych. Ten obszar zastosowań analizy danych ma wciąż
ogromny potencjał rozwojowy. W tym przypadku metody statystyczne i data mining mogą
być niezwykle przydatne m.in. do szacowania dokładności testów diagnostycznych, porów-
naniu ze sobą konkurencyjnych testów, jak również w odkrywaniu nowych reguł diagnos-
tycznych. Przedmiotem analiz mogą być zarówno pojedyncze czynniki rokownicze –
parametry opisujące stan pacjenta, jak i złożone, wielowymiarowe dane medyczne
(np. zapis EKG, zdjęcia USG, dane laboratoryjne) czy też nawet dane genetyczne.
Stosowanie nowej terapii/leku. Zmiana procedur leczenia, stosowanie nowej terapii czy
leku muszą być w odpowiedni sposób uzasadnione badaniami empirycznymi. Techniki
statystyczne, a coraz częściej również metody data mining pełnią bardzo istotną funkcję
w poszukiwaniu nowych terapii czy leków. Pozwalają bowiem nie tylko oddzielić to co
przypadkowe, od tego co przyczynowe, ale również prowadzą do ustalenia nowych zależ-
ności, niemożliwych do ustalenia bez wykorzystania tych metod.
Podejmowanie decyzji w zakresie prewencji i chorób. Badania prewencyjne. Wyko-
rzystując narzędzia analityczne dostępne w STATISTICA możemy z dużym prawdopodo-
bieństwem określać ryzyko wystąpienia u poszczególnych pacjentów danego zjawiska
(np. zawału lub udaru mózgu) lub wyodrębniać grupy pacjentów obciążonych podwyższo-
nym ryzykiem i dzięki temu poprawić trafność wyborów strategii leczenia i profilaktyki.
Analiza wyników badań klinicznych. We współczesnej medycynie podstawowym narzę-
dziem oceny skuteczności leków, procedur medycznych, testów diagnostycznych, modyfi-
kacji czynników ryzyka, diety czy też efektów edukacji zdrowotnej są badania kliniczne.
W zależności od celów badań i rodzaju stosowanych interwencji są one projektowane
w standardzie badań eksperymentalnych lub obserwacyjnych. W badań klinicznych wyniki
nigdy nie są jednoznaczne, statystyka pozwala wykazać, że otrzymane wyniki nie są dzie-
łem przypadku Program STATISTICA zawiera kompletny zestaw narzędzi i metod statys-
tycznych służących do wszechstronnego opracowania i graficznej prezentacji wyników
takich badań klinicznych.
Badania genetyczne. Duże ilości danych dostarczanych przez badania genetyczne wyma-
gają niejednokrotnie specjalnego wieloetapowego podejścia. Niezbędny jest etap przygoto-
wania danych do analizy, konieczne staje się stosowanie technik redukcji wymiaru,
grupowania obiektów podobnych oraz selekcji istotnych cech. Wynikiem takiej wstępnej
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
7
analizy są na przykład listy genów o istotnie zmienionej ekspresji, liczące i tak setki, a na-
wet tysiące elementów. W celu wyszukiwania wzorców w tak dużych bazach danych częs-
to wykorzystywane są specjalne algorytmy data mining nastawione na analizę dużych
ilości wielowymiarowych danych i uwzględnianie bardzo złożonych zależności.
Metaanaliza. Ilościowa synteza wyników pochodzących z niezależnych badań pierwot-
nych pozwala rozszerzyć wnioski z pojedynczych badań na szerszą populację i bardziej
precyzyjnie ocenić wpływ działania analizowanego czynnika. Procedury statystyczne dos-
tępne w Zestawie medycznym STATISTICA umożliwia m.in. wykonywanie obliczeń dla
szeregu miar efektu, przedstawienie wyników metaanalizy w postaci szczegółowego rapor-
tu oraz wykresu typu forest plot. Narzędzie pozwala ocenić niejednorodność badań, prze-
prowadzić analizę w grupach i analizę wrażliwości efektu łącznego na zmiany modelu.
Automatyzacja sprawozdawczości. Narzędzia analizy danych pomagają zarówno
w automatyzacji raportowania rutynowych działań, jak również w monitorowaniu stanu
realizacji projektów i badań medycznych, uwalniając tym samym lekarzy od wielu
czasochłonnych zajęć.
Text mining. W oparciu o techniki statystyczne możemy uwzględniać w analizie infor-
macje zapisane w języku naturalnym np. rozpoznania, wywiady, opisy wyników badań
medycznych itp. Możliwe jest zatem powiązanie nieustrukturyzowanego tekstu i danych
sformalizowanych w celu pozyskiwania nowych, interesujących nas informacji.
Rozwiązania StatSoft
STATISTICA spełnia wszystkie wymagania, jakie osoby wykorzystujące statystykę w na-
ukach biomedycznych stawiają systemom analitycznych:
dostarcza proste w obsłudze, intuicyjne środowisko pracy;
zapewnia otwartość i elastyczność umożliwiającą wymianę danych pomiędzy różnymi
aplikacjami, w tym MS Excel oraz możliwość pobierania danych z dowolnych baz
danych;
udostępnia komplet zarówno prostych, jak i zaawansowanych narzędzi analizy danych,
wykorzystywanych do opracowywania wyników badań medycznych - klasyczne me-
tody statystyczne, jak i specjalistyczne techniki data mining;
zawiera specjalnie zaprojektowane procedury statystyczne powszechnie wykorzysty-
wane w naukach medycznych;
ma ogromne możliwości wizualizacji danych, umożliwiające tworzenie atrakcyjnych
graficznie raportów i zestawień.
Środowisko pracy
Programy STATISTICA są znane z prostego w użyciu, intuicyjnego, graficznego środowis-
ka pracy. Można wybrać pracę z menu w postaci wstążki (patrz poniżej) lub z klasycznym
menu (użytkownik może w każdej chwili dokonać wyboru).
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
8
Oprócz interakcyjnego graficznego środowiska użytkownicy mają także dostęp do interfej-
su bazującego na STATISTICA Visual Basic, a w specjalnych wersjach dostępny jest inter-
fejs bazujący na przeglądarce internetowej.
STATISTICA zapewnia integrację z pakietem MS Office. Dzięki temu, pracując z danymi
i wynikami analiz otrzymanymi w STATISTICA, można jednocześnie wykorzystywać
narzędzia obu tych popularnych pakietów – analitycznego i biurowego.
Dostęp do danych
STATISTICA jest zoptymalizowana pod kątem pracy z dużymi plikami danych. Możliwa
jest wymiana danych z innymi aplikacjami. Programy STATISTICA dysponują wieloma
możliwościami zarówno pobierania danych zewnętrznych, jak i udostępniania swoich da-
nych innym programom. Pliki danych z rozmaitych aplikacji (np. Excel, pliki tekstowe,
.xml i wiele innych) można wczytać do arkusza STATISTICA.
Każdy program z rodziny STATISTICA zawiera także STATISTICA Query. Narzędzie to
umożliwia łatwy dostęp do danych gromadzonych w różnego typu bazach danych
(np. Sybase, Oracle, MS SQL Server itp.) za pomocą standardu OLE DB lub ODBC. Sys-
tem pozwala łatwo tworzyć zapytania w trybie graficznym (bez znajomości języka SQL),
a użytkownicy znający SQL mogą także tworzyć zapytania w trybie tekstowym. Więcej
informacji na www.statsoft.pl/query.html.
Opcjonalnie możliwa jest praca z bazą danych przy pomocy technologii IDP (In-Place
Database Processing), która pozwala uniknąć zapisywania na lokalnym dysku kopii całego
zbioru danych wymaganego do analizy.
Najwyższej jakości grafika
Dostępne w każdym produkcie z rodziny STATISTICA wysokiej jakości narzędzia wizuali-
zacji wyników analiz umożliwiają czytelną prezentację danych i wyników analiz.
STATISTICA oferuje setki typów dwuwymiarowych i trójwymiarowych obrazów graficz-
nych, a praktycznie każdy szczegół wyglądu wykresu może być dowolnie zmieniany przez
użytkownika. Przy zapisie wykresów STATISTICA w formacie pliku graficznego można
określić rozdzielczość (w dpi) dla takich formatów jak TIFF, GIF, PNG, JPG oraz BMP,
dzięki czemu można dostosować jakość obrazów do celu, w jakim później chcemy je
wykorzystać.
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
9
STATISTICA Mapy to dodatek dla użytkowników aktualnej wersji STATISTICA. Umożli-
wia graficzne przedstawienie danych dotyczących jednostek administracyjnych na dos-
tępnych szablonach map (podział na województwa oraz powiaty).
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
10
Zarządzanie wynikami analiz
STATISTICA zawiera mechanizmy elastycznego i wygodnego zarządzania wynikami ana-
liz. W trakcie przeprowadzania analiz na wyjściu otrzymujemy wyniki w postaci multime-
dialnych tabel (arkuszy) i wykresów.
Skoroszyty, które zachowują każdy z wynikowych dokumentów w postaci osobnej karty,
stanowią domyślny sposób zarządzania wynikami. Możliwe jest także zapisanie utworzo-
nego skoroszytu w formacie HTML, dzięki czemu publikacja wyników pracy w Internecie
czy intranecie jest znacznie ułatwiona. Wynikowe arkusze i wykresy mogą być kolejno
wstawiane do raportów (w pliku raportu STATISTICA i/lub MS Word) lub zapisywane jako
pliki PDF (dotyczy to także m.in. raportów STATISTICA).
Skalowalność
Rozwiązania z rodziny STATISTICA są skalowalne pod każdym względem:
liczby użytkowników – od wersji jednostanowiskowych po sieciowe i korporacyjne
systemy wieloużytkownikowe z kontrolą dostępu i pracą przez Internet lub Intranet,
wielkości przetwarzanych danych – STATISTICA jest zoptymalizowana pod kątem
szybkości wykonywanych analiz, a technologia IDP umożliwia analizę ekstremalnie
dużych zbiorów danych; szybkość analiz wykonywanych na dużych zbiorach danych
można dodatkowo przyspieszyć poprzez wykorzystanie wersji STATISTICA dla proce-
sorów wielordzeniowych oraz wielowątkowe wykonywanie wybranych procedur ana-
litycznych i przekształceń danych oraz korzystanie z 64-bitowej wersji programu,
zakresu procedur analitycznych – w każdym momencie można rozszerzyć licencję
o dodatkowe metody analityczne, cały czas pracując w tym samym środowisku, bez
konieczności zmiany interfejsu użytkownika i związanych z nim przyzwyczajeń.
Programowalność i otwarta architektura
Każdy z programów z rodziny STATISTICA ma wbudowane bardzo rozbudowane i bogate
środowisko programistyczne STATISTICA Visual Basic (zgodne ze standardowym MS
Visual Basic). Umożliwia ono programowy dostęp do praktycznie każdego elementu
i każdej funkcji programu. Programy STATISTICA Visual Basic można uruchamiać nie
tylko w STATISTICA, lecz (dzięki zgodności ze standardami) także w innych środowiskach
bazujących na konwencjach MS Visual Basic (np. Excel, Word lub w samodzielnych
instalacjach Visual Basic).
Wybrane narzędzia analityczne z rodziny STATISTICA
Każda z aplikacji analitycznych może pracować zarówno jako wersja jednostanowiskowa
(na pojedynczym komputerze), w sieci (na wielu komputerach użytkowników), jak i może
być elementem korporacyjnego systemu analizy danych.
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
11
Zakres metod analitycznych oferowanych przez STATISTICA jest niezwykle bogaty. Meto-
dy analityczne zostały podzielone na różne programy, z których można zbudować odpo-
wiedni zestaw analityczny.
Poszczególne programy z rodziny STATISTICA można łączyć w jednym pakiecie, który
może być z czasem rozszerzany o dodatkowe moduły. Dzięki temu możemy mieć dostęp
do bardzo wielu różnych metod analitycznych zawartych w jednej aplikacji STATISTICA.
Oto lista wybranych programów STATISTICA (podobna lista jest zamieszczona na stronach
www.statsoft.pl, menu Programy, sekcja Pełna lista programów):
STATISTICA Zestaw Medyczny
Wychodząc naprzeciw oczekiwaniom osób zajmujących się opracowywaniem wyników
badań medycznych, stworzyliśmy specjalistyczny pakiet analityczny STATISTICA Zestaw
Medyczny, który stanowi uzupełnienie funkcjonalności programów z rodziny STATISTICA.
W skład pakietu wchodzą narzędzia ułatwiające i przyspieszające proces obróbki danych
medycznych, począwszy od czyszczenia danych, poprzez ich analizę, aż po przygotowanie
końcowego raportu:
Czyszczenie danych:
Poprawność danych użytkownik ma możliwość łatwiejszego zdefiniowania reguł
poprawności danych w specjalnie do tego celu przygotowanym kreatorze.
Braki danych umożliwia przekodowanie braków danych.
Zmienne sztuczne umożliwia zamianę cech jakościowych na odpowiadające im
zmienne sztuczne.
Analizy:
Krzywe ROC są narzędziem służącym do oceny poprawności klasyfikatora
(pojedynczej zmiennej lub całego modelu), zapewniają one łączny opis jego
czułości i specyficzności.
Metaanaliza i metaregresja moduł jest narzędziem umożliwiającym syntezę
wyników wielu niezależnych badań, szczególnie w sytuacji, gdy nie mamy dostępu
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
12
do danych surowych, a dysponujemy jedynie zbiorczymi wynikami tych badań.
Podejście takie pozwala rozszerzyć wnioski z pojedynczych badań na szerszą
populację oraz zwiększyć wiarygodność otrzymanych wyników.
Kreator regresji logistycznej moduł umożliwia zbudowanie i ocenę modelu re-
gresji logistycznej. Korzystając z Kreatora, badacz krok po kroku wykonuje kolej-
ne etapy związane z budową modelu regresji, poczynając od sposobu kodowania
zmiennych oraz wyboru istotnych cech do analizy, poprzez sprawdzanie założeń
i identyfikację interakcji, aż po ocenę dobroci dopasowania modelu, analizę reszt
czy zbadanie jego zdolności predykcyjnych.
Kreator regresji liniowej moduł umożliwia zbudowanie i ocenę modelu regresji
liniowej (nowość do wersji STATISTICA 12). Podobnie jak w przypadku opisy-
wanego powyżej kreatora regresji logistycznej badacz krok po kroku wykonuje
kolejne etapy związane z budową modelu regresji, poczynając od sposobu kodo-
wania zmiennych, określania transformacji oraz wyboru istotnych cech do analizy,
poprzez sprawdzanie założeń i identyfikację interakcji, aż po ocenę dobroci dopa-
sowania modelu, analizę reszt czy zbadanie jego zdolności predykcyjnych.
Propensity Score Matching moduł umożliwia korektę obciążenia oceny efektu
spowodowanego nielosowym doborem do grupy interwencji i kontroli (nowość
do wersji STATISTICA 12). Korekta ta odbywa się poprzez odpowiednie dopaso-
wanie do każdego przypadku z grupy z interwencją przypadku bądź przypadków
z grupy niepoddanej interwencji.
Analizy dodatkowe:
Miary powiązania/efektów moduł przeznaczony do obliczania na podstawie ta-
beli 2x2 szeregu wskaźników powiązania lub efektu.
Wykres Blanda-Altmana przedstawia stopień zgodności pomiędzy dwiema róż-
nymi próbami bądź wskaźnikami.
Test post hoc ANOVA Friedmana Moduł umożliwia wykonanie testów post hoc
dla nieparametrycznej analizy wariancji dla prób zależnych. Test może być oparty
na średnich bądź sumach rang.
Karta CUSUM ważona ryzykiem bardzo czuła metoda pozwalająca na wykrywa-
nie zmian w wynikach procesów klinicznych (nowość do wersji STATISTICA 12).
Pozwala oceniać jakość realizowanych procesów medycznych w „czasie rzeczy-
wistym”.
STATISTICA Pakiet Podstawowy jest obszernym zestawem najpopularniejszych me-
tod statystycznych, obejmującym m.in. statystyki opisowe, tabele wielodzielcze, korelacje,
testy parametryczne i nieparametryczne, analizę regresji, STATISTICA Query, STATISTICA
Visual Basic.
STATISTICA Pakiet Zaawansowany zawiera wszystkie funkcjonalności programu
STATISTICA Pakiet Podstawowy, a także moduły do analizy rozkładów, modelowania
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
13
liniowego i nieliniowego, analizy szeregów czasowych, analiz wielowymiarowych oraz
analizy mocy testów.
STATISTICA Zestaw Skoringowy jest rozwiązaniem wspierającym proces budowy,
oceny oraz utrzymania modeli i kart skoringowych stosowanym do różnego rodzaju sko-
ringów – medycznego, marketingowego i innych.
STATISTICA Zestaw do Analiz Marketingowych i Rynkowych ułatwia i przyspiesza
proces opracowania wyników badań, ze szczególnym uwzględnieniem badań ankietowych.
Gromadzenie i analiza danych ankietowych. W ofercie StatSoft dostępne są narzędzia,
wspierające prowadzenie badań ankietowych. Zintegrowany system wprowadzania i gro-
madzenia danych ankietowych umożliwia m.in. wprowadzanie danych z uzupełnionych an-
kiet lub ich wypełnianie on-line, za pośrednictwem komputera z dostępem do Internetu
i przeglądarkę.
STATISTICA Data Mining Starter Pack umożliwia rozpoczęcie korzystania z metod
data mining oferując spore możliwości i przystępną cenę. Zestaw zawiera programy
STATISTICA: Pakiet Zaawansowany (narzędzia klasycznej statystyki), Automatyczne Sieci
Neuronowe oraz Trees (drzewa decyzyjne i drzewa wzmacniane).
STATISTICA Automatyczne Sieci Neuronowe jest to program zawierający narzędzia
do budowy oraz wdrażania modeli bazujących na sieciach neuronowych.
STATISTICA Trees to zestaw narzędzi do budowy drzew decyzyjnych – klasyfika-
cyjnych i regresyjnych: moduły C&RT, CHAID, drzewa interakcyjne, drzewa wzmacnia-
ne, losowy las.
STATISTICA Data Miner to kompletny zestaw narzędzi data mining. Jest łatwym
w użyciu i wydajnym systemem do realizacji wszystkich etapów wydobywania z danych
użytecznej wiedzy: od pobierania danych z baz czy hurtowni danych, poprzez etapy czysz-
czenia i transformacji danych, wykonywanie analiz danych, po tworzenie raportów. Spec-
jalne techniki data mining w STATISTICA Data Miner są zoptymalizowane pod kątem
przetwarzania olbrzymich zbiorów danych.
STATISTICA SAL (Sequence, Association and Link Analysis – analiza sekwencji,
asocjacji i połączeń) wykorzystuje szereg najnowszych technik analitycznych przeznaczo-
nych do znajdowania w zbiorach danych reguł dotyczących wspólnego występowania zja-
wisk (elementy występujące często razem lub w określonej kolejności itp.).
STATISTICA Text Miner jest rozszerzeniem systemu STATISTICA Data Miner, służą-
cym do przekształcania pozbawionych struktury danych (głównie tekstów) w użyteczną
wiedzę.
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
14
STATISTICA Enterprise to system analizy danych ogólnego przeznaczenia, m.in. dla
zastosowań typu business intelligence w marketingu, finansach i innych obszarach. Użyt-
kownicy mogą korzystać ze wspólnych danych (zapytań do baz danych), współużytkować
centralnie uaktualniane skrypty analiz, udostępniać wyniki swoich analiz itp. STATISTICA
Enterprise ma własny system użytkowników i grup z możliwością zarządzania uprawnie-
niami do zasobów systemu, narzędzie do definiowania szablonów raportów oraz generator
raportów (raporty mogą być generowane automatycznie co pewien czas lub o określonym
czasie). Wyniki pracy mogą być udostępniane w środowisku lokalnym (innym użytkowni-
kom STATISTICA Enterprise) oraz rozpowszechniane w szerszym zakresie (np. jako
raporty publikowane w Internecie lub intranecie).
STATISTICA Enterprise Server jest internetowym systemem udostępniania i analizy
danych. Umożliwia zdalne uruchamianie STATISTICA w ramach przeglądarki internetowej
(wszystkie obliczenia są wykonywane na serwerze), a także szybki i łatwy dostęp do
danych, raportów i narzędzi analitycznych z praktycznie każdego komputera połączonego
z Internetem. System jest oferowany jako kompletne rozwiązanie, zawierające funkcjonal-
ność wybranych produktów z rodziny STATISTICA.
STATISTICA Decisioning Platform jest rozwiązaniem pomagającym instytucjom
sprawniej podejmować trafne decyzje z wykorzystaniem analizy danych. Łączy ono
siedem kluczowych funkcji, wymaganych do sprawnego wykorzystania predykcji
w codziennej działalności organizacji:
Zarządzanie i sprawdzanie reguł decyzyjnych (wynikających z zasad prowadzenia
działalności w danej organizacji, zewnętrznych regulacji oraz interpretacji wyników
modeli i zasad ich stosowania).
Modelowanie predykcyjne (wykorzystanie danych historycznych do segmentacji, kla-
syfikacji, przewidywania i prognozowania).
Zarządzanie modelami (wdrażanie i uruchamianie modeli, system uprawnień oraz
nadzorowanie działania modeli predykcyjnych).
Text mining (wykorzystanie w modelach tekstów w języku naturalnym).
Obliczanie przewidywań na życzenie i w zadanych odstępach czasu (stosowanie mo-
deli dla nowych danych na życzenie lub w oparciu o harmonogram z zapisem wyników
w bazie lub hurtowni danych).
Automatyzacja i integracja z innymi systemami (z wykorzystaniem standardowych
technologii, np. OLE DB, SOAP oraz skryptów Visual Basic).
Wizualizacja danych (ułatwienie zrozumienia wykrytych wzorców i prezentacja wyni-
ków za pomocą wykresów).
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
15
Szkolenia StatSoft Polska
Kursy organizowane przez StatSoft Polska przeznaczone są dla wszystkich, którzy w krót-
kim czasie chcą zdobyć lub pogłębić wiedzę w zakresie przetwarzania i analizy danych
w różnych dziedzinach i zastosowaniach oraz obsługi programów STATISTICA. Oprócz
kursów otwartych realizujemy także szkolenia i warsztaty na zamówienie.
Nasze kursy są kursami autorskimi, a nie kalkami szkoleń przygotowanych za granicą
i przetłumaczonych na język polski. Dzięki temu są one doskonale dopasowane do pol-
skich realiów i spełniają oczekiwania uczestników. Gwarancją najwyższej jakości naszych
szkoleń są prowadzący – specjaliści w zakresie analizy danych, mający rozległe doświad-
czenie. W ciągu kilkunastu lat przeszkoliliśmy tysiące osób na kilkuset szkoleniach.
Uczestnicy naszych kursów otrzymują obszerne materiały szkoleniowe, a także pliki z da-
nymi, które prowadzący wykorzystują w czasie szkoleń. Dzięki temu późniejsze samo-
dzielne przypomnienie zagadnień omawianych w czasie kursów jest znacznie ułatwione.
Oprócz szkoleń współpracujemy także z renomowanymi polskimi uczelniami wyższymi
przy organizacji studiów podyplomowych, które związane są z analizą danych.
Kursy otwarte w Krakowie
Kursy otwarte StatSoft Polska odbywają się w naszym Centrum Szkoleniowym w Krako-
wie, w małych grupach. Lista dostępnych kursów jest stale rozszerzana – obecnie jest już
ponad 50 różnych tematów kursów do wyboru. Proponujemy m.in. gotowe cykle
szkoleniowe:
Statystyka w medycynie
Statystyczna analiza danych
Prognozowanie
Data mining
Marketing i badania rynku
To tylko przykładowe ścieżki kursowe. Chętnie pomożemy w doborze tematów i zaplano-
waniu odpowiedniej kolejności potrzebnych kursów każdej zainteresowanej osobie czy
instytucji.
Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Kursy otwarte. Można tam
znaleźć m.in. takie informacje o kursach otwartych, jak: aktualny terminarz, szczegółowe
programy, informacje organizacyjne, formularz zgłoszeniowy.
Szkolenia i warsztaty na zamówienie
Szkolenia na zamówienie mogą zostać przeprowadzone zgodnie z naszymi standardowymi
programami lub można je w dowolnym stopniu dopasować. Możemy też przygotować
zupełnie nowe szkolenie, dopasowane do indywidualnych, specjalistycznych wymagań.
Zajęcia mogą mieć formę warsztatów, w czasie których wykorzystywane są dane dostar-
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
16
czone przez uczestników szkolenia. Dzięki takiemu podejściu wiedza z zakresu analizy
danych jest przyswajana znacznie łatwiej.
Szkolenia na zamówienie mogą odbyć się w dowolnym miejscu w Polsce – w siedzibie
zamawiającego, w Centrum Szkoleniowym StatSoft czy innym, wybranym miejscu.
Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Kursy na zamówienie.
Usługi konsultingowe i wdrożeniowe
StatSoft Polska oferuje różnego rodzaju usługi związane z analizą danych (statystyczną,
data mining itp.) i oprogramowaniem STATISTICA. Są to usługi konsultingowe (doradcze),
wdrożeniowe itp. Każda firma czy instytucja może skorzystać z doświadczenia konsul-
tantów StatSoft Polska, specjalistów w zakresie analizy danych i wykorzystania oprogra-
mowania STATISTICA, aby zapewnić poprawność i efektywność wykonywanych analiz,
powodzenie wdrożenia systemów analitycznych i ich zgodność z normami czy innymi
wymogami.
Członkowie zespołu StatSoft brali udział w projektach i przygotowywali opracowania dla
wielu przedsiębiorstw i instytucji. Doświadczenie i rozległa wiedza konsultantów, zorien-
towanie na potrzeby klientów, terminowość i zaangażowanie analityków oraz stosowanie
najlepszych narzędzi analitycznych to nasz sposób na powodzenie projektów i zadowolenie
klientów.
Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Konsulting.
Usługi wdrożeniowe
StatSoft Polska oferuje szeroką gamę usług polegających na implementacji i integracji
systemów – od niewielkich systemów monitorowania i analiz czy dostosowania oprogra-
mowania STATISTICA do pracy z istniejącą bazą danych, po wdrożenia zintegrowanych,
korporacyjnych systemów analitycznych, obejmujących zbieranie danych, hurtownię oraz
system analiz oraz raportowania i publikacji.
StatSoft ma wieloletnie doświadczenie w realizacji zaawansowanych projektów informa-
tycznych w dziedzinie analizy statystycznej, data mining, monitorowania i raportowania
dla różnorodnych zastosowań i klientów. Są wśród nich rozwiązania dla setek użytkowni-
ków w ramach największych, międzynarodowych korporacji oraz wysoce wyspecjalizowa-
ne systemy wspierające prace niewielkich zespołów analityków i ekspertów. Wdrożeniom
naszych systemów informatycznych towarzyszą szkolenia dotyczące obsługi systemów
i stosowanych metod analizy danych oraz usługi konsultingowe.
Nasze rozwiązania zwykle obejmują:
stworzenie systemu ETL łączącego dane z różnych źródeł i przygotowującego je do
analizy,
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
17
zaprojektowanie i wdrożenie hurtowni lub analitycznej bazy danych na potrzeby
tworzenia i stosowania modeli,
opracowanie modeli predykcyjnych,
przygotowanie systemów automatycznie stosujących modele dla nowych klientów,
transakcji, okresów, partii produkcyjnych itp.,
stworzenie systemu raportowego, automatycznie tworzącego raporty i rozpowszech-
niającego je, np. w portalu internetowym lub poprzez pocztę elektroniczną.
ETL ABD
Transakcyjne bazy danych
System akwizycji danych
Plikowe źródła danych
Integracja źródeł danych
Analityczna baza danych
Portal
10%
15%
20%
33%8%14%
Silnik reguł i modeli
Repozytorium reguł i modeli
Reguły biznesowe
Pulpit menadżerski
Użytkownicy
Inne aplikacje
Zewnętrzna baza danych
System raportowy
Opracowywanie modeli
Monitorowanie kluczowych parametrów
Realizujemy wdrożenia modeli analitycznych (np. prognostycznych) i rozwiązań data
mining, przemysłowych rozwiązań SPC, aplikacji dla przemysłu farmaceutycznego, labo-
ratoriów badawczych i pomiarowych, bankowości i finansów, medycyny, badań rynku
i wiele innych.
Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Systemy dedykowane.
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
18
Popularyzacja wiedzy z zakresu analizy danych
StatSoft od wielu lat przyczynia się w dużym stopniu do popularyzacji wiedzy związanej
z analizą danych i jej prawidłowym stosowaniem w różnych dziedzinach. Szkolimy osoby
zajmujące się analizą danych, pomagamy w doborze i optymalizacji wykorzystywania róż-
nych narzędzi analitycznych. Organizujemy seminaria, webinaria, konferencje i inne wyda-
rzenia, podczas których specjaliści i praktycy zajmujący się na co dzień analizą danych
dzielą się swoimi doświadczeniami. Na naszych stronach internetowych udostępniamy
obszerne zasoby różnych materiałów, które dotyczą różnych zastosowań analizy danych,
narzędzi analitycznych itp.
Seminaria, konferencje
Regularnie organizujemy seminaria i konferencje, na których przedstawiane są zastosowa-
nia różnych technik analizy danych i narzędzia z rodziny STATISTICA. Tematykę poszcze-
gólnych wydarzeń dostosowujemy do aktualnych trendów i oczekiwań. Nasze seminaria co
roku przyciągają setki zainteresowanych.
Nasze seminaria i konferencje to przede wszystkim ciekawe wystąpienia, prezentowane
przez specjalistów w zakresie analizy danych, a także możliwość nawiązania nowych kon-
taktów i wymiany doświadczeń z osobami z całej Polski, a wszystko to w miłej atmosferze.
Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Seminaria.
Prezentacje internetowe – webinaria, webcasty
Idąc z duchem czasu, regularnie organizujemy prezentacje internetowe – webinaria. Jest to
doskonały sposób, aby za pośrednictwem Internetu wysłuchać ciekawych wystąpień, nie
ruszając się sprzed własnego komputera.
Na naszych stronach WWW zamieszczane są nagrania tych i wielu innych prezentacji
internetowych. Dzięki temu można pozyskać wiele ciekawych informacji na tematy
związane z nowoczesną analizą danych w dowolnym miejscu i o dogodnej porze.
Więcej informacji na www.statsoft.pl, menu Zasoby, sekcja Webinaria i webcast.
Zasoby na stronach internetowych StatSoft
Strony internetowe StatSoft są skarbnicą wiedzy z zakresu analizy danych w różnych dzie-
dzinach. Każdy zainteresowany tą tematyką znajdzie coś dla siebie. Poniżej wymienione są
wybrane zasoby. Podane opisy wyjaśniają, jak łatwo uzyskać przekierowanie ze strony
głównej StatSoft Polska www.statsoft.pl do odpowiedniego zasobu, poprzez grupy menu
dostępne na początku strony:
Wirtualna czytelnia – menu Zasoby, sekcja Czytelnia.
Internetowy podręcznik statystyki:
Wersja polska – menu Zasoby, sekcja Podręcznik statystyki (pol),
Copyright © StatSoft Polska 2014, info@DaneWiedzaSukces.pl
19
Wersja angielska – menu Zasoby, sekcja Podręcznik statystyki (ang).
Często zadawane pytania dotyczące instalacji i obsługi oprogramowania STATISTICA
i odpowiedzi na nie – menu Zasoby, sekcja Pytania i odpowiedzi.
Pobieranie plików (rozszerzenia i uaktualnienia STATISTICA, wersja próbna itp.) –
menu Zasoby, sekcja Do pobrania.
Księgarnia internetowa – menu Zasoby, sekcja Książki.
Strona StatSoft Inc. – menu O Firmie, sekcja Centrala lub www.statsoft.com.
To tylko wybrane zasoby. Zachęcamy do odwiedzania stron www.statsoft.pl, które są na
bieżąco aktualizowane i rozbudowywane.
Specjalna oferta dla uczelni
Mając na uwadze potrzeby instytucji naukowych i edukacyjnych, proponujemy uczelniom
powszechny dostęp do oprogramowania STATISTICA oraz korzystanie z naszych szkoleń
i innych usług na specjalnych warunkach.
Specjalne Licencje Akademickie typu Site License na programy z rodziny STATISTICA
zapewniają wszystkim pracownikom i studentom danej uczelni (lub wydziału) dostęp do
najnowocześniejszych rozwiązań w zakresie statystycznej analizy danych, data mining oraz
wizualizacji danych. W ramach licencji można instalować oprogramowanie na kompute-
rach uczelnianych, a także na komputerach domowych pracowników i studentów. Oprogra-
mowanie STATISTICA może być wykorzystywane zarówno do celów dydaktyczno-
edukacyjnych, jak i badań naukowych.
Uczelniom i instytutom PAN oferujemy także oprogramowanie STATISTICA na określoną
liczbę komputerów oraz udział w szkoleniach ze specjalną zniżką. Możemy zapewnić także
wszechstronną pomoc, np. w przeprowadzaniu analiz.
Już od prawie 15 lat StatSoft organizuje konkurs na najlepszą pracę doktorską i magister-
ską przygotowaną z zastosowaniem narzędzi statystyki i analizy danych zawartych w prog-
ramach STATISTICA. Celem konkursu jest promocja autorów najlepszych prac oraz
popularyzacja nowoczesnych metod analizy danych.
Więcej informacji na www.statsoft.pl, menu Rozwiązania, sekcja Oferta akademicka.