Statystyczne metody analizy danych - Strona...
Transcript of Statystyczne metody analizy danych - Strona...
![Page 1: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/1.jpg)
Statystyczne metody analizy danych
Agnieszka Nowak - Brzezińska
![Page 2: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/2.jpg)
SZEREGI STATYSTYCZNE
SZEREGI STATYSTYCZNE – odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny.
Szeregi statystyczne dzielimy na szeregi:
• szczegółowe
• rozdzielcze (punktowe, przedziałowe)
• czasowe (momentów, okresów)
![Page 3: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/3.jpg)
Szereg rozdzielczy
• Szereg rozdzielczy to uporządkowany i pogrupowany materiał statystyczny. Poszczególnym wariantom cech ilościowym lub jakościowym przyporządkowane są odpowiadające im liczebności.
• szereg rozdzielczy punktowy (buduje się przeważnie dla cechy skokowej).
• szereg rozdzielczy przedziałowy (budowany jest dla cech ciągłych. Złożony jest z przedziałów klasowych, ich granice mogą być domknięte lub otwarte. Rozpiętość przedziału (interwał), jest różnicą między górną i dolną granicą klasy).
![Page 4: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/4.jpg)
Etapy budowy przedziałów w szeregach rozdzielczych przedziałowych
• mogą być następujące: • ustalenie liczby klas • Można skorzystać ze wzoru: • gdzie: k – liczba klas, N – liczba obserwacji • ustalenie wartości cechy minimalnej i maksymalnej • Są to wartości cech odpowiednio najmniejsze (xmax) oraz
(xmin), które mogą stanowić początek pierwszego przedziału (xmin) oraz koniec ostatniego (xmax).
• ustalenie rozpiętości przedziałów klasowych • Rozpiętość można wyznaczyć następująco: • gdzie: h - rozpiętość przedziału • budowa przedziałów klasowych
![Page 5: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/5.jpg)
szereg rozdzielczy punktowy - przykład
• Badaniu objęto 20 studentów pod względem liczby rodzeństwa. Otrzymano następujące wyniki: 2, 3, 1, 0, 4, 2, 3, 1, 0, 2, 3, 2, 4, 0, 0, 4, 2, 3, 1, 5.
• Badana cecha (liczba rodzeństwa) jest cechą skokową. W celu utworzeni szeregu rozdzielczego punktowego należy obliczyć liczebność związaną z wariantami badanej cechy.
![Page 6: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/6.jpg)
szereg rozdzielczy przedziałowy - przykład
• Badaniu objęto 20 pracowników pewnej firmy ze względu na staż pracy. Otrzymano następujące wartości: 12, 20, 2, 15, 16, 30, 6, 21, 5, 13, 12, 25, 4, 16, 21, 23, 14, 18, 16, 9.
• W tym przypadku wskazana jest budowa szeregu rozdzielczego przedziałowego. Liczbę klas oraz rozpiętość można wyznaczyć z powyrzej podanych wzorów: N=20, xmin=2, xmax=30, k=4 (po zaokrągleniu), h=6 (po zaokrągleniu).
![Page 7: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/7.jpg)
PRZYKŁAD 1 (szereg szczegółowy i szereg rozdzielczy)
![Page 8: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/8.jpg)
SZEREG ROZDZIELCZY PUNKTOWY
![Page 9: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/9.jpg)
ZALECENIA przy grupowaniu w szereg rozdzielczy przedziałowy
![Page 10: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/10.jpg)
![Page 11: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/11.jpg)
![Page 12: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/12.jpg)
![Page 13: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/13.jpg)
![Page 14: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/14.jpg)
![Page 15: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/15.jpg)
Średnia arytmetyczna • Średnią arytmetyczną - definiuje się jako sumę wartości cechy mierzalnej
podzieloną przez liczbę jednostek skończonej zbiorowości statystycznej.
gdzie: n - liczebność zbiorowości próbnej (próby), xi - wariant cechy.
![Page 16: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/16.jpg)
![Page 17: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/17.jpg)
![Page 18: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/18.jpg)
![Page 19: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/19.jpg)
Należy pamiętać, że przy pogrupowaniu danych
źródłowych w szereg rozdzielczy przedziałowy
następuje pewna utrata informacji.
Jeżeli policzymy średnią dla szeregu szczegółowego lub
szeregu rozdzielczego punktowego, to wynik będzie
dokładny i taki sam.
Dla danych w postaci szeregu rozdzielczego przedziałowego
średnia będzie już przybliżeniem. Tym większym, im szersze są
przedziały klasowe, im jest ich mniej, itd. Y
![Page 20: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/20.jpg)
![Page 21: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/21.jpg)
Ważniejsze własności ŚREDNIEJ arytmetycznej
![Page 22: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/22.jpg)
Średnia geometryczna
Średnią geometryczną - stosuje się w badaniach średniego tempa zmian zjawisk, a więc gdy zjawiska są ujmowane dynamicznie.
![Page 23: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/23.jpg)
Moda • Modalna (dominanta D, moda, wartość najczęstsza) - jest to wartość
cechy statystycznej, która w danym rozdziale empirycznym występuje najczęściej.
• Dla szeregów szczegółowych oraz szeregów rozdzielczych punktowych modalna odpowiada wartości cechy o największej liczebności (częstości).
• W szeregach rozdzielczych z przedziałami klasowymi bezpośrednio można określić tylko przedział, w którym modalna występuje, jej przybliżoną wartość wyznacza się graficznie z histogramu liczebności (częstości) lub ze wzoru interpolacyjnego:
gdzie: m - numer przedziału (klasy), w którym występuje modalna,
- dolna granica przedziału, w którym występuje modalna,
nm - liczebność przedziału modalnej, tzn. klasy o numerze m, nm-1;
nm+1 - liczebność klas poprzedzającej i następnej, o numerach m -1 i m + 1,
hm - rozpiętość przedziału klasowego, w którym występuje modalna.
![Page 24: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/24.jpg)
• Modalna (Mo) zwana też dominantą (D) jest to wartość cechy, która występuje najczęściej w badanej zbiorowości.
![Page 25: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/25.jpg)
Dominanta
• Dominanta (modalna, wartość najczęstsza) należy do średnich pozycyjnych i jest taką wartością zmiennej, która w danym rozkładzie empirycznym najczęściej występuje.
• Zastosowanie – Dominanta stosowana jest do wskazania jaka wartość cechy statystycznej ma największą
liczebność (jest najbardziej popularna) w określonej zbiorowości.
• Wyznaczenie modalnej możliwe jest gdy rozkład empiryczny posiada jeden ośrodek dominujący, asymetria rozkładu jest umiarkowana oraz gdy przedział dominanty i dwa sąsiednie mają taki sam interwał (rozpiętość przedziału, czyli wartość różnicy między górną i dolną granicą badanej cechy).
• dla szeregu szczegółowego i rozdzielczego punktowego W szeregach szczegółowych i rozdzielczych punktowych dominantą jest wartość cechy, której odpowiada największa liczebność.
• dla szeregu rozdzielczego przedziałowego W szeregach rozdzielczych przedziałowych modalna znajduję się w przedziale o największej liczebności. Dla wyznaczenia konkretnej wartości liczbowej wartości najczęstszej, znajdującej się w danym przedziale zastosowanie ma wzór:
![Page 26: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/26.jpg)
Y
Y
![Page 27: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/27.jpg)
Y
Y
![Page 28: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/28.jpg)
Y
![Page 29: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/29.jpg)
Modalna możemy wyznaczyć graficznie tak jak to pokazano na rysunku
![Page 30: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/30.jpg)
Modalną wyznaczamy i sensownie interpretujemy tylko wtedy, gdy dane są pogrupowane w szereg rozdzielczy (punktowy lub przedziałowy).
2. Liczebność populacji powinna być dostatecznie duża. 3. Diagram lub histogram liczebności (częstości) ma wyraźnie
zaznaczone jedno maksimum (rozkład jednomodalny). 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy
modalna nie występuje w skrajnych przedziałach (pierwszym lub ostatnim) - przypadek skrajnej asymetrii. Nie da się w takim przypadku analitycznie wyznaczyć modalnej.
5. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy przedział modalnej oraz dwa sąsiednie przedziały (poprzedzający i następujący po przedziale modalnej) powinny mieć taką samą rozpiętość.
![Page 31: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/31.jpg)
Mediana
• Mediana (Me) - wartość środkowa, inaczej: kwartyl 2 (QII).
• Jest to taka wartość cechy X, która dzieli zbiorowość na dwie równe części, tj. połowa zbiorowości charakteryzuje się wartością cechy X mniejszą lub równą medianie, a druga połowa większą lub równą.
Mediana dla szeregu szczegółowego
• Szereg musi być posortowany rosnąco !!!
• Wartość mediany wyznacza się inaczej gdy liczebność populacji (n) jest nieparzysta, a inaczej gdy jest parzysta.
![Page 32: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/32.jpg)
![Page 33: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/33.jpg)
![Page 34: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/34.jpg)
![Page 35: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/35.jpg)
![Page 36: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/36.jpg)
Y
Y
![Page 37: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/37.jpg)
Y
Y
![Page 38: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/38.jpg)
Kwartyl pierwszy i trzeci
• Dla szeregu szczegółowego kwartyl pierwszy i trzeci wyznacza się w ten sposób, że w dwóch częściach zbiorowości, które powstały po wyznaczeniu mediany, ponownie wyznacza się medianę; mediana w pierwszej części odpowiada kwartylowi pierwszemu, a w drugiej kwartylowi trzeciemu.
• Dla szeregu rozdzielczego wyznaczenie kwartyli poprzedza się ustaleniem ich pozycji:
![Page 39: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/39.jpg)
• gdzie: m - numer przedziału (klasy), w którym występuje odpowiadający mu kwartyl, - dolna granica tego przedziału, nm - liczebność przedziału, w którym występuje odpowiedni kwartyl, - liczebność skumulowana do przedziału poprzedzającego kwartyl, hm - rozpiętość przedziału klasowego, w którym jest odpowiedni kwartyl.
![Page 40: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/40.jpg)
Dla szeregów szczegółowych
![Page 41: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/41.jpg)
przykład
• Weźmy dane o liczbie braków:
• 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4
• Jak pamiętamy: n=50
![Page 42: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/42.jpg)
![Page 43: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/43.jpg)
Dla szeregów rozdzielczych punktowych
![Page 44: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/44.jpg)
![Page 45: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/45.jpg)
Dla szeregów rozdzielczych przedziałowych
![Page 46: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/46.jpg)
czas dojazdu pracowników firmy Y
![Page 47: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/47.jpg)
Rozstęp
• Najprostszą i najbardziej intuicyjną miarą zmienności przypadków w populacji próby jest rozstęp.
• Rozstęp - różnica pomiędzy wartością maksymalną, a minimalną cechy - jest miarą charakteryzującą empiryczny obszar zmienności badanej cechy. W związku z tym, że przy jego obliczeniu ignoruje się wszystkie dane (za wyjątkiem dwóch wartości - minimalnej i maksymalnej), nie daje on jednak informacji o zróżnicowaniu poszczególnych wartości cechy w zbiorowości.
![Page 48: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/48.jpg)
Dla szeregów szczegółowych
• Weźmy dane z (liczba braków):
• 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0,0, 0,
0, 0, 0, 0, 0, 0, 0,
0, 1, 1, 1, 1, 1, 1,
1, 1, 2, 2,2, 2, 2, 2,
3, 3, 3, 3, 4, 4
![Page 49: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/49.jpg)
Inny przykład
• Weźmy dane z innego przykładu
10, 10, 10, 12, 12, 12, 12,
13, 13, 13,
13, 13, 14, 14, 15, 15, 15
![Page 50: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/50.jpg)
Dla szeregów rozdzielczych punktowych
![Page 51: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/51.jpg)
Dla szeregów rozdzielczych przedziałowych
![Page 52: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/52.jpg)
• histogramy i wykresy częstości
• wykresy rozrzutu (scatterplots)
• wykresy pudełkowe (boxplot)
Graficzny opis danych
![Page 53: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/53.jpg)
![Page 54: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/54.jpg)
• Dla danych jakościowych • Porządkują wiedze o danych analizowanych • Pokazują odchylenia w danych • Pokazują dane dominujące w zbiorze
histogramy
Histogram to jeden z graficznych sposobów przedstawienia rozkładu empirycznego cechy. Składa się z szeregu prostokątów umieszczonych na osi współrzędnych. Na osi „X” mamy przedziały klasowe wartości cechy np. dla atrybutu płeć: „K, M”, na osi „Y” liczebność tych przedziałów.
![Page 55: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/55.jpg)
Histogram
• Najpopularniejsza statystyka graficzna. Przedstawia liczności pacjentów w poszczególnych przedziałach (nazywanych tez kubełkami) danej zmiennej.
• Domyślnie w funkcji histogram liczba kubełków dobierana jest w zależności od liczby obserwacji jak i ich zmienności.
• Możemy jednak subiektywnie wybrać interesującą nas liczbę kubełków.
![Page 56: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/56.jpg)
Histogram a rodzaj danych
Dane jakościowe Dane ilościowe
![Page 57: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/57.jpg)
Wykres punktowy (rozrzutu)
![Page 58: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/58.jpg)
Dla tych samych danych
O tym która linia regresji lepiej odwzrowuje dane decyduje współczynnik determinacji R2.
![Page 59: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/59.jpg)
Wykresy rozrzutu pokazują relację między daną na osi X a daną na osi Y
Wykresy rozrzutu też wskazują dobrze odchylenia w danych
![Page 60: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/60.jpg)
Typ korelacji
Scatterplot showing no discernable relationship
Nieliniowa zależność danych
Korelacja ujemna
![Page 61: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/61.jpg)
Wykres pudełkowy
• Wykres pudełkowy można wyznaczać dla pojedynczej zmiennej, dla kilku zmiennych lub dla pojedynczej zmiennej w rozbiciu na grupy.
• Wykres przedstawia medianę (środek pudełka), kwartyle (dolna i górna granica pudełka), obserwacje odstające (zaznaczane kropkami) oraz maksimum i minimum po usunięciu obserwacji odstających.
• Wykres pudełkowy jest bardzo popularną metodą prezentacji zmienności pojedynczej zmiennej.
![Page 62: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/62.jpg)
![Page 63: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/63.jpg)
![Page 64: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/64.jpg)
![Page 65: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/65.jpg)
Co można odczytać z wykresów?
Boxplot Histogram
Kwantyl tak nie
Mediana tak nie
Wartość min tak tak
Wartość max tak tak
Wartość cechy tak tak
Liczebność nie tak
Częstość nie tak
Wzajemna korelacja zmiennych
nie tak
![Page 66: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/66.jpg)
Wykres łodygowo-liściowy
• Diagram łodygowo-listkowy (ang. stemplot lub stem-and-leaf diagram) jest graficznym sposobem prezentacji danych ilościowych. Podobnie jak histogram, służy on do przedstawiania kształtu rozkładu, ma jednak nad nim tę przewagę, że przedstawia wszystkie dane, które tworzą rozkład.
• Diagram łodygowo-listkowy rysuje się w bardzo prosty sposób. Ustalamy najpierw, jakie liczby stanowić będą łodygę, zwykle opuszczając jedną lub dwie cyfry w zapisie dziesiętnym, a następnie sortujemy je rosnąco. Uzyskane liczby zapisujemy w jednej kolumnie, oddzielamy pionową kreską i dopisujemy obok obcięte końcówki – liście.
![Page 67: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/67.jpg)
![Page 68: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/68.jpg)
Histogram
• wykres częstości danych. Wykonamy go za pomocą polecenia: hist()
![Page 69: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/69.jpg)
![Page 70: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/70.jpg)
Scatter plot – wykres rozrzutu
• Wykres rozrzutu punktów na osiach X i Y. plot(x-variable, y-variable)
![Page 71: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/71.jpg)
Box-and-Whisker Plot – wykres pudełkowy.
boxplot(var1,var2) na wykresie zmienne będą zaprezentowane w takiej kolejności jak argument funkcji boxplot a więc najpierw var1 a potem var2.
> boxplot(gnp,invest)
![Page 72: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/72.jpg)
Wykres kołowy (Pie charts)
• świetnie przedstawiają procentowy rozkład danych. > pie(gnp)
![Page 73: Statystyczne metody analizy danych - Strona Głównazsi.tech.us.edu.pl/~nowak/smad/SMADw2szeregi.pdf · 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie](https://reader031.fdocument.pub/reader031/viewer/2022020216/5c76c5f509d3f2d3778c1824/html5/thumbnails/73.jpg)
Obowiązkowa lektura…
http://zsi.tech.us.edu.pl/~nowak/smad/smad_lab4.pdf