STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ......
Transcript of STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ......
![Page 1: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/1.jpg)
STATYSTYKA INDUKCYJNA
O sondażach i nie tylko
![Page 2: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/2.jpg)
www.logic.amu.edu.pl
DWA DZIAŁY
ESTYMACJA
Co na podstawie
wyników z próby
mogę powiedzieć o
wynikach w
populacji?
WERYFIKACJA
HIPOTEZ
Czy moje
przypuszczenia
uczynione przed
badaniami okazały
się słuszne?
![Page 3: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/3.jpg)
www.logic.amu.edu.pl
ESTYMACJA
Co znaczy to słowo?
z łac.:
aestimo, aestimare, czyli oceniać, szacować
z ang.:
to estimate, czyli szacować
z statysty.:
Szacowanie nieznanych parametrów z populacji generalnej na podstawie określonych statystyk z próby, a także błędów z tym
związanych (Sambor 1990)
z pol.:
Szacowanie badanej wartości w populacji na podstawie wyników uzyskanych z próby, a także określanie możliwej
pomyłki w tej sprawie.
![Page 4: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/4.jpg)
www.logic.amu.edu.pl
PO CO ESTYMACJA?
Wyniki zwykle podawane są w postaci:
Wśród badanych tekstów drobnych
wiadomości prasowych udział czasowników
wynosił 9,51%.
Próba: 100 000 tekstów.
Co z tego wiemy o wszystkich drobnych
wiadomościach prasowych w języku polskim?
Na razie niestety nic
![Page 5: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/5.jpg)
www.logic.amu.edu.pl
CO MOŻEMY WIEDZIEĆ?
Z całą pewnością?
NIC
Z pewnym założonym przez nas
prawdopodobieństwem:
MOŻEMY OKREŚLIĆ PRZEDZIAŁ W
JAKIM BĘDZIE SIĘ ZNAJDOWAŁA DANA
WARTOŚĆ
I to jest właśnie estymacja przedziałowa
![Page 6: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/6.jpg)
www.logic.amu.edu.pl
PO STATYSTYCZNEMU
Mamy dany ESTYMATOR
Czyli wartość otrzymaną z próby, która w jakiś sposób przybliża wartość w populacji
Zakładamy WSPÓŁCZYNNIK UFNOŚCI
Czyli prawdopodobieństwo z jakim uzyskany przez nas wynik będzie odpowiadał faktycznemu wynikowi w populacji
Obliczamy PRZEDZIAŁ UFNOŚCI
Czyli przedział, w którym będzie się mieścić nasz wynik w populacji
![Page 7: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/7.jpg)
www.logic.amu.edu.pl
JESZCZE BARDZIEJ PO STATYSTYCZNEMU
ESTYMATOR
Określona statystyka z próby, na podstawie którejszacujemy nieznany parametr w populacjigeneralnej
WSPÓŁCZYNNIK UFNOŚCI (1-α)
Określone z góry prawdopodobieństwo, z którymustalony przedział liczbowy pokryje nieznanąwartość parametru
PRZEDZIAŁ UFNOŚCI
„Jest to jeden z przedziałów, otrzymywanych zróżnych prób, mający tę własność, że w Xprzypadkach na 100 obejmuje on prawdziwąwartość [badanego] parametru”
(Sambor 1990)
![Page 8: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/8.jpg)
www.logic.amu.edu.pl
JAK TO WYGLĄDA W PRAKTYCE
Przebadany 100 000 tekstów
Wśród badanych tekstów udział czasowników
wynosił 9,51% Na podstawie obliczeń stwierdzono, że:
Z prawdopodobieństwem 99%
Przyjąć można, że
Udział czasowników w tekstach drobnych wiadomości
prasowych mieści się w przedziale:
(9,27 %; 9,74%)(Kamińska 1984)
ESTYMATOR
WSPÓŁCZYNNIK UFNOŚCI
PRZEDZIAŁ UFNOŚCI
PRÓBA
![Page 9: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/9.jpg)
www.logic.amu.edu.pl
Ważkie pytanie:
KTO W KOŃCU WYGRA TE WYBORY?!
Lub prościej:
ILE PROCENT DOSTANIE
GROBELNY?
![Page 10: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/10.jpg)
www.logic.amu.edu.pl
PEWIEN WAŻNY SONDAŻ
Wartość estymatora:
Współczynnik ufności:
Standardowo przyjmowane: 90%, 95%, 99% lub 99,9%
PRÓBA: 593 OSÓB
46,4%
46,4%
18,8%
5,1% 4,1%
Ryszard Grobelny
Grzegorz Ganowicz
Jacek Bachalski
Tadeusz Dziuba
źródło: www.wyborcza.pl
![Page 11: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/11.jpg)
www.logic.amu.edu.pl
OBLICZAMY…
WZÓR (dla częstości):
Estymator (plus, minus)
STAŁA
WARTOŚĆWARTOŚĆ
ESTYMATORA
LICZEBNOŚĆ
PRÓBY
![Page 12: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/12.jpg)
www.logic.amu.edu.pl
INNYMI SŁOWY…
PRZYJMUJE WARTOŚCI
(1-ά) 90% 95% 99% 99,9%
uα1,64 1,96 2,58 3,29
![Page 13: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/13.jpg)
www.logic.amu.edu.pl
JESZCZE KILKA INFORMACJI
Wzór:
Zmienna, którą szacujemy na charakter losowy
Pobrana próba jest duża (n>30) i
reprezentatywna
Zakładamy, że zmienna ma rozkład normalny
![Page 14: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/14.jpg)
www.logic.amu.edu.pl
ROZKŁAD NORMALNY
Zwany inaczej krzywą Gaussa lub krzywą
dzwonową
![Page 15: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/15.jpg)
www.logic.amu.edu.pl
NO TO LICZYMY
1) Wyniki Grobelnego dla różnych
współczynników ufności
2) Wyniki poszczególnych kandydatów dla
współczynnika ufności 95%
Próba: 593
obliczenia
46,4%
18,8%
5,1% 4,1%
Ryszard Grobelny
Grzegorz Ganowicz
Jacek Bachalski
Tadeusz Dziuba
![Page 16: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/16.jpg)
www.logic.amu.edu.pl
Proszę ustawić się w
SZEREG
ROZDZIELCZY.
Zmienna:
KOLOR OCZU.
![Page 17: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/17.jpg)
www.logic.amu.edu.pl
I JESZCZE RAZ WZORY
Dla częstości
Dla średniej, znane odchylenie standardowe w
próbie
![Page 18: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/18.jpg)
www.logic.amu.edu.pl
Próba: 859
Próba: 1011
Próba: 946
![Page 19: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/19.jpg)
www.logic.amu.edu.pl
WERYFIKACJA HIPOTEZ
Co to jest hipoteza?
Po co jest hipoteza?
Jaką najczęściej postać ma hipoteza?
3 przykłady hipotez dla dowolnych badań
związanych z językiem.
![Page 20: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/20.jpg)
www.logic.amu.edu.pl
LOGICZNE SENTYMENTY
Jak sprawdza się, czy konkluzja logicznie
wynika z przesłanek?
1. Zakładam, że nie wynika (prawdziwe
przesłanki, nieprawdziwy wniosek)
2. Sprawdzam, czy to możliwe.
3. Jeśli odrzucam tę możliwość – wiem, że
wynika.
analogicznie w statystyce
![Page 21: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/21.jpg)
www.logic.amu.edu.pl
SPRAWDZAJĄC HIPOTEZĘ
Dotyczącą związku między dwoma zjawiskami:
Zakładam, że ten związek nie istnieje.
Sprawdzam, jak bardzo jest ten brak związku
prawdopodobny.
W zależności od tego prawdopodobieństwa –
przyjmuję bądź odrzucam hipotezę o braku
związku
Tym samym – odrzucam bądź przyjmuję
hipotezę o istnieniu związku.
![Page 22: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/22.jpg)
www.logic.amu.edu.pl
PRZYKŁAD
Moje przypuszczenie: Istnieje związek między wykształceniem a ilością używanych słów.
Jak je sprawdzam:
1. Zakładam, że ten związek nie istnieje.
2. Na podstawie zebranych danych sprawdzam, jak bardzo jest to prawdopodobne.
3. Ustalam, że prawdopodobieństwo to wynosi 0,5%
WIĘC
4. Odrzucam swoje założenie
I TYM SAMYM
5. Przyjmuję swoje przypuszczenie, że istnieje związek między wykształceniem, a ilością używanych słów.
![Page 23: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/23.jpg)
www.logic.amu.edu.pl
TO TERAZ TO SAMO JĘZYKIEM
STATYSTYKI
1. Zakładam, że ten związek nie istnieje.
2. Sprawdzam, jak bardzo jest ten brak związku prawdopodobny
3. W zależności od tego prawdopodobieństwa –przyjmuję bądź odrzucam hipotezę o braku związku
4. Tym samym – odrzucam bądź przyjmuję hipotezę o istnieniu związku.
1. Przyjmuję hipotezę zerową
mówiącą o braku związku
między badanymi
zjawiskami.
2. Przy pomocy
odpowiedniego testu
statystycznego sprawdzam
poziom istotności.
3. W zależności od poziomu
istotności przyjmuję bądź
odrzucam hipotezę zerową.
4. Tym samym – odrzucam lub
przyjmuję hipotezę
alternatywną.
![Page 24: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/24.jpg)
www.logic.amu.edu.pl
PODSTAWOWE POJĘCIA
HIPOTEZA ZEROWA
Hipoteza sprawdzana testemstatystycznym, przeważnie stwierdza brak związkumiędzy badanymi zjawiskami.
POZIOM ISTOTNOŚCI
Prawdopodobieństwo z jakim prawdziwa jesthipoteza zerowa
TEST STATYSTYCZNY
Operacja matematyczna przeprowadzana naposiadanych danych określająca poziom istotności, atakże często siłę domniemanego związku.
![Page 25: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/25.jpg)
www.logic.amu.edu.pl
PYTANIA DO TEKSTU
Jak brzmiała hipoteza zerowa?
Jak bardzo była ona prawdopodobna?
Jaką hipotezę ostatecznie przyjęto?
Jakie jest prawdopodobieństwo jej
poprawności?
Jakie są ostatecznie konkluzje z badań (po
jednej na parę)
![Page 26: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/26.jpg)
www.logic.amu.edu.pl
![Page 27: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/27.jpg)
www.logic.amu.edu.pl
DWA DZIAŁY
ESTYMACJA
Co na podstawie
wyników z próby
mogę powiedzieć o
wynikach w
populacji?
WERYFIKACJA
HIPOTEZ
Czy moje
przypuszczenia
uczynione przed
badaniami okazały
się słuszne?
![Page 28: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/28.jpg)
ZA TYDZIEŃ –
KOLOKWIUM
Obecność obowiązkowa!
www.logic.amu.edu.pl
![Page 29: STATYSTYKA INDUKCYJNAlogic.amu.edu.pl/images/e/ee/Stat_indu_rozum.pdf · I JESZCZE RAZ WZORY ... Statystyka dla językoznawców, Warszawa 1990. Kamińska, I., Różnice między stylami](https://reader034.fdocument.pub/reader034/viewer/2022050410/5f87883ca7c9d17ee32ed30f/html5/thumbnails/29.jpg)
www.logic.amu.edu.pl
BIBLIOGRAFIA:
Hammerl, R., Sambor, J., Statystyka dla językoznawców, Warszawa 1990.
Kamińska, I., Różnice między stylami funkcjonalnymi polszczyzny
pisanej, Wrocław 1984.
Kleśta J., Analiza akustyczna polskich spółgłosek nosowych realizowanych
przez dzieci niesłyszące, Investigationes Linguisticae 2006.