Adattípusok, ábrák és grafikonok az...
Transcript of Adattípusok, ábrák és grafikonok az...
Táblázatok és grafikonok
• Elsőként mindig érdemes táblázatokba rendezni és ábrázolni az adatokat!
• Miért?
• Ismerkedjünk az adatokkal!
• Milyen különbségek látszanak? Milyen irányba?
• A statisztika semmit nem mond, ha mindezt nem látjuk! Az soha nem elég információ, hogy szignifikánsak a különbségek!!!
• Bizonyos esetekben a teszt megválasztását is befolyásolhatja, amit a vizuális benyomások keltenek! (l. később az egy vagy kétoldalas tesztek)
Amit ne
• Ne felejtsük el a PONTOS tengelycímeket !!!darab?? %?? Más??! Mi a dimenzió???
• Se a jelmagyarázatot! (mi a két oszlop?)
• Kétdimenziós adatokat soseábrázoljunk 3D-ben!
• 2 db adatot általában nem ábrázolunk grafikonon
0
5
10
15
kutya cica tehénke
Me
gaka
dás
jele
nsé
g
Táblázatok és grafikonok
Kérdés: hogyan változik a magánhangzók azonosítása az éneklésben az f0 függvényében? (identification_test_halg.xlsx)
Hipotézis: csökken az ejtési szándék szerinti azonosítás aránya, mert egyre jobban megváltozik a magánhangzók ejtése.
• Észlelési kísérlet (identification_test.xlsx)
• Excel táblázat (milyen infók vannak benne? Honnan?)
• Alakítsuk át a nyers adatokat! nyers_egyadatkozlo fül
• Hogyan elemezzem?
• Confusion matrices (SPSS): inger – válasz párok
Táblázatok és grafikonok
Kérdés: hogyan változik a magánhangzók azonosítása az éneklésben az f0 függvényében? (identification_test_halg.xlsx)
Hipotézis: csökken az ejtési szándék szerinti azonosítás aránya, mert egyre jobban megváltozik a magánhangzók ejtése.
• Alakítsuk át a nyers adatokat! nyers_egyadatkozlo fül
darab(), darab2(), darabteli(), jobb(), bal(), sorokból oszlopok
Confusion matrices (SPSS): inger – válasz párok
Analyze > tables > Custom tables
Darabszám vagy az összes válasz százalékos aránya: count + row totalN %,
Adatok szétszedése csoportokra: split file f0-ra és test/filler-re!!!
Táblázatok és grafikonok
Kérdés: Hogyan ítélnek meg bizonyos innovatív nyelvi formákat felnőtt magyar anyanyelvű beszélők? A nyelvi formák két változatának elfogadottsága érdekel! (innovativ_halg.xlsx)
Hipotézis: ? (exploratív elemzés)
Elfogadható a mondat?
1: egyáltalán nem 5: teljesen
• Likert skálás válaszok hogyan elemezzem?
Táblázatok és grafikonok
innovativ_halg.xlsx
• Sorsz.: adatközlő száma
• Valtozo: nyelvi változó, aminek a két variánsát
teszteltük
• Valtozo variansa: a két variáns
• valaszTipus: a két variáns a konzervatív és innovatív
kategóriák szerint átkódolva (ez érdekel minket, mert
ettől lesz minden nyelvi változó együtt kezelhető)
• Ertekeles: válasz 1-5-ig terjedő skálán
Táblázatok és grafikonok
Elfogadható a mondat?
1: egyáltalán nem 5: teljesen
Arra vagyok kíváncsi, hogy milyen az újabb
(innovatív) vagy a régebbi (konzervatív) változó
megítélése az összes változó esetben: Van eltérés
köztük? Ha van, melyiket preferálják a kettőből?
Boxplot (spss): clustered!
Variable: ertekeles, Cathegory Axis:
kerdesKategoria, Clusters by: innovKonzValasz
Mit tehetek, ha arra vagyok kíváncsi, hogy
• relatíve, az összes nyelvi változóban, egymáshoz képest van-e eltérés a két változat megítélése között?
• ezek a relatív eltérések mekkora horderejűek –azaz van-e kiugróan eltérő (jó vagy rossz) megítélésű relatíve, az átlagoshoz képest
És szeretném kivonni a képletből az egyéni válaszadási stratégiákat is.
Standardizálás SPSSben & boxplot
Mivel az emberek egyedi válaszadási stratégiákkal élnek, és az egy emberen belüli kiugrások érdekelnek standardizálás egyénenként.
• Split by subject
• Analyze > Descriptive Statistics > Descriptives > Variables: ertekeles > TICK boksz: save standardizedvalues as variables egy új oszlopban elmenti a standardizált értékeket.
• Ábra? Boxplot: split visszavonása, clustered byinnovKonz
Standardizálás: az adott érték hány szórásnyira van az átlagtól0: átlagos Előjel: (--) kisebb vagy (+) nagyobb mint az átlagÉrtelmezés: Az akiami „innovatív”, az anema „innovatív” és kisebb mértékben az iknemik „ikes” értékelése kirívó kirívóan elutasítják.
Táblázatok és grafikonok
Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott.xlsx)
Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb.
• Formánsfrekvenciák Hogyan elemezzem?
• Első körben grafikusan excel!!!
Táblázatok és grafikonok
Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott.xlsx)
Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb.
• Akusztikus magánhangzótér #1 az összes adat pontdiagramon – elkülönítés a Vk mentén.
Pontdiagram
700
1200
1700
2200
2700
3200
100 300 500 700 900 1100 1300 1500
F2 (
Hz)
F1 (Hz)
a:
i:
u:
a:
i:
u:
• Minden V egy adatsor• X-Y pontdiagram• Tengelycímek!!!
• Alakítsuk úgy a diagram orientációját, hogy
megfeleljen az IPA konvenciónak. Mit kell
ehhez tenni?
• Alakítsuk úgy a diagram orientációját, hogy
megfeleljen az IPA konvenciónak. Mit kell
ehhez tenni?
• x-tengely: F2
• y-tengely: F1
• Tengelyek megfordítása
• Akusztikus magánhangzótér #2
• ugyanezen adatokkal, összekötött pontdiagram mediánokkal vagy átlagokkal –elkülönítés az életkor mentén.
Összekötött pontdiagram átlagokkal
í
ú
á
1000
1500
2000
2500
3000
3500
200 400 600 800 1000 1200
F2 (
Hz)
F1 (Hz)
gyermek
felnott
Táblázatok és grafikonok
Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott_halg.xlsx)
Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb.
• Formánsfrekvenciák Hogyan elemezzem?
• Szorgalmi: centralizáció mértékének operacionalizálása az egyes V-k euklideszi távolságának kiszámítása a V-tér középpontjától
𝑒𝑢𝑘 𝑑𝑖𝑠𝑡 = (𝑥1 − 𝑥2)2 + (𝑦1 − 𝑦2)2
Ahol az egyik pont koordinátái (x1, y1), a másiké (x2,y2)
𝑦𝑐𝑒𝑛𝑡𝑟 =𝐹2𝑖 + 𝐹2ú
2
V-tér középpontja pl. a szélső V-k átlaga :
𝑥𝑐𝑒𝑛𝑡𝑟 =𝐹1ú + 𝐹1á
2
í
úá
1000
1500
2000
2500
3000
3500
200 700 1200
F2 (
Hz)
F1 (Hz)
gyermek
felnott
Otthoni feladat gyakorlásképpen
Ugyanolyan időtartamúak a nyelvileg hosszú magánhangzók (a nyelvállástól függetlenül)? (longvow.xlsx)
Hipotézis:
Nem, a magánhangzók időtartama a nyelvállásfokkal változik (felső < középső < alsó és legalsó).
• Adatok: veláris V-k időtartamai Hogyan elemezzem (grafikusan)?
• Egy lehetőség: Boxplot.
Adatok forrása: http://clara.nytud.hu/~mady/courses/statistics/2012tavasz/index.html
Otthoni feladat gyakorlásképpen
Ugyanolyan időtartamúak a nyelvileg hosszú
magánhangzók (a nyelvállástól függetlenül)?
(longvow.xlsx)
Hipotézis:
Nem, a magánhangzók időtartama a nyelvállásfokkal
változik
(felső < középső < alsó és legalsó).
• Egy további lehetőség: átlag + szórás ábrázolása (SPSS)
Adatok forrása: http://clara.nytud.hu/~mady/courses/statistics/2012tavasz/index.html
Táblázatok és grafikonok
Kérdés: Átlagosan az állat vagy a növénynevek a hosszabbak? (ratings.xlsx)
Hipotézis: ? (exploratív)
• boxplot (otthon!)
• Hisztogram ezt csináljuk meg!
• Error bar (otthon!)
• Mi az összefüggés a szó hossza és a gyakorisága között? Lásd a folytatásban: korrelációelemzés.
Adatok forrása: R, „languageR” csomag
Összefüggés a szóhossz és gyakoriság között?
• Intuitívan:
• Készítsünk egy pont-diagramot, ami a két tengelya két adat
Házi feladatÁbrázoljuk a felnőtt nő és a gyermek magánhangzóit az akusztikus magánhangzótérben (F1 × F2 tér) úgy, hogy annak állása az az IPA elrendezéssel (azaz az artikulációs V-térrel) egyezzen!
• Érdemes használni az adatsor hozzáadása opciót!
• Állítsuk az x tengelyt a (200, 1300) tartományra!
• Állítsuk az y tengelyt az (500, 3500) tartományra!
• Mindkét skálán állítsuk be fő léptéknek az 500 Hz-et, kisléptéknek a 250 Hz-et!
• Vegyük fel a segédrácsokat!
• Vegyük fel a megfelelő tengelyfeliratokat (zárójelben a mértékegységgel)!
• Formázzuk meg úgy az adatsorokat, hogy elkülönüljenek a gyermek és a felnőtt nő adatai, de a megfelelő magánhangzók összetarozzanak (pl. más szín, de azonos forma)!
• Mentsük el a grafikont pdf-ben!
• Készítsük el a grafikont logaritmizált skálával is! Hasonlítsuk össze a két grafikont.