Korelace a elaborace aneb úvod do vztahů proměnných
description
Transcript of Korelace a elaborace aneb úvod do vztahů proměnných
Korelace a elaborace aneb úvod do vztahů proměnných
L. Rabušic, konference 17.-18. 10. 2002, Brno
Závislost dvou proměnných-přehled
Nominální (kontingenční koeficienty, koeficienty Nominální (kontingenční koeficienty, koeficienty asociace)asociace)
Ordinální (Korelační koeficienty dle Spearmana a Ordinální (Korelační koeficienty dle Spearmana a Kendalla)Kendalla)
Kardinální (Pearsonův párový korelační Kardinální (Pearsonův párový korelační koeficient, párová regrese)koeficient, párová regrese)
L. Rabušic, konference 17.-18. 10. 2002, Brno
Začněme opakováním aneb 4 typy závislosti 2 kardinálních proměnných
Silná pozitivní závislostSilná pozitivní závislost Slabá pozitivní závislostSlabá pozitivní závislost Silná negativní závislostSilná negativní závislost Nulová závislostNulová závislost Dopad na korelační koeficient a regresní Dopad na korelační koeficient a regresní
koeficientkoeficient Upozornění-lineární regrese i korelace měří Upozornění-lineární regrese i korelace měří
jen lineární vztahyjen lineární vztahy
L. Rabušic, konference 17.-18. 10. 2002, Brno
4 typy lineární závislosti 2 kardinálních proměnných
y = 1,2286x - 0,5143
0123456789
10
0 2 4 6 8
Silná Silná pozitivnípozitivní závislost závislost r = 0,97r = 0,97
L. Rabušic, konference 17.-18. 10. 2002, Brno
4 typy lineární závislosti 2 kardinálních proměnných
y = -1,2286x + 10,514
0123456789
10
0 2 4 6 8
Silná Silná negativnínegativní závislost r = závislost r = - 0,97- 0,97
L. Rabušic, konference 17.-18. 10. 2002, Brno
4 typy lineární závislosti 2 kardinálních proměnných
y = 0,8429x + 2,9143
0
2
4
6
8
10
12
14
16
0 2 4 6 8
SlabáSlabá pozitivnípozitivní závislost závislost r = 0,35r = 0,35
L. Rabušic, konference 17.-18. 10. 2002, Brno
4 typy lineární závislosti 2 kardinálních proměnných
y = 5
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8
NulováNulová závislost závislost r = 0r = 0
L. Rabušic, konference 17.-18. 10. 2002, Brno
!!!Korelace předpoklady!!!
Předpoklad pro Předpoklad pro Pearsonův koeficientPearsonův koeficient normalita normalita proměnných viz např procedura Explore v proměnných viz např procedura Explore v Analyze-Descriptives (tedy pro korelace chceme Analyze-Descriptives (tedy pro korelace chceme náhodný výběr z normálního rozdělení/regrese náhodný výběr z normálního rozdělení/regrese naopak předpokládá volbu kombinace naopak předpokládá volbu kombinace vysvětlujících proměnných)vysvětlujících proměnných)
Předpoklad pro Předpoklad pro Spearmanův/KendallůvSpearmanův/Kendallův koeficient koeficient ordinalita proměnnýchordinalita proměnných
L. Rabušic, konference 17.-18. 10. 2002, Brno
Poučky o velikosti koeficientů
Hodnota korelace v abs. hodnotě
interpretace souvislosti
0,01 – 0,09 triviální, žádná
0,10 – 0,29 nízká až střední
0,30 – 0,49 střední až podstatná
0,50 0,69 podstatná až velmi silná
0,70 0,89 velmi silná
0,90 – 0,99 téměř perfektní
De Vaus: 2002
Jak odhalit vliv třetí proměnné(Elaborace a dílčí korelace)
Otázky, které je třeba si položit při odhalení párového vztahu (de Vaus 2002):
1.1. Jaká je povaha tohoto vztahu, je kauzální nebo ne?Jaká je povaha tohoto vztahu, je kauzální nebo ne?
2.2. Pokud je tento vztah kauzální, je přímý, nebo Pokud je tento vztah kauzální, je přímý, nebo nepřímý (to je když X ovlivňuje Y prostřednictvím nepřímý (to je když X ovlivňuje Y prostřednictvím třetí proměnné)?třetí proměnné)?
3.3. Pokud je tento vztah nepřímý, jakým mechanismem Pokud je tento vztah nepřímý, jakým mechanismem proměnná X ovlivňuje proměnnou Y?proměnná X ovlivňuje proměnnou Y?
4.4. Pokud je vztah mezi X a Y nekauzální povahy, jakou Pokud je vztah mezi X a Y nekauzální povahy, jakou funkcí se dá modelovat? funkcí se dá modelovat?
Elaborace
Způsob jak Způsob jak odhalit odhalit vliv třetí proměnné rozpracovali už vliv třetí proměnné rozpracovali už v roce 1950 v roce 1950 Patricia Patricia Kendall s Kendall s Paulem Paulem Lazarsfeldem. Lazarsfeldem.
Technika byla nazvána Technika byla nazvána elaborationelaboration, což lze překládat jak , což lze překládat jak rozpracování, precizace nebo elaborace. rozpracování, precizace nebo elaborace.
Definice tohoto způsobu analýzy by mohla znít: Definice tohoto způsobu analýzy by mohla znít:
Elaborační analýza obsahuje zavedení třetí proměnné do Elaborační analýza obsahuje zavedení třetí proměnné do vztahu mezi dvěma proměnnými a zhodnocení jejího vztahu mezi dvěma proměnnými a zhodnocení jejího působení. Tím umožňuje hlubší porozumění působení. Tím umožňuje hlubší porozumění původnímu párovému vztahu. původnímu párovému vztahu.
Elaborace se obvykle provádí prostřednictvím dvou postupů:
1.1. Zavedením třetí, testové proměnné do třídění Zavedením třetí, testové proměnné do třídění druhého stupně – jinými slovy vytvořením druhého stupně – jinými slovy vytvořením podmíněných tabulek a výpočtem podmíněných podmíněných tabulek a výpočtem podmíněných korelacíkorelací..
2.2. VVýpočtem parciálních tabulek a parciálních ýpočtem parciálních tabulek a parciálních korelací. korelací.
Modely vztahů mezi třemi proměnnými
Mezi X a Y je zdánlivý (nepravý) vztah (Mezi X a Y je zdánlivý (nepravý) vztah (spuriousspurious))
XX Y Y
ZZ
Příklad: Nepravý vztah je takový, kdy nalezený domněle kauzální vztah, Příklad: Nepravý vztah je takový, kdy nalezený domněle kauzální vztah, takovýmto vztahem vůbec není. Vztah mezi X a Y se jeví jako existující, takovýmto vztahem vůbec není. Vztah mezi X a Y se jeví jako existující, avšak je nalezen pouze proto, že jak X, tak Y jsou ovlivňovány existencí avšak je nalezen pouze proto, že jak X, tak Y jsou ovlivňovány existencí a působením proměnné Z. Např. Byl nalezen vztah mezi počtem dětí a a působením proměnné Z. Např. Byl nalezen vztah mezi počtem dětí a výskytem čápů. Tento vztah je způsoben tím, že čápi se nalézají na výskytem čápů. Tento vztah je způsoben tím, že čápi se nalézají na venkově a na venkově (proměnná Z) se rodí více dětí. venkově a na venkově (proměnná Z) se rodí více dětí.
L. Rabušic, konference 17.-18. 10. 2002, Brno
Poučky o dílčích korelacích
a) Nastane situace, že vypočtený parciální koeficient má přibližně stejnou hodnotu, jako původní korelace. Co to znamená? Testová proměnná nemá na původní vztah vliv a my si můžeme být jisti, že původní korelace není zdánlivá.
b) Parciální koeficient je výrazně nižší než původní korelace a je blízký nule. V takovém případě to znamená, že testová proměnná plně vysvětluje původní vztah, který byl zdánlivý. (resp. zdánlivá korelace či intervenující proměnná )
c) Parciální koeficient se změní jenom částečně. Pak je testová proměnná jen částečně vhodná k vysvětlení původní korelace.
L. Rabušic, konference 17.-18. 10. 2002, Brno
Poznámka závěrem k dílčí korelaci
Jak se snažila ukázat tato lekce, při hledání Jak se snažila ukázat tato lekce, při hledání statistických vztahů bychom se neměli spokojit statistických vztahů bychom se neměli spokojit pouze s párovám (bivariate) výsledkem. Vždy, pouze s párovám (bivariate) výsledkem. Vždy, když to má smysl, se pokoušejte zavádět třetí když to má smysl, se pokoušejte zavádět třetí proměnné a zjišťujte, zdali původní vztah proměnné a zjišťujte, zdali původní vztah „vydržel“, nebo byl modifikován. Prohloubíte tím „vydržel“, nebo byl modifikován. Prohloubíte tím své poznání a přinesete výsledky, které budou své poznání a přinesete výsledky, které budou postaveny na solidním základě.postaveny na solidním základě.