STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS...

23
STATYSTYKI OPISOWE Populacj nazywa si kady kompletny zbiór pomiarów, obiektów lub jednostek podlegajcych badaniu. Kad populacj charakteryzuj wielkoci zwane parametrami. Próba stanowi cz, podzbiór badanej populacji. Na podstawie obserwacji, które znalazly si w próbie uzyskuje si oceny parametrów populacji, czyli wartoci estymatorów parametrów opisujcych populacj. Empiryczny rozklad prawdopodobiestwa Przyklad 1. W pewnym dowiadczeniu farmakologicznym oznaczano moment pojawienia si symptomów choroby u 21 szczurów, którym podano now szczepionk. Otrzymano nastpujce obserwacje: 12, 1, 2, 12, 2, 22, 3, 3, 3, 25, 5, 17, 7, 7, 1, 2, 16, 17, 7, 2, 5 (dni). Histogram Budow histogramu rozpoczynamy od zbudowania szeregu rozdzielczego, tzn. od pogrupowania obserwacji w klasy. Liczba klas waha si zwykle midzy 5 a 20 i jest ona tym wiksza im liczniejsza jest próba. W naszym przykladzie przyjmiemy 5 klas. Szeroko klas obliczamy ze wzoru k x x R min max - = , gdzie R oznacza szeroko klasy, x max – najwiksz obserwacj, x min najmniejsz obserwacj, a k liczb klas. Miary poloenia Wród miar poloenia najprostsz a zarazem najczciej podawan charakterystyk próby jest rednia arytmetyczna. redni arytmetyczn obserwacji nazywamy wielko . 1 1 _ = = n i i x n x Median uporzdkowanego cigu obserwacji nazywamy warto rodkow (jeli liczba obserwacji jest nieparzysta) lub redni arytmetyczn dwóch wartoci rodkowych (gdy liczba obserwacji jest parzysta). Mod (wartoci modaln) zbioru obserwacji jest obserwacja najczciej wystpujca w zbiorze. Moda moe nie istnie lub moe by kilka wartoci modalnych w danej próbie. Kwartylami 3 2 1 i Q Q , Q nazywamy wielkoci, które dziel zbiór obserwacji na cztery równe czci. Kwartyl pierwszy, zwany take dolnym, jest median tych obserwacji, które nie s wiksze ni mediana w calej próbie, a kwartyl trzeci, zwany górnym, jest median obserwacji nie mniejszych od mediany w calej próbie. Miary rozproszenia Najprostsz miar rozproszenia obserwacji jest rozstp. Rozstpem nazywamy rónic midzy najwiksz i najmniejsz obserwacj w próbie. W badaniach nad plonowaniem nowej odmiany pomidora pobrano dwie próby. W pierwszej uzyskano nastpujce obserwacje: 12, 13, 11, 14, 15, 15, 18 (kg). W drugiej próbie zanotowano: 10, 8, 9, 20, 13, 12, 26 (kg). W pierwszej z prób jest on równy 18 –11 = 7, a w drugiej 26 – 8 = 18. Wariancj zbioru danych nazywamy wielko . x n x n x x n s n i n i i i n i _ i - - = - - = = = = 1 2 1 2 1 2 2 1 1 1 1 1 Odchyleniem standardowym nazywamy pierwiastek kwadratowy z wariancji czyli s. W pewnych sytuacjach moemy chcie porówna zmienno w populacjach, o których wiadomo, e maj ne wartoci oczekiwane. Do tego celu posluy si moemy wspólczynnikiem zmiennoci. Wspólczynnikiem zmiennoci nazywamy wielko 100%. x s cv = Skonoci nazywamy stopie asymetrii rozkladu. Kurtoz nazywamy stopie splaszczenia krzywej rozkladu.

Transcript of STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS...

Page 1: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

STATYSTYKI OPISOWE Populacj� nazywa si� ka�dy kompletny zbiór pomiarów, obiektów lub jednostek podlegaj�cych badaniu. Ka�d� populacj� charakteryzuj� wielko�ci zwane parametrami. Próba stanowi cz���, podzbiór badanej populacji. Na podstawie obserwacji, które znalazły si� w próbie uzyskuje si� oceny parametrów populacji, czyli warto�ci estymatorów parametrów opisuj�cych populacj�. Empiryczny rozkład prawdopodobie�stwa Przykład 1. W pewnym do�wiadczeniu farmakologicznym oznaczano moment pojawienia si� symptomów choroby u 21 szczurów, którym podano now� szczepionk�. Otrzymano nast�puj�ce obserwacje: 12, 1, 2, 12, 2, 22, 3, 3, 3, 25, 5, 17, 7, 7, 1, 2, 16, 17, 7, 2, 5 (dni). Histogram Budow� histogramu rozpoczynamy od zbudowania szeregu rozdzielczego, tzn. od pogrupowania obserwacji w klasy. Liczba klas waha si� zwykle mi�dzy 5 a 20 i jest ona tym wi�ksza im liczniejsza jest próba. W naszym przykładzie przyjmiemy 5 klas. Szeroko�� klas

obliczamy ze wzoru k

xxR minmax −

= , gdzie R oznacza szeroko�� klasy, xmax – najwi�ksz�

obserwacj�, xmin najmniejsz� obserwacj�, a k liczb� klas. Miary poło�enia W�ród miar poło�enia najprostsz� a zarazem najcz��ciej podawan� charakterystyk� próby jest �rednia arytmetyczna. �redni� arytmetyczn� obserwacji

nazywamy wielko�� .1

1

_

�=

=n

iix

nx

Median� uporz�dkowanego ci�gu obserwacji nazywamy warto�� �rodkow� (je�li liczba obserwacji jest nieparzysta) lub �redni� arytmetyczn� dwóch warto�ci �rodkowych (gdy liczba obserwacji jest parzysta). Mod� (warto�ci� modaln�) zbioru obserwacji jest obserwacja najcz��ciej wyst�puj�ca w zbiorze. Moda mo�e nie istnie� lub mo�e by� kilka warto�ci modalnych w danej próbie. Kwartylami 321 i QQ,Q nazywamy wielko�ci, które dziel� zbiór obserwacji na cztery równe cz��ci. Kwartyl pierwszy, zwany tak�e dolnym, jest median� tych obserwacji, które nie s� wi�ksze ni� mediana w całej próbie, a kwartyl trzeci, zwany górnym, jest median� obserwacji nie mniejszych od mediany w całej próbie. Miary rozproszenia Najprostsz� miar� rozproszenia obserwacji jest rozst�p. Rozst�pem nazywamy ró�nic� mi�dzy najwi�ksz� i najmniejsz� obserwacj� w próbie. W badaniach nad plonowaniem nowej odmiany pomidora pobrano dwie próby. W pierwszej uzyskano nast�puj�ce obserwacje: 12, 13, 11, 14, 15, 15, 18 (kg). W drugiej próbie zanotowano: 10, 8, 9, 20, 13, 12, 26 (kg). W pierwszej z prób jest on równy 18 –11 = 7, a w drugiej 26 – 8 = 18. Wariancj� zbioru danych nazywamy wielko��

.xn

xn

xxn

sn

i

n

iii

n

i

_

i���

���

��

��

−−

=�

��

−−

= � ��= == 1

2

1

2

1

22 1

11

11

Odchyleniem standardowym nazywamy pierwiastek kwadratowy z wariancji czyli s. W pewnych sytuacjach mo�emy chcie� porówna� zmienno�� w populacjach, o których wiadomo, �e maj� ró�ne warto�ci oczekiwane. Do tego celu posłu�y� si� mo�emy współczynnikiem zmienno�ci. Współczynnikiem zmienno�ci nazywamy wielko��

100%.xs

cv =

Sko�no�ci� nazywamy stopie� asymetrii rozkładu. Kurtoz� nazywamy stopie� spłaszczenia krzywej rozkładu.

Page 2: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Przedziały ufno�ci Przedziałem ufno�ci nazywamy losowy, uzyskany na podstawie próby przedział, w którym z przyj�tym prawdopodobie�stwem (ufno�ci�) le�y nieznany parametr, czyli zachodzi nast�puj�ca relacja ( ) αθ −=<< 1baP . Przedziały ufno�ci dla warto�ci oczekiwanej

,11,1, αµ αα −=�

��

+<<− −−ns

txns

txP nn

gdzie 1, −ntα jest warto�ci� z tablic t-Studenta dla n-1 stopni swobody Przykład 1. W badaniach nad całkowit� długo�ci� karpia uzyskano nast�puj�ce obserwacje (w cm): 29.9 40.2 37.8 29.7 34.9 43.4 28.6 40.7 35.9 31.7 44.5 34.9 28.8 29.0 39.2. Na podstawie uzyskanych obserwacji chcemy znale�� 95% przedział ufno�ci dla warto�ci oczekiwanej. Przedziały ufno�ci dla wariancji Przy konstruowaniu przedziału ufno�ci dla wariancji korzysta si� z faktu, �e je�li próba jest mała (n<30), to 22 /σs �� 1

2−nχ .

Na tej podstawie buduje si� przedział ufno�ci według wzoru

( ) ( ),1

11

1

22

2

2

ασ −=��

���

−<<−c

snc

snP

gdzie 21 c i c s� warto�ciami z rozkładu 21−nχ spełniaj�cymi nast�puj�ce zale�no�ci

( ) αχ21

12 =< cP oraz ( ) αχ

21

22 =≥ cP .

Przedział ufno�ci dla wska�nika struktury

Wska�nik struktury okre�la cz�sto�� wyst�powania badanego stanu w populacji. Do oszacowania wska�nika struktury pobieramy prób� z populacji i oznaczamy w niej liczb� elementów (osobników) posiadaj�cych dan� cech�. Je�li w n-elementowej próbie takich osobników jest m, to oszacowaniem wska�nika struktury jest

./ˆ nmp = Z teorii statystyki wiadomo, �e gdy próba jest du�a, to ( ).ˆ p)-p(1p,N~p Na tej podstawie szacuje si� wska�nik struktury według nast�puj�cego wzoru

ααα −=

�����

�����

��

−+<<

��

−− 1

11

nnm

nm

unm

pn

nm

nm

unm

P .

Przykład 4. W pewnej populacji badano liczb� osób zara�onych wirusem HIV. W�ród 400 zbadanych osób u 8 stwierdzono obecno�� wirusa. Z dokładno�ci� 99% chcemy oszacowa� metod� przedziałow� wska�nik osób chorych w tej populacji.

Page 3: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Testy istotno�ci Testy dla warto�ci oczekiwanej Populacja ma rozkład normalny N( µ , )σ , przy czym σ jest znane, populacja du�a.

( )1;0~0 N

n

xu

oHσµ−

= .

Przykład 1. Badano mas� ciała �wi� pewnej rasy w wieku 3 miesi�cy utrzymywanych w gospodarstwach agroturystycznych, dysponuj�cych du�ymi wybiegami dla trzody chlewnej. Dotychczasowe obserwacje wskazuj�, �e masa ciała osobników kształtuje si� na poziomie 65 kg. Dla 100 losowo wybranych osobników stwierdzono �redni� mas� ciała równ� 67 kg. Zakładamy, �e odchylenie standardowe masy ciała wynosi 3 kg. Przyjmujemy poziom istotno�ci 01.0=α . Populacja ma rozkład normalny N( µ , )σ , przy czymσ jest nieznane, populacja mała.

10 ~ −

−= n

oHt

n

sx

Przykład 2. Dla zweryfikowania hipotezy, �e �rednia długo�� łodyg pewnej odmiany ró�y wynosi 86 cm, z dostarczonej partii kwiatów wybrano losowo prób� 12 ró�, których długo�ci były nast�puj�ce: 80, 90, 78, 85, 76, 92, 68, 84, 79, 77, 82, 85. Przyjmujemy poziom istotno�ci ,05.0=α Testy istotno�ci dla dwóch �rednich Populacje o rozkładach N( ), 11 σµ i N( ), 22 σµ , wariancje nieznane – równe; próby małe.

2210

2121

222

211

21 ~

)11

(2

)1()1(−+

+−+

−+−

−= nn

Ht

nnnnsnsn

xxt

Przykład 3. Na poziomie istotno�ci α = 0.05 sprawdzimy hipotez�, czy ciel�ta rasy Charolaise i rasy Aberdeen Angus maj� te sam� mas� ciała przy urodzeniu. Losowe próby masy ciała ciel�t (wyra�one w kilogramach) były nast�puj�ce: Rasa Charolaise: 24, 27, 24, 30 Rasa Aberdeen Angus: 26, 30, 29, 35, 29, 32. Populacje o rozkładach N( ), 11 σµ i N( ), 22 σµ , wariancje nieznane – nierówne; próby

małe.

2

22

1

21

21

ns

ns

xxt

+

−= ,

Przykład 4. Badano długo�� p�dów (w cm) dwóch odmian �ycicy wielokwiatowej (A i B). Uzyskano nast�puj�ce wyniki (wyra�one jako �rednie długo�ci p�dów ro�lin z poszczególnych poletek): Odmiana A 13 15 12 10 18 14 15 Odmiana B 16 14 13 19 18 22 11 17 Pytamy, czy długo�ci p�dów obu odmian ró�ni� si� istotnie? Test dla dwóch zmiennych poł�czonych (pary skorelowanych obserwacji). Populacje o

rozkładach N( ), 11 σµ i N( ), 22 σµ 10

~ −= nHz

tnsz

t

gdzie: sz jest odchyleniem standardowym ró�nic warto�ci cech X i Y (zi = xi - yi) a n jest liczb� porównywanych par.

Page 4: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Przykład 5. Badano wpływ sposobu rozmna�ania pewnej ro�liny uprawnej na długo�� p�dów. W tym celu na ka�dym z 8 poletek umieszczono ro�liny samopylne i pochodz�ce z krzy�owania, uzyskuj�c nast�puj�ce wyniki: Nr poletka 1 2 3 4 5 6 7 8 Krzy�owanie 188 101 156 197 97 94 120 178 Samopylno�� 150 97 134 139 95 91 118 161 Testy dla dwóch wariancji Niektóre z poprzednio prezentowanych testów dla dwóch �rednich bazowały na zało�eniu, �e wariancje dla obydwu populacji s� jednakowe (czyli: 2

22

1 σσ = ). Zało�enie to, podobnie jak

ka�de inne, powinno by� poddane weryfikacji. 12,110

22

21 ~ −−= nn

HF

s

sF Przyjmujemy: 2

221 ss > ;

Przykład 6. Badano długo�� p�dów dwóch odmian słonecznika. Dla pierwszej odmiany uzyskano nast�puj�ce wyniki (w centymetrach) dla 17 losowo wybranych ro�lin: 120, 170, 210, 150, 197, 200, 170, 211, 192, 162, 167, 94, 210, 160, 190, 174, 93. Wybrano 15 ro�lin drugiej odmiany i dokonuj�c na nich pomiarów p�dów uzyskano: 96, 143, 176, 74, 204, 230, 170, 155, 120, 150, 150, 140, 170, 140, 50. Sprawd�my, czy wariancje długo�ci p�dów s� równe. Weryfikujemy wi�c hipotez� (na poziomie istotno�ci 01.0=α ): Testy dla wska�ników struktury Test dla jednego wska�nika struktury Weryfikujemy hipotez� zerow�, �e wska�nik struktury równy jest pewnej warto�ci p0.

npp

pnm

u)1( 00

0

−= ~ N(0, 1)

gdzie m oznacza liczb� osobników posiadaj�cych badan� cech�, n jest liczb� badanych osobników. Warto�� u porównujemy z warto�ci� krytyczn� αu odczytan� z tablic rozkładu normalnego Przykład 7. Wysuni�to hipotez�, �e 20% studentów pali papierosy. W celu sprawdzenia tej hipotezy wylosowano niezale�nie 150 osób, w�ród których 50 zadeklarowało, �e pali papierosy. Zweryfikujemy t� hipotez� na poziomie istotno�ci α =0.05. Test dla dwóch wska�ników struktury Chcemy sprawdzi�, czy wska�niki struktury w dwóch populacjach s� równe. Przykładowo, je�li porównywaliby�my płodno�� dwóch ras bydła, wyró�niliby�my (na podstawie obserwacji z prób o liczebno�ciach n1 i n2) w ramach ka�dej z ras liczb� osobników płodnych (odpowiednio: m1 i m2). Podobnie jak wy�ej, hipotez� o równo�ci dwóch wska�ników struktury weryfikowa� b�dziemy na podstawie prób du�ych. Statystyka testowa wyra�ana jest nast�puj�cym wzorem:

)1,0(~0

21 N

nqp

ppu

H

−=

21

21

nnmm

p++

= , p1q −= , 21

21

nnnn

n+

=

. Przykład 8. Porównywano sił� kiełkowania dwóch odmian grochu. W�ród 200 nasion odmiany PIAST wzeszło 85, natomiast w�ród 300 nasion odmiany DAWO wzeszło 150. Czy siła kiełkowania nasion obu tych odmian jest statystycznie istotnie ró�na? Hipotez� weryfikujemy na dwóch poziomach istotno�ci: α =0.05 oraz α =0.01.

Page 5: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

ANALIZA WARIANCJI DLA KLASYFIKACJI POJEDYNCZEJ

Zało�enia: • Jednorodno�ci wariancji obiektowych, tzn. �e badane obiekty nie maj� wpływu na wielko��

wariancji poszczególnych obiektów; • Rozkład normalnym reszt losowych, co jest równoznaczne z zało�eniem o rozkładzie

normalnym cechy; • Niezale�no�ci mi�dzy obserwacjami dotycz�cymi ró�nych obiektów.

Test oceny jednorodno�ci wariancji Do testowania hipotezy H0:

221 ... tσσ == przeciwko H1: wariancje obiektowe nie s� równe

u�ywamy statystyki matematycznej postaci:

21

1

222 ~]ˆlog)1(ˆlog)[(303.2

−=� −−−= t

t

iii snstn

cχχ

gdzie: �= −

−−−

+=t

i i tnntc

1)

11

1(

)1(31

1 �=

=t

iinn

1

��= =

−−

=t

i

n

jiij

i

yytn

s1 1

22 )(1ˆ �

=

−−

=in

jiij

ii yy

ns

1

22 )(1

1ˆ .

Test ró�nicy �rednich H0: 21 µµ = = ... = tµ , H1: �rednie obiektowe nie s� równe. �ródło zmienno�ci Liczba stopni

swobody Suma kwadratów redni kwadrat

Mi�dzy obiektami Wewn�trz obiektów (bł�d)

T - 1 n. - t

ASS

eSS AMS

eMS

tnte

A FMS

MSF −−=

.,1,~ α n ni

i

N

•=

= �1 SS y

yne ij

j

ni

i

Ni

ii

N

= −==

=�� �2

11

2

1

, �= •

••• −=N

i i

iA n

yny

SS1

22

,

y yijj

n

i

N i

••==

=

��

���2

11

2

Zadanie Badano wpływ dodania pewnego preparatu do paszy na przyrosty masy ciała (w gramach) kaczek rasy Pekin. Do�wiadczenia zało�ono w układzie klasyfikacji pojedynczej wyró�niaj�c trzy grupy �ywieniowe (I – bez dodatku preparatu; II – z 2% dodatkiem; III – z 5% dodatkiem), do których losowo przydzielono kaczki. Uzyskano nast�puj�ce wyniki GR1 GR2 GR3 78 77 96 69 76 79 70 74 77 75 73 78 74 78 79 68 71 83 73 80 85 84 82 74 Replikacje9 7 8 �rednie 73.889 75.571 82.375 Sprawd�, czy dodanie preparatu mo�e by� rekomendowane w �ywieniu kaczek?

Page 6: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Test t-Studenta (metoda Fishera; Najmniejsze Istotne Ró�nice – NIR) Test ten stosujemy do porównania par �rednich obiektowych. Pierwszym etapem testowania

istotno�ci ró�nic na podstawie tego testu jest wyznaczenie najmniejszych istotnych ró�nic (NIR) w

oparciu o nast�puj�cy wzór: ��

��

+= −

jietn nn

MStNIR11

.,αα

Je�li: NIRyy ji >− to stwierdzamy, �e iµ ró�ni si� od jµ na przyj�tym poziomie istotno�ciα .

OCENA WSPÓŁCZYNNIKA KORELACJI LINIOWEJ (PEARSONA) W przypadku analizy ł�cznej dwóch cech X i Y dysponujemy parami obserwacji dokonanymi na ka�dym elemencie:

x1, y1

x2, y2 . xn, yn Zakładamy, �e próba pochodzi z populacji o dwuwymiarowym rozkładzie normalnym. Miar� zmienno�ci dwóch zmiennych jest kowariancja:

)Y,X(cov = sxy = �=

−−−

n

iii yyxx

n 1

))((1

1= )

n

)y)(x(yx(

n

n

i

n

i

n

iii

ii�� �

=

= =−− 1

1 1

11

Estymator współczynnika korelacji liniowej Pearsona uzyskujemy ze wzoru:

���

���

��

��

−���

���

��

��

��

��

−==

� �� �

���

= == =

===

n

i

n

iii

n

i

n

iii

n

ii

n

ii

n

iii

yx

xyxy

yn

yxn

x

yxn

yx

ss

sr

1

2

1

2

1

2

1

2

111

11

1

Test istotno�ci współczynnika korelacji liniowej H0: ρ = 0 H1: ρ ≠ 0 Przy zało�eniu prawdziwo�ci hipotezy zerowej (o niezale�no�ci cech) statystyka:

21 2

−−

= nr

rt ma rozkład t-Studenta z n-2 stopniach swobody.

Zadanie Badano zale�no�� pomi�dzy długo�ci� p�du (w cm), a długo�ci� kłosa (w cm) pewnej odmiany pszenicy. Z poletka wybrano losowo 12 ro�lin, u których dokonano pomiaru obydwu cech. Wyniki zaprezentowano w tabeli. Nr ro�liny 1 2 3 4 5 6 7 8 9 10 11 12 Długo�� p�du 105 103 101 107 103 102 104 103 102 106 105 101 Długo�� kłosa 5.6 6.2 4.8 6.5 5.4 5 5.6 6 4.9 6.3 5.2 4.9 Zinterpretuj uzyskany wynik. Sprawd�, czy otrzymana zale�no�� mo�e by� uznana za istotn�?

Page 7: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

OCENA WSPÓŁCZYNNIKA REGRESJI LINIOWEJ Równanie regresji liniowej: y = x10 ββ +

Y – zmienna zale�na (obja�niana), X – zmienna niezale�na (obja�niaj�ca), �0 – stała – punkt przeci�cia prostej z osi� rz�dnych, �1 - współczynnik regresji liniowej,

Estymator współczynnika regresji liniowej uzyskujemy ze wzoru:

� �

���

= =

===

��

��

��

−==

n

i

n

iii

n

ii

n

ii

n

iii

xn

x

yxn

yxb

1

2

1

2

11111

1

1

β xbyb 100ˆ −== β

Test istotno�ci współczynnika regresji liniowej H0: 1β = 0 H1: 1β ≠ 0

1

1

bsb

t = ∼ 2−nt .

gdzie: ��

��

−= 2

12

2

1 21

bs

s

ns

x

yb jest bł�dem standardowym współczynnika regresji.

Zadanie Badano zale�no�� miedzy plonem peluszki (w przeliczeniu w kwintalach na hektar), a poziomem białka w nasionach (w gramach na kilogram). Uzyskano nast�puj�ce wyniki z 15 plantacji: Plon peluszki Zawarto�� białka

w nasionach 18.2 20.6 18.3 21.9 23.2 19.4 17.0 22.5 19.2 19.7 21.0 18.7 18.0 23.6 16.9

200.7 192.8 199.7 183.8 180.2 198.3 203.6 182.5 198.0 197.5 185.0 199.0 199.6 180.0 202.0

• wyznacz równanie regresji prostej, • wykre�l prosta regresji, • sprawd�, czy t� regresj� mo�na uzna� za istotn�, • podaj bł�d standardowy estymatora współczynnika regresji liniowej.

okre�l jakiej zawarto�ci białka w nasionach mo�na oczekiwa�, je�li plon peluszki wyniesie 22q/ha

Page 8: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

ZADANIA 1. Przeprowadzono do�wiadczenie wazonowe, w którym badano wpływ dodawania popiołu do podło�a na poziom plonowania szpinaku. Wyodr�bniono trzy grupy wazonów. Ka�da z grup składała si� z siedmiu wazonów. Pierwsza stanowiła grup� kontroln� (bez dodatku popiołu). Do wazonów drugiej grupy dodano popiół drzewny, natomiast do wazonów trzeciej grupy – popiół w�glowy. Uzyskane obserwacje zestawiono w tabeli.

Plon szpinaku w zale�no�ci od podło�a Grupa kontrolna (K) (y1)

Grupa wazonów z popiołem drzewnym (P1) (y2)

Grupa wazonów z popiołem w�glowym (P2) (y3)

29.5 31.7 28.3 35.5 33.8 37.2 37.8

43.1 44.2 43.9 49.1 46.5 48.2 45.7

45.2 49.3 50.7 41.2 41.8 40.3 42.1

Która z trzech technologii uprawy szpinaku mo�e by� rekomendowana? 2. Badano korelacj� mi�dzy wiekiem a ci�nieniem krwi u kobiet. Otrzymano nast�puj�ce obserwacje: wiek 56 42 72 36 63 47 55 49 38 42 68 ci�nienie 147 125 160 118 149 128 150 145 115 140 152 Oblicz i zbadaj istotno�� współczynnika korelacji mi�dzy badanymi cechami. ( α=0.01 ) 3. Badano przyrosty plonu ziarna pszenicy w zale�no�ci od dawki wody z deszczowania. Otrzymano nast�puj�ce wyniki: dawki wody: 40 60 60 65 80 80 80 110 120 120 130 przyrosty 0.2 0.25 0.27 0.3 0.3 0.4 0.6 0.6 0.7 0.75 0.8 Przyjmuj�c α=0.05 zbada� istotno�� regresji liniowej i wyznaczy� spodziewany przyrost plonu przy dawce 100 mm.

Page 9: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

WSPÓŁCZYNNIK INBREDU I SPOKREWNIENIA Powszechnie wiadomo obserwuj�c ludzi, zwierz�ta czy ro�liny �e osobniki z jednej rodziny wykazuj� do siebie pewne podobie�stwo. Młodzi rodzice z dzie�mi spieraj� si� do kogo pociecha jest bardziej podobna. Osobniki s� podobne nie tylko do rodziców, ale tak�e maja wspólne cechy z pół i –pełnym rodze�stwem, wujkami, dziadkami. Stopie� podobie�stwa przy wi�zach rodzinnych mo�e by� policzony u�ywaj�c zasad spokrewnienia genetycznego. Współczynnik spokrewnienia Współczynnik spokrewnienia addytywnego mi�dzy osobnikami -prawdopodobie�stwo, �e allel z danej pary alleli jednego osobnika jest identyczny przez pochodzenie z allelem tej samej pary drugiego osobnika (innych osobników). Druga cz��� definicji wymaga aby allele były identyczne przez pochodzenie. Dwa allele s� identyczne przez pochodzenie (IBD) je�eli jeden z nich jest bezpo�rednio kopi� drugiego (jeden osobnik jest przodkiem drugiego-spokrewnienie w lini prostej) lub gdy oba s� kopia tego samego allelu u wspólnego przodka (spokrewnienie w lini bocznej). Dlatego osobniki mog� mie� allele identyczne przez pochodzenie je�eli posiadaj� co najmniej jednego wspólnego przodka.

( )( )( )FyFx

FR

a

n

xy ++

+�

��

=�

11

121

Linia boczna linia prosta Współczynnik inbredu. Współczynnik inbredu osobnika X (Fx) jest prawdopodobie�stwem �e oba allele w losowo wybranym locus s� identyczne przez pochodzenie. Współczynnik inbredu jest parametrem charakteryzuj�cym pojedynczego osobnika, w przeciwie�stwie do spokrewnienia które odnosz� si� do podobie�stwa mi�dzy osobnikami. Współczynnik inbredu potomka jest równy połowie spokrewnienia addytywnego mi�dzy jego rodzicami. Dlatego osobnik mo�e by� zinbredowany tylko wtedy gdy jego rodzice posiadaj� wspólnego przodka. Je�eli oba allele s� identyczne przez pochodzenie to osobnik jest homozygotyczny w danym locus. Dlatego te� współczynnik inbredu mo�na tez interpretowa� jako prawdopodobie�stwo wzrostu homozygotyczno�ci osobnika na skutek kojarzenia krewniaczego jego rodziców. Aby obliczy� współczynnik inbredu osobnika wypisujemy �cie�ki ł�cz�ce jego rodziców! (nie dochodzimy do osobnika!!!) przez wspólnych przodków.

( )FaFn

ix +�

��

= � 121

21

Fx- inbred osobnika, Fa inbred wspólnego przodka rodziców

Interpretacja współczynnika inbredu: Poziom homozygotyczno�ci osobnika X b�dzie o ...% wy�szy od �redniego poziomu homozygotyczno�ci osobników nie maj�cych wspólnych przodków. Skutki inbredu: Pozytywne: +konsolidacja genetyczna populacji +eliminacja genów recesywnych +utrwalenie korzystnych cech wybranego przodka negatywne (depresja inbredowa) -ujawnienie genów letalnych i semiletalnych -obni�enie cech produkcyjnych i reprodukcyjnych -obni�enie zdolno�ci adaptacyjnych i �ywotno�ci -zmienjszenie zmienno�ci genetycznej

n

iX

aXa F

FR � �

��

++=

21

11

Page 10: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Metoda �cie�ek Metoda �cie�ek opiera si� na zasadzie �e przy ka�dym przekazywaniu jest prawdopodobie�stwo ½ �e został przekazany dany allel. We�my za przykład półrodze�stwo: W O1 O2

�cie�ka ł�cz�ca je to O1 – W – O2 Dlatego s� rozdzielone przez 2 �cie�ki. W celu obliczenia spokrewnienia osobników X i Y Nale�y znale�� wspólnych przodków tych osobników (osobnik W) a nast�pnie �cie�ki ł�cz�ce je przez wspólnego przodka. Nale�y uwzgl�dni� wszystkich wspólnych przodków, jednak nie wolno przechodzi� dwukrotnie przez tego samego osobnika, zapisujemy na �rodku wspólnego przodka i zgodnie z kierunkiem strzałek dochodzimy od niego do jednego i drugiego osobnika. Macierz spokrewnie� addytywnych W celu obliczenia elementów macierzy spokrewnie� addytywnych nale�y podj�� nast�puj�ce kroki:

1. Uporz�dkowa� osobniki według wieku. Rodzic powinien mie� zawsze ni�szy numer ni� potomek. Utworzy� macierz o liczbie kolumn i wierszy odpowiadaj�cej liczbie osobników w rodowodzie.

2. elementy macierzy b�d� obliczane tylko w cz��ci ponad diagonalnej gdy� a ij = a ji 3. dla zwierz�t których rodzice s� znani zwierz� i o rodzicach s i d elementy

pozadiagonalne aij= ½ asi+ ½ adi i diagonalne ajj= 1+ ½ asd je�eli s lub/i d s� nieznane asi lub/i adi s� równe 0

E C A D B I F J G

H Przykład: Przypu��my �e interesuje nas współczynnik inbredu osobnika H. Dlatego musimy wypisa� �cie�ki ł�cz�ce osobniki G i J. Jest kilka mo�liwych �cie�ek: 1) J – A – I – G ( ½ )(1+2) (1+ FA) 2) J – A – C – D – I - G ( ½ )(2+3) (1+ FC) 3) J – B – E –F - G ( ½ )(2+2) (1+ FE) Konieczna jest znajomo�� współczynnika inbredu wspólnych przodków A C i E, poniewa� rodzice C i E s� nieznani a tak�e jeden z rodziców A jest nieznany przyjmujemy �e s� oni nie spokrewnieni, tzn �e współczynnik inbredu osobników A C i E jest równy 0. dlatego współczynnik inbredu osobnika H wynosi FH= ½ [( ½ )(3) + ( ½ )(5) + ( ½ )(4) ]= ½ *7/32 = 0.1095 Dla tego samego rodowodu mo�emy utworzy� macierz spokrewnie� addytywnych.

Page 11: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Osobnik ojciec matka osobnik ojciec matka E - - 1 - - C - - 2 - - D C - 3 2 - A C - 4 2 - B E - 5 1 - I A D 6 4 3 F E - 7 1 - J A B 8 4 5 G F I 9 7 6 H J G 10 8 9 a11= 1+ a-- =1+0=1 a12= ½ a1- + ½ a1-=0+0=0 a13= ½ a12 + ½ a1-=0+0=0 a14= ½ a12 + ½ a1-=0+0=0 a15= ½ a11 + ½ a1-=0.5+0=0.5 a16= ½ a14 + ½ a13=0+0=0 a17= ½ a11 + ½ a1-=0.5+0=0.5 a18= ½ a14 + ½ a15=0+0.25=0.25 a19 = ½ a17 + ½ a16=0.25+0=0.25 a1 10=½ a18 + ½ a19=0.125+0.125=0.25 a22=1+ a-- =1+0=1 a23=½ a22 + ½ a2-=0.5+0=0.5 itd.

-- -- 2- 2- 1- 43 1- 45 76 89

1 2 3 4 5 6 7 8 9 10 1 1.0 0 0 0 0.5 0 0.5 0.25 0.25 0.25 2 1.0 0.5 0.5 0 0.5 0 0.25 0.25 0.25 3 1.0 0.25 0 0.625 0 0.125 0.313 0.219 4 1.0 0 0.625 0 0.5 0.313 0.406 5 1.0 0 0.25 0.5 0.125 0.313 6 1.125 0 0.313 0.563 0.438 7 1.0 0.125 0.5 0.313 8 1.0 0.219 0.609 9 1.0 0.609 10 1.109 poniewa� macierz spokrewnie� jest macierz� symetryczn� czyli aij=aji po wypełnieniu poszczególnych wierszy mo�emy je przepisa� jako kolumny �rednie spokrewnienie w populacji obliczamy jako �redni� elementów ponad przek�tn�. �redni inbred w populacji obliczamy jako �redni� elementów na przek�tnej pomniejszonych o 1 Współczynnik spokrewnienia dominacyjnego - prawdopodobie�stwo, �e para alleli jednego osobnika jest identyczna parze alleli drugiego osobnika (innych osobników). dji = dij = 0.25(asisjadidj + asidjadisj)

dii = 1 + (aii-1)2d11= 1+ (a11-1) =1+0=1 d12= ¼( a--*a--+ a--*a--)=0.25*0=0 a36= ¼( a24*a-3 +a23*a-4)=0.25*0=0 a68= ¼( a44*a35 +a45*a34)=0.25*(1*0+0*0,25)=0 a910= ¼( a78*a69 +a79*a68)=0.25*(0,125*0,563+0,5*0,313)=0,0567 Współczynnik spokrewnienia epistatycznego (typu addycja * addycja) – prawdopodobie�stwo, �e dwie pary alleli jednego osobnika s� identyczne z tymi samymi parami drugiego osobnika (innych osobników). Iloczyny Hadammarda elementów macierzy A, czyli: (a#a)ij = aij * aij

Page 12: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

PARAMETRY GENETYCZNE

Podstawowe �ródła zmienno�ci genetycznej:

� losowy rozdział chromosomów � zró�nicowana frekwencja alleli � rekombinacja � mutacje � interakcje alleliczne i niealleliczne. Odziedziczalno�� w szerszym sensie jest ilorazem wariancji genetycznej do wariancji

fenotypowej. 2

22

P

Ghσσ=

Odziedziczalno�� w w��szym sensie jest to udział wariancji genetycznej addytywnej w

wariancji fenotypowej 2

22

P

Ahσσ

=

Współczynnik odziedziczalno�ci zawiera si� wi�c w przedziale <0,1>. Wysoka warto�� h2 wskazuje na mo�liwo�ci prowadzenia skutecznej selekcji, gdy� �wiadczy to o stosunkowo du�ej zmienno�ci genetycznej przy niewielkiej zmienno�ci �rodowiskowej. Parametr ten jest cech� okre�lonej populacji obserwowanej w danym czasie i jako taki mo�e ulega� pewnym zmianom. Współczynnik powtarzalno�ci wyra�aj�cy stopie� siły zale�no�ci mi�dzy powtarzanymi warto�ciami fenotypowymi osobników dla danej cechy, definiowany jest jako stosunek wariancji genetycznej i wariancji �rodowiskowej trwałej do wariancji fenotypowej.

2

22

P

EG prσ

σ+σ=

Zawiera si� w przedziale <0,1>. Szacowany jest dla cech, które ujawniaj� si� wi�cej ni� jeden raz w ci�gu �ycia osobników. Celem oceny tego parametru jest uzyskanie informacji nie tylko o mo�liwo�ciach prowadzenia skutecznej, lecz tak�e wczesnej selekcji. Korelacje genetyczne s� miar� siły zale�no�ci mi�dzy efektami genetycznymi dwóch cech. Analogiczne relacje zachodz� dla korelacji fenotypowych i �rodowiskowych. Miar� korelacji jest współczynnik korelacji zawieraj�cy si� w przedziale <-1, +1>. Dodatnia warto�� tego współczynnika wskazuje na to, �e wraz ze wzrostem warto�ci jednej cechy nast�puje wzrost warto�ci drugiej. Odwrotne relacje wyst�puj� dla ujemnej korelacji. Współczynnik korelacji równy (b�d� bliski zeru) wskazuje na brak zale�no�ci mi�dzy par� cech. Najwa�niejszymi z hodowlanego punktu widzenia s� korelacje genetyczne, gdy� na podstawie ich oceny mo�na miedzy innymi przewidywa� skutki selekcji ukierunkowanej na doskonalenie jednej cechy.

Podział zmienno�ci fenotypowej

Addytywna

Dominacyjna

Epistatyczna

...

Wariancja genetyczna Interakcja genotyp-�rodowisko

�rodowiskowa trwała �rodowiskowa losowa

Wariancja �rodowiskowa

Wariancja fenotypowa

Page 13: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Współczynnik korelacji wykorzystywany był cz�sto w selekcji ze wzgl�du na cechy trudno mierzalne. Wówczas selekcja mogła odbywa� si� na podstawie warto�ci cechy łatwej w obserwacji, skorelowanej jednak z cech� trudno mierzaln�. Przyczyny istnienia korelacji genetycznych: zjawisko plejotropii i sprz��enia genów. Wielko�� współczynnika korelacji genetycznej, jako parametru odnosz�cego si� nie do poszczególnych osobników lecz do całej populacji, mo�e by� bezpo�rednio wynikiem składu jej puli genowej. Czynnikami o charakterze genetycznym, zmieniaj�cymi wielko�� współczynnika korelacji genetycznej mo�e by� selekcja osobników, jak i ich migracja. SZACOWANIE KOMPONENTÓW WARIANCJI Jednoczynnikowa analiza wariancji mo�e by� stosowana je�eli jedynym czynnikiem ró�nicuj�cym struktur� populacji jest podział na grupy półrodze�stwa. Zało�enia:

� wariancje dla poszczególnych grup ojcowskich powinny by� jednorodne, � liczebno�� grupy ojcowskiej z teoretycznego punktu widzenia powinna by� wi�ksza ni� 2 (w praktyce nie powinna by� mniejsza ni� 10),

� grup ojcowskich powinno by� co najmniej kilkadziesi�t, � w przypadku testowania hipotez wymagany jest rozkład normalny wektora obserwacji, � spokrewnienie w ramach jednej grupy ojcowskiej powinno wynosi� 0,25, � spokrewnienie mi�dzy osobnikami z ró�nych grup ojcowskich powinno by� równe zeru. Model dla klasyfikacji pojedynczej: y s eij i ij= + +µ ,

gdzie: yij - obserwacja j-tego potomka po i-tym ojcu, µ − �rednia ogólna, si − efekt losowy i-tego ojca, eij − losowy efekt resztowy zwi�zany z obserwacj� j -tego potomka po

i -tym ojcu.

Tabela analizy wariancji/(kowariancji) dla klasyfikacji pojedynczej. ródło Stopnie Suma �redni Warto�� oczekiwana zmienno�ci swobody kwadratów kwadrat �redniego kwadratu (iloczynów) (iloczyn) (iloczynu)

Mi�dzy N − 1 SSs MSs � �σ σe sk2 2+ gr. ojcowskimi ( sXYSS ) ( sXYMS ) ( se k covcov + ) Wewn�trz grup ojcowskich n N• − SSe MSe �σ e

2

( eXYSS ) ( eXYMS ) ( ecov )

N - liczba ojcówni - liczba córek po i -tym ojcu

SS yyne ij

j

ni

i

Ni

ii

N

= −==

=�� �2

11

2

1

SSyn

yns

i

ii

N

= −• ••

•=�

2 2

1

��

���

�−

−= �

=••

N

iin

nn

Nk

1

211

1

�=

• =N

iinn

1

2

1 1

2

��

���

= ��

= =••

N

i

n

jij

i

yy

Page 14: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

σ σA s2 24= , st�d: �

� �h s

s e

22

2 2

4=

σ σ

22

2

ec

c

ˆˆˆ

rσ+σ

σ=

sysx

sGr σσ

cov=

))((

covcov2sY

2eY

2sX

2eX

seE

33

3r

σσσσ −−

−=

))((

covcovr

sYeYsXeX

seP 2222 σ+σσ+σ

+=

WARTO�� HODOWLANA- MODEL POJEDYNCZEGO LOCUS Przyjmijmy, �e cecha ilo�ciowa jest determinowana przez pojedyncze locus o 2 allelach. W tym locus s� mo�liwe trzy genotypy: BB, Bb, bb. Mo�emy okre�li� cech� ilo�ciowo przez przyj�cie �redniej z dwóch alternatywnych homozygot jako �rodek (o) i zdefiniowanie ka�dego genotypu w odniesieniu do tego �rodka. W tym modelu warto�� genotypowa BB GBB=o+a GBb=o+d Gbb=o-a, gdzie o jest �rodkiem, 2a jest ró�nic� mi�dzy alternatywnymi homozygotami d bb o Bb BB a a Przypu��my, �e frekwencja B wynosi p a frekwencja b wynosi q, gdzie p+q=1. Je�eli populacja jest w stanie równowagi Hardego-Weinberga wtedy frekwencja genotypu BB wynosi p2, bb q2, a Bb 2pq. Oczywi�cie p2+2pq+q2=1. �rednia warto�� genotypowa populacji wynosi =o+p2a+2pqd+q2(-a) po przekształceniach otrzymujemy �e =o+(p-q)a+2pqd Warto�� hodowlana mo�e by� zdefiniowana jako 2x(oczekiwana warto�� fenotypowa potomstwa powstałego z kojarzenia osobnika z losowo wybranymi partnerami wyra�ona jako odchylenie od �redniej populacji). Warto�� hodowlana jest sum� przeci�tnych efektów genów osobnika. α=a+d(q-p) ABB =2q� ABb=(q-p)� Abb=-2p� Odchylenie dominacyjne: Dla locci addytywnych, gdzie d=0 odchylenie warto�ci genotypowej od �redniej populacji jest równe warto�ci hodowlanej, G- =A. W przypadku istnienia dominacji pojawia si� ró�nica mi�dzy A i G. Ró�nica mi�dzy warto�ci� genotypowa zwierz�cia (wyra�ona jako odchylenie od �redniej) a warto�ci� hodowlan� jest nazywana odchyleniem dominacyjnym: D=G- -A DBB=-2q2d DBb=2pqd Dbb=-2p2d Całkowita warto�� fenotypowa zwierz�cia zale�y od genotypu i �rodowiska, st�d P=G+E= + A+D+E Podobnie mo�na rozdzieli� wariancje na poszczególne komponenty VP = VG +VE = VA+VD +VE VA = 2pq �2 VD = (2pqd)2 VG = VA + VD

Dla wi�kszej liczby locci nale�y ponadto uwzgl�dni� efekt współdziałania alleli z ró�nych locci, czyli efekt epistazy. St�d, P = + A + D + I +E. Dla wi�kszo�ci cech ilo�ciowych przyjmuje si� poligeniczny model dziedziczenia, w którym cecha warunkowana jest przez wiele genów o równym ale bardzo małym efekcie.

( )[ ]( )( )( )1N1nn8

h4h1n4)h(V

222

−−−−+=

Page 15: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Przykład 1. Analizowano mas� ciała myszy w wieku 2 tygodni uzyskuj�c nast�puj�ce pomiary: Po samcu 1: 7,8,7,6,7; Po samcu 2: 4,6,7,6,7; Po samcu 3: 9,7,8,7,9; Po samcu 4: 7,5,6,8,9. Jaka jest odziedziczalno�� tej cechy? Czy jej powtarzalno�� mo�e wynosi� 0.1- uzasadnij. Przykład 2. Analizowano zawarto�� tłuszczu w pierwszej laktacji. Próba składała si� z 15 grup ojcowskich o liczebno�ciach równych odpowiednio: 21, 30, 48, 33, 42, 16, 5, 42, 50, 45, 47, 22, 38, 40, 29. Suma kwadratów dla �ródła zmienno�ci mi�dzy grupami ojcowskimi wyniosła 45.49 a wewn�trz grup: 275.57. Oszacuj h2 analizowanej cechy oraz jej bł�d standardowy. Przykład 3. Z pewnej populacji wybrano 50 niespokrewnionych ze sob� krów, z których ka�da miała zbadan� wydajno�� tłuszczu w 3 laktacjach. Wykonano analiz� wariancji, przyjmuj�c za grupy wydajno�� (laktacje) jednej krowy. Uzyskano nast�puj�ce sumy kwadratów: dla zmienno�ci mi�dzy grupami (krowami) SSc=242 550, a dla zmienno�ci „wewn�trz krów” (mi�dzy laktacjami): SSe=90 000.Oszacuj powtarzalno�� tej cechy. Przykład 4. W tabeli zawarte s� wyniki analizy kowariancji wydajno�ci tłuszczu (cecha X) i zawarto�ci tłuszczu (cecha Y) w laktacji krów, przy czym populacja słu��ca do oblicze� składała si� z 40 grup półrodze�stwa po 50 osobników ka�da. Oszacuj wielko�� korelacji genetycznej, �rodowiskowej i fenotypowej.

Suma kwadratów ródło zmienno�ci

Liczba stopni swobody Cecha X cecha Y

Suma iloczynów

Mi�dzy grupami 253500 196,95 2667,6 Wewn�trz grup 2940000 1078 16464 Przykład 5. Populacja składała si� z 90 grup półrodze�stwa po 120 osobników ka�da, suma kwadratów dla pierwszej cechy dla zmienno�ci mi�dzy ojcami wynosi 300 natomiast wewn�trz ojców wynosi 1500, �redni iloczyn mi�dzy ojcami wynosi 11.24, wewn�trz ojców 0.79. Wariancja ojcowska dla drugiej cechy wynosi 1. Oszacuj odziedziczalno�� pierwszej cechy, jej bł�d standardowy oraz korelacje genetyczn� mi�dzy tymi cechami. Czy gdyby analizowanymi cechami były przyrost masy ciała i zawarto�� mi�sa w tuszy to tak� korelacj� uznałby� za korzystn�, dlaczego?

Page 16: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Przykład 6. Załó�my �e masa ciała lochy jest warunkowana przez pojedyncze locus z dwoma allelami o warto�ciach genotypowych równych bb 130kg, Bb 150kg, BB 160 kg. Frekwencja allelu recesywnego wynosi 0.7. Jaka jest warto�� hodowlana i odchylenie dominacyjne zwierz�t o poszczególnych genotypach? Jaka jest �rednia warto�� hodowlana i odchylenie dominacyjne w populacji? Jaka jest oczekiwana warto�� potomstwa osobników o genotypie BB? Jaka jest zmienno�� genetyczna zwierz�t w tej populacji? Wiedz�c, �e wariancja �rodowiskowa dla masy ciała wynosiła 68kg2 oszacuj odziedziczalno�� w sensie w��szym i szerszym. Przykład 7. U myszy obserwowano gen karłowato�ci pygma (pg). Myszy nie posiadaj�ce tego genu (+,+) wa�yły �rednio 12g, nosiciele pojedynczej jego kopii (+,pg) charakteryzowała �rednia masa = 11g, natomiast osobniki z dwoma takimi genami (pg,pg) wa�yły �rednio tylko 8g. P=0.2. Wyznacz warto�� hodowlan� i odchylenie dominacyjne zwierz�t o poszczególnych genotypach oraz komponenty wariancji genetycznej. Przykład 8. Wariancja genetyczna jest dwa razy wi�ksza od �rodowiskowej. Jaka jest odziedziczalno�� tej cechy? Przykład 9. Wariancja genetyczna jest 3 razy mniejsza od �rodowiskowej trwałej i równa �rodowiskowej losowej. Jaka jest odziedziczalno�� i powtarzalno�� tej cechy? BLUP – Najlepsza Liniowa Nieobci��ona Predykcja - Best Linear Unbiased Prediction Model ojca - oceniane s� samce na podstawie u�ytkowo�ci ich potomstwa. Zakłada si�, �e: spokrewnienie w ramach grupy ojcowskiej wynosi ¼. brak spokrewnienia mi�dzy osobnikami z ró�nych grup ojcowskich. samce s� kojarzone z losow� grup� samic Zapis modelu liniowego ojca w notacji macierzowej: y = Xββββ + Zu + e y – nx1 wymiarowy wektor obserwacji (obserwacje cech potomstwa, zwykle córek, zestawiane s� w kolumnie), n jest liczb� obserwacji; ββββ - px1 wymiarowy wektor nieznanych efektów stałych (np. stad, sezonów wycielenia itp.) p- liczba poziomów efektów stałych; u – sx1 wymiarowy wektor nieznanych warto�ci hodowlanych ojców, s jest liczb� ocenianych ojców; e – nx1 wymiarowy wektor nieznanych efektów bł�dów losowych; X – nxp wymiarowy macierz incydencji dla efektów stałych (wi���ca obserwacje z odpowiednimi efektami); Z – nxs wymiarowy macierz incydencji dla efektów losowych (wi��e obserwacje potomstwa z efektami ojca). Układ równa� mieszanych (BLUP):

��

���

ΖΧ

=��

���

���

���

Ι+ΖΖΧΖΖΧΧΧ

− y

y

uhh '

'~ˆ

''''

2

24

β

Page 17: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Przykład 1 Buhaj Córki Wydajno�� mleka Stado córek Sezon wycielenia

córek A A1 4000 Iwno wiosna A2 3500 Racot wiosna A3 4100 Iwno zima B B1 5800 Racot wiosna B2 4700 Iwno zima Model zwierz�cia (osobniczy) – Metoda BLUP model zwierz�cia (Animal Model) jest najdokładniejsz� metod� statystyczn� stosowan� praktyce w wielu krajach do oceny wielu cech i gatunków zwierz�t gospodarczych. Niektóre własno�ci metody BLUP AM:

� pozwala na wyeliminowanie wpływów czynników stałych (np. czynniki �rodowiskowe, wiek), � wykorzystuje informacje od osobników spokrewnionych z wykorzystaniem optymalnych wag, � bierze pod uwag� wyst�puj�c� selekcj� oraz trend genetyczny, � maksymalna dokładno�� – selekcja na podstawie BLUP powinna da� najwy�szy post�p hodowlany poniewa� wykorzystuj�c wszystkie dost�pne informacje maksymalizuje dokładno�� oceny,

� selekcja na bazie BLUP optymalizuje odst�p pokole� albowiem młode zwierz�ta przeci�tnie lepsze od starszych, chocia� wariancja ich warto�ci hodowlanych jest mniejsza ani�eli wariancja osobników starszych,

� przez optymalne wykorzystanie informacji rodzinowej BLUP maksymalizuje post�p w nast�pnym pokoleniu. W praktyce sprowadza si� to do faktu, �e najlepiej wycenione zwierz�ta s� cz�sto ze sob� spokrewnione. Zatem stosowanie BLUP animal model dłu�szy czas mo�e prowadzi� do inbredu i wynikaj�cych z tego konsekwencji.

� umo�liwia ocen� wszystkich osobników (obserwowanych i nie obserwowanych) � ocena samców jest poprawiona o warto�� samic Zapis modelu zwierz�cia w notacji macierzowej: y = Xββββ + Za + e y - nx1 wymiarowy wektor obserwacji osobników ββββ - px1 wymiarowy wektor efektów stałych X - nxp wymiarowy macierz incydencji dla efektów stałych Z - nxq wymiarowy macierz incydencji (wi��e obserwacje z ocen� osobników) a - qx1 wymiarowy wektor losowych genetycznych efektów addytywnych osobników q jest liczb� ocenianych osobników e - nx1 wymiarowy wektor bł�dów losowych Układ równa� mieszanych (BLUP):

��

���

ΖΧ

=��

���

��

���

αΑ+ΖΖΧΖΖΧΧΧ

− y'

y'

a~ˆ

''

''1 2

2

hh1−=α

Przykład 2. Osobnik Matka Ojciec U�ytkowo��

osobnika Stado osobnika

K L T 8500 Iwno W S T 9200 Iwno S B M 8300 Racot L B M 9100 Racot

Page 18: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

DOKŁADNO�� OCENY WARTO�CI HODOWLANEJ Dokładno�� oceny warto�ci hodowlanej jest to korelacja mi�dzy prawdziw� a przewidywan�

warto�ci� hodowlan� A

I

AI

I

AI

IA **

)A,Icov(r

σσ=

σσσ=

σσ=

2

22

Dokładno�� oceny przeprowadzanej na podstawie metody BLUP oblicza si� wg

wzoru: α−= jj dr 1

gdzie dj to element diagonalny macierzy LHS-1 w wierszu, w którym znajduje si� rozwi�zanie dla efektu losowego osobnika j. Dokładno�� oceny na podstawie indeksu selekcyjnego zale�y od dost�pnych �ródeł informacji:

ródła: Strabel T. 2006. Genetyka cech ilo�ciowych zwierz�t w praktyce. http://jay.au.poznan.pl/~strabel/ Van Arendonk J. , Bijma P., Bovenhuis H., Crooijmans R., Van der Lende T. 2002. Animal Breeding and Genetics-lecture notes ABG-20304. Wageningen University, The Netherlands. INDEKS SELEKCYJNY Ł�czna warto�� hodowlana - warto�� hodowlana osobnika pod wzgl�dem wi�cej ni� jednej cechy. Indeks selekcyjny - liczba wyra�aj�ca ł�czn� warto�� hodowlan� na podstawie równania regresji wielokrotnej. I b x b x b xi i i t t= + + +1 1 2 2 ... , gdzie: Ii − warto�� indeksu i-tego osobnika b b bt1 2, , ... , − współczynniki regresji wielokrotnej x x xi i it1 2, , ... , − warto�ci fenotypowe cech i-tego osobnika. Konstrukcja indeksu selekcyjnego obejmuj�cego dwie cechy I b x b x= +1 1 2 2 ,

gdzie: bas1

1

1

= i bas2

2

2

=

s s1 2, − odchylenia standardowe fenotypowe odpowiednio dla cechy I i II.

Page 19: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Wielko�ci a1 i a2 uzyskujemy rozwi�zania nast�puj�cego układu równa�:

221

121

Gp

Gp

Raar

Rara

=+

=+

−pr współczynnik korelacji fenotypowej mi�dzy cechami.

Natomiast:

( )( )

R h d d r

R h d r d

G G

G G

1 1 1 2

2 2 1 2

= +

= + ,

gdzie: rG – współczynnik korelacji genetycznej mi�dzy cechami h1 i h2 s� pierwiastkami kwadratowymi estymatorów odziedziczalno�ci cech 1 i 2 , d v s h1 1 1 1= oraz d v s h2 2 2 2= v1 i v2 s� wagami ekonomicznymi cech. Przykład 1. Skonstruuj indeks selekcyjny obejmuj�cy dwie cechy kur nie�nych. Czy do dalszej hodowli wybrałby� kur�, która zniosła 312 jaj o masie 64g czy tak� która zniosła 310 jaj o masie 65g?

Współczynnik korelacji Cecha ( )ix

Waga ekonomiczna ( )iv

Odchylenie standardowe ( )is

Współczynnik odziedziczalno�ci ( )2

ih genetycznej ( )Gr

fenotypowej ( )pr

Nie�no�� liczba jaj Masa jaja (g)

1 5

37 3

0.27 0.43

- 0.26

- 0.1

Przykład 2. Oblicz ł�czn� warto�� hodowlan� dwóch tryków, których wydajno�� wełny czystej wynosiła: tryk A = 6,0, tryk B = 5,0 a ich masy odpowiednio 30,0 i 31,0. Wariancja wydajno�ci wełny i masy wynosiła 1,0 i 5,0 a odziedziczalno�� tych cech: 0,4 i 0,3. Korelacja genetyczna i fenotypowa mi�dzy tymi cechami wynosi odpowiednio 0,2 i 0,4. Przyjmij dziesi�ciokrotnie wi�ksz� wag� ekonomiczn� dla masy zwierz�t ani�eli dla masy wełny. SELEKCJA jest to wybór osobników na rodziców nast�pnego pokolenia.

Intensywno�� selekcji (i) to �rednia przewaga selekcjonowanych zwierz�t wzgl�dem całej populacji wyra�ona w jednostkach odchylenia standardowego.

w kierunku jednej cechy+ najłatwiejsz i najbardziej intensywana- jednostronna, nie uwzgl�dnia zwi�zków mi�dzy cechami- mo�e doj�� do spadku innych cech

nast�pczakolejno w kierunku ka�dej z wybranych cech

- długotrwała- osi�gniety poprzednio poziom mo�e si� obnizyc przy selekcji na kolejna cech�

niezale�narównocze�nie dla kilku cech z ustaleniem poziomu minimalnego

+ uwzglednia równocze�nie ró�ne cechy- brak podej�cia całosciowego

wska�nikowauwzgl�dnia ł�cznie wszystkie cechy i ich powiazania

w kierunku wielu cech+ bardziej celowa- trudniejsza i mniej intensywna- skuteczno�c zale�y od właciwego doboru cech i ich zwiazków

METODY SELEKCJI

Page 20: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Przeliczanie frakcji na intensywno�� selekcji Frakcja 0,001 0,002 0,003 0,004 0,005 0,006 0,007 0,008 0,009 I 3,364 3,167 3,047 2,959 2,889 2,831 2,781 2,737 2,698 Frakcja 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 I 2,663 2,419 2,266 2,153 2,061 1,984 1,917 1,858 1,804 Frakcja 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 I 1,755 1,400 1,159 0,966 0,798 0,644 0,497 0,350 0,195 Ró�nica selekcyjna (S) to ró�nica mi�dzy �redni� warto�ci� wyselekcjonowanych zwierz�t a �redni� warto�ci� cechy w populacji:

PiS σ= Reakcja na selekcj� (R) to ró�nica mi�dzy warto�ci� �redni� w populacji wyj�ciowej a �redni� pokolenia potomnego. Przy braku niegenetycznych oddziaływa� powoduj�cych podobie�stwo mi�dzy rodzicami a potomstwem oraz braku selekcji naturalnej, stosunek reakcji na selekcj� do ró�nicy selekcyjnej równa si� odziedziczalno�ci. Jest to tzw. odziedziczalno�� zrealizowana.

��=

i

i

S

Rh2

Dokładniejsz� metod� jest regresja reakcji na selekcj� na ró�nic� selekcyjn�

��

���

=

=

=

==

��

��

��

−=

t

i

t

ii

i

t

i

t

ii

t

ii

ii

t

SS

t

SRSR

h

1

2

12

1

11

2

Odst�p pokole� (L) jest to �redni wiek rodziców w momencie urodzenia potomstwa. Post�p genetyczny to zwi�kszenie warto�ci genetycznej zwierz�t w czasie, pod wzgl�dem

okre�lonej cechy lub grupy cech. Afm

PfmP

fm

Pfmrok h

LL

iih

LL

iiR σ

=+

=σ=+

= 2

Przykład 1. Na podstawie danych zawartych w tabeli oszacuj odziedziczalno�� zrealizowan�. Jakiej warto�ci cechy nale�y si� spodziewa� w szóstym pokoleniu?

stado podstawowe

Stado selekcyjne

Reakcja na selekcj�

I 40 41.6 2.3 II 44.1 0.8 III 44.6 1 IV 45.1 0.9 V 46.5 1.5 VI Przykład 2. Selekcja owiec pod k�tem masy wełny. Załó�my, �e posiadamy stado owiec składaj�ce si� z 1000 matek których struktura wiekowa jest nast�puj�ca: 250szt. - ma 2 lata, 200 - 3 lata, 180 - 4 lata, 150 – 5 lat, 120 - 6lat, 100 - 7lat. W stadzie jest tak�e 20 tryków z czego 12 ma 2 lata, a 8 - 3 lata. Przyjmijmy, �e tryki utrzymywane s� zwykle poprzez 2 lata, matki - 6 lat, a pierwsze potomstwo uzyskuje si� od zwierz�t w wieku 2 lat. Osobniki kojarzone s� w stosunku 1 do 50, plenno�� wynosi 1, a 80% jagni�t dorasta wieku dojrzałego. Przyjmuj�c za podstaw� selekcji fenotyp własny osobników, oraz �e odziedziczalno�� cechy wynosi 0,30 a fenotypowe standardowe odchylenie 0,4 kg oblicz, jaka jest reakcja na selekcj� w przeliczeniu na rok?

Page 21: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

i

i PPr

vδδ=

Rysunek 1. Praca hodowlana w stadzie owiec W wyniku procesu starzenia zwierz�ta z poszczególnych grup wiekowych przechodz� co roku do starszych klas. Praca hodowlana realizowana jest w momencie selekcji najlepszych fenotypowo rocznych tryków i jarlic. Co roku potrzeba uzupełni� najmłodsze grupy zwierz�t, tj. 250 samic i 12 samców. Poniewa� dost�pnych jest po 400 młodych kandydatów st�d: fm=12/400 ff=250/400 po przeliczeniu frakcji na intensywno�� selekcji (patrz tabela) otrzymujemy: im=2.266 if=0.644. Odst�p pokole� dla samców i samic obliczamy jako �rednie wa�one wieku i liczebno�ci poszczególnych grup wiekowych, tj.: Lm=(12*2+8*3)/(12+8)=2.4 Lf=(250*2+200*3+180*4+150*5+120*6+100*7)/(250+200+180+150+120+100)=3.99.

kg..*.....

Rrok 05504030993426440662 =

++=

Przykład 3. W pewnym laboratorium zamierzano prowadzi� prac� hodowlan� w kierunku zwi�kszenia wagi szczurów w wieku 10 tygodni. Wielko�� utrzymywanej populacji wynosiła �rednio 200szt. Stosunek płci do kojarze� wynosił 1:4 (samców do samic), a jedna samica odchowywała przeci�tnie 4 młode. Oblicz, jaka b�dzie �rednia masa zwierz�t po 5 pokoleniach pracy hodowlanej wiedz�c, �e odziedziczalno�� tej cechy wynosi 0,4, �rednia masa pocz�tkowa zwierz�t 150g, a fenotypowe odchylenie standardowe 1,725. PROGRAMY HODOWLANE Program hodowlany jest struktur� zorganizowan� w celu genetycznego doskonalenia populacji zwierz�t gospodarskich. Cel hodowlany okre�la kierunek w którym chcemy doskonali� populacj�, czyli okre�la, które cechy b�d� doskonalone i jaki nacisk jest poło�ony na ka�da z cech. Mo�e on by� wyra�ony w kategoriach wag ekonomicznych lub po��danej poprawy cech.

Cel hodowlany w oparciu o ekonomiczny model systemów produkcyjnych: warto�� ekonomiczna ka�dej cechy jest determinowana przez modelowanie efektu jaki wywiera ta cecha na dochód stada. Równanie dochodu jest wyprowadzane w taki sposób �e jest funkcj� cech celu hodowlanego a warto�� ekonomiczna ka�dej z cech jest pochodn� cz�stkow� równania wzgl�dem tej cechy. Dlatego warto�� ekonomiczna cechy i wyra�a si� równaniem:

Gdzie Pr jest równaniem dochodu a Pi jest warto�ci� fenotypow� cechy i.

Page 22: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

Warto�� ekonomiczna

Cecha

Zys

k

Funkcja zysku

warto�� ekonomiczna

1 jednostka

Wykres ilustruje

u�ycie funkcji dochodu do wyprowadzenia wag ekonomicznych. Waga ekonomiczna cechy to wzrost dochodu dzi�ki poprawie tej cechy o jedn� jednostk�. Po znalezieniu wag ekonomicznych cel hodowlany (H) jest wyra�any jako wa�ona suma warto�ci hodowlanych i wag ekonomicznych:

H= A1v1+A2v2+.... Cel hodowlany oparty o po��dany post�p stosowany jest głównie w przypadkach

cech dla których trudno jest wyprowadzi� wagi ekonomiczne (np. zdrowie czy dobrostan) ale wci�� mo�e by� po��dane ich genetyczne doskonalenie. Mo�na wtedy wyprowadzi� wagi cech vi w oparciu o po��dany post�p (np. utrzymanie obecnego poziomu płodno�ci) a nast�pnie sformułowa� cel hodowlany H jak w równaniu powy�ej Składnikami programu hodowlanego s� : system gromadzenia danych, metody i narz�dzia oceny warto�ci hodowlanej, system selekcji i kojarzenia, struktura przekazywania uzyskanego post�pu w populacji produkcyjnej Optymalny wzór programu hodowlanego zale�y od gatunku i cech zawartych w celu hodowlanym Jako�� alternatywnych programów hodowlanych mo�e by� oceniana przez porównywanie odpowiedzi na selekcje (zrealizowanej lub oczekiwanej), utrzymania ró�norodno�ci genetycznej (współczynnik inbredu) oraz kosztów realizacji programu. Interakcja genotyp x �rodowisko jest zjawiskiem w którym wra�liwo�� genotypu na zmiany w �rodowisku ró�ni si� pomi�dzy genotypami. Je�eli wyst�puje interakcja genotyp x �rodowisko wtedy wzgl�dna wydajno�� genotypów ró�ni si� mi�dzy �rodowiskami W zastosowaniu do hodowli zwierz�t interakcja genotyp x �rodowisko jest istotna przy decydowaniu co do celów hodowlanych i oceny warto�ci hodowlanej. ródła: Strabel T. 2006. Genetyka cech ilo�ciowych zwierz�t w praktyce. http://jay.au.poznan.pl/~strabel/ Szwaczkowski T. 2000. Parametry genetyczne. Drobiarstwo Polskie 10:7-9. Van Arendonk J. , Bijma P., Bovenhuis H., Crooijmans R., Van der Lende T. 2002. Animal Breeding and Genetics-lecture notes ABG-20304. Wageningen University, The Netherlands.

Page 23: STATYSTYKI OPISOWE parametrami estymatorów stwajay.up.poznan.pl/~awolc/Materialy06.pdf · MS A MS e t n t e AF MS MS = ~ a, -1 , .-n i i N • = = 1 S •S y y e ij n j ni i N i

WZORY:

( )( )( )yx

a

n

xy F1F1

F121

R++

+�

��

=�

kN

nn

nii

N

=−

−�

��

��•

• =�

11

1 2

1

sysx

sG *

covr

σσ=

))((

covcovr

sYeYsXeX

seP 2222 σσσσ ++

+=

dij = 0.25(asisjadidj + asidjadisj) dii = 1 + (aii-1)2

�ródło Stopnie Suma redni Warto�� oczekiwana zmienno�ci swobody kwadratów kwadrat �redniego kwadratu Mi�dzy grupami ojcowskimi Wewn�trz

grup ojcowskich n N• − SSe MSe �σ e2

(bł�d)

��

���

ΖΧ

=��

���

���

���

αΑ+ΖΖΧΖΖΧΧΧ

− y'y'

ab

''''

1 d v s h2 2 2 2= ABb=(q-p) 1yzS −=

( )G2111G rddhR += Abb=-2p 1G2p1 Rara =+ 12 yyR −=

2G21p Raar =+ 2

2

hh1−=α α=a+d(q-p)

( )2G122G drdhR += ABB =2q. d v s h1 1 1 1=

bas2

2

2

= Nett=-cF + Nc(Rd-Cd) bas1

1

1

=

��

���

=

=

=

==

��

��

��

−=

t

1i

2t

1ii

2i

t

1i

t

1ii

t

1ii

ii2

t

SS

t

SRSR

h

2

2

h41

h41

1−=α

( )a

n

ix F1

21

21

F +�

��

= �

n

iX

aXa 2

1F1F1

R � �

��

++=

2e

2s

2s2

ˆˆˆ4

hσ+σ

σ=

2s

2e ˆkˆ σ+σsMSsSS1N −

( )[ ]( )( )( )1N1nn8

h4h1n4)h(V

222

−−−−+=

�= •

••• −=N

1i

2

i

2i

s ny

ny

SS

���=

= =

−=N

1i i

2i

N

1i

ni

1j

2ije n

yySS

)3)(3(cov3cov

r2sY

2eY

2sX

2eX

seE σ−σσ−σ

−=

iidsii a21

1a +=)aa(21

aii dsij +=