Generatory liczb pseudolosowych

Generatory liczb pseudolosowych

Plan wykładu:

1.Generatory o rozkładzie równomiernyma) linioweb) kombinowane – generator uniwersalnyc) nieliniowe

2. Generatory o dowolnym rozkładzie prawdopodobieństwaa) metoda odwracania dystrybuantyb) metoda eliminacjic) superpozycja rozkładówd) rozkład dyskretny

3.Generatory o rozkładach wielowymiarowycha) rozkład równomierny na sferze i kuli w RM

b) dwuwymiarowy rozkład normalny

4.Testowanie generatorówa) testy zgodności z rozkładem: , OPSOb) testy zgodności z rozkładem statystyk: pozycyjne, test sum

2

Generatory o rozkładzie równomiernym

Najprostsze generatory liczb losowych to generatory fizyczne wykorzystujące:1) szumy układów elektronicznych2) Promieniotwórczość

Zalety: dostajemy ciągi liczb losowych (niezależne, nieskorelowane) Wady: wymagana ciągła kalibracja (testowanie parametrów), kłopoty techniczne z obsługą, brak powtarzalności serii.

Własności generatorów komputerowycha) łatwość obsługib) możliwość generowania dowolnego rozkładu c) dowolna liczba wymiarówd) Powtarzalność ciągów generowanych liczb

generatoryliczb losowych

fizyczneprogramowe

(komputerowe)

Jak pracują komputerowe generatory liczby?

1) Tworzony jest ciąg liczb nieujemnych (naturalnych)

o rozkładzie równomiernym według wybranego algorytmu. Liczby ograniczone są od góry przez reprezentację, np. dla k=32 bitowej reprezentacji liczby całkowitej bez znaku, kres górny

Ta – okres aperiodyczności ciąguT0 – okres ciągu

2) Aby uzyskać liczby „rzeczywiste” dokonujemy przekształcenia

3) Dokonujemy kolejnej transformacji ciągu aby uzyskać ciąg o zadanym rozkładzie prawdopodobieństwa (normalny, wielomianowy, etc.)

X0; X1; X2; : : : ; Xn

m = 232

U =X

m) Ui 2 (0; 1]

X0; : : : ;Xº¡1| {z }Ta

Xº ;Xº+1; : : : ; Xº+P¡1| {z }To

; Xº+P ; : : :

3

Generatory liniowe

Generatory liniowe tworzą ciąg liczb według schematu:

gdzie: a1, a2,...,ak, c, m – parametry generatora (ustalone liczby)

Operację

nazywamy dzieleniem modulo a jej wynikiem jest reszta z dzielenia liczb całkowitych a i n.

Lub inaczej: r jest kongruentne do a modulo n jeśli n jest dzielnikiem a-r.

Generatory wykorzystujące operację dzielenia modulo to generatory kongruentne lub kongruencyjne.

Przykład

19 mod 6 =1 15 mod 6 =318 mod 6 =0 14 mod 6 =217 mod 6 =5 13 mod 6 =116 mod 6 =4 12 mod 6 =0

Xn+1 = (a1Xn + a2Xn¡1 + : : :

+akXn¡k+1 + c) mod m

r = (a mod n); a; n; r 2 Z

a ´ r mod n) r = a¡jan

kn

Aby wygenerować ciąg liczb pseudolosowych należy zdefiniować jego parametry.Liczby

nazywamy ziarnem generatora (seed). Dla bardziej rozbudowanych generatorów liczby te otrzymujemy z innego generatora lub np. używając zegara systemowego (X0).

Najprostszy generator liniowy ma dwie odmianya) generator multiplikatywny gdy

b) generator mieszany gdy

Maksymalny okres generatora liniowego to (m-1)

Generator multiplikatywny

c 6= 0

c = 0

X0; X1; X2; : : : ; Xk

Xi+1 = aXi¡1 mod m

ki =

¹aXi¡1m

º; i ¸ 1

X1 = aX0 ¡mk1

X2 = a2X0 ¡mk2 ¡mk1aX3 = a3X0 ¡mk3 ¡mk2a¡mk1a2: : : : : : : : : : : :

Xn = anX0 ¡m(kn + kn¡1a+ : : :+ k1an¡1)

4

Ostatnie równanie można zapisać w postaci

skąd wynika, że wybór X0 determinuje wszystkie liczby w generowanym ciągu (a i m są ustalone) – uzyskany ciąg liczb jest deterministyczny

Przykład.

Generator multiplikatywny

Xn = anX0 mod m

X i

a=1 2 3 4 5 6 7 8 9 10

i=0 1 1 1 1 1 1 1 1 1 1

1 1 2 3 4 5 6 7 8 9 10

2 4 9 5 3 3 5 9 4 1

3 8 5 9 4 7 2 6 3

4 5 4 3 9 9 3 4 5

5 10 1 1 1 10 10 10 1

6 9 5 4 3

7 7 8 6 2

8 3 4 9 5

9 6 2 8 7

10 1 1 1 1

Xi = aXi¡1 mod 11; X0 = 1

5

Okres generatora multiplikatywnego

Maksymalny okres generatora multiplikatywnego uzyskujemy dla

Gdy m jest liczbą pierwszą a p jest czynnikiem pierwszym liczby (m-1).

PrzykładWykorzystujemy liczby Marsenne'a (które dość często są liczbami pierwszymi)

Okres generatora

Liczby

występują dokładnie 1 raz w pojedynczym okresie generatora.Odległość pomiędzy najbliższymi sąsiadami

T = minfi : Xi = X0; i > 0g

a(m¡1)=p 6= 1 mod m

m = 2p ¡ 1

T = 231 ¡ 2

U = fUi; 1 · i · T g

1

231 ¡ 1 = 4:657£ 10¡10

p = 31) m = 231 ¡ 1; a = 75

6

Rozkład przestrzenny ciągu

Wadą generatorów multiplikatywnych jest nierównomierne pokrycie d-wymiarowej kostki (Id).Generowane liczby lokalizują się na hiperpłaszczyznach, których położenie uzależnione jest od parametrów generatora.

Przykład. Xi = aXi¡1 mod 11

a) X0=1, a=2b) X0=1, a=8

(U1; U2; : : : ; Ud); (U2; U3; : : : ; Ud+1); : : :

(U1; U2; : : : ; Ud); (Ud+1; Ud+2; : : : ; U2d); : : :

7

Parametry statystyczne generatora o rozkładzierównomiernym w (0,1)-> U(0,1)

Jeśli generowany ciąg liczb jest niezależny to wartość oczekiwana (średnia) powinna wynosić

natomiast wariancja jest równa

Ponadto współczynniki autokorelacji elementów ciągu powinny wynosić 0.

Jeśli parametry statystyczne generatora (ciągu generowanych przez niego liczb) odbiegają od powyższych wartości to jest on nieprzydatny (lub warunkowo przydatny).

¹¹ =1

N

NX

i=1

xi

¾2 =

Z 1

0

(x¡ ¹)2dx = 1

12

¹¾ =1

N

NX

i=1

(xi ¡ ¹¹)2

Przykład.Przeanalizujmy parametry statystyczne L bitowego generatora

Można nim wygenerować 4 ciągi liczb o okresie

Jeden z nich:

Ciąg liczb pseudolosowych

jest permutacją liczb

Liczby znormalizowane

Średnia

Wariancja

Xi+1 = aXi mod 2L

c ´ 3 mod 8; X0 ´ 1; 3; 9; 11 mod 16

X0;X1; X2; : : :

8j + 1; 8j + 3; j = 0; 1; : : : ; 2L¡3 ¡ 1

T = 2L¡2

¾2 =1

12¡ 13

3 ¢ 2m

¹¹ =1

2¡ 1

2L¡1

¹ =

Z 1

0

xdx =x2

2

¯̄¯̄1

0

=1

2

Ui =Xi

m=Xi

2L

8

Funkcja autokorelacji opisuje zależność elementów ciągu od wyrazów poprzednich.Definicja

oraz wzór dla ciągu skończonego (r=s-t)

Inaczej: opisuje związek pomiędzy elementami dówch szeregów – danego i przesuniętego o r.

Efektywnie funkcję autokorelacji można badać przy użyciu FFT – splot dwóch wektorów.

Dla analizowanego generatora mieszanegooraz dla r=1 współczynnk autokorealcji można oszacować z poniższej relacji

A =1

a¡ 6c

am(1¡ c

m)

B =a

mR1 2 [A¡B;A+B]

Przykłady generatorów liniowych

Ich okresy są maksymalne tj. równe (m-1)

Generatory na rejestrach przesuwnych

Definiujemy ciąg bitów bi otrzymywanych rekurencyjnie

gdzie:

są stałymi binarnymi , a stałe bi

tworzą ciąg inicjujący.

Xi = (1176Xi¡1 + 1476Xi¡2 + 1776Xi¡3) mod (232 ¡ 5)

Xi = 213(Xi¡1 +Xi¡2 +Xi¡3) mod (232 ¡ 5)

Xi = (1995Xi¡1 + 1998Xi¡2 + 2001Xi¡3) mod (235 ¡ 849)

Xi = 219(Xi¡1 +Xi¡2 +Xi¡3) mod (232 ¡ 1629)

bi = (a1bi¡1 + : : :+ akbi¡k) mod 2

i = k + 1; k + 2; : : :

a1; a2; : : : ; ak 2 f0; 1g

b1; b2; : : : ; bk 2 f0; 1g

Rr =1

(N ¡ r)¾2N¡rX

i=1

(Xi ¡ ¹)(Xi+r ¡ ¹)

~Rr =E[(Xt ¡ ¹)(Xs ¡ ¹)]

¾2

9

Inny sposób zapisu relacji rekurencyjnej wykorzystuje operator xor

Który można zdefiniować

Jeśli założymy

to relację rekurencyjną można zapisać przy użyciu xor

Jakie są własności takiego ciągu bitów?

Ciąg jest okresowy o okresie nieprzekraczającym 2k a dokładniej (2k-1) ze względu na wyrzucenie układu bitów złożonych z samych zer. Praktyczną realizacją tego pomysłu jest algorytm wykorzystujący tylko dwa elementy ciągu:

a b a xor b

0 0 0

0 1 1

1 0 1

1 1 0

a xor b = (a+ b) mod 2

aj1 = aj2 = : : : = ajk = 1

bi = bi¡j1 xor bi¡j2 xor : : : xor bi¡jk

bi = bi¡p xor bi¡q ; p > q; p; q 2 N

Wykorzystujemy ciąg bitów do obliczenia liczby pseudolosowej z przedziału (0,1] (generator Tauswortha)

gdzie: s jest ustaloną całkowitą liczbą nieujemną

a) jeśli s<L to do utworzenia Ui oraz Ui+1 wykorzystywane są elementy tego samego podciągu

b) jeśli s=L to Ui oraz Ui+1 są tworzone z rozłącznych fragmentów ciągu globalnego

Ciąg bitów łatwo generuje się przy użyciu rejestrów przesuwnych oraz bramek logicznych (xor) – łatwa implementacja w języku C.

Ui =LX

j=1

2¡jbis+j

= 0:bis+1 : : : bis+L

i = 0; 1; 2; : : :

10

Generator Fibonacciego

Punktem wyjścia do konstrukcji generatora są liczby Fibonacciego

a dokładniej ciąg reszt tego ciągu

Powyższy ciąg reszt ma rozkład równomierny ale nie spełnia testów niezależności (autokorelacja). Jego modyfikacja

nie posiada już tej wady.Okres generatora zależy od operacji. Dla

f0 = f1 = 1

fn = fn¡2 + fn¡1

¦ = +; ¡; ¤; xor

T =

8>><>>:

(2r ¡ 1)2L¡1 F (r; s;+)(2r ¡ 1)2L¡1 F (r; s;¡)(2r ¡ 1)2L¡3 F (r; s; ¤)(2r ¡ 1) F (r; s; xor)

m = 2L

Generator charakteryzuje się dużym okresem ale jest wolniejszy np. względem generatorów multiplikatywnych co obecnie nie jest już dużą wadą.

Kombinacje generatorów

Zakładamy że dysponujemy zmiennymi losowymi X i Y określonymi na zbiorze S={1,2,...,n}z rozkładami prawdopodobieństwa

Z tych liczb możemy utworzyć wektory

Za normę wektora przyjmiemy p-normę

Miarą „odległości” danego rozkładu od rozkładu rónomiernego będzie wówczas wyrażenie

qqq = (q1; q2; : : : ; qn)

krk =Ã

nX

i=1

rpi

!1=p

rrr = (r1; r2; : : : ; rn)

PfX = ig = ri

PfY = ig = qi

i = 1; 2; : : : ; n

±(X) = k(r1; r2; : : : ; rn) ¡ (1=n; 1=n; : : : ; 1=n)k

Xi = Xi¡2 +Xi¡1 mod m; i ¸ 2

Xi = Xi¡r ¦Xi¡s mod m

i ¸ r; r > s ¸ 1

11

Dla określonego działania na zbiorze S tj.

rozkład nowej zmiennej losowej

będzie bliższy rozkładowi równomiernemu niż rozkłady zmiennych X i Y

Nowy ciąg ma lepsze własności statystyczne a także większy okres. Jeżeli ciąg

ma okres T1, a ciąg

ma okres T2 i są liczbami pierwszymi to wtedy nowy ciąg liczb

ma okres równy T1T2.

Generator uniwersalny

Daje jednakowe wyniki na dowolnym komputerze. Jego działanie oparte jest na wykorzystaniu kombinacji kilku generatorów.

+; ¡; ¤; xor

X ¦ Y

±(X ¦ Y ) · minf±(X); ±(Y )g

X1;X2; : : : ; Xn

Y1; Y2; : : : ; Yn

Xi ¦ Yj

Pierwszy z nich jest generatorem Fibonacciego

działanie jest zdefiniowane następująco

Inicjalizację generatora tj.wyznaczenie ciągu

przeprowadzamy przy pomocy ciągu bitów (24-bitowa mantysa, 16 bitowe liczby całkowite) tj.

Ciąg bitów generujemy przy użyciu dwóch generatorów

Vi = Vi¡97 ¦ Vi¡33Vi 2 [0; 1)

x ¦ y = x¡ y; x ¸ y

F (97; 33; ¦)

x ¦ y = x¡ y + 1; x < y

V1; V2; : : : ; V97

V1 = 0:b1b2 : : : b24

V2 = 0:b25b26 : : : b48

yn = (yn¡3yn¡2yn¡1) mod 179

zn = (52zn¡1 + 1) mod 169

bn =

½0; gdy ynzn mod 64 < 32

bn = 1; w pozostalych przypadkach

Un = Vn ¦ cn

12

Dla określonego działania na zbiorze S tj.

rozkład nowej zmiennej losowej

będzie bliższy rozkładowi równomiernemu niż rozkłady zmiennych X i Y

Nowy ciąg ma lepsze własności statystyczne a także większy okres. Jeżeli ciąg

ma okres T1, a ciąg

ma okres T2 i są liczbami pierwszymi to wtedy nowy ciąg liczb

ma okres równy T1T2.

Generator uniwersalny

Daje jednakowe wyniki na dowolnym komputerze. Jego działanie oparte jest na wykorzystaniu kombinacji kilku generatorów.

+; ¡; ¤; xor

X ¦ Y

±(X ¦ Y ) · minf±(X); ±(Y )g

X1;X2; : : : ; Xn

Y1; Y2; : : : ; Yn

Xi ¦ Yj

Pierwszy z nich jest generatorem Fibonacciego

działanie jest zdefiniowane następująco

Inicjalizację generatora tj.wyznaczenie ciągu

przeprowadzamy przy pomocy ciągu bitów (24-bitowa mantysa, 16 bitowe liczby całkowite) tj.

Ciąg bitów generujemy przy użyciu dwóch generatorów

Vi = Vi¡97 ¦ Vi¡33Vi 2 [0; 1)

x ¦ y = x¡ y; x ¸ y

F (97; 33; ¦)

x ¦ y = x¡ y + 1; x < y

V1; V2; : : : ; V97

V1 = 0:b1b2 : : : b24

V2 = 0:b25b26 : : : b48

yn = (yn¡3yn¡2yn¡1) mod 179

zn = (52zn¡1 + 1) mod 169

bn =

½0; gdy ynzn mod 64 < 32

bn = 1; w pozostalych przypadkach

Un = Vn ¦ cn

13

Generatory muszą być zainicjowane

Okres generatora kombinowanego: 2120.

Drugi generator (cn) o rozkładzie równomiernym w (0,1) jest zdefiniowany następująco

Okres tego generatora to 224-3.Okres generatora uniwersalnego (Un): 2

144

y1; y2; y3 2 f1; 2; : : : ; 178gz1 2 f0; 1; : : : ; 168g

cn = cn¡1 ¦µ7654321

16777216

¶

n ¸ 2

c1 =362436

16777216

c ¦ d = c¡ d; c ¸ d

c ¦ d = c¡ d+362436

16777216; c < d

c; d 2 [0; 1)

Generatory nieliniowe

Zaletą generatorów nieliniowych jest to, że ciągi generowanych przez nie liczb nie układają się na hiperpłaszczyznach tak jak w przypadku generatorów liniowych. Wykorzystuje się w nich „odwrotność modulo”:

Przykład:

Do znalezienia x-1 wykorzystuje się algorytm podziału Euklidesa (poszukiwania największego wspólnego podzielnika dwóch liczb)

Algorytm:

Jeśli

(gcd-greatest common divisor)

x ¢ x¡1 mod m = 1

5 ¢ 3 mod 7 = 1 x = 5 x¡1 = 3

a; b;2 Z; b 6= 0; a = b ¢ q + r

q; r 2 Z; 0 · r < jbj

ri+1 = 0;=) gcd(a; b) = ri

r0 = a

r1 = b qi =

¹r¡1ri

º

...

ri+1 = ri¡1 ¡ qiri; 0 · ri+1 < jrij

14

Generowanie x-1 algorytmem Aignera:1) generujemy ciąg liczb:

i wyznaczamy wspołczynniki qi

2) generujemy ciąg liczb

3) jeśli x=0 to x-1=0

Generator nielinowy Eichenauera-Lehna

gdzie: m jest liczbą pierwszą

Uzyskujemy w ten sposób ciąg liczb

o rozkładzie równomiernym.

Generator Eichenauera-Hermanna

W generatorze tym kolejne elementy ciągu są niezależne od poprzednich – cecha szczególnie przydatna w obliczeniach równoległych.

Dla

generator osiąga okres T=m.Aby generator osiągał maksymalny okres równy m musi być spełniony jeszcze warunek

jest najmniejszą liczbą całkowitą dla której zachodzi

a 2 f1; 2; : : : ;mg

m2 ¡ 1

Xi = (a(i+ i0) + b)¡1 mod m; i = 0; 1; : : :

zm2¡1 ´ 1 mod (z2 ¡ bz ¡ a)

fzn+2; zn+1; zn; : : : ; z1g

qi+1 =

¹zi+2zi+1

º

fqn+1; qn; : : : ; q1g

fw1; w2; : : : wn+2gw1 = 1; w2 = 0

wi = qi¡1wi¡1 + wi¡2; 3 · i · n+ 2

x¡1 = (¡1)n+1wn+2

Xi+1 = (aX¡1i + b) mod m; i = 0; 1; : : :

Xi 2 f0; 1; : : : ; m¡ 1g

Ui =Xi

m2 [0; 1)

zn+2 = m; zn+1 = x; z1 = 1

zi = zi+2 ¡ qi+1zi+1; 1 · i · n

z 2 Z

15

Generatory o dowolnym rozkładzie prawdopodobieństwa

Metoda odwracania dystrybuanty

Dystrybuanta określonego rozkładu prawdopodobieństwa jest funkcją

niemalejącą i prawostronnie ciągłą

Dystrybuanta jednoznacznie definiuje rozkład prawdopodobieństwa. Związek pomiędzy dystrybuantą a gęstością prawdopodobieństwa f(x):

Jeśli uda nam się znaleźć F-1 to:

zmienna losowa x ma rozkład o dystrybuancie F

F : R! R

limx!¡1

F (x) = 0

limx!1

F (x) = 1

U = F (x)! x = F¡1(U)

F (x) =

Z x

¡1f(y)dy

16

U jest zmienną losową o rozkładzie równomiernym w przedziale (0,1).

Nową zmienną losową będzie

Generujemy więc ciąg liczb pseudolosowych

który przekształcamy w ciąg

Liczby Xi mają rozkład prawdopodobeństwa o dystrybuancie F.Odwracanie dystrybuanty można wykorzystać także w przypadku rozkładów dyskretnych.

Np. ciąg zmiennych

o rozkładzie

X = F¡1(U)

PfX · xg = PfF¡1(U) · xg= PfU · F (x)g= F (x)

U1; U2; : : : ; Un 2 (0; 1)

X1;X2; : : : ; Xn 2 (¡1;1)

X1;X2; : : : ; Xn

pk = PfX = kg; k = 0; 1; 2; : : :

Można wygenerować przy użyciu ciągu

korzystając ze wzoru

Odwracanie dystrybuanty sprawia często duże trudności numeryczne.

U1; U2; : : : ; Un 2 (0; 1)

Xn = min

(k : Un ·

kX

i=0

pi

); n = 1; 2; : : :

Przykład - rozkład jednomianowy

f(x) = xn

n = 1; 2; 3; : : :

x 2 [0; 1]

F (y) =

Z y

0

xndx =yn+1

n+ 1= U

y = ((n+ 1)U)1

n+1 y 2 [0; 1]

17

Przykład - rozkład wykładniczy

gęstość prawdopodobieństwa

Dystrybuanta

f(x) = e¡x; x 2 [0;1)

F (x) =

Z x

0

e¡x0dx0

F (x) = 1¡ e¡x = U

e¡x = 1¡ U

F¡1(x) = x = ¡ln(1¡ U)

U 2 (0; 1)! x 2 (0;1)

Przykład - rozkład normalny N(0,1)

F (x) =

Z x

¡1e¡x

02dx0 = erf(x)

f(x) = e¡x2

µx =

y ¡ ¹p2¾

¶

18

Szukanie funkcji odwrotnej erf(x) jest kosztowne. Częściej stosuje się metodę Boxa-Mullera:

chcemy policzyć prawdopodobieństwo

Wprowadzamy nowe zmienne

f(x; y) = f(x) ¢ f(y) = e¡x2+y2

2

p(x; y) = f(x; y)dxdy

r2 = x2 + y2

x = rcos(µ)

y = rsin(µ)

x; y 2 (¡1;1)

r 2 [0;1)µ 2 [0; 2¼]

p = f(x; y)dxdy = f(r; µ)drdµ

p(r; µ) = r ¢ e¡r2=2drdµ

Wprowadzamy nową zmienną

z =r2

2! dz = rdr

p(z; µ) = e¡zdzdµ = f (z)dz ¢ dµ

z 2 [0;1)

f(z) = e¡z

Dostajemy rozkład wykładniczy

z = ¡ln(1¡ U1); U1 2 (0; 1)

x = rcos(µ) =p¡2ln(1¡ U1)cos(2¼U2)

y = rsin(µ) =p¡2ln(1¡ U1)sin(2¼U2)

Ponieważµ = U2 ¢ 2¼; U2 2 (0; 1)

Dla pary (U1,U2) dostajemy (x,y) z rozkładu N(0,1)

Przejście x 2 N(0; 1)! X 2 N(¹; ¾)X = x ¢ ¾ + ¹

19

Metoda eliminacji (von Neumann)

Chcemy wygenerować ciąg zmiennych losowych o gęstości prawdopodobieństwa fw przedziale [a,b].Wartość f jest w przedziale [a,b] ograniczona od góry przez stałą d.

Sposób otrzymania ciągu zmiennych losowych o rozkładzie f(x) jest następujący:

1) Losujemy dwie zmienne o rozkładzie równomiernym

2) jeżeli

3) gdy powyższy warunek nie jest spełniony wówczas odrzucamy parę U1, U2

4) wykonujemy czynności 1-3 aż do uzyskania odpowiednio licznego ciągu

Wygenerowana zmienna losowa X ma rozkład prawdopodobieństwa f.

U1 2 [a; b] U2 2 [0; d]

U2 · f(U1)) X = U1

20

Generowanie ciągu liczb pseudolosowych o zadanym rozkładzie algorytmem Metropolisa

Modyfikujemy metodę eliminacji. W standardowej postaci jest ona mało wydajna – bo nierzadko odrzucamy większość wyników. Dzięki algorytmowi Metropolisa nie odrzucamy żadnego.

Akceptację nowego położenia (nowej liczby w ciągu) dokonujemy zgodnie z formułą

czyli:

1) Jeśli f(xi) > f(xi-1) to nowe położenie akceptujemy zawsze.

2) W przeciwnym wypadku akceptacja następuje z prawdopodobieństwem f(xi)/f(xi-1). Jeśli nie akceptujemy nowego punktu to zatwierdzamy stary (każdy krok generuje nowy element ciągu).

Uwaga: w naszym przykładzie

aby zachodził warunek pij=pji

h(xi¡1; xi) = min(1;f(xi)

f(xi¡1))

xnew = xi + (2 ¢ U(0; 1)¡ 1)

xi+1 =

8<:

xi () xnew < 0xi () xnew > 0 u 2 U(0; 1) > hxnew () xnew > 0 u 2 U(0; 1) < h

21

Superpozycja rozkładów

Naszym zadaniem jest uzyskanie ciągu liczb pseudolosowych o gęstości f(x), którą możemy wyrazić w postaci

gdzie: gt(x) oraz h(t ) są również gęstościami prawdopodobieństwa – funkcje znane.Rozkład prawdopodobieństwa f(x) nazywamy rozkładem złożonym.Algorytm generowania liczb o rozkładzie f(x) jest następujący:

1) generujemy zmienną T o rozkładzie h2) dla wartości t zmiennej losowej T generujemy zmienną losową X dla rozkładu gęstości gt(x)

W praktyce całkę często zastępuje się sumą

f(x) =

Z 1

¡1gt(x)h(t)dt

f(x) =1X

i=1

pigi(x) =KX

i=1

pigi(x)

Przedział [a,b] w którym generujemy ciąg zmiennych z rozkładem f(x) dzielimy na sumę K rozłącznych podprzedziałów. W każdym z nich (Ai) wyznaczamy

oraz

gdzie: 1Ai jest funkcją przynależności do podzbioru Ai.

Algorytm generacji ciagu zmiennej X jest wówczas następujący:

1) Losujemy zmienną losową

2) Dla wygenerowanej wartości i zmiennej I generujemy X z rozkładem gęstości

Dla dostatecznie wąskich przedziałów można h(t) przybliżyć wielomianem niskiego stopnia.

pi =

Z

Ai

f(x)dx

gi(x) =111Aif(x)

pi

I 2 f1; 2; : : : ;Kg

gi(x) =111Aif(x)

pi

pi ¸ 0;KX

i

pi = 1

22

Przykład – rozkłady o gęstościach wielomianowych

x 2 [0; 1]

Algorytm generowania zmiennej losowej:

1. Generujemy indeks

z rozkładem prawodopodobieństwa

2. Wylosować zmienną losową X o rozkładzie

Zmienna X ma zadany rozkład wielomianowy.

k 2 f1; 2; 3; : : : ;Mg

f(x) =MX

n=1

cnxn cn ¸ 0

Z 1

0

f(x)dx = 1 =MX

n=1

cnn+ 1

Pfk = ng = cnn+ 1

fn(x) = (n+ 1)xn

Przykład – rozkład Beta Eulera

x 2 [0; 1]

B(p; q) =¡(p)¡(q)

¡(p+ q)

¡(x) =

Z 1

0

tx¡1e¡tdt

Jeśli dwie zmienne g1 i g2 mają rozkłady

To zmienna Z:

ma rozkład f(x;p,q)

g1 2 ¡(p) g2 2 ¡(q)

Z =g1

g1 + g2

f¡(x; p) = xp¡1e¡x=¡(p)

f(x; p; q) =1

B(p; q)xp¡1(1¡ x)q¡1

p; q > 0

23

Rozkład dyskretny

a) metoda odwracania dystrybuanty

W rozkładzie dyskretnym mamy określone prawdopodobieństwo wylosowania danej liczby

wraz z warunkiem

Algorytm generowania ciągu zmiennych o rozkładzie dyskretnym:

1) X=0, S=p0

2) Losujemy zmienną U o rozkładzie równomiernym z przedziału [0,1]3) Sprawdzamy warunek

a)Iteracyjnie obliczamy

dopóki warunek jest spełnionyb) W przeciwym wypadku akceptujemy X4) Kroki 1-3 wykonujemy aż do uzyskania odpowiednio licznego ciągu X1,X2,X3,...

PfX = kg = pk; k = 0; 1; 2; : : : ;M

MX

k=0

pk = 1

U > S

X = X + 1; S = S + px

b) Metoda równomiernego rozbicia przedziału

Zakładamy że zmienna losowa X przyjmuje określone wartości z pewnym prawdopodobieństwem

Przedział (0,1) dzielimy na K+1 podprzedziałów o jednakowej długości

Zmienna U wpada do przedziału

Konstruujemy dwa ciągi

µi¡ 1K + 1

;i

K + 1

¶; i = 1; 2; : : : ;K + 1

[(K + 1)U + 1]

PfX = kg = pk; k = 0; 1; 2; : : : ;K

q¡1 = 0

gi = max

½j : qj <

i

K + 1

¾; i = 1; 2; : : : ; K + 1

qi =

iX

j=0

pj ; i = 0; 1; : : : ; K

24

Algorytm

1) Generujemy zmienną U o rozkładzie równomiernym w (0,1)

2) Obliczamy

3) Iteracyjnie obliczamy

dopóki jest spełniony warunek

4) Jeśli

to akceptujemy X5) Kroki 1-4 powtarzamy aż do uzyskania odpowiednio licznego ciągu X1,X2,...

Powyższy algorytm zapewnia to, że warunek

będzie sprawdzany conajwyżej dwukrotnie.

X = [(K + 1)U + 1]

X = X ¡ 1

qX¡1 > U

X = gX + 1

qX¡1 < U

qX¡1 > U

Generatory o rozkładach wielowymiarowych

Zadanie można sformułować następująco:

Należy wygenerować ciąg wielowymiarowych zmiennych losowych

których rozkład prawdopodobieństwa ma gęstość

Do generacji takiego ciągu można stosować metodę eliminacji czy superpozycji rozkładów. Przy użyciu metody elminacji w najprostszej postaci pojawiają się problemy.

Przykład. Określić prawdopodobieństwo akceptacji wielowymiarowej zmiennej losowej o rozkładzie równomiernym na kuli jednostkowej (Kk(0,1)) . Algorytm.Losujemy m zmiennych niezależnych o rozkładzie równomiernym w (-1,1) i konstruujemy zmienną wielowymiarową

Zmienną akceptujemy jeśli

kUUUk2 · 1

XXX = (X1; X2; : : : ; Xk)

f (x1; x2; : : : ; xk)

UUU = (U1; U2; : : : ; Uk)

25

Prawdopodobieństwo akceptacji zmiennej jest równe ilorazowi objętości kuli i opisanej na niej kostki [-1,1]k

Średnia liczba wylosowanych punktów Nm potrzebnych do realizacji jednej zmiennej wynosi

Modyfikacją usprawniającą powyższy algorytm jest podział kostki na rozłączne podobszary i przeprowadzenia losowania w każdym z nich z osobna.

Nm =1

pm

m pk Nk

2 7.854 x 10-1 1.27

5 1.645 x 10-1 6.08

10 2.490 x 10-3 4.015 x 102

20 2.461 x 10-8 4.063 x 107

50 1.537 x 10-28 6.507 x 1027

Rozkład równomierny na sferze

Jeżeli k-wymiarowa zmienna losowa

ma rozkład równomierny na sferze to

k-wymiarowa zmienna X ma rozkład sferycznie konturowany jeżeli jej gęstość prawdopodobieństwa

zależy tylko od

XXX = (X1; X2; : : : ; Xk)

Sk =

8<:(x1; : : : ; xk) :

kX

j=1

x2j = 1

9=;

gX(x1; x2; : : : ; xk) = f(kxk)

kxk2 =kX

j=1

x2j

26

Wniosek: mając do dyspozycji odpowiedni rozkład sferycznie konturowany można go użyć do generowania zmiennej losowej o rozkładzie równomiernym na powierzchnii kuli.

Przykład.

m-wymiarowy rozkład normalny opisuje gęstość

Algorytm generowania rozkładu równomiernego na sferze w m wymiarach:

1) Generujemy m-wymiarową zmienną losową X o rozkładzie normalnym2) Obliczamy

Rozkład nowej zmiennej X będzie równomierny na sferze Sk.

Rozkład równomierny na sferze Sk i Sk+1

Tw. Jeżeli zmienna

ma rozkład równomierny na k-wymiarowej sferze Sk,R jest zmienną o rozkładzie

a s jest losowym znakiem

to (k+1)-wymiarowa zmienna losowa

ma rozkład równomierny na (k+1) wymiarowej sferze.

Rozkład równomierny w kuli Kk

Długość wektora wodzącego R zmiennej X jest także zmienną losową i ma ona rozkład

Pfs = 1g = Pfs = ¡1g = 1

2

h(r) = (2k ¡ 1)rk¡1; 0 · r · 1

h(r) =

(rk¡1p1¡r2 ; 0 · r · 10 r =2 [0; 1]

XXX =xxx

kxxxk

XXX = (x1; x2; : : : ; xk)

ZZZ = (Rx1; Rx2; : : : ; Rxk; sp1¡R2)

gX(x1; : : : ; xk) =1

(2¼)k=2exp

µ¡12k~xk2

¶

27

Wystarczy więc wygenerować punkt

leżący na sferze Sk a następnie obliczyć

Zmiena X leży wewnątrz kuli jednostkowej Kk i ma w tym obszarze rozkład równomierny.

Po co rozkład w kuli Kk(0,1)?

Pewne obiekty wielowymiarowe możemy przedstawić w postaci prostych transformacji liniowych współrzędnych.

Taką transformację reprezentuje macierz

Przykład – hiperelipsoidę w Rk otrzymamy transformując Kk(0,1).

Testowanie generatorów liczb pseudolosowych

Ponieważ wszystkie generatory o dowolnym rozkładzie bazują na wykorzystaniu ciągów liczb losowych o rozkładzie równomiernym więc istotne jest badanie tylko generatorów liczb o takim właśnie rozkładzie.

Testowanie generatora jest procesem złożonym:

1) Dla ustalonej liczby n, generujemy n kolejny ch liczb startując od losowo wybranej liczby początkowej

2)Obliczamy wartość statystyki testowej (T)

3)Obliczamy F(T) czyli dystrybuantę statystyki T, gdy weryfikowana hipoteza jest prawdziwa

4) Kroki 1-3 powtarzamy N-krotnie obliczając statystyki: T1,T2,...,TN. Jeśli weryfikowana hipoteza jest prawdziwa to

jest ciągiem zmiennych niezależnych o rozkładzie równomiernym. Testowanie generatora kończy się sprawdzeniem tej hipotezy.

F (T1); F (T2); F (T3); : : : ; F (TN )

ZZZ = (Z1; Z2; : : : ; Zk)

XXX = (RZ1; RZ2; : : : ; RZk)

~Z = A ~X

28

Testy zgodności z zadanym rozkładem

Test chi-kwadrat

Jest najczęściej stosowanym testem. Badamy w nim hipotezę że generowana zmienna losowa X ma rozkład prawdopodobieństwa o dystrybuancie F.

Jeżeli

to możemy dokonać następującego podziału zbioru wartości zmiennej X

Generujemy n liczb

Sprawdzamy ile z nich spełnia warunek

Ich liczbę oznaczamy ni.

F (a) = 0 F (b) = 1

a < a1 < a2 < : : : < ak = b

pi = Pfai¡1 < X · aig; i = 1; 2; : : :

X1;X2; : : : ; Xn

ai¡1 < X · ai

Statystyką testu jest

Dla dużego n statystyka ta ma rozkład 2 o (k-1) stopniach swobody.

Możemy tak dobrać szerokości przedziałów aby otrzymać zależność

wówczas statystyka przyjmuje prostszą postać

Â2k¡1 =kX

i=1

(ni ¡ npi)2npi

pi =1

k

Â2k¡1 =k

n

kX

i=1

n2i ¡ n

29

Test OPSO (overlapping-pairs-sparse-occupancy)

Generujemy ciąg liczb

Jeśli z każdej weźmiemy k bitów to możemy utworzyć ciąg liczb całkowitych

z zakresu {0,1,...,2r-1}.

Następnie tworzymy ciąg kolejnych nakładających się par

Jeśli przez Y oznaczymy liczbę takich par

które nie pojawiły się w ciągu (Ii,Ii+1), to ta zmienna

ma rozkład normalny N() – oczywiście dla odpowiednio dużego n.

Przykładowe parametry testu OPSO

X1;X2; : : : ; Xn

I1; I2; : : : ; In

(I1; I2); (I2; I3); : : : ; (In¡1; In)

f(i; j) : i; j = 0; 1; : : : ; 2b ¡ 1g

b n 10 221 141909 290.26

11 222 1542998 638.75

12 223 567639 580.80

Testy zgodności rozkładów statystyk

Jeżeli wygenerowany ciąg zmiennych losowych

Jest ciągiem zmiennych niezależnych to możemy z elementów tego ciągu utworzyć wektory

które też będą zmiennymi losowymi ale o rozkładzie równomiernym w kostce jednostkowej (0,1)m.

Możemy zatem zdefiniować pewną funkcję

określoną w kostce jednostkowej. W ten sposób tworzymy ciąg nowych zmiennych losowych

o jednakowym rozkładzie i dystrybuancie

Testowanie generatora polega na sprawdzeniu hipotezy że ciąg Y1,Y2,... jest próbką z populacji o dystrybuancie G.

X1;X2; : : : ; Xn

(X1;X2; : : : ; Xm); (Xm+1; Xm+2; : : : ;X2m); : : :

y = h(x1; x2; : : : ; xm)

Yj = h(X(j¡1)m+1; X(j¡1)m+2; : : : ;Xjm)

j = 1; 2; : : :

G(y) = PfYj · yg

30

Testy oparte na statystykach pozycyjnych

Dla wektorów losowych w kostce (0,1)m definiujemy funkcje

co generuje nowe zmienne

Nowe zmienne mają następujące rozkłady

Testowanie generatora polega na sprawdzeniu hipotezy o zgodności rozkładów zmiennych U,V,R z powyższym. Testy przeprowadza się dla niewielkich wartości m=2,3,...,10.

u = maxfx1; x2; : : : ; xmgv = minfx1; x2; : : : ; xmgr = u¡ v

U; V; R

PfUj · ug = um; 0 · u · 1

PfVj · vg = 1¡ (1¡ v)m; 0 · v · 1

PfRj · rg = mrm¡1 ¡ (m ¡ 1)rm; 0 · r · 1

Test sum

Definiujemy funkcję

Wygenerowana zmienna losowa Y ma rozkład o gęstości

Dla m=2

Dla m=3

Testowanie generatora polega na weryfikacji hipotezy, że zmienna losowa Y ma rozkład zgodny z gm(y). Zazwyczaj m nie przekracza 5.

y = x1 + x2 + : : :+ xm

g2(y) =

½y 0 · y · 1

2¡ y 1 < y · 2

g3(y) =

8<:

y2

2 0 · y · 112 (y

2 ¡ 3(y ¡ 1)2) 1 < y · 212 (y

2 ¡ 3((y ¡ 1)2 + 3(y ¡ 2)2)) 2 < y · 3

Generatory liczb pseudolosowych

Documents

Transcript of Generatory liczb pseudolosowych