למדנו לבצע בדיקת השערות לממוצע מדגם.

18
n x z םםםםם םםםם םםםםם םםםםםם םםםםםם םםםם. םם םםם םםםם םםםםם םםםםםם םםםםם םםםם:.1 םם םםםםם םםםםםםםםםם "םםםםםם"..2 םםםםםם םם םם( םםםםם םםםם םם םםםםםםםםםם) םםםםםם םםםם םםםםםם םםםםםם םםםםםםם םםם םםם םםםם םםם םם םםםםםם םם םםםםםםםם םם םםםםםםםםם

description

למדנו לבצע בדיקת השערות לממוצע מדגם. על מנת לבצע בדיקת השערות עלינו לדעת: את ממוצע האוכלוסייה "הרגילה". סטיית התקן של האוכלוסייה (הרגילה או עם הטיפול מאחר והנחנו שוויון שונויות). הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה. ומה כאשר סטיית התקן של האוכלוסייה לא ידועה?. - PowerPoint PPT Presentation

Transcript of למדנו לבצע בדיקת השערות לממוצע מדגם.

Page 1: למדנו לבצע בדיקת השערות לממוצע מדגם.

n

xz

למדנו לבצע בדיקת השערות לממוצע מדגם.

על מנת לבצע בדיקת השערות עלינו לדעת:את ממוצע האוכלוסייה "הרגילה".1.סטיית התקן של האוכלוסייה )הרגילה או עם הטיפול מאחר 2.

והנחנו שוויון שונויות(

הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה

Page 2: למדנו לבצע בדיקת השערות לממוצע מדגם.

, Sn) )סטיות תקןאם בונים התפלגות דגימה של התוחלת של סטיות התקן תהיה שונה מסטיית התקן

(.) של האוכלוסייה ממנה נדגמו המדגמים

. הוא אומדן מוטה ל-Snמכאן ש-

.הוא אומד חסר הטיה ל- Sn-1ניתן להוכיח ש-

)(1snE

)(snE

appletמה תהיה צורתה של התפלגות הדגימה של סטיות תקן?

לא האוכלוסייה של התקן סטיית כאשר ומהידועה?

1

1

2

1

nS

n

in

xxi

Page 3: למדנו לבצע בדיקת השערות לממוצע מדגם.
Page 4: למדנו לבצע בדיקת השערות לממוצע מדגם.

2

1

)1(~2

1

2

n

nns

2

sn2

1sn2

1 sn2

1

)1( n 2

2

1)1( snn

2

2

1)1( snn

2

2

1)1( snn

dfn

dfn

222

1

22

2

התפלגויות שונותמשפחה של

Page 5: למדנו לבצע בדיקת השערות לממוצע מדגם.

tהתפלגות

n ידועים, התפלגות הדגימה של ממוצעים עבור ו-כאשר מספיק גדול תתפלג נורמלית

nNx

,~

אבל לרב הפרמטרים של האוכלוסייה אינם ידועים. לא, ניתן לאמוד אותה. ידוע אך אם

הוא2אומד חסר ההטיה ל-

אומד חסר הטיה הוא אומד שממוצע התפלגות הדגימה שלו שווה לפרמטר האוכלוסייה. במקרה הפרטי, אם נדגום

ונחשב בכל מדגם את האומדן nאינסוף מדגמים בגודל .2הממוצע של כל האומדנים יהיה שווה ל-

S n

2

)1(

S n

2

)1(

Page 6: למדנו לבצע בדיקת השערות לממוצע מדגם.

לכן: אם סטיית התקן של האוכלוסייה אינה ידועה

ניתן להשתמש באומדן שלה:

11

2

1

n

xxn

ii

nss

1

n

nnss אזי:Snאם כבר חישבנו את

כי: 1

1

2

1

2

111

n

n

ii

n

ii

n ssn

xx

n

n

n

xx

n

n

Page 7: למדנו לבצע בדיקת השערות לממוצע מדגם.

ובחזרה להתפלגות הדגימה של ממוצעים. מאחר ואנו משתמשים באומדן לסטיית התקן במקום בפרמטר, יש

גורם נוסף לטעות.

מכאן שסטיית התקן של התפלגות הדגימה תהיה גדולה יותר.

הפתרון הוא שימוש בהתפלגות אחרת, התפלגות "רחבה" יותר מההתפלגות הנורמלית. התפלגות זאת קרויה

.tהתפלגות יהיה:תצפית בודדתעכשיו הסטטיסטי שלנו עבור

sxt

n

xi

1

t אינו מתפלג נורמלית אלא מתפלג t שהיא התפלגות רחבה יותר.

היא בעצם משפחה של התפלגויות tיתרה מכך התפלגות ככל שמספר (d.f.=n-1כפונקציה של דרגות החופש )ד"ח=

( מדויק יותר )קרוב sהתצפיות גדול יותר, כך האומדן שלנו ) צרה יותר ושואפת לנורמלית.t( והתפלגות יותר ל-

?df=n-1למה William Gosset: Student’s t

Guinness's brewery

Page 8: למדנו לבצע בדיקת השערות לממוצע מדגם.
Page 9: למדנו לבצע בדיקת השערות לממוצע מדגם.

ובהתפלגות דגימה של ממוצעים:

x

x

n

x

Sn

xsx

t

1

2,0

1,0

~~

df

df

N

ttz

מתי

x

x

S

x יתפלגt?

מתפלג נורמליתxכאשר 1.

n>30 כאשר או2.

nss n

x1

1

nss n

x

Page 10: למדנו לבצע בדיקת השערות לממוצע מדגם.

מכאן, תהליך בדיקת ההשערות זהה לחלוטין לבדיקת השערות על .zממוצע כפי שלמדנו עם

aH

aH

:

:

1

0

aH

aH

:

:

1

0או

1)

.n>30 מתפלג נורמלית, או x( הנחות: 2

( חישוב הסטטיסטי3

p לערך הקריטי בטבלה, או חישוב t( השוואת הסטטיסטי 4 EXCELבאמצעות

nsx

tn

x

1

=TDIST)t,df,tails(

מבחן דו-צדדי2 מבחן חד-צדדי1

מקבל ערכים חיוביים בלבד!

NORMSDIST TDIST 1-

Page 11: למדנו לבצע בדיקת השערות לממוצע מדגם.
Page 12: למדנו לבצע בדיקת השערות לממוצע מדגם.

nsxt

דוגמא

₪ .6500ידוע שההכנסה הממוצעת של משפחה ישראלית היא )לפני איסוף הנתונים( שתושבי הצפון מרוויחים טועןכלכלן ממשרד האוצר

מעל לממוצע האוכלוסייה. מתושבי הצפון ומצא שממוצע ההכנסה שלהם עמד של40הוא דגם מקרית

. s=700 ₪ ו-0007?0.05האם טענת הכלכלן מוצדקת ברמת מובהקות של

6500:

6500:

1

0

H

H

52.4

40700

65007000

t

05.0

ולומר שהכלכלן צדק.H0לכן ניתן לדחות את

.t, התפלגות הדגימה היא n>30מכוון ש

1)

2)

3)

)לכל היותר(1.697 הוא df=39 חד-צדדי עם =0.05הערך הקריטי עבור (4

=TDIST)4.52,39,1(=2.8E-05 0001.05.,52.4)39( ppt

697.1)1,05.0,30(

684.1)1,05.0,40(

t

tטבלה

Page 13: למדנו לבצע בדיקת השערות לממוצע מדגם.

( מהי עוצמת המבחן שביצע הכלכלן אם מתברר שכלל תושבי הצפון 5 ₪?6900מרוויחים בממוצע

TINV)0.1,39(=1.68

לשים לב! הפקודה היא דו-צדדית, לכן בהשערה חד-צדדית יש להכפיל את .2ב-

=TINV),df(דו צדדי

94.668540

70068.16500

)(

n

stx cc

93.1

40

700690094.6685

t

0.03=TDIST)1.93,39,1( 97.01

6500 6900

H0 H1

Page 14: למדנו לבצע בדיקת השערות לממוצע מדגם.

1

n

nnss :, הראנו שSnאם כבר חישבנו את

לכן:

1

nx sS

n

1

11

nn

n

n

n

ssss nn

nx

כי

x

x

S

xt 1

1

nnsss nn

x

Page 15: למדנו לבצע בדיקת השערות לממוצע מדגם.

1

)1,2()1,2( xnxnstxstxp

אם סטיית התקן של האוכלוסייה אינה ידועה, אזי נוכל לבנות .tרווח בר סמך בהתבסס על התפלגות

דוגמה: 4000 נמצא שההכנסה הממוצעת היתה n=30במדגם בגודל

95%. ברמת בטחון של 0s=300עם אומדן לסטיית התקן ((=0.05?מהו ממוצע ההכנסה של כלל האוכלוסייה ,

72.54730

3000

n

ssx

72.547*045.2400072.547*045.24000

09.512091.2879

=TINV),df(

רווח בר סמך לממוצע האוכלוסייה

2.045(=TINV)0.05,29

Page 16: למדנו לבצע בדיקת השערות לממוצע מדגם.

דוגמא:שרת החינוך רוצה לדעת מהו הממוצע בחשבון של כלל 10התלמידי י"ב בישראל. לשם כך היא דגמה באופן מקרי

תלמידי י"ב. בהנחה שציוני חשבון מתפלגים נורמלית, מהו ?95%ממוצע באוכלוסייה ברמת בטחון של

.70,60,80,90,60,73,76,81,90,65להלן הנתונים:

1

)1,2()1,2( xnxnstxstxp

%9537.8263.66 p

2

2

(()

1

(()

)

)

i

i

EXCEL

stdevn

stdevpn

xx

xx

מאחר ומדובר בתהליך איטרטיבי.t מינימלי בהתפלגות nלא נעסוק ב-

Page 17: למדנו לבצע בדיקת השערות לממוצע מדגם.

הוא הבסיס למשפחת הסטטיסטיקה tמבחן הפרמטרית:

ניתוח שונות•רגרסיה•

זו הסטטיסטיקה הרווחת בשוק.דרישות:

משתנים בסולם רווח/יחס )מבוססת על ממוצעים(התפלגות דגימה נורמלית

למרות שרב המשתנים במדעי החברה לא עונים לדרישות אלו, הסטטיסטיקה הרווחת היא פרמטרית.

Page 18: למדנו לבצע בדיקת השערות לממוצע מדגם.

דגימה מקרית:כל המבחנים הסטטיסטיים מבוססים על דגימה מקרית. דגימה שבה לכל פרט באוכלוסייה יש סיכוי זהה להיכלל

במדגם.זו הנחה שכמובן לרב לא מתקיימת. אי קיומה פוגעת גם

ביכולת ההכללה של הממצאים )תוקף חיצוני(.

לכל מחקר ארבעה סוגי תוקף עיקריים: - עד כמה ההגדרה האופרציונלית של תוקף מבנה•

המשתנים תואמת את ההגדרה התיאורטית. - האם המשתנה הבלתי תלוי הוא הסיבה תוקף פנימי•

למשתנה התלוי או שמא ישנם משתנים חיצוניים המתערבים במחקר.

- עוצמת המבחן, טעות מסוג תוקף המסקנה הסטטיסטית •I.בחירת המבחן הסטטיסטי , - יכולת הכללה של הממצאים )דגימה מייצגת(תוקף חיצוני•