דף נוסחאות סטטיסטיקה 2008

7
ףף ףףףףףףףףף- ףףףףףףף ףףףף ףףףף( Ω ףףףף-) ףף ףףףףףףף ףףףףףףףףף ףףףףףף ףףףףף. ףףףףף ףףףף( ω ףףףףף) ףףףףףף ףףף ףףףףףף. ףףףףף( A,B ףףףף-) ףף ףףףףףףף ףףףףףף. ףףףףף ףףף( - ф .) ףףףףף ףףף ףףףףףףף ףףףףף- - ףףףףף ףף ףף ףףףףףףף ףףףףףףףף ףףףףף ףףףף ףA ףףB ףףףףף- . ףףףףף ףף ףף ףףףףףףף ףףףףףףףף ףA ףB . ףףףףף ףףףףף ףף ףף ףףףףףףף ףףףףףףףף ףףף ףףףףףף ףףףףףףA . ףףף ףףף ףףףףףףף- - A ףףףף ףB ףףףף ףף ףףףףף ףףףףףף ףA ףףףףף ףB . ףףףףףףף ףףףף- A ףB ףףףףףףף ףףףף ףף ףףף ףף ףףףףף ףףףףףף ףףףףףף ףףףףףף. ףףףףף. ףףףף ףףףףףףף ףףףף ףףףףףף ףףףףף- A 1 , A 2 , …, A n ףףףף ףףףף ףףףףףףף ףףףף ףףףףףף ףף ףף ףףף ףףףףףףף ףףףףף ףףףףף ףףףף ףףףף. ףףףףף ףףףף ףף ףףףףף ףףף- . 3 ףףףףףףףף ףף ףףףףףףף, , - ףףףףףף ףף- A 1 , A 2 , …, A n ףףףף ףףףףףףף ףףףף ףףףףףף ףף ףףף. , , , . ףףף ףףףף ףףP)A( ? ףףףף ףף ףףףףףA ףףף ףף ףףףףףףףף ףףףףףףA ףףף. ףףףף ףףףףףףף ףףףףףף)ףףףף( - Ω ףףףף ףףףף ףףףף ףףףףףף ףף ףףףω ףףףףף ףף ףף ףף ףףףף ףףףףף ףףףףףף. ףףףףףףף ףףף ףףףףףףף: ףףףף ףף ףף ףף ? ףףףףף ףףףףףףףףףףףף.- ףףףףףףףףףףףף ףףףף ףףףףףףףףף ףףףףn ףףףףף ףףףףף ףףףףף ףףף: ףףףף ףףףףףף ףףףףףףk ףףףףף ףףףףn ףףףףף ףף ףףף ףףף ףףףףף ףףףn k . )1=!0( ףףףף ףףףףףף ףףףףףףk ףףףףף ףףףףn ףףףףף ףף ףףףףףף ףףףף ףףףף ףףףףף- ףףף ף ףףףף ףףףףףףףףף ףףףףףk ףףףףף ףףףףn ףףףףף ףףף ףףףףףף ףףףף ףףףף ףףףףף- ףףף ףףףף ףףףףףף ףףףףף "ףףףףף" ףף ףףףףף ףףףף ףף ףףףףףף. ףףףףףףף ףף ףףףףף ףף ףףףףף ףףףף ףףףףףף. ףףףףףףף ףףףףףף ףףףףףףףף- ףףףףףף ףףףףףA ףףףף ףףףף ףףףףףף ףףףףףףB ףףףףףף ףP)A|B( ףףףף. P)B(>0 ףף ףףף ףףףףףף- ףףף ףףףף ףףףףףף ףףףףףף ףף ףףףףף ףףףףףף- ףףףףף ףףףף:

description

באדיבות עידן פרומקין.\מושקע במיוחד!

Transcript of דף נוסחאות סטטיסטיקה 2008

Page 1: דף נוסחאות סטטיסטיקה 2008

נוסחאות- סטטיסטיקה דף

בניסוי. אחת אפשרית ( תוצאהω) פשוט מאורעכלשהו. בניסוי האפשרויות התוצאות כל (- אוסףΩ) מדגם מרחב(.ф- )ריק מאורעפשוטים. מאורעות של (- אוסף…A,B) מאורע

.B אוA מ באחת לפחות המופיעות התוצאות כל את המכיל - - מאורעמאורעות בין פעולה התוצאות כל את המכיל מאורע–. B וA ל המשותפות התוצאות כל את המכיל - מאורע

.A במאורע נמצאות שלא האפשריות

וA- זרים מאורעות. B ב נמצאתA ב אפשרית תוצאה כל כאשרB ב מוכלA- - מאורעות בין יחסBבזוגות זרים מאורעות אוסף. בשניהם. כלומר הנמצאת אפשרית תוצאה אף אין אם זרים מאורעות-

זרים. כלומר הינם באוסף שונים מאורעות שני כל אם בזוגות זרים מאורעות אוסף נקראA1, A2, …, An האוסף

. - וגםמורגן דה חוקי

- , , הסתברות של אקסיומות3

. אז בזוגות זרים מאורעות הינםA1, A2, …, An - אםמתקיים , , , וגם

.

היאA למאורע ההסתברות אז הואA מאורע כי ? נניחP(A) את נחשב איך.

הסברות. אותה את יש זה במדגםω לכל אם סימטרי מדגם מרחב הינוΩ- )אחיד( סימטרי הסתברות מרחבקומבינטוריקה. ? בעזרת את או את נחשב סימטרית: איך הסתברות במרחב

קומבי הוא: בשורה שונים עצמיםn לסדר האפשרויות מספרנטוריקה-

nk. (1=!0) הוא החזרה ועם סדר עם עצמיםn מתוך עצמיםk לבחירת הדרכים מספר הוא- החזרה וללא לסדר חשיבות עם עצמיםn מתוך עצמיםk לבחירת הדרכים מספר

מ

הוא- החזרה וללא לסדר חשיבות ללא עצמיםn מתוך עצמיםk לבחור האפשרויות מספר המשלים. את לחשב לשקול "לפחות" יש המילה מופיעה כאשר תלויים. בלתי בהכרח הם החזרה עם ניסויים

.P(A|B) כ מסומנת B המאורע שהתרחש ידוע כאשרA מאורע שיתרחש - ההסתברותמותנית הסתברות -השרשרת כלל אזP(B)>0 כאשר

וגם

-ההיפוך נוסחת את מקבלים השרשרת מכלל בייז: נוסחת

מהבאים- , אחד מתקיים אם תלויים בלתי יהיוB וA- תלויים בלתי מאורעותB וA גם אז ב"תB וA ש ידוע , אם A ב"ת, ̄ A ב"ת, B ו̄ B ו̄ ב"ת. ̄

פונקצית. X,Y,Z ב ממשי. מסומן ערך המדגם מתוצאות אחת לכל המתאימה פונקציה - הינומקרי משתנה הערך את יקבל שהוא ההסתברות את לקבל יכול המקרי שהמשתנה ערך לכל נותנת מקרי משתנה - שלהסתברות

- .פונ' הסתברות של תכונותהזה. . בנוסף, אז מקבלX ש ערכים הינםx1, x2, …, xn בנוסף, אם

ע"י ומחושבת מקבל המקרי שהמשתנה הערכים של משוקלל ממוצע הינה מקרי משתנה של - תוחלתתוחלת הנוסחה-

מתקיים מ"מ שני כל - עבורהתוחלת תכונות כ

וגם מתקיים בנוסף

Page 2: דף נוסחאות סטטיסטיקה 2008

ניתן פיזור, בעזרת מדד היא . למעשה, השונות ע"י נתונהX של - השונותשונות -השונות תכונותמהתוחלת. מרוחקים מקבלX ש של הערכים כמה עד להעריך

ע"י נתונהX - שלהתקן סטיית. ממשייםa, b קבוע. בנוסף, לכל משתנהX . כאשר וגם כ ומקיימת

מהערכים אחד כל לקבל יכולXזו: . במשפחה אחיד מתפלגX- מקריים משתנים של מיוחדות משפחות אחד הואk כאשר ע"י נתונה זהה: . ההסתברות בהסתברות הבאים

האברים. בנוסף, וגם מן

את סופרX ניסוי בכל להצלחהp הסתברות עם ב"ת ניסוייםn של : בסדרה בינומי מתפלגX במשפחהההצלחות. מתקיים: מספר

ביחידת האירועים מספר את סופרX. פואסוני מתפלגX- מקריים משתנים של מיוחדות משפחות המשך הזמן. מתקיים- יחידת באורך רק תלוי והוא הוא האירועים מספר ממוצע כאשר כלשהי זמן וגם

שני קובעים ההתפלגות ההתפלגות. את של התוחלת סביב וסימטרית רציפה - התפלגותנורמלית התפלגות . כל כך ההתפלגות את לסמן . ניתן2σ ע"י המסומנת והשונותμ ע"י המסומנת פרמטרים: התוחלת

כך- אותו . נסמן1 ושונות0 תוחלת בעל סטנדרטי נורמלי מקרי משתנה שיהיה כך לתקנן ניתן נורמלי מקרי משתנה הבא- בנוסף, עבור החישוב ע"י נעשה . התקנון

. מתקייםa, b וקבועים נורמלי מקרי משתנה

ההסתברות. פונקצית ערכי של האמצע שהוא הסימטריה קו היא התוחלת וסימטרית רציפה התפלגות של במקרה

כלשהו נתוןz לערך קטנים ערכים יקבל נורמלי מקרי שמשתנה - ההסתברותשטחים חישוב ע"י הסתברות חישובי אופן, ההסתברות הבא: באותו בציור . כנתוןz לערך משמאל לפונ' הצפיפות שמתחת השטח הוא לערך. שמימין השטח הוא נתוןz מערך גדולים ערכים לקבל המשתנה של

ערכים יקבל שהמשתנה לכך, ההסתברות בהמשך ולכן1 הוא לגרף שמתחת הכולל השטח נקודתי ערך לקבל ההסתברות הינו ערכים שני של טווח בתוך

אפס. היא כלשהו

הינו: כללי נורמלי משתנה עבורXp כ , מסומןp ה האחוזון של הערך חישוב מ )גדול גדול מספיקn עבור2σ ושונותμ תוחלת בעלת מאוכלוסיהX1, X2, …, Xn מדגם - עבורהמרכזי הגבול משפט

עם מתפלג בקירוב הדגימות סכום כן, גם . כמוn/2σ ושונותμ תוחלת עם נורמלי מתפלג בקירוב המדגם ( ממוצע30 . כלומר: וגם2σn ושונותnμ תוחלת

כך הנבחר אקראי תחום הואα-1 סמך ברמתμ לתוחלת סמך ידועה(- רווחσ )כאשר לתוחלת סמך רווח-סמך רווח אורך. . כלומרα-1 ל שווהμ של האמיתי הפרמטר את יכלול שהוא שההסתברות

העמידה שגיאת- הרווח גבולות חישוב- לתוחלת( המדגם ממוצע בין )הסטייה

הסמך... רווח , אורךα-1נתונה, סמך ברמת כי המבטיח המינימאלי המדגם - גודלהמדגם גודל לחישוב נוסחה מסוים. על יעלה ...לא

)האומד( לתוחלת המדגם ממוצע בין . הסטייה המדגם ממוצע סביב סימטרי סמך - הרווחסמך הרווח תכונות סמך. אורך הרווח אורך למחצית שווה זו המדגם. שגיאה טעות או האמידה שגיאת )הפרמטר( נקראתμ האמיתית

הסמך שרמת ככל: α-1 הסמך ברמתגורמים: בשלושה תלוי כן המדגם. הוא בממוצע תלוי ואינו קבוע הוא הרווח הוצא ממנה האוכלוסיה שלσ התקן יותר. בסטיית גדול בתחום לנו עולה יותר רב )בטחון גדל הרווח אורך יותר גבוהה

אורך יותר גדול שהוא . ככלn המדגם יותר. ובגודל גדול סמך הרווח אורך יותר גדולה התקן שסטיית המדגם. ככל

Page 3: דף נוסחאות סטטיסטיקה 2008

שאר שכל )בתנאי פי סמך הרווח אורך להקטנת תגרוםk פי המדגם לב: הגדלת לשים יותר. יש קטן סמך הרווח

.k2 פי המדגם את להגדיל עלינוk פי הרווח אורך את להקטין קבועים(. מכאן, כדי הגורמים

)תוחלת( האוכלוסיה. ניתן בממוצע שינוי לגבי כלשהי השערה לבדוק רוצים כאשרZ במבחן - משתמשיםZ מבחן שונות כי פעמים, וכן30 מ יותר דוגמים כאשר או נורמלית מתפלגת האוכלוסיה כי נתון כאשר במבחן להשתמש

.מובהקות רמת= ראשון מסוג טעות היאα זה ידועה. במבחן האוכלוסיה =α false positive ראשון מסוג טעות.

β שני מסוג טעותהמוכר. למצב יחסית שינוי כל אין במציאות בעוד שינוי שחל ונאמין0H את שנדחה הסיכויfalse negative1 היא שהמציאות = הסיכויH0 את וקיבלנוH .1 היא שהמציאות = הסיכויהמבחן עוצמתH0 את ודחינו

Hכ . מסמנים π = 1-βככל2יותר. קטנה יותר, העוצמה קטנה המובהקות שרמת - ככל1העוצמה? על משפיע . מה - גדלה. העוצמה יותר גדול שהמדגם - ככל3גדלה. העוצמה מהשניה אחת רחוקות שההשערות

במדגם שהתקבלו כמו חריגות כ"כ תוצאות לקבל ההסתברות התוצאה. זוהי מובהקות את המצייןp value יש כן כמו תלויים, אז בלתי והם ו נתון נכונה.H0 כאשר

-Z מבחן המשך

.α > PV כאשרPV לפי0H את דוחים

)תוחלת( האוכלוסיה. ניתן בממוצע שינוי לגבי כלשהי השערה לבדוק רוצים כאשרT במבחן - משתמשיםT מבחן זה במבחן אנשים. משתמשים30 לפחות דגמו כאשר או נורמלית מתפלגת שהאוכלוסיה נתון כאשר במבחן להשתמש

מתוך המדגם עבור המחושבת - שונותהמדגמית השונותידועה. אינה באוכלוסיה השונות כאשרשהתקבלו: התוצאות

Page 4: דף נוסחאות סטטיסטיקה 2008

מתוך המחושבת תקן סטיית המדגמית. זוהי השונות לשורש - שווהמדגמית תקן סטיית. עצמו המדגם ממצוע

השונות כאשר לתוחלת סמך רווח -T התפלגות ולפי ידועה אינה הוא:n עבור הרווח גבולות חישוב

- הוא:הרווח אורך

-t למבחןSPSS פלט

דרגותחופש

PVלדו צדדית

Page 5: דף נוסחאות סטטיסטיקה 2008

דיאטה. ואחרי לפני קשר. למשל- משקל בניהם שיש תצפיות של כזוגות בנויים המדגמים שני זה - במקרהמזווג מדגם בין ההפרש שהואD את ניצור שלנו ההשערה את לבחון כדי

.Y לממוצעX ממוצע

בודקים צדדית. כאשר דו להשערה הואPV בטבלאות, ה שונה, מסוג השערה

בשתיים. אותו לחלק יש

שונים. בגדלים גם להיות יכולות וזרות. הן שונות מקבוצות באים המדגמים שני זה - במקרהתלויים בלתי מדגמים שני נורמלית. מתפלגות שהדגימות המדגמים. מניחים של הממוצעים שני את להשוות היא המבחן מטרת

.F הוא המבחן המדגמים. סטטיסטי בשני שונויות שיווין - בודקלוין מבחן0H1 ו שוות שהשוניות הינהHשונות. שונויות הינהSigה הינו PVמבחן של

.0H את דוחיםα מ קטןPV כאשר.α = 0.05 ל תמיד אותו ובודקים לויןנסתכל. השניה בטבלה שורה איזו על קובע לוין מבחן

D את מגדירים לא תלויים בלתי במדגמיםהממוצעים. שני בין ההפרש את רק אלא

המבחן ביצוע קטגוריאליים. לשם משתנים שני בין קשר קיים האם לבדוק היא המבחן - מטרתתלות לאי2Χ מבחן קשר? היה לא אילו צפוי היה - מהExpectedשנמצא. מה של - השכיחויותObservedשכיחויות. של טבלאות שתי בונים דוחים אתα מובהקות רמת המשתנים. עבור בין קשר שקיים להסיק יותר גדול סיכוי יש כך מאפס יותר רחוק2Χ ש ככל

ודרגותαהשערת האפס אם המשתנה שקיבלנו גדול יותר מהמשתנה המתאים בטבלה. את המשתנה בטבלה מוצאים לפי מחשבים2Χ בונים בעזרת הנוסחה -< סה"כ טור * סה"כ שורה / סה"כ כולל. אז Expectedהחופש. את טבלת ה

כך: מחברים את כל האיברים לפי הנוסחה:

- חייב להיות בין מינוס אחד לאחד.1: תכונות- ניתן להשתמש רק כאשר הקורלציה היא לינארית. מקדם המתאם של פטרסון - סימן המקדם נקבע לפי המונה שכן המכנה תמיד חיובי )מכפלה של סטיות תקן(. אם המקדם חיובי הקשר חיובי ולהיפך.2 - אם הערך המוחלט שווה לאחד4- ככל שהערך המוחלט מתקרב לאחד כך העוצמה של הקשר הלינארי בין המשתנים עולה. 3

0.8 ל 0.5 לאחד הקשר חזק, אם הוא נע בין 0.8- אם הערך המוחלט נע בין 5אז הקשר הוא מושלם והנק' הן על קו הרגרסיה. -Y ו Xשונות משותפת ל הקשר חלש. 0.5הקשר בינוני ואם הוא קטן מ

- משוואת הרגרסיה

מחשבים באמצעות b ו aאת

דרגו ת

PV לדו

D של לתוחלת סמך רווח.95% של בטחון ברמת

Page 6: דף נוסחאות סטטיסטיקה 2008

.Y ו Xבניגוד למקדם המתאם, משוואת הרגרסיה אינה סימטרית ומשתנה בהתאם ל