ניתוח שונות (ANOVA): הגדרה ודוגמאות

5 ביוני 202610 דקות קריאה

ניתוח שונות (ANOVA) הוא מבחן השערות הבודק האם שלוש קבוצות או יותר נבדלות זו מזו בממוצע שלהן, על ידי השוואת השונות בין הקבוצות לשונות בתוך הקבוצות. אם אתם מנסים לענות על השאלה "האם קבוצה א', ב' או ג' מתפקדות אחרת?", ANOVA מספק ערך p (p-value) וצעד הבא ברור: אילו הבדלים הם אמיתיים ואילו הם רעש סטטיסטי.

הגדרה: מה ניתוח שונות בודק באמת (ומדוע הוא נקרא כך)

הגדרת ניתוח שונות: ANOVA בודק האם ההבדלים בין ממוצעי הקבוצות גדולים יותר ממה שהייתם מצפים משינויים אקראיים בתוך הקבוצות עצמן.

השם מבלבל אנשים כי המטרה היא לבדוק ממוצעים, אך הוא נקרא "שונות". הטריק הוא ש-ANOVA משתמש בשונות כסרגל מדידה כדי לקבוע "עד כמה מפתיעים" ההבדלים בין הממוצעים. הוא מחשב F-statistic, שהוא בעצם:

"עד כמה ממוצעי הקבוצות מפוזרים?" (שונות בין-קבוצתית)
חלקי
"עד כמה נקודות הנתונים בתוך כל קבוצה מפוזרות?" (שונות תוך-קבוצתית)

אם השונות בין הקבוצות גדולה ביחס לשונות בתוך הקבוצות, ערך ה-F עולה וערך ה-p יורד.

אם אתם מחפשים את ההגדרה הפורמלית: ANOVA הוא הליך סטטיסטי לבדיקת השערת האפס שכל ממוצעי הקבוצות שווים (למשל, μ1 = μ2 = μ3), תחת הנחות מסוימות על תהליך יצירת הנתונים.

להגדרה הקנונית והקשר היסטורי, ראו את הסקירה של ויקיפדיה על ניתוח שונות. לפרשנות מעשית, המסגרת שלעיל היא זו שאני משתמש בה בעבודה על מוצרים ותפעול כאשר אנו משווים מספר גרסאות וזקוקים להחלטה מנומקת.

רכיב	מה הוא מודד	אינטואיציה
שונות בין-קבוצתית	כמה רחוקים ממוצעי הקבוצות מהממוצע הכללי	"האם ממוצעי הקבוצות מופרדים?"
שונות תוך-קבוצתית	כמה הנקודות מפוזרות בתוך כל קבוצה	"האם כל קבוצה רועשת?"

הנחה	מה זה אומר	מה לעשות אם היא מופרת
עצמאות	תצפיות אינן קשורות	השתמשו ב-ANOVA למדידות חוזרות או מודלים מעורבים
שאריות נורמליות בקירוב	שגיאות הן נורמליות בערך	לרוב תקין עם n הגון; אחרת בצעו טרנספורמציה או השתמשו במבחנים לא-פרמטריים
הומוגניות של שונויות	לקבוצות יש שונות דומה	השתמשו ב-Welch’s ANOVA או בשיטות חסונות

אפשרות	ממוצע מדד עיקרי	שונה סטטיסטית?	סיכון תפעולי	פעולה הבאה
א	18 דקות	בסיס	נמוך	שמור כביקורת
ב	16 דקות	לא לעומת א'	בינוני	בצע איטרציה על הטקסט, הרץ שוב
ג	12 דקות	כן לעומת א'	בינוני-גבוה	השקה פיילוט + ניטור

ניתוח שונות (ANOVA): הגדרה ודוגמאות

הגדרה: מה ניתוח שונות בודק באמת (ומדוע הוא נקרא כך)

מתי ANOVA הוא המבחן הנכון (ומתי הוא שגוי)

איך ANOVA עובד: קבוצות, ממוצעים, שונות ומבחן ההשערות

דוגמה מעשית ל-ANOVA חד-כיווני (מספרים פשוטים, ללא דיבורים מיותרים)

דוגמה ל-ANOVA דו-כיווני: מתי אינטראקציות חשובות

הנחות ששוברות את ה-ANOVA בחיים האמיתיים (ומה לעשות במקום)

טעויות נפוצות: מה אנשים חושבים ש-ANOVA אומר להם (אבל הוא לא)

כיצד ליישם ANOVA להחלטות אמיתיות מבלי להיתקע

שאלות נפוצות