הסבר על הנחות ANOVA עבור מי שאינם סטטיסטיקאים

7 ביוני 20269 דקות קריאה

הנחות ANOVA הן התנאים שחייבים להתקיים במידה סבירה כדי שמבחן ניתוח שונות (ANOVA) יפיק ערכי p ומסקנות מהימנים. ניתוח מערכתי זה מפרק את ההנחות לשפה פשוטה: נורמליות, אי-תלות, שונויות שוות, חריגים, ושלבי הכנת הנתונים שמונעים מ"מובהקות סטטיסטית" להפוך ל"הטעיה סטטיסטית".

מה זה ANOVA (ומה באמת אומרות "הנחות")

הגדרת ניתוח שונות כך: ANOVA הוא מבחן סטטיסטי המשווה ממוצעים של קבוצות על ידי בדיקה האם ההבדלים בין הקבוצות גדולים יותר ממה שהיית מצפה מרעש אקראי בתוך הקבוצות. הביטוי "ניתוח שונות" הוא מילולי: הוא מנתח כיצד השונות מתחלקת ל"רעש תוך-קבוצתי" ו"אות בין-קבוצתי".

הנחות אינן משוכות אקדמיות. הן תנאי ההפעלה שבהם המתמטיקה שמייצרת את ערך ה-p מתנהגת כמצופה. כאשר מפרים את ההנחות, מצב הכשל הרגיל הוא פשוט: מקבלים תוצאות שנראות משכנעות אך אינן ניתנות לשחזור.

אם אתם זקוקים להגדרה הרשמית, הדף של ויקיפדיה על ניתוח שונות (ANOVA) הוא מקור אמין, אך המטרה המעשית צרה יותר: דעו מה יכול לשבור את המסקנה שלכם, ומה לעשות בנידון.

נורמליות: מה צריך להיות "נורמלי" כדי ש-ANOVA תעבוד

גרפי Q-Q והיסטוגרמות של שאריות המשמשים לבדיקת הנחות נורמליות ב-ANOVA – נורמליות שאריות

מסגרת החלטה: ב-ANOVA, ההנחה היא שהשאריות (טעויות) מתפלגות בקירוב נורמלי, ולא בהכרח הנתונים הגולמיים בכל קבוצה. בפועל, אנשים לעיתים קרובות בודקים כל קבוצה בכל מקרה כי קל יותר להמחיש זאת.

הנה התרגום למי שאינו סטטיסטיקאי: ANOVA מצפה שהרעש האקראי סביב כל ממוצע קבוצה לא יהיה מוטה מאוד או בעל זנבות קיצוניים. אי-נורמליות קלה היא לרוב בסדר, במיוחד כאשר גודל המדגם סביר ומאוזן. הטיה חמורה בשילוב עם מדגמים קטנים היא המקום שבו אתם נתקלים בבעיות.

מה רואים בנתונים	למה זה משנה	מה לעשות הלאה
כל קבוצה נראית בערך כמו פעמון, ללא זנבות חריגים	הנורמליות כנראה מספיקה	הרץ ANOVA והמשך הלאה
התפלגויות מוטות (נפוץ בזמן, הכנסות, שיהוי)	הממוצע רגיש להטיה	שקול טרנספורמציה (לוג) או השתמש בחלופה לא-פרמטרית
n קטן לכל קבוצה (כמו 5-10) עם הטיה/חריגים נראים לעין	ערכי p יכולים להשתנות בפראות	העדף שיטות חסינות, bootstrap, או תכנן מחדש את המבחן

בדיקת הכנת נתונים	מה יכול להשתבש	איך לתקן
שורה אחת שווה יחידה בלתי תלויה	גודל מדגם מנופח מישויות חוזרות	בצעו אגרגציה לפי ישות או השתמשו במודלים של מדידות חוזרות/מעורבים
קבוצות מוגדרות בצורה נקייה	משתמשים נסחפים בין קבוצות, תיוג שגוי	הקפיאו שיוך לקבוצה ובצעו ביקורת על חיבורים (joins)
חוסר בנתונים מובן	נשירה יוצרת הטיה בקבוצה אחת	דווחו על חוסר לפי קבוצה; שקלו אימפוטציה בזהירות
יחידות עקביות	דקות לעומת שניות, המרות מטבע	סטנדרטיזציה של יחידות ובדיקה חוזרת של טווחים
גדלי מדגם מאוזנים (כאשר אפשר)	n לא שווה מגביר בעיות שונות	העדיפו תכנונים מאוזנים; השתמשו ב-Welch כאשר לא מאוזן

הנחה	בדיקה מהירה	אם היא נכשלת
אי-תלות	האם יש משתמשים/מכשירים/חנויות חוזרים?	השתמשו במדידות חוזרות, מודלים מעורבים, או אגרגציה
נורמליות (שאריות)	גרף Q-Q נראה סביר?	טרנספורמציה, שיטות חסינות, או מבחן לא-פרמטרי
שונויות שוות	גרפי קופסה + Levene	ANOVA של Welch; התאימו שיטת פוסט-הוק
חריגים	האם הם טעויות או קיצוניים אמיתיים?	תקנו טעויות; הריצו רגישות; בחרו מדיניות
שלמות נתונים	חיבורים, תוויות, יחידות, חוסר	בצעו ביקורת על הצינור, הריצו ניתוח מחדש

הסבר על הנחות ANOVA עבור מי שאינם סטטיסטיקאים

מה זה ANOVA (ומה באמת אומרות "הנחות")

נורמליות: מה צריך להיות "נורמלי" כדי ש-ANOVA תעבוד

אי-תלות: ההנחה ששוברת את ANOVA הכי הרבה

שונויות שוות: מתי "פיזור דומה" משנה, ומתי להשתמש ב-Welch

חריגים: ההבדל בין אות אמיתי לבין תאונת נתונים

הכנת נתונים: העבודה השקטה שהופכת את ANOVA למהימנה

רשימת תיוג מעשית להנחות שניתן להריץ ב-10 דקות

שאלות נפוצות