דיאגרמת עץ סטטיסטית היא הדרך המהירה ביותר שאני מכיר להפוך את התשובה "זה תלוי" למשהו שניתן לחשב: תוצאות מסתעפות, הסתברות מותנית, והערך הצפוי של כל נתיב. מדריך זה מראה כיצד לבנות דיאגרמת עץ בסטטיסטיקה, לחשב הסתברויות של נתיבים, ולאחר מכן לתרגם כל ענף ללוח אפשרויות מוכן להחלטה עם השלכות שניתן להשוות זו לצד זו.
מהי דיאגרמת עץ בסטטיסטיקה ואילו בעיות היא פותרת?
דיאגרמת עץ בסטטיסטיקה היא מודל מסתעף המייצג אירועים רציפים והסתברויות שלהם, המשמש לעיתים קרובות עבור הסתברות מותנית וניתוח תרחישים. בעבודה על קבלת החלטות, היא הופכת לשימושית עוד יותר כאשר מסמנים במפורש מה נמצא בשליטתכם (בחירות) לעומת מה שנמצא בשליטת העולם (מקריות).
הבעיה המעשית שהיא פותרת אינה "איך לצייר ענפים". היא זו: צוותים מתווכחים במעגלים כי הם דוחסים שלושה דברים שונים למשפט אחד: הנחות, הסתברויות והעדפות. דיאגרמת עץ סטטיסטית כופה הפרדה. כשעושים זאת נכון, אפשר להצביע על צומת ספציפי ולומר, "אנחנו לא מסכימים על ההסתברות הזו", במקום להתווכח על כל התוכנית.
שני מצבים נפוצים שבהם ראיתי דיאגרמות עץ משחררות החלטות תקועות:
ראשית, הימורי כניסה לשוק עם שלבים תלויים. דוגמה: "אם נשיק את תכונה א', אז המכירות יוכלו להציע את פלח ב', ואם הפיילוט יצליח, נגייס עובדים". אלו אירועים מותנים. עץ הופך את התלות למפורשת.
שנית, סיכון תפעולי ותכנון אירועים. דוגמה: "אם מתרחשת תקלה אצל ספק, אז אנחנו עוברים למערכת גיבוי, ואם המעבר מצליח אנחנו יורדים בביצועים בצורה מבוקרת, אחרת אנחנו מפרים את ה-SLA". זו לוגיקה של החלטות, לא סיעור מוחות.
אם אתם רוצים מעטפת רחבה יותר של מסגרת החלטות סביב עצים (מתי להשתמש בהם ומתי לא), פירטנו זאת ב-. עצים מצוינים כאשר רצף והסתברות חשובים. הם חלשים כאשר ההחלטה מבוססת בעיקר על ערכים, פוליטיקה או אסטרטגיה ארוכת טווח עם הסתברויות שלא ניתן לדעת.
דיאגרמת עץ סטטיסטית הופכת לרמת החלטה כאשר בונים אותה בסדר קפדני: הגדרת השאלה, הגדרת ציר הזמן, ואז הסתעפות.
הנה תהליך העבודה שאני משתמש בו עם מנהלי מוצר ומפעילים, כי הוא מונע את שני מצבי הכשל הקלאסיים: ענפים חסרים וספירה כפולה של תוצאות.
שלב 1: כתבו את ההחלטה כבחירה כפויה, לא כנושא
רע: "שינוי תמחור".
טוב: "האם עלינו להשיק תמחור מבוסס שימוש ברבעון השלישי, לשמור על התמחור הנוכחי, או להריץ פיילוט היברידי?"
אם זו לא בחירה כפויה, תסיימו עם עץ אינסופי.
אם הצוות שלכם מתקשה לבחור את המבנה הנכון (עץ מול מטריצה מול תרשים זרימה), השתמשו ב-איך לבחור מסגרת החלטה לצוות שלכם כמסנן מהיר. תרשים זרימה של החלטות מצוין ללוגיקה דטרמיניסטית. עץ מיועד להסתעפות הסתברותית.
שלב 2: הפרידו בין סוגי צמתים (זה חשוב יותר מהציור)
אתם צריכים שני סוגי צמתים:
צמתי החלטה (ריבועים במוסכמות רבות): נקודות שבהן אתם בוחרים פעולה.
צמתי תוצאה (עיגולים): נקודות שבהן אי-הוודאות מתבהרת.
יש לי דעה נחרצת על זה: אם לא תפרידו ביניהם, העץ הופך לסיפור, לא למודל. אתם גם מאבדים את היכולת לבצע חישוב ערך צפוי נקי.
שלב 3: הסתעפו לפי זמן, לא לפי קטגוריה
הסתעפות לפי קטגוריה ("סיכון שוק", "סיכון טכני", "סיכון משפטי") נראית מסודרת אך בדרך כלל שוברת את לוגיקת ההסתברות כי סיכונים אלו אינם מוציאים זה את זה. במקום זאת, הסתעפו לפי מה שקורה קודם, ואז מה שקורה אחר כך.
מבנה דוגמה פשוט:
החלטה: השקה עכשיו מול עיכוב של 6 שבועות
אם השקה עכשיו (צומת החלטה) → תוצאה: הצלחת קליטה מול כישלון קליטה (צומת תוצאה)
אם הצלחת קליטה → תוצאה: שימור גבוה מול שימור נמוך
אם כישלון קליטה → תוצאה: תיקון דחוף בשבוע אחד מול תיקון ב-3 שבועות
כעת תרחישי ההחלטה שלכם מסודרים ברצף. זה מה שהופך הסתברות מותנית למשמעותית.
שלב 4: אכפו חוקי הסתברות בכל צומת תוצאה
בכל צומת תוצאה, הסתברויות הענפים חייבות להסתכם ל-1.00 (או 100%). אם אינכם יכולים לעשות זאת בכנות, עצרו ושכתבו מחדש את הצומת. "הצלחה / הצלחה חלקית / כישלון" בדרך כלל טוב יותר מ"הצלחה / כישלון" כי צוותים מסתירים אי-ודאות בבינאריות.
הפניה חיצונית: אם אתם צריכים הגדרה רשמית של ערך צפוי ומדוע הוא מחושב כפי שהוא, הערך הצפוי של ויקיפדיה מדויק וקריא.
כיצד מחשבים הסתברויות נתיב וערך צפוי?
הסתברות נתיב היא פשוטה. ערך צפוי הוא המקום שבו צוותים הופכים לרשלניים.
חישוב הסתברות נתיב (הכפלה לאורך הענף)
הסתברות נתיב היא ההסתברות לרצף מלא של תוצאות. מחשבים אותה על ידי הכפלת ההסתברויות המותנות לאורך אותו נתיב.
אם יש לכם:
P(A) = 0.6
P(B | A) = 0.3
אז ההסתברות ל-A ואז B היא:
P(A and B) = P(A) * P(B | A) = 0.6 * 0.3 = 0.18
השורה האחת הזו היא כל העניין בעץ הסתברות.
בניית טבלת תגמול (כדי שהעץ יהפוך למודל החלטה)
דיאגרמת עץ סטטיסטית ללא תגמולים היא רק תרגיל בהסתברות. כדי להשתמש בה כמודל החלטה, הקצו תגמול לכל עלה סופי: הכנסה, עלות, זמן שנחסך, חשיפה לסיכון, השפעה על לקוחות, או ציון משוקלל.
אני אוהב לשמור על זה פשוט בצורה אכזרית בהתחלה: מדד ראשי אחד, מדד סיכון אחד.
עלה (תוצאה סופית)
הסתברות נתיב
תגמול (ערך)
תרומה לערך צפוי
השקה עכשיו → הצלחה → שימור גבוה
0.18
900
162
השקה עכשיו → הצלחה → שימור נמוך
0.42
300
126
השקה עכשיו → כישלון → תיקון שבוע
0.28
100
28
השקה עכשיו → כישלון → תיקון 3 שבועות
0.12
-200
-24
ערך צפוי הוא סכום ההסתברות כפול התגמול לאורך העלים:
EV = Σ (הסתברות נתיב * תגמול)
אמת שראויה לציטוט: ערך צפוי אינו תחזית. זו עדשת החלטה שמאלצת אתכם לתמחר אי-ודאות.
הוסיפו סיכונים והנחות במפורש (אחרת הערך הצפוי הופך לנשק)
בצוותים אמיתיים, ערך צפוי נכשל כשמישהו משתמש בו כדי להעמיד פנים שאי-הוודאות נפתרה. שני תיקונים שעובדים:
ראשית, הציגו את טווח התגמול. אם תגמול הוא "300 אלף דולר עד 1.2 מיליון דולר", הכניסו את הטווח לטבלה וחשבו ערך צפוי למקרה הטוב ולמקרה הרע.
שנית, רשמו את ההנחות הצמודות לכל הסתברות. מאיפה הגיע 0.6? קבוצות עבר? פיילוט קטן? שיקול דעת של מומחה? אם זה שיקול דעת, סמנו זאת כשיקול דעת.
זה המקום שבו מדע ההחלטות הוא מעשי, לא אקדמי. אתם לא מנסים להיות "צודקים". אתם מנסים להיות עקביים וניתנים לעדכון.
הפניה חיצונית: עבור סקירה מבוססת של מלכודות קוגניטיביות המעוותות הערכות הסתברות (ביטחון יתר, הזנחת שיעור בסיס), עבודתו של זוכה פרס נובל מסוכמת היטב ב-סקירת ה-APA על תרומותיו של כהנמן.
כיצד הופכים עץ ללוח אפשרויות עם השלכות?
דיאגרמת עץ סטטיסטית מצוינת למידול. היא לא נהדרת לשיתוף פעולה, איטרציה, או שמירה על השוואתיות של פשרות כאשר ההקשר משתנה. זה המקום שבו צוותים חוזרים למסמכים מבולגנים ודיוני Slack.
הגשר הוא להמיר את העץ ללוח אפשרויות שבו כל אפשרות יציבה, וההשלכות מתעדכנות ככל שההנחות משתנות.
הנה התרגום שעובד בפועל:
אלמנט עץ
מה הוא הופך להיות בלוח אפשרויות
למה זה עוזר
צומת החלטה (בחירה)
כרטיס אפשרות
שומר על קבוצת ההחלטות מפורשת וניתנת להשוואה
צומת תוצאה (אי-ודאות)
בלוק תרחיש עם הסתברויות
מאלץ הסתברות מותנית להישאר צמודה לאפשרות הנכונה
עלה סופי
פריט השלכה (השפעה, עלות, זמן)
הופך השפעות מסדר שני לנראות, לא מנופנפות
טבלת תגמול
שדות ציון/מדד (ערך צפוי, סיכון, ביטחון)
מאפשר לצוותים להשוות בתצוגות רשת/טבלה בלי לחשב מחדש
ב-Lucid, זה ההבדל בין "דיאגרמה שעשינו פעם אחת" לבין לוח החלטות מבוסס בינה מלאכותית שנשאר חי. אתם יכולים להקליט או לכתוב את הדילמה המבולגנת, ליצור מפת אפשרויות, ואז לשמור על היתרונות/חסרונות וההשלכות העתידיות עקביים בזמן שאתם מעדנים הנחות. הלוח מתעדכן באופן מיידי, מה שחשוב כי עצי החלטה מתיישנים ברגע שמידע חדש מגיע.
כשאתם רוצים לבדוק את המבנה הרחב סביב העץ (מי מחליט, איך עובדת הסכמה, מתי קבלת החלטות חד-צדדית מתאימה), קשרו זאת למסגרת החלטה. עץ הוא כלי בתוך תהליך, לא התהליך עצמו.
אפשרות א': השקה עכשיו
אפשרות ב': עיכוב של 6 שבועות לעבודת אמינות
אפשרות ג': הרצת פיילוט מוגבל
לעץ עשוי להיות עומק שונה לכל אפשרות. זה נורמלי. הלוח שומר עליהם ניתנים להשוואה על ידי סטנדרטיזציה של השדות שאכפת לכם מהם: ערך צפוי, סיכון כלפי מטה, זמן למשוב, הפיך מול בלתי הפיך, וביטחון.
זה המקום שבו מטריצת קבלת החלטות יכולה להשלים את העץ: העץ נותן לכם תגמולים משוקללי הסתברות, המטריצה לוכדת קריטריונים איכותניים כמו סיכון מותגי או עומס תמיכה. השתמשו בשניהם כאשר ההחלטה בעלת סיכון גבוה.
גם: אם הארגון שלכם דן בניתוח בעזרת בינה מלאכותית בתהליך עבודה זה, היו כנים לגבי היתרונות והחסרונות של בינה מלאכותית. בינה מלאכותית נהדרת ביצירת ענפים סבירים והצפת השלכות חסרות. היא אינה מקור אמת להסתברויות. התייחסו לבינה מלאכותית כעוזר מובנה, ואז בססו הערכות על נתונים.
מהם היתרונות והחסרונות של בינה מלאכותית?
יתרונות: מהירות, רוחב יצירת תרחישים, ועקביות בעיצוב אפשרויות והשלכות. חסרונות: עובדות מומצאות, כיול חלש של הסתברויות, והסיכון שצוותים יוציאו שיקול דעת למיקור חוץ במקום לתעד הנחות.
מהם 5 היתרונות ו-5 החסרונות של בינה מלאכותית?
חמישה יתרונות מעשיים הם טיוטות ראשונות מהירות של תרחישי החלטה, כיסוי טוב יותר של מקרי קצה, עיצוב מחדש מהיר לטבלאות, שפה עקבית בין אפשרויות, ותיעוד קל יותר. חמישה חסרונות הם ציטוטים מפוברקים, טון בטוח מדי, ניחושי הסתברות ללא שיעורי בסיס, סיכוני פרטיות עם קלטים רגישים, ושאננות בבדיקה.
איך מחשבים את ה-MAP?
MAP בדרך כלל אומר הערכת Maximum A Posteriori בסטטיסטיקה בייסיאנית, לא לחץ דם עורקי ממוצע. הוא מחושב על ידי מקסימיזציה של ההתפלגות הפוסטריורית:
argmax θ p(θ|data)
, שלעיתים קרובות פרופורציונלי ל-
p(data|θ)p(θ)
.
מה אומרת לך מטריצת השונות המשותפת?
מטריצת שונות משותפת אומרת לך איך משתנים נעים יחד, כולל השונות של כל משתנה והשונות המשותפת בין זוגות. היא שימושית למידול רב-משתני, אך היא אינה חלק ישיר מעץ הסתברות אלא אם כן אתם ממדלים אירועים מתואמים וזקוקים לגישה שונה מהסתעפות מותנית פשוטה.
הפכו את העץ הבא שלכם להחלטה שניתן להגן עליה
התחילו עם דילמה אמיתית אחת שאתם חושבים עליה יותר מדי כרגע. שרטטו את דיאגרמת העץ הסטטיסטית עם צמתי החלטה קפדניים מול צמתי תוצאה, חשבו הסתברויות נתיב, ואז בנו טבלת תגמול עם טווחים והנחות מפורשות. ברגע שיש לכם את זה, תרגמו כל בחירה ללוח אפשרויות כך שההשלכות יישארו ניתנות להשוואה כאשר הקלטים משתנים.
אם אתם רוצים לעשות זאת בדקות במקום לבנות מחדש גיליונות אלקטרוניים בכל פעם, צרו לוח ב-Lucid: הירשמו ל-Lucid וצרו לוח החלטות מבוסס בינה מלאכותית מההערות הגולמיות שלכם, ואז עדנו הסתברויות והשלכות עד שהפשרות יהיו ברורות.