$
שיזף רפאלי
ד"ר שיזף רפאלי פרופ' רפאלי הוא ראש המרכז לחקר האינטרנט באוניברסיטת חיפה לכל הטורים של ד"ר שיזף רפאלי

מה יהיה?

26 יום לפני הבחירות לנשיאות ארצות הברית, נחשול הסקרים מציף את המדיה. הבעיה היא שרוב האנשים ניזונים מתוצאותיו של מדע שאת שורשיו הם אינם מבינים

שיזף רפאלי 07:5011.10.12
26 יום לפני הבחירות לנשיאות ארצות הברית, נחשול הסקרים והשקרים מציף את המדיה. תוצאות העימות הראשון טרפו את הקלפים במירוץ שנראה סגור מראש, וכולם פונים לתורת ההסתברות בניסיון לנבא את העתיד.

 

כריכת הספר של נייט סילבר כריכת הספר של נייט סילבר

הבעיה היא שסקרים הם עניין פופולרי הרבה יותר מקורסים בסטטיסטיקה, שעליה הם מתבססים. כך יוצא שרוב האנשים ניזונים מתוצאותיו של מדע שאת שורשיו הם אינם מבינים. מגמה מטרידה נוספת היא הקיפאון במדע הסטטיסטיקה: ככל שמקבלי החלטות מרבים להישען על סקרים, כך מתרבות גם ההזדמנויות שבהן תחזיות סטטיסטיות נכשלות. המדע שמאחורי הסקרים השתכלל, אבל אנחנו עדיין לא מצליחים לספק ניבוי איכותי של תוצאות בחירות ומשחקי ספורט, אין לנו תחזית מדויקת של מזג האוויר, והניסיונות לחזות משברים כלכליים נראים פאתטיים.

 

על רקע שתי המגמות האלה בולטים במיוחד הישגיו של הסטטיסטיקאי נייט סילבר, שמצליח בניבוי שורה ארוכה של תוצאות, פוליטיות ואחרות - כמעט, היינו אומרים, בניגוד לסיכויים הסטטיסטיים.

 

תהילתו הראשונה של סילבר הגיעה ממערכת ניבוי בתחום הבייסבול, שאותה בנה ומכר ברווח גדול. הוא פנה לעיסוק בייעוץ עסקי, ומשם לחיזוי פוליטי. בכל אחד מן התחומים האלה ההצלחה האירה לו פנים: הוא ניבא, למשל, את פרטי הפרטים של תוצאות הבחירות לנשיאות ולסנאט ב־2008. בעת כתיבת הדברים, אגב, הוא צופה ב־75% ודאות שהנשיא אובמה ינצח. הבלוג שלו, "538" (FiveThirtyEight.com, כמספר האלקטורים לנשיאות ארצות הברית), אומץ על ידי "הניו יורק טיימס", ומשמש אחד המקורות המצוטטים ביותר גם במערכת הבחירות הנוכחית. עכשיו הוא מוציא לאור ספר על ניבוי וחיזוי: "The Signal and the Noise", "הסיגנל והרעש", שכותרת המשנה שלו היא "מדוע תחזיות כה רבות נכשלות, אבל חלקן מצליחות" (is.gd/SignalAndNoise).

 

סילבר הוא חסיד נלהב של הגישה הבייסיאנית, ומשמש מבקר חריף של מי שאינם מאמצים את הגישה הזאת להתמודדות עם אי־ודאות. הטעות הגדולה של רוב הסטטיסטיקאים המסורתיים, הוא טוען, היא הסתמכות על גישות מסורתיות להסתברות, חוק המספרים הגדולים והכללה מכניסטית של תוצאות מדגמים. הגישה שלו מעודנת יותר, ומביאה בחשבון הנחות לגבי טעויות והטיות אנוש. סילבר מדגים בספרו איך, אם נשענים רק על סטטיסטיקה "מהסוג הישן", אפשר לייצר תחזיות וניבויים מוטעים והרי אסון. מאידך, שימוש נכון בהסתברות, תוך שקלול של הטיות אנושיות וטעויות והצלחות עבר, יכול להוביל להצלחות - בין אם מדובר בעניין קליל כמו הימורי ספורט או תכנון המהלכים במשחק שחמט, ובין אם על הפרק נושאים רציניים כמו הסיכוי לעליית מחירי הדיור, הסיכון האפשרי מנזקי הוריקן או ההיערכות לאיומי טרור.

 

 

רומני ואובמה. מי יישב בחדר הסגלגל? רומני ואובמה. מי יישב בחדר הסגלגל? צילום: רויטרס

 

הבעיה וההזדמנות של נבואה משתנות לנגד עינינו. עד לפני כמה שנים עמדו לרשותנו יכולות חישוב מוגבלות, מגושמות ואטיות. גם הנתונים שיכולנו לאסוף היו מעטים. מה שהצטיינו בו, ולכן גם התמקדנו בו, היו התיאוריות: מלאכת התחזיות ניתנה בידי מי שפיתחו תיאוריות שאפשרו זיהוי של קווי מגמה. היום הגלגל התהפך: בעידן ה־Big Data נתונים יש כמו חול, וגם כושר החישוב של מחשבים עבר את כל התחזיות. מה שנותר הוא הצורך להתעדכן בהתייחסות לתיאוריות.

 

זה בדיוק העדכון שמציע סילבר. הגישה שלו מייצרת הבנה של ההסתברות בתחומים חשובים, כמו רפואה ("מה הסיכוי שתוצאות ממוגרמה מעידות על סרטן?") או זוגיות ("מה הסיכוי שבן זוגי בוגד בי, לנוכח חפצים מחשידים שמצאתי אצלו?"). עוד יותר מרתק היישום שהוא מראה לתחומים כמו חיזוי פוליטי, ואפילו ביטחוני: סילבר מסיים את ספרו בהדגמה של גישת החיזוי שלו להחלטות לגבי התמודדות עם טרור כאן, בישראל. גם כאן האתגר הוא של אי־ודאות, וגם כאן הוא מביא לידי ביטוי את הטכניקות שפיתח ומראה איך ניתוח קר של הנתונים מוביל לבחירה מודעת במדיניות מסוימת - גם אם היא מפתיעה.

בטל שלח
    לכל התגובות
    x