דואר אדום ועידות

שיטות חיזוי: הכול צפוי, אם יש נתונים

למרות שהנבואה ניתנה לשוטים, מערכות למידה מונחית מאפשרות לייצר תבניות שיכולות לספק תובנות לגבי העדפות של לקוח או רמת סיכון של לווה

יעקב רימר 20:4712.02.17

האם ניתן לחזות את העתיד? במילה אחת – לא. בשתי מילים – לרוב לא. מסתבר שקל יותר לעשות את זה בדיעבד, לדוגמא, אחרי אירועים גדולים כמו "מגדלי התאומים", "האביב הערבי", או בחירת טראמפ, תמיד צצים יידעונים (או חברות טכנולוגיה) שמציגים איך הם זיהו זאת מראש בשיטות שברשותם.

קראו עוד בכלכליסט:

ראשית, כדאי לזכור שאם למישהו יש שיטה טובה לחזות כל אירוע בעתיד, הוא כנראה משתמש בה בעצמו כדי לגרוף רווחים יפים בבורסה (או בקזינו אחר), במקום למכור אותה לך. שנית, יש אירועים שקל לצפות אותם. למשל, אם תרוויח כסף, מס הכנסה יהיה שותף שלך. אבל עדיין, לפעמים קורה שלא (אם אתה טייקון). וברצינות, שיטות חיזוי מבוססות על העיקרון שבו מנסים להשליך על העתיד מתוך הניסיון שהצטבר בעבר. זה יכול לעבוד במקרים מסוימים, אבל לא בהכרח. בכל מקרה, מדובר על שיטות שנעזרות בכלים וחשיבה סטטיסטית. כל מי שעקב אחרי מערכות בחירות, זוכר ששיטות סטטיסטיות לא תמיד פוגעות.

יש מקרים בהם שיטות חיזוי עובדות טוב למדי. למשל, בנקים משתמשים באלגוריתם שמבוסס על נתוני הלווה כדי להחליט מה הסיכוי שיוכל להחזיר את ההלוואה. המשפט הידוע ש"עדיף להיות עשיר ובריא מאשר עני וחולה" נכון. כנראה שלווה צעיר ואמיד, בעל עבודה יציבה ובריאות טובה יזכה להלוואה, בעוד שקשיש חביב, גוסס ותפרן – לא. שימו לב שגם כאן אין ודאות, כי יתכן שהצעיר האמיד ישקיע את כל כספו על קרן הצבי (למשל, בקרנות מיידוף), ואילו הקשיש החביב יקבל למחרת טלפון מאריאלה. אבל עדיין, למרות הפן הלא-חברתי של הדברים, בנקים הם עסק כלכלי ושיטות חיזוי של סיכוני הלוואות יעילות למזעור סיכונים לאורך זמן.

דוגמא טובה נוספת היא מערכות שחוזות איזה ספרים או סרטים יעניינו אותך. מרבית האנשים אוהבים ז'אנרים מסוימים. למשל, אם צפית ב"מלחמת הכוכבים" 4, 5, 6, 1, 2, 3, ו 7, כנראה שתשמח לקופון הנחה ל"מלחמת הכוכבים 3.5 – רוג אחד". סביר שיותר מאשר אם צפית לאחרונה ב"חלף עם הרוח", "קזבלנקה" ו"הנסיכה הקסומה". שיטות המבוססות על העיקרון הזה גורפות רווחים נאים לחברות שמשתמשות בהן (למשל אמזון).

בעולם למידת המכונה (Machine Learning) מכלול השיטות האלו קרוי למידה מונחית (Supervised learning). הרעיון הבסיסי הוא ללמוד מדוגמאות אמיתיות שהתוצאה עבורן ידועה. למשל, אוסף של נתוני הלוואות שאנו יודעים האם הן הוחזרו או לא. חוקר המידע יזין את נתוני ההלוואות לתוך אלגוריתם הלמידה ויבנה מודל לחיזוי. לאחר מכן הוא ייקח אוסף אחר של דוגמאות ידועות ויבדוק עד כמה המודל מצליח לחזות נכון את התוצאות עבורן. שימו לב שלמרות שאלו עדיין דוגמאות מהעבר, הן חדשות עבור המודל. לפיכך, לימוד ביצועי המודל עליהן מהווה מדד טוב לגבי התוצאות שיתקבלו ממנו בעתיד, בעולם האמיתי. לא נתאר כאן כיצד מודדים את איכות המודל ומכיילים אותו, אבל מדובר בתהליך מורכב.

ואחרי שאמרנו את כל זה, נחזור שוב לשאלה האם ניתן לחזות את העתיד. כפי שראינו, בשימושים עסקיים נפוצים ויום-יומיים אפשר, ואפילו בתוצאות טובות. אבל לחזות את נפילת מגדלי התאומים, או אפילו את זכייתה של קבוצה קטנה ואלמונית בשם לסטר סיטי בפריימר ליג (ההפתעה הספורטיבית הגדולה בכל הזמנים?), זה כבר סיפור אחר לגמרי. יש לכך כמה וכמה סיבות, אבל אם נמשיך את ההסבר הקודם, שיטות החיזוי מבוססות כאמור על למידה מהעבר. מכיוון שקודם להתרחשות המפתיעה לא נפלו מגדלי תאומים אחרים, ולא הייתה זכייה דומה בליגה הבריטית, די בעייתי לנסות ללמוד מדוגמאות דומות (כי אין). יתרה מכך, מכלול הנסיבות והמידע שנדרש לנסות ולנבא אירועים מסוג זה הוא כל כך גדול, עד שלא בכדי נאמר שהנבואה ניתנה לשוטים.

אבל רגע תשאלו, היו אוהדים של לסטר סיטי שהימרו על זכייתה כבר בתחילת העונה וזכו בסכומי עתק (יחס ההימורים נע אז בין 1-1,000 עד 1-5,000). הם ראו את הנולד! על כך יש לי שתי תשובות. הראשונה - אוהד שרוף של קבוצה מתאים כנראה להגדרה "שוטה" באהבתו לקבוצה שלו. והשנייה והטובה יותר, יש פתגם בערבית שאומר "אפילו תרנגול עיוור מוצא לפעמים גרגר".

הכותב הינו יועץ בכיר בנושאי סייבר, ביג דאטה ואנליטיקה