• תפריט
מוסף 16.05.2013

מה הם כבר יודעים?

ענף הביג דאטה פורח, ואינספור אלגוריתמים הופכים את החיים שלנו לאוסף של עובדות רווחיות

ארי טוכמן מצא את עצמו בתחום המהפכני ביותר בעמק הסיליקון, ואחד השנויים במחלוקת בעולם, לגמרי בטעות. זה קרה בסוף שבוע נטול שינה ב־2009, שבו טוכמן ושותפו ג'ון סטוקטון חיפשו כיוון חדש לסטארט־אפ הכושל שלהם. הם היו שני דוקטורים לפיזיקה גרעינית שעזבו את הקריירה בסטנפורד לטובת עולם היזמות, וכמו הרבה יזמים אחרים גילו שהחברה שלהם לא מתקדמת לשום מקום. "הרעיון המקורי שלנו היה לבנות חיישנים אטומיים לניווט צוללות והנחיית טילים", מספר טוכמן בראיון ל"מוסף כלכליסט". "אבל לא השגנו מימון. כל האנג'לים והקרנות חשבו שנחוצה השקעה גדולה מדי, ואנחנו היינו חסרי ניסיון. אף אחד לא היה מעוניין להשקיע".

 

מרכז מיקור חוץ של חברות ביג דאטה בבנגלור, הודו. עיקר המשימה הוא מציאת הנוסחה מרכז מיקור חוץ של חברות ביג דאטה בבנגלור, הודו. עיקר המשימה הוא מציאת הנוסחה צילום: רויטרס

 

טוכמן ושותפו לקחו פסק זמן, והחליטו לשנות גישה. הם יגלו מה עומד להיות התחום הגדול הבא, ורק אז יקימו סטארט־אפ חדש. "חשבנו לעצמנו שאם נוכל לצפות מה יהיה התחום החם הבא ונתברג בו בשלב מוקדם, נצליח לקבל מימון”, הוא מספר. אבל איך מוצאים את הדבר הלוהט הבא? יש אנשים שמדברים עם חברים, קוראים מגזינים מקצועיים או הולכים לכנסים. טוכמן וסטוקטון ניסו משהו אחר. "החלטנו לאסוף כמה שיותר פטנטים ומאמרים מדעיים, לנתח אותם באופן ממוחשב, וככה לנסות לצפות אילו תחומי טכנולוגיה עומדים להיות טרנדיים. והרעיון היה שברגע שנגלה מה התחומים האלה - למשל תאים סולאריים, או מיפוי רצפי דנ"א - נוכל להשתמש בידע שלנו כמדעני גרעין כדי להמציא בהם משהו".

 

התוצאות היו לא צפויות. "באותו סוף שבוע ארוך פיתחנו את האלגוריתם שיעבור על 6 מיליון פטנטים ו־13 מיליון מאמרים אקדמיים, ויעזור לנו לבחור תחום. אבל כשהתחלנו להיפגש עם אנג'לים גילינו שהם מתלהבים לא מהרעיונות שלנו לסטארט־אפ אלא דווקא מהאופן שבו ניגשנו למידע. בהתחלה התעלמנו מההתלהבות הזאת, אבל בשלב מסוים הבנו שזו בעצם החברה שיש לנו ביד. ואז הקמנו את Quantifind. זה היה ממש אקראי. זה לא מה שחשבנו שיקרה".

 

טוכמן וסטוקטון, במילים אחרות, צללו לאוקיינוס המידע כדי לגלות בו את הדבר הבא, וגילו לגמרי במקרה שכבר יש להם ביד את הדבר הבא: עצם הצלילה לאוקיינוס המידע, ושליית הדבר הבא מתוכו. ביג דאטה, כך קוראים לתחום הלוהט הזה. קוואנטיפיינד גייסה מיליונים מקרן אנדרסין הורוביץ, מקרנות ההון סיכון המשפיעות והמקושרות בעמק הסיליקון, שנמנתה עם המשקיעים המוקדמים בסקייפ, פייסבוק וזינגה. הלקוחות הגיעו מהר: בהתחלה הם עבדו עם ענקית הביטחון נורתרופ גרומן, שקישרה אותם ל־CIA. אלגוריתמי כריית המידע שלהם סייעו לסוכנות הביון האמריקאית לאתר שמות שיש סבירות גבוהה שהם שמות בדויים שמשמשים טרוריסטים. יישום אחר שפיתחו אפשר לחוקרים במדעי החיים לחלץ נתונים ומסקנות שמבוססים על מאות מיליוני מחקרים, שלא היתה שום דרך אחרת לסקור בשיטתיות. "וכרגע אנחנו עובדים בצמוד לאולפנים בהוליווד, למשל סוני פיקצ'רס", מספר טוכמן. טרוריסטים, גנים, דרך לחזות שוברי קופות - זה לא משנה. אם יש לך אלגוריתם שמאתר דפוסים בתוך מכרות מידע, אתה במשחק. כך עובד עולם ה"ביג דאטה".

 

ארי טוכמן. "הגישה שלנו הכי פחות מפחידה" ארי טוכמן. "הגישה שלנו הכי פחות מפחידה" צילום: אימג'בנק, gettyimages

 

מהפכת המידע

 

העולם טובע במידע. מיליארד משתמשי פייסבוק מעלים לאתר 10 מיליון תמונות חדשות מדי שעה. 800 מיליון משתמשי יוטיוב מזינים לאתר שעה של תוכני וידיאו מדי שנייה. חברות סלולר, חברות אשראי, בנקים, רשתות סופרמרקטים - במחשבים של כולם נערמים הררי מידע מפורט על פעילות לקוחותיהם. הוסיפו לזה את כל הנתונים שהתקבלו ונצברים מחיישנים שמודדים, לדוגמה, רעידות אדמה, את מזג האוויר ואת מצב התנועה בכבישים, מאגרי מידע ממשלתיים ורפואיים, והרשימה עוד ארוכה. מאמר מצוטט של חוקרים מאוניברסיטת ברקלי העריך שמשחר האנושות ועד 2003 האנושות יצרה, בספרים ומכתבים, הקלטות וסרטים, בולים ושלטים, 5 אקסה־בייט של מידע. כיום כמות המידע הזאת מיוצרת באינטרנט ביומיים. לפי הערכות, עד סוף השנה יגיע סך המידע הצבור בעולם ל־1,200 אקסה־בייט - כמות ששקולה ליותר מ־1.5 טריליון ספרים. 98% מהמידע הזה שמור בשרתי מחשבים, בעיקר של ממשלות וארגונים גדולים.

 

המונח "ביג דאטה" צץ לראשונה ב־1997, לאחר שאחסון מידע דיגיטלי הפך לראשונה לזול יותר מאחסונו על גבי נייר. הוא הופיע בנייר מחקר של נאס"א, שדן בקושי הצפוי בעתיד של כמויות הולכות וגדלות של מידע ממוחשב. 15 שנים לאחר מכן, ביג דאטה הפך למונח לוהט בקרב יצרני מחשבים ויועצי ניהול, ולמה שנראה כמו הבטחה למהפכה בתחומי המחקר המדעי, השיווק והכוח של ארגונים וממשלות. הרעיון המושך הוא של שימוש במאגרי מידע אדירים כדי לזהות דפוסים סמויים, וכך לספק תחזיות והמלצות שלא ניתן היה להגיע אליהן קודם. הוא הניב מאות מיליוני דולרים בגיוסי הון, ודוחף עוד ועוד חברות להצהיר על עצמן שהן "חברות ביג דאטה". יש הטוענים שמרוב באזז המושג הפך לעמום. אבל הוא לא מפסיק לצבור תאוצה, בעיקר הודות למידע המפתיע שמושג בעזרתו.

 

איזה מין מידע? אחת הדוגמאות המוקדמות היתה של וולמארט, ענקית הקמעונאות האמריקאית, שאוגרת במחשביה מידע על 100 מיליון הלקוחות שקונים אצלה כל שבוע. בעונת ההוריקנים של 2004 החליטו מנהלי הרשת לנסות לברר מה הלקוחות שלהם קונים לקראת הסערה. הם סרקו את מאגר הנתונים האדיר שלהם, וגילו שהפריט הנמכר ביותר בימים שלפני הגעת הסערה לחוף הוא דווקא בירה. פריט פופולרי אחר היה פופ־טארט, מאפה ממולא קרם לטוסטר, בטעם תות. מכירותיו הכפילו עצמן פי שבעה. את הדפוסים האלה לא זיהה אף מנהל בשר ודם. הם היו משוכנעים שהלקוחות ייקנו סוללות, לא בירה. הגילוי הורגש בשורת הרווח של וולמארט.

 

מאז שוק הביג דאטה התמלא בחברות וממציאים. ההערכות על גודל השוק מגוונות, ונעות בין 6 ל־11 מיליארד דולר בשנה החולפת. אבל האנליסטים מסכימים שהוא גדל בקצב מסחרר: בין 30% ל־40% בשנה. לפי חברת המחקר האמריקאית גרטנר, עד 2016 ייווצרו בעולם יותר מ־4.4 מיליון משרות של אנשי מערכות מידע שיתמכו בענף הביג דאטה, כמחצית מהמשרות יהיו בארצות הברית. באותה שנה, מעריכה החברה, שירותי ביג דאטה יסייעו להגדיל את הכנסות תאגידי העולם בכ־230 מיליארד דולר.

 

מחברי הספר "ביג דאטה" מאייר שונברגר (משמאל) וקוקייר מחברי הספר "ביג דאטה" מאייר שונברגר (משמאל) וקוקייר

 

ואכן, כולם קופצים על העגלה: בנק ג'יי.פי מורגן צ'ייס מתעד את שיחות הטלפון והאימיילים של 250 אלף עובדיו, ונותן לאלגוריתמים ממוחשבים לסרוק אותם ולזהות דפוסי פעילות לא שגרתיים, שעשויים להעיד על חשד למעילה. הטכנולוגיה פותחה במקור עבור שירותי הביון האמריקאיים. חברת רולס רויס אוספת בזמן אמת נתונים ממאה חיישנים שמותקנים בכל אחד ממנועי הסילון שהיא מייצרת, ונוסחאות שמדעני ביג דאטה פיתחו מנתחות את המידע במרכז בקרה בבריטניה ומתריעות על סכנה מתקלות זמן רב לפני שהן מתרחשות. כורי המידע של פייסבוק חוקרים חיים של אחרים: ניתוח שינויי הסטטוסים ברשת החברתית גילה, לדוגמה, שפרידות מתרחשות דווקא לקראת סוף השבוע. גם זו תובנת ביג דאטה. ואפילו הנשיא אובמה הצטרף לחגיגה. במערכת הבחירות האחרונה צוות אנשי מחשב ניתח הררי מידע וסייע לאובמה להתאים את מסרי הבחירות שלו לכל פלח אוכלוסייה ונפה בארצות הברית. בסוף השנה שעברה אובמה אישר תקציבי ענק למחקר ופיתוח בתחום, ובשבוע שעבר הוא הכריז שממשלתו תאפשר לראשונה גישה לכמויות אדירות של מידע ממשלתי, מתוך תקווה שהדבר יעודד חדשנות. “יזמים מוכשרים עושים דברים מדהימים עם המידע", אמר.

 

ולא מדובר רק בהתפתחות שמשליכה על ענף השיווק והטכנולוגיה, אלא גם במה שיוביל לשינוי חברתי אדיר. כך לפחות טוען בראיון ל"מוסף כלכליסט" פרופ' ויקטור מאייר־שונברגר מאוניברסיטת אוקספורד, שעם קנת' קוקייר מ"האקונומיסט" פרסם לפני חודשיים רב־מכר מדובר על התחום החדש. לספר שלהם קוראים: "ביג דאטה: מהפכה שתשנה את האופן שבו אנחנו חיים, עובדים וחושבים".

 

אז באיזו מהפכה מדובר? "בעולם שלפני הביג דאטה היה מאוד קשה עבורנו בני האדם לאסוף מידע", אומר מאייר־שונברגר. "זה היה אטי ויקר. בעצם, כחיינו בעוני של מידע. וכדי להתגבר על העוני במידע בני האדם היו צריכים להמציא תיאוריות מסובכות כדי להבין איך העולם עובד. אם אין לך מספיק מידע, אתה חייב להמציא תיאוריה כדי לפצות על זה. קבלת ההחלטות שלנו, המוסדות שלנו, האופן שבו הארגונים שלנו פועלים, התבססו על העובדה שאין לנו מספיק מידע. לכן נזקקנו למומחים, לאנשים שלפחות מעמידים פנים שהם מבינים טוב יותר מאיתנו. אבל עכשיו, כשיש לנו מבול של מידע, אנחנו צריכים לחשוב מחדש על הרבה מדפוסי ההתנהגות שלנו, ועל איך שאנחנו מקבלים החלטות. זה לב המהפכה. והמהפכה הזאת תשפיע על כל המגזרים בכלכלה, על האופן שבו אנחנו חושבים ומחליטים, והאופן שבו החברה שלנו עובדת".

 

אוהד ברזילי. "חיים רק לפי סטטיסטיקות לא יעבדו לאורך מן" אוהד ברזילי. "חיים רק לפי סטטיסטיקות לא יעבדו לאורך מן" צילום: עמית שעל

 

באנו לשנות

 

האתגר בביג דאטה, אומר טוכמן מקוואנטיפיינד, הוא "לגלות מה חשוב, בלי לדעת מה אתה מחפש". מדעני הביג דאטה מנסים למצוא דפוסים בתוך בליל אדיר של נתונים, שבכלל לא נועדו להיקרא על ידי תוכנה, ושאין בעולם טבלת אקסל שתחזיק אותם. משימתו של מדען הביג דאטה היא לשלות, בעזרת נוסחאותיו, דפוסים וכללים על מהלך העולם מתוך ים של מידע שעשוי לכלול מאמרים, דו"חות, ציוצים בטוויטר, פוסטים בפייסבוק, חשבוניות מס, נתוני מכירות של חנויות בגדים ונתוני מלאי של בתי מרקחת. באופן מפתיע, טוכמן אומר, זה לא מאוד שונה מהניסיון למדוד התנהגות של חלקיקים אטומיים.

 

אחת הדוגמאות לכך היא בעבודה שקוואנטיפיינד עושה עבור אולפני קולנוע. האמרה של התסריטאי וויליאם גולדמן שלפיה בתעשיית הקולנוע 'אף אחד לא יודע כלום' אינה בהכרח מדויקת, אומר טוכמן. "תמיד יהיו חריגים, ודוגמאות קיצוניות, אבל חלק גדול מהעסק הרבה יותר צפוי משהיית חושב. המספרים לימדו אותנו, לדוגמה, שלבאזז ולתגובות של אנשים אין שום השפעה על מספר הצופים או על הרווחים. בשנתיים האחרונות השתמשנו באלגוריתם ובתשתית הביג דאטה שלנו כדי לנסות לזהות אילו אותות כן משנים, ועוזרים ליצור רווח. אנשים שמדברים על טריילר של סרט וכמה הוא מגניב, לדוגמה, אינם מדד. אין מתאם מובהק בין העובדה שמישהו אומר שהוא אוהב את הטריילר לזה שהוא יקנה כרטיס. אתה צריך להיות הרבה יותר מתוחכם כדי למצוא אות שאומר משהו".

 

מרכז שירות של חברת סלולר בישראל מרכז שירות של חברת סלולר בישראל צילום: עמית שעל

 

אז אתם עוקבים אחרי דיונים ברשתות חברתיות ומחפשים שם את האותות להצלחה של סרט?

"להיות מסוגל לנבא כל סוג של הצלחה הוא לא דבר בעל ערך כמו שהיית חושב. מה שבעל ערך הוא להיות מסוגל לשנות את התחזית הזאת. ליכולת לחזות מכירות או נתח שוק יש פחות ערך מהיכולת לשנות את מידת ההצלחה. וזה הכיוון שלנו”.

 

החברה של טוכמן קטנה ומרובת מתחרים. היא מעסיקה 25 עובדים, ולמעשה כמעט לא נחשפה לציבור הרחב, למעט אזכור קצר ב"פייננשל טיימס". טוכמן, שמתכנן חשיפה פומבית בקיץ, מספר שהסכים להתראיין ל"מוסף כלכליסט" כי היה שמח לגייס כישרונות ישראלים.

 

במה הביג דאטה יועיל לציבור הרחב?

"זה תלוי בתחום. בתחום הביטחוני יהיה אפשר לצפות את ההתקוממות הבאה, או לדעת מאיפה יגיעו איומים. במגזר הפיננסי זה יעזור לזהות הונאה או מסחר על סמך מידע פנים. בשיווק זאת האפשרות לחזות טרנדים. בעצם, יש לך מיליארד אנשים שמתנהגים כמו קבוצת מיקוד חיה. ואפשר ללמוד הרבה מאוד מקבוצת מיקוד של מיליארד אנשים".

זה לא מאוד מרגיע לדעת שהחיים שלך הם חלק מקבוצת מיקוד.

 

"יש בזה משהו. אבל הגישה שלנו היא הכי פחות מפחידה מכל אלה שנתקלתי בהן. לנו לא אכפת מהאדם היחיד. אנחנו עושים הכל באופן מצרפי, ולא צריכים מידע אישי. זו קבוצת מיקוד של מיליארד אנשים, אבל כולם אנונימיים. יש גישות אחרות, של חברות שעוקבות אחרי קובצי עוגיות באינטרנט, ומצליבות את מספר כרטיס האשראי שלך עם כל מה שפרסמת ברשת ועם האתרים שגלשת בהם, וממש חופרות במידע האישי של כל משתמש. ואני חושב שזה אכן מפחיד. ויש סיכוי שבעתיד תהיה רגולציה שמאוד תקשה על דברים כאלה”.

 

הניתוח הדקדקני של המידע והניסיון לשנות את התוצאות - לשנות התנהגויות של אנשים - אינו תיאור של תחזית דמיונית אלא השגרה החדשה שעולם השיווק מתרגל אליה. בשנה שעברה "הניו יורק טיימס" תיאר איך רשת טארגט, המתחרה הגדולה של וולמארט בארצות הברית, רתמה את מדעני המידע שלה כדי שיפתחו מנגנון יקר ערך - מערכת שתזהה מי מלקוחות הרשת נמצאת בהיריון. עבור קמעונאית כמו טארגט זהו מידע שימושי ביותר. לידת תינוק משנה דפוסי קנייה, ואם לקוחה מגיעה לחנות שלך סביב תקופת הלידה יש סיכוי לא רע שהיא תמשיך לקנות אצלך עוד שנים. הבעיה היא שכל החנויות מתחרות על לקוחות שכבר ילדו. טארגט רצתה לזהות את כולן כבר בשליש השני של ההיריון, ולהתאים להן באופן אוטומטי מבצעים וקופונים לוויטמינים ובגדי היריון.

 

האלגוריתם שפיתח צוות מדעני המידע של טארגט הצליח לזהות 25 מוצרים, כמו למשל קרמים נטולי ריח או סידן ומגנזיום, שמשמשים אינדיקציה טובה להיריון, ואפילו יכולים להצביע בסבירות גבוהה באיזה חודש הלקוחה. מובן שכל המידע חסר ערך אם אי אפשר לדעת מי הלקוחה שקנתה את הקרם או תוספי המזון ושנמצאת בהיריון. אבל טארגט יודעת היטב איך לעקוב אחר הלקוחות שלה. במצגת בכנס מקצועי ב־2010 הציג אנדרו פול, ראש צוות הביג דאטה של הרשת, את מגוון שיטות המעקב, דרך רכישות אונליין, אפליקציה בטלפון, תיעוד הרכישות בחנות, פתיחת אימיילים שיווקיים, והרשימה עוד ארוכה. "יש בזה הרבה 'האח הגדול'”, הודה פול בפני הקהל.

 

לא מה יודעים, אלא מה עושים

 

כיום כמעט כל החברות הגדולות בעולם נעזרות במידה זו או אחרת בביג דאטה. הפרטיות שלנו היא כבר לא מה שהיתה. ואם שואלים את מאייר־שונברגר, זה לא ביג דיל. “יכול להיות שתפיסת הפרטיות שלנו והפחד מחשיפה בפני אחרים הם תוצר של עידן מיעוט המידע, עידן ה'סמול דאטה'. כשאתה מוגדר על ידי 100 נתונים, אז כל נתון שתגלה לצד שלישי מגדיר אותך באופן מאוד ישיר. אבל אם יש מיליון נתונים לגביך, אז לחשוף עוד נתון אחד לא מזיק יותר מדי. לחשוב על פרטיות כעל שמירה על מידע היא צורת חשיבה של עידן ה'סמול דאטה', שלא בהכרח מתאימה לעידן ה'ביג דאטה'”.

 

אז איך צריך לחשוב על פרטיות עכשיו?

“השאלה החדשה היא לא למי יש מידע עליי, אלא גם, וזה יותר חשוב, מה הם עומדים לעשות עם המידע. אנחנו גם צריכים להיות מודעים לכוח החיזוי של המידע. אנחנו צריכים להיזהר בעיקר משימושים שיטילו על אנשים אחריות על האופן שבו, לפי מסקנות הביג דאטה, הם צפויים להתנהג בעתיד, כלומר על פעולות שהם עדיין לא ביצעו. יש מדינות שבהן מערכת הבריאות אומרת לאנשים 'אתה לא עומד לקבל את הניתוח הזה, ולא בגלל מי שאתה, אלא כי אנחנו צופים שבעוד שנתיים תתחיל לעשן, ובגלל זה לא שווה לבצע בך השתלת ריאה'. זו ענישה על פעולה עתידית חזויה, במקום ענישה על פעולה אמיתית בעבר. ובעידן ה'ביג דאטה' זו יכולה להיות המקבילה של סוגיית הפרטיות'.

 

אבל אם מערכת הבריאות מוגבלת במשאבים, לא הגיוני לנסות לקבל החלטות חכמות?

“אני לא אומר שלא צריך לקבל החלטות שמבוססות על מידע. אבל החלטות כאלה צריך לבצע תחת זכוכית מגדלת. אנחנו חושבים למשל שצריך לדרוש שאלגוריתמיקאים חיצוניים יבדקו אם האלגוריתם מדויק, אם המידע הוא מאיכות מספיק גבוהה, כדי לוודא שהתחזית עצמה אמינה. והמומחים האלה גם צריכים להיות מסוגלים להגיד לאדם שמושפע מההחלטה מה הגורמים שהובילו אליה. זה לא עוזר לאף אחד להגיד: 'אני לא הולך לתת לך משכנתא כיוון שהצפי הוא שאתה לא הולך לשלם'. אבל אם אני אומר לבן אדם 'אני לא הולך לתת לך משכנתא, כיוון שאתה צפוי לא להחזיר אותה, וזה בהתבסס על העובדה שבשני מקרים, לפני שלוש שנים וחמש שנים, היו לך שני כרטיסי אשראי ולא שילמת בזמן', אז הוא יודע שאם הוא יתחיל לשלם לחברת כרטיסי האשראי כמו שצריך הוא יוכל ליצור דירוג אשראי שיאפשר לו לקבל משכנתא בעוד חמש שנים. זה נותן לך את המניעים להתנהגות נכונה. ואם אתה לא תיתן לאנשים תמריצים כאלה, הם לא ישנו את ההתנהגות שלהם, וזו תהיה בדיוק התוצאה ההפוכה מהרצוי".

 

האלגוריתמיקאים החיצוניים שעליהם מדבר מאייר־שונברגר הם רק אחת מההצעות שלו לאופן שבו החברה שלנו צריכה להתאים את עצמה לעידן הביג דאטה. עוד הצעה היא לקבוע תאריכי תפוגה למידע. בעידן הביג דאטה, הוא אומר, למידע יש שימושים לא צפויים שלעתים לא קשורים בכלל למטרה המקורית שלשמה נאסף. אפליקציות ניווט, למשל, יכולות לספק מידע לא רע על מצב הכלכלה. זו תובנה שעשויה לגרום לחברות לרצות לשמור מידע לנצח — "אבל מבחינה חברתית, וגם מבחינה אישית, יש לנו צורך חשוב בשכחה", הוא אומר. הצעה אחרת, שמופיעה בספרו, היא להגביל את כוחן של החברות השולטות במידע, ולמנוע את היווצרותם של "ברוני מידע", על משקל "הברונים השודדים", כינוים של הטייקונים ששלטו במסילות הרכבת, מפעלי הפלדה ורשתות הטלגרף של ארצות הברית במאה ה־19. והוא מוסיף שהוא מעודד מכך שהממשל בארצות הברית הכריח את גוגל לספק נתוני טיסות למתחרים שלה אחרי שרכשה את ספקית מידע הטיסות ITA.

 

מאייר־שונברגר חושב שהשינוי התודעתי שיתרחש בגלל הביג דאטה נרחב הרבה יותר מהגדרה מחודשת של פרטיות או שמירת זכויות. לדעתו אנחנו ניצבים בפני מהפכה מחשבתית. “בעידן הביג דאטה, אנחנו נסתפק הרבה פעמים בלדעת מה קורה, בלי לדעת למה זה קורה. ממילא קשה לדעת למה. בני האדם תמיד מאמינים בסיבה ותוצאה, אבל כשאתה מסתכל מקרוב על הדברים אתה מגלה שהרבה פעמים אנחנו לא באמת יודעים מה גרם לדברים לקרות. אנחנו יודעים שכשמקוררים לוקחים אספירין. אבל כשאתה מדבר עם ביולוגים או רוקחים או רופאים, ושואל אותם 'איך אספירין עוזר לצינון', הם מושכים בכתפיים ואומרים: 'אנחנו יודעים שבהרבה מקרים אנשים שיש להם צינון ולוקחים אספירין מרגישים יותר טוב'. ואם אתה אומר להם 'אבל זה רק מתאם, זה לא הוכחה סיבתית', הם מודים שזה נכון. והאמת היא שאנשים אוהבים לראות סיבות, ואוהבים לדעת 'למה', אבל הרבה פעמים להבין את ה'מה' זה מספיק טוב. וניתוח מבוסס ביג דאטה מאפשר לנו להבין את ה'מה' באופן שלא היה אפשרי בעבר. והרבה פעמים זה מספיק טוב. ולכן אנחנו סבורים שבעידן הביג דאטה היה שינוי דגש מחקירת ה'למה' לחקר ה'מה'”.

 

לא לשכוח את ה"למה"

 

בקומה השלישית בבניין רקנאטי, בפקולטה לניהול באוניברסיטת תל אביב, אוהד ברזילי יושב מתחת לצילום גדול של סטיב ג'ובס הצעיר - מהימים שבהם היה לג'ובס שיער שופע, ומחשבי אפל נראו כמו קופסאות קטנות. ברזילי, דוקטור למדעי המחשב, הוא אחד ממובילי מסלול ההתמחות בביג דאטה בתוכנית לניהול טכנולוגיה, חדשנות ויזמות בפקולטה. עצם העובדה שדוקטור למדעי המחשב יושב בפקולטה לניהול מלמדת משהו על השינויים במגזר העסקי, וכשאני שואל את ברזילי מה מנהלי העתיד צריכים לשנות באופן המחשבה שלהם הוא עונה במהירות: “להקשיב לדאטה, במובן הכי פשוט. ברגע שאתה מודע לנתונים שיש לך ביד, כבר תדע מה לעשות”.

 

והאם אכן מדובר כאן במהפכה?

"מוקדם מדי להגיד אם זו מהפכה. יכול להיות שזה יהיה אחד המאפשרים של מהפכה עתידית. אבל לבדו, ביג דאטה הוא עדיין לא מהפכה. זה כמו שהאינטרנט, שנוצר ב־1969, לא היה מהפכה. חיכינו עד שיגיעו המחשב האישי, והטלפון הנייד, והרשתות החברתיות. ועכשיו החיים שלנו שונים לגמרי ממה שהיו לפני חמש שנים. זה התאפשר בעזרת כל הדברים האלה, אבל לקח זמן עד שהחלקים הסתדרו במקום. באותו אופן, ביג דאטה הוא אחד המרכיבים של המהפכה העתידית, אבל היא עדיין לא כאן”. הד לדברים האלה אפשר לשמוע גם אצל טוכמן: “צריך להבין שביג דאטה הוא עוצמתי, אבל לא כל יכול. עלינו להיות כנים עם עצמנו”.

 

כשאני מנסה לברר אצל ברזילי אם אכן אנחנו צפויים להפסיק לנסות להבין למה דברים קורים ולהתמקד בחילוץ תבניות מהמידע, הוא מסתייג. "בשביל להיערך להוריקן הבא זה בסדר גמור. מה שהיה הוא שיהיה. וייתכן אפילו שככה וולמארט משרישים את תרבות שתיית הבירה בהוריקנים. וגם זה חלק טבעי מהעולם. כשמשהו מצליח הוא מצליח עוד יותר. כך שאתה יכול לזהות מה הדפוס, לתקוף אותו, ולעשות מזה המון כסף.

 

"אבל יש כאלה שלא עוצרים פה. חוקר טוב רוצה גם לשאול ממה נובע הדפוס הזה. מה הצורך האנושי הבסיסי שבא פה לידי ביטוי. וזה שינוי מעניין: כשאתה רוצה להגיע לנפש האדם אתה מתחיל במספרים היבשים. היית מצפה שזה יהיה תהליך הפוך, שנתחיל באינטואציה ואז ננסה לבחון אותה מספרית. וכאן אני אומר: בוא נראה איך העולם מתנהג, ועכשיו האתגר הבא, היותר עמוק, הוא להבין למה זה קורה, מה המודל הקוגניטיבי, הפסיכולוגי, החברתי, הארגוני”.

 

כדי להמחיש את הנקודה ברזילי מספר לי על המחקר האחרון שלו, שטרם התפרסם. יחד עם ד"ר דויד צביליחובסקי ויעל ענבר הוא יצא לחקור את קיקסטארטר, אתר מימון ההמונים שבו כל אחד יכול לגייס מהגולשים כסף לכל יוזמה אישית שלו, משעון שמתממשק לאייפון, דרך קרטיבים בטעמים חדשים ועד סרטים אמנותיים. בשנה החולפת יותר מ־2 מיליון גולשים השקיעו יותר מ־300 מיליון דולר בפרויקטים דרך האתר. ברזילי ועמיתיו יצאו לגלות מי מצליח לגייס מימון. “הורדנו את כל קיקסטארטר, 80 אלף פרויקטים, והתחלנו לטחון את הנתונים. ואמרנו, 'אוקיי, בוא נראה מה הסיפור שהנתונים מספרים'. ופתאום אתה מגלה שאם אתה תומך בפרויקטים בעצמך, אז אנשים יתמכו בפרויקט שלך. יש מתאם מובהק בין מספר תמיכות העבר שלך למספר התמיכות בפרויקט שאתה תייצר”.

 

והאתגר, אומר ברזילי, הוא להבין למה זה קורה. "למה אם אני תומך בהרבה פרויקטים אז גם תומכים בי? אולי רוצים להרגיש חלק מקהילה? אולי אנשים מצאו חברים ברשת? אולי הם מרגישים שייכות? אולי הם מגדירים את עצמם דרך הפעילות הזאת? אולי יש תחומים שנחשבו אזוטריים אבל קיימים בתת־קהילות? וזה כמובן יכול להיות שילוב של כל הגורמים האלה.

 

"אם אתה לא מבין למה דברים כאלה קורים, אם לא עשית את הצעד הנוסף, אז התועלת שתצמח לך תהיה מוגבלת בזמן. זה כמו שיש לך פורמט חדש לתוכנית טלוויזיה, והוא יוצא מדהים. ואז יוצאים שניים, שלושה, ארבעה חקיינים שגם להם הולך טוב, והשישי נראה כמו מסטיק. אם אתה לא מבין, אם אתה לא חופר עוד, אתה יכול רק לחקות. אחרי שאתגר קרת הוציא את 'געגועיי לקיסינג'ר' כולם הוציאו ספרי סיפורים קצרים. השניים־שלושה הראשונים היו ממש טובים, אבל חלק מהספרים שהופיעו אחר כך הרגישו לא יותר מאטריות מחוממות.

 

"ובביג דאטה זה אותו הדבר. אף על פי שמפתה להגיד 'תעשה את זה, את זה ואת זה ותצליח', חייבים את הצעד הנוסף, להבין למה. קח את הדוגמה של קיקסטארטר. נניח שגילינו שלתמוך בפרויקטים קודמים משפר את סיכויי ההצלחה שלך. מי שקורא את המאמר שלנו יכול לומר 'רגע, עכשיו אני הולך לתמוך בשישה־שבעה פרויקטים, ואז ליצור את הפרויקט שלי'. אבל לעשות את זה זה בדיוק לא להבין שזו לא התמיכה עצמה שגרמה לזה, אלא העובדה שנוצרה כאן מערכת יחסים, שנכנסת לקהילה והפכת לחלק מהדבר הזה. ואף על פי שיש כאן מובהקות סטטיסטית והכל, זה לא יעבוד לאורך זמן”.

 

ובעודו מקיש על המקלדת במרץ, בחיפוש אחרי גרף מעניין להראות לי, ברזילי מצטט שיר של יהודה עמיחי:

אני זוכר שאלה בספר לימוד החשבון / על רכבת שיוצאת ממקום אחד ורכבת אחרת / שיוצאת ממקום אחר. מתי ייפגשו? / ואף אחד לא שאל מה יקרה כאשר ייפגשו / אם יעצרו או יעברו אחת על פני השנייה ואולי יתנגשו.

 

בטל שלח
    לכל התגובות
    x