$
שיזף רפאלי
ד"ר שיזף רפאלי פרופ' רפאלי הוא ראש המרכז לחקר האינטרנט באוניברסיטת חיפה לכל הטורים של ד"ר שיזף רפאלי

העיתונות הבאה היא ביג דאטה?

כלי הידע התאגידי החדש מתחיל לדלוף לידינו

שיזף רפאלי 08:5126.12.13
ביג דאטה, נתוני עתק בעברית, הם שם המשחק. עבור ארגונים עסקיים, מחקריים ומודיעיניים הגוגל החדש הוא מסדי נתונים גדולים שבאמצעותם אפשר לאבחן תופעות ולדלות מידע על העולם. נתוני עתק עומדים כיום מאחורי חברות המסחר המצליחות בבורסות העולם. הם מסייעים לתאגידים להמשיך להגדיל את רווחיהם, והם שעזרו לברק אובמה לנצח בבחירות האחרונות.

 

עד לאחרונה הם דרשו משאבי עתק לשם איסוף כמויות אדירות של נתונים וניתוחם. וכפי שאפשר לצפות, הכלים וההזדמנויות שאך אתמול היו נחלת מעטים וחזקים הולכים וזולגים לרשות הציבור.

 

כמו Ngram של גוגל, שמציג את מספר ההופעות של מילים ושמות במיליוני ספרים מודפסים, כך ב־GDELT אפשר למצוא דו"חות ותרשימים שמבוססים על פרסומי העיתונים הכתובים אנגלית ברחבי העולם כמו Ngram של גוגל, שמציג את מספר ההופעות של מילים ושמות במיליוני ספרים מודפסים, כך ב־GDELT אפשר למצוא דו"חות ותרשימים שמבוססים על פרסומי העיתונים הכתובים אנגלית ברחבי העולם

 

כבר ישנו שירות Ngram של גוגל (books.google.com/ngrams), המאפשר לחפש מושגים, ומציג, מיניה וביה, את מספר ההופעות שלהם במיליוני ספרים שנדפסו מאז 1500. בשבועות האחרונים סיפרנו איך שימוש באלגוריתמים של ניתוח ביג דאטה אפשר לחוקרים למפות את הרשתות החברתיות ביצירות אפיות כמו איליאדה ואודיסיאה. בשבוע שעבר הראינו כאן את מיזם whoisbigger.com, שבו ניתוח של ויקיפדיה מסייע לזהות אילו דמויות היסטוריות משפיעות ונחשבות יותר.

 

כעת התופעה הגיעה אל מפתנה של העיתונות. במסד נתונים שנקרא GDELT נאספים בצורה ממוחשבת כל האזכורים בעיתונות הכתובה באנגלית של אנשים, ארגונים, מקומות, אירועים, רגשות ונושאים מסוקרים (gdelt.utdallas.edu). מפעילי הפרויקט מצליבים הרים של נתוני עתק עם מפות וכלי המחשה ויזואליים ויוצרים תרשימים ומפות שמציגים את החדשות ותהליכים עולמיים באופן שמאפשר להבין את הקורה סביבנו לעומק ולראות, הלכה למעשה, את התמונה הרחבה. במקום רצף ידיעות מקוטעות עולה רשת: מוצגות פתאום מפות שמראות את התוואי המדויק של התפשטות המחאה במצרים ואת כל הערים והכפרים בעולם שאירעו בהם מחאות חברתיות — מכל סוג שהוא, כל אחת מסומנת לפי עוצמתה היחסית — ב־2013. כעת אפשר להבין את המרקמים שעולים מתוך הכרוניקה.

 

בגיליון החדש של המגזין "פוריין פוליסי" מוצגים כמה פרויקטים שנעשו שם עבור העיתון, אשר מנתחים תופעות שעד כה לא היו נגישות. לדוגמה, בכתובת is.gd/h5OArs ישנו מיפוי אינטראקטיבי של 25 אלף האישים החשובים ביותר שהוזכרו בעיתונות בחצי השנה האחרונה, לרבות רשת הקשרים שביניהם והצגה של המרוחקים והמנותקים, למשל שחקני הקולנוע ההוליוודיים או קבוצות כוח שונות בהודו, ושל מי שעדיין קרובים לצלחת ומקושרים בעבותות חזקות, כמו הנשיא לשעבר ג'ורג' בוש.

 

במקום אחר ברשת, is.gd/MhLrul, אחד מיוצרי GDELT, קאלב ליטארו, מראה את כל הנתונים שנוגעים לשיח על איראן בששת החודשים האחרונים. הקלקה על כל שם תחשוף את רשתות המשנה שלו, שמתבססות על המוני פרסומים, מוכרים ושוליים כאחד, ומאפשרות לכל מי שיש לו קצת סבלנות להפוך לאנליסט מודיעין לעת מצוא. כך, למשל, אפשר לראות שבאופן מפתיע לא די שפוליטיקאים ישראלים משמשים בתיווך, גם עיתונים ורשתות שידור ממלאים תפקיד ברשתות השיח. ובעזרת לחיצות נוחות אפשר לגלות את השמות הפחות מוכרים שאיכשהו חוזרים שוב ושוב בהקשר הזה. המפה הזאת לא מספרת סיפור סדור וערוך, והדיוק בתרשים, שנוצר בידי אלגוריתם מחשב, אינו מושלם וכולל לדוגמה שמות כפולים. ואולם, מתוך צפיפות העצים אפשר פתאום לראות את היער.

 

אלה צעדים ראשונים בנתיב חדש של צריכת מידע, שעשוי להשפיע על העיתונות בעתיד. האם עכשיו פחות מפתיע שאחת הדמויות הבולטות ביותר במיפוי הרשתות החדשות היא דווקא המדליף אדוארד סנודן?

 

בטל שלח
    לכל התגובות
    x