$
שוק ההון

"הרעש הקיים ברשת מנבא את מחירי המניות של המחר"

ערן אגם, ראש מחלקת אנליזה ומחקר בפלייטק, מסביר איך עובדת המערכת לניבוי מניות שפיתח

אסף גילעם 08:42 12.06.13

 

לפי התיאוריה הכלכלית הקלאסית, באופן אופטימלי צריכות תנודות המחירים של שוקי ההון להתרחש באופן רנדומלי, ואין לאף אדם היכולת לחזות את כיוון המחירים ברמת דיוק הגבוהה מ־50%. אף על פי כן, התנהגות השווקים בשנים האחרונות, במיוחד מאז משבר 2008, הוכיחה כי תיאוריות לחוד ומציאות כלכלית לחוד, ולאחרונה מתפרסמים יותר ויותר מחקרים שמראים שהרשת משבשת את התיאוריות הכלכליות הכי בסיסיות.

 

במחקר שהתבצע לאחרונה בפקולטה למינהל עסקים באוניברסיטת וורוויק, בדקו החוקרים את הקשר בין חיפושים בגוגל למחירי מדד דאו ג'ונס. במחקר הם התמקדו ב־98 מונחים, בעיקר כלכליים, כמו "חוב", "נגזרים" ו"משבר", בין השנים 2004 ו־2011, והשוו למחירי הסגירה של המדד. כשכמות החיפושים בשבוע מסוים למונחים כלכליים ירדה, הם בחרו לקנות את המדד, ובמקרה של עלייה בחיפושים כלכליים, הם ביצעו "שורט" על המדד. בין המילים שהחוקרים מצאו כאפקטיביות ביותר לחיזוי, היתה המילה "חוב" (Debt). בהתמקדות בצורת ניבוי זאת הצליח הפורטפוליו של החוקרים להציג תשואה תיאורטית של 326%, כשהמדד הניב באותה התקופה תשואה של 16% בלבד.

 

ערן אגם ראש מחלקת אנליזה ומחקר בפלייטק
ערן אגם ראש מחלקת אנליזה ומחקר בפלייטקצילום: עמית שעל

 

מחקר נוסף שהתבצע באוניברסיטת אינדיאנה בארה"ב התמקד ביכולתם של אלגוריתמים לנתח את מצב הרוח לפי טוויטר. במחקר בדקו 9.7 מיליון "ציוצים" מ־2.7 מיליון משתמשים בטוויטר, בין מרץ לדצמבר 2008. האלגוריתם ניתח את הציוצים לשש רמות מצב רוח: אושר (Happiness), טוב לב (Kindness), עוררות (Alertness), ביטחון (sureness), חיוניות (vitality) ורוגע (calmness). החוקרים מצאו כי ישנו מתאם ישיר בין רמת מצב הרוח לתפקוד המדד, כשמדד הרוגע היה האינדיקטור החזק ביותר לחיזוי האם מדד דאו ג'ונס עלה בתקופה שבין שניים לשישה ימים לאחר הבדיקה, בדיוק מרשים של 87.6%. כל זה נחמד ויפה בתיאוריה. יש ישראלי אחד שטוען כי הוא כבר יכול לנבא את מחירי המניות בפועל - ערן אביכזר־אגם, ראש מחלקת האנליזה בפלייטק בארבע וחצי השנים האחרונות. אגם החל בפיתוח המנוע האנליטי אלפס (Elphs analytic engine) בשעות הפנאי בכלל כניסיון ליצור מנוע לחיפוש מדויק.

 

"אני עובד על הפרויקט הזה כשנתיים. במקור זה היה אמור להיות פלטפורמה לחיפוש. היה לי איזשהו רעיון שהוא מעין חצי טוויטר, ובניתי אלגוריתמים שקשורים לניתוח טקסט. כבר בניתי ממשק משתמש ומערכת וזה נראה יפה מאוד, אבל בשלב כלשהו הבנתי שאני לא אוכל להמריא עם זה, והחלטתי לקחת את זה לנישה אחרת".

 

לזקק את הקשקשת

 

אגם החליט להתמקד בתחום הפיננסי. "מה שהאלגוריתמים שלי עושים זה ניתוח טקסט וניסיון למדוד את כמות הרעש שחברות מייצרות באינטרנט - ולא רק חברות. יש לי מאגר מידע ענק של 'ישויות'. המערכת שואבת מהרבה מקורות מידע מאמרים, ואני מנסה למדוד את העוצמה של כל ישות בתוך המאמרים האלה. אני מייצר איזושהי מפה שגם מחברת בין ישויות וגם מודדת את הרעש הישיר שכל ישות מייצרת בפני עצמה. בעזרת המדידות האלה אני יכול למדוד בדיוק כמה רעש ישות מסוימת מייצרת לאורך זמן, אם הרעש יורד או עולה, את הסמנטיקה של הישות - אם מדברים עליה לחיוב או לשלילה, ועוד מדדים שונים.

 

החלטתי לבדוק עד כמה למדדים האלה יש קשר לביצוע בפועל של המניה. הרעיון מאחורי זה אומר שמה שקורה באינטרנט מייצג את מה שהולך לקרות או את מה שקרה כבר. השאלה מה קודם למה - האם הרעש קודם לכמה שהמניה עולה או להפך, שהרעש הוא תגובה לכמה שהמניה עולה".

 

כדי לבדוק את המערכת שפיתח, אגם ביצע פיילוט נרחב - הוא אסף וניתח מאמרים בתקופה של ארבע שנים ממקורות רבים, סך הכל יותר ממיליון מאמרים. הפיילוט התמקד בביצועים של שבע מניות הטכנולוגיה הגדולות בבורסה האמריקאית. "ניסיתי לבנות להן מודל שמספק להם תחזית. אני בעצם יודע מה אופי הרעד ועוצמתו עכשיו, מה היה לפני כמה ימים, ויש לי גם היסטוריה מאוד עמוקה, אז אני יודע לבנות מודל שיודע להשוות את צורת הרעש למצבים דומים באותה המניה. מזה אני מנבא מה שהולך לקרות".

 

 

 

מהם המקורות?

"המקורות הם מגוונים, זה יכול להיות ממאמרים פיננסיים ב'ניו יורק טיימס', לציוצים של אנשים מאוד מסוימים שאני עוקב אחריהם, וגם לפוסטים בפייסבוק. מבחינתי כל טקסט קטן הוא מאמר שאני מתייחס אליו בנפרד במערכת".

 

גם בפורומים של מניות?

"לא, מה שאני מנסה לעשות הוא קצת שונה. אני מנסה לנטר ולנתח את המקור של הנתונים, עוד לפני שזה מגיע לפורומים שבהם המשקיעים מחליטים בעצמם אם זה הולך לעלות או לרדת".

 

אז מה הפרמטרים למאגר?

"אני עוקב רק אחרי מקורות שהם אמינים ושהם ידועים, שיש להם גם מספיק טראפיק באתר שלהם, ומספיק חשיפה, כך שלדעתי הם מקורות שיכולים להשפיע על דעת קהל. פורום שאני לא יודע מי קורא בו ומה מקורו, אני מעדיף לא להשתמש בנתונים שהוא מפיק. אלו יכולים להכניס לי יותר רעש למודל מאשר לעזור". כדי להוכיח את הביצועים של האלגוריתם יצר אגם סימולציית מסחר בזמן אמיתי. "עקבתי אחרי המניות במשך שמונה חודשים, וכל יום ניסיתי לספק תחזית לארבעה ימים קדימה, איפה מחיר המניה יהיה בעוד ארבעה ימים".

 

למה ארבעה ימים בעצם?

"ראשית, מניסוי וטעייה. מסתבר שזמן מאוד קצר אחרי סגירת שער המניה יש יכולת חיזוי טובה, שהולכת ומשתפרת ומגיעה לשיא מסוים אחרי שלושה־ארבעה ימים, ואחרי זה יכולת זאת שוב יורדת. בנוסף, זה גם מעניק לך מספיק זמן להגיב - להחליט אם לסחור במניה או לא. מעבר לזה יכולת החיזוי מידרדרת מהר, והיא משתווה להטלת מטבע. הנקודה האופטימלית מבחינתי היא ארבעה ימים, שם הדיוק נע בממוצע סביב ה־60% - למניות מסוימות זה יותר טוב, ולחלק זה פחות טוב. מה שאני עושה בפועל זה מספק תחזית למניה, מה מחיר הסגירה שלה יהיה, ואז אני בודק האם מחיר הסגירה גבוה יותר או נמוך יותר ממחיר הסגירה אתמול. אם הוא גבוה יותר, זו אינדיקציה לקנייה. אם המחיר נמוך יותר, אני מבצע את הבדיקה גם למחרת, ואם הוא שוב נמוך, יומיים ברצף, אז אני מחסל את ההחזקות שלי".

 

והתוצאות של אגם מרשימות. בסיום הפיילוט הצליח אגם לזהות את מחירי המניות בדיוק של 65% בממוצע. הבנצ'מארק לבדיקה - קנייה של המניה בתחילת הפיילוט ומכירתה בסוף הפיילוט. בתקופת הבדיקה טיפסה מניית אפל בכ־50%. "זה יפה מאוד, אבל עם המודל שלי יש שיפור של 20%, כך שאני מצליח להציג תשואה של 58%".

 

המקרה של מניית גוגל מרשים אף יותר: המניה ירדה בתקופת הבדיקה ב־5%, אך המודל של אגם הצליח על ידי 15 פעולות מכירה וקנייה מתוזמנות להציג תשואה חיובית של 30%. "פה אני עושה את הכסף, גם אם המניה יורדת בתקופה הזאת, אבל בין לבין היא מייצרת עליות, אני מצליח לתפוס אותן".

 

זה לא דומה לניתוח טכני, שאומר שהמידע מגולם במחיר המניה, ולפיו מנסים לתת תחזית קדימה?

"ניתוח טכני בא ומסתכל רק על הגרף של המניה, ועל סמך זה מנסה לספק תחזית, לפי צורות התנהגות דומות בעבר. מה שאני עושה, זה אומר שמחוץ למה שקיים כרגע במחיר של המניה יש אינפורמציה שתשפיע עליה בעוד X ימים. ואתה מנסה למדוד את התוספת הזאת, איך היא הולכת להשפיע בעוד כמה ימים.

 

"אני מביא בחשבון את מחיר המניה. המודל שלי בנוי על אלגוריתם של בינה מלאכותית שנקרא רשתות נוירונים. חלק מהפרמטרים שנכנסים למודל, הם גם מדדים שקשורים לגרף של המניה עצמה, ופרמטרים שונים, שלא קשורים לא לרעש של המניה ולא לגרף שלה. איזשהו כור היתוך של נתונים".

 

 

מפתח - לא סוחר

 

על פניו המודל יכול להיות רווחי גם אם היית גם מוכר בחסר (שורט) בימים של ירידות?

"נכון, אני מניח שכן. אני לא מגיע מעולם של מסחר, אני מתייעץ עם אנשים מהתחום. מן הסתם, החוזקה שלי מתבטאת בתחום של הניתוח והאלגוריתמים. הסימולציות נועדו להראות שיש ערך במודל. אני מניח שסוחר מנוסה יוכל לקחת את המודל ואולי לעשות איתו תשואה יותר טובה עם מסחר מתוחכם יותר (אופציות, שורטים ועוד). אבל מכיוון שאני לא מגיע מהתחום, היה חשוב לי להראות שהמודל שלי עובד, והרבה יותר מוצלח מהבנצ'מארק".

 

אז מה השלב הבא?

"השלב הבא יהיה לקחת את זה כמה צעדים קדימה. תחילה להביא את הפלטפורמה לעבוד בלייב. ואז השאיפה היא לעשות הוכחת מודל (POC - Proof Of Concept - א"ג) עם בית השקעות גדול, עדיף מחו"ל. לאחר תקופה של מסחר אוטומטי אמיתי לפי האלגוריתמים, נבדוק האם התשואה בפועל עובדת כמו המודל. לאחר מכן האופציות מגוונות - בין אם למכור את זה, ובין אם להקים קרן שתסחור לפי המודלים".

 

איך המודל שלך מתיישב עם המחקרים עד כה ששללו יכולת חיזוי אמיתית לכיוון של מניות?

"יש לא מעט חברות שמתעסקות בתחום הזה, ואני מניח שיש לזה סיבה - בגלל שהמסחר היום הוא לא רק משחק של הגדולים, אלא של הרבה מאוד סוחרים ומשקיעים קטנים בצורה עצמאית, אנשים שמושפעים ממה שקורה בשוק וברשת. אם אתה מצליח למדוד מה קורה בשוק בצורה מסוימת, אז אתה יכול לצפות גם מה אנשים יעשו. אנחנו חושבים בצורה יחסית פשוטה, אנשים נוטים להאמין שאם יש רעש חיובי על מניה, אז היא תעלה. אז אולי סוחר מנוסה יתפוס את זה מוקדם יותר, אבל סוחרים פחות מנוסים יתפסו את זה מעט באיחור. אם תצליח לנחש מה הסוחרים הפחות מנוסים יעשו בהתאם לפרסומים בתקשורת על מניה מסוימת, אז אתה יכול לתפוס חלק מהעליות האלה או מהירידות".

 

זה בעצם איסוף מודיעין גלוי שלא מגולם במלואו במחיר המניה כיום?

"נכון, המידע לא מגולם במלואו כיום, ויהיה מגולם בצורה אופטימלית בעוד שלושה־ארבעה ימים".

 

מבחינת מאמרים, אתה מתרכז במאמרים שמתייחסים רק לחברה, לדוגמה אפל, או לענף כולו?

"אני מתייחס לכל. כל מאמר טכנולוגי מבחינתי הוא בסיס לידע. יכול להיות מאמר שלא מזכיר במילה את אפל אבל מבחינתי הוא יכול להשפיע על המניה, זה חלק מהסוד של המודל".

 

זה יכול לעבוד גם במניות ישראליות?

"כדי שזה יעבוד, צריך כמות מינימלית של מידע, כדי שיהיה אפשר לספק מודל. צריך נפח מספיק גדול, שתוכל להתבסס עליו. מניה צריכה להיות מספיק חזקה או מספיק מעניינת כדי שידברו עליה, וייצרו נפח של רעש. שנית, ככל שאני אשאב יותר מאמרים, הכיסוי שלי יהיה רחב מספיק כדי שאוכל לספק ניבוי גם במניות פחות גדולות. הכל עניין של נפח נתונים שאפשר למצוא באינטרנט. המערכת כרגע מבוססת לחלוטין על מאמרים מחו"ל, ועל השפה האנגלית. אני מניח שבשלב ראשוני שכזה אני עוד לא אנסה לעשות לזה לוקליזציה לשווקים קטנים יותר, אבל זה אפשרי במידה מסוימת".

 

איפה אתה עומד לעומת המתחרים?

"אני לא מכיר אישית אנשים שעושים את זה. יש חברות שמנסות לעשות את זה בהצלחה מעורבת. יש אפליקציית סטוק־סונאר. שמוכרים מנויים. המפתחים שלה מוכרים מנויים, סורקים מאמרים ומספקים התראות מכירה וקנייה למנויים שמשלמים להם כ־30 דולר לחודש. אני לא מאמין בזה, אני לא מאמין שאם למישהו יש מודל טוב, הוא ילך וימכור מנויים.

"בנוסף יש אנשים אחרים בישראל, שיש להם כיוונים דומים לשלי, אבל הם נמצאים בשלבים ראשוניים, אין להם עדיין מודל עובד. מחקרים אחרים שנעשו בשוק, הגיעו למסקנה שכן ניתן לספק חיזוי על סמך נתונים ברשת, אבל גם בבדיקות שלהם הם הגיעו לרמת דיוק של 55%, אז המודל שלי גם יותר טוב".

 

ערן אביכזר־אגם (35)

השכלה: תואר ראשון במדעי המחשב מברוקלין קולג' בניו יורק

תפקיד: ראש מחלקת אנליזה ומחקר בחברת פלייטק

תפקידים קודמים: יועץ ומייסד בחברת אקס־פר־טו, אנליסט עסקי ב"ניו יורק טיימס"

 

 

x