$
חדשות טכנולוגיה
טכנולוגי מאקרו ראש כתבה HEADER

מאקרו טכנולוגי

משחקי מלחמה

מערכות בינה מלאכותית מהוות את הבסיס לאינספור שירותים, אך עדיין נופלות מבני אדם בתחום קבלת החלטות בזמן אמת. חיבורן למשחקי אסטרטגיה והצבתן מול יריבים אנושיים יאפשר להן לבצע את הקפיצה הנדרשת

הראל עילם 16:2312.11.16

שיתוף פעולה שעליו הכריזה חברת המשחקים הענקית בליזארד־אקטיביז'ן עם מערכת הבינה המלאכותית של גוגל דיפמיינד (Deepmind) סולל את הדרך לתפנית משמעותית בתחום חקר ה־AI. בליזארד תלמד את דיפמיינד לשחק במשחק האסטרטגיה הפופולרי סטארקראפט 2 (Starcraft 2), ותשיק בתחילת השנה הבאה כלי פיתוח שיעניקו לחוקרי בינה מלאכותית גישה לנתונים ההיסטורים של מיליוני קרבות רשת שנוהלו במשחק.

 

האינטרס של בליזארד ברור, היא מעוניינת ליצור יריב דיגיטלי שיהווה תחרות ראויה גם לגיימרים הטובים ביותר בעולם בלי שתצטרך להשקיע שנים ארוכות בפיתוח מערכת בינה מלאכותית משלה. גם עבור הגיימרים מדובר ביתרון גדול, שכן הם יוכלו ליהנות מיריב מאתגר ומהנה. ברוב המקרים, היריב הממוחשב במשחקי אסטרטגיה אינו חכם במיוחד, אלא נהנה ממהירות תגובה שבני האם אינם יכולים להתחרות בה ולמעשה פשוט מרמה. דיפמיינד תגביל את מהירות התגובה שלה לזו של שחקן אנושי מיומן ובמקום זה תתמקד בלמידה ופיתוח של אסטרטגיות. המהלך עשוי לאפשר זינוק משמעותי לתחום הספורט הדיגיטלי, שכן הוא יאפשר לערבב בין יריבים אנושיים וממוחשבים בתוך קרבות המוניים.

 

מתוך Starcraft. לשחק כמו בן אדם מתוך Starcraft. לשחק כמו בן אדם

 

אבל למהלך החדש יש השלכות שמרחיקות לכת הרבה מעבר לתחום המשחקים, והוא מסמן פריצת דרך בתחום הרשתות העצביות — האלגוריתם שבבסיס מערכת ה־AI של גוגל ואולי הפיתוח המבטיח ביותר ב־50 השנה האחרונות בתחום מדעי המחשב. רשתות עצביות הן השם שהוענק לאלגוריתם שמחקה את פעולת המוח האנושי ומאפשר למערכות שמבוססות עליהן ללמוד ולהתפתח. בניגוד לאלגוריתם רגיל הכולל סט פקודות ברורות במודל של אם א' אז ב', במקרה של רשת עצבית המחשב מקבל קלט, מתנסה בתגובות האפשרויות, ומניתוח התוצאות מחליט מה התגובה המועדפת לכל מקרה ומקרה. בשנים האחרונות הפכו רשתות עצביות לבסיס לאינספור שירותים מבוססי AI: הן מפעילות מערכות זיהוי פנים עבור פייסבוק ומנתחות תיקים רפואיים בחיפוש אחר סימנים מוקדמים למחלות תורשתיות עבור IBM.

 

אלא שעד כה רשתות עצביות התמודדו עם קלט סטטי כמו תיקים, מסמכים, תמונות וסרטונים שהן יכלו לנתח ללא מגבלת זמן. דיפמיינד התמודדה עם מטלות כמו פתירת מבוכים, משחק הלוח GO מול יריבים אנושיים או משחק הארקייד הפופולרי Breakout של ארטארי — שכולם מתאפיינים בסביבה סטטית. המשחקים הללו אפשרו למחשב לקחת את הזמן, להתנסות בצורה חופשית ולתכנן מהלכים קדימה.

 

 איור: ערן מנדל

 

אך לא כך בסטארקראפט, משחק אסטרטגיה בזמן אמת שדורש מהשחקן להגיב לשדה קרב דינמי ומשתנה, שמורכב ממאות יחידות לוחמות. כאן נדרשת ה־AI להגיב בזמן אמת בקצבים מהירים הרבה יותר מאלה הנדרשים במשחקים כמו Breakout. המחשב לא רק מקבל הרבה יותר נקודות פלט — כלומר מפעיל מספר גדול בהרבה של יחידות משחק — אלא שולט במספר מערכות שונות. בנוסף, לראשונה המחשב יפעל בסביבה שבה הוא אינו יודע הכל: הוא אינו רואה היכן היריב נמצא בכל רגע, מה הוא עושה והיכן מוצבות היחידות שלו. במקום זאת, דיפמיינד נדרשת לפעול על בסיס מידע חלקי ולגבש החלטות מושכלות. וכל זאת כשהוא מתחרה ביריב אנושי, שהיכולת שלו לבצע טעויות הופכת אותו לגורם לא צפוי ומורכב להבנה.

 

לדברי אוריול וינאליס, חוקר AI בכיר בגוגל, משחקים הם דרך נפלאה ללמד רשתות עצביות: "אתה יכול להריץ אותם במהירות, ושוב ושוב. יש מנצח ומפסיד ברורים ויש נקודות מידע מרובות במערכת שפותחה עבור יצירת אתגר מעניין לבני אדם", אמר בראיון ל"טלגארף" הבריטי. אמירה לא מפתיעה בהתחשב בכך שלפני שנרכשה בידי גוגל הוקמה דיפמיינד בידי מספר מפתחי משחקי מחשב לשעבר, כולל ד"ר דמיס האסביס, שפיתח את מערכת הבינה המלאכותית של משחק הסימולציה Black & White.

 

גוגל מודה שייקח זמן רב עד שדיפמיינד תוכל לנצח את השחקנים הטובים ביותר בסטארקראפט, אבל הניסוי חשוב מכיוון שהוא מצביע על שינוי בתחום הבינה המלאכותית. עד כמה שזה עשוי להישמע מפתיע, שיתוף הפעולה עשוי להוביל דווקא לשיפור יכולות בתחום הרכב האוטונומי של גוגל. לרשתות עצביות יש יתרון ברור על פני אלגוריתמים אחרים בתחום זה, שכן בסופו של דבר, אחרי למידה מספקת, הן יודעות להתמודד עם מצבים של מידע חסר שמחשב לא תוכנת להתמודד איתם. כך, למידת משחקי המחשב עשויה להוביל את המחשב להתחרות מול בני אדם בזירה שעד כה האחרונים שלטו בה היד רמה: היכולת לקבל החלטות בזמן אמת מול יריב אנושי ובלתי צפוי. 

בטל שלח
    לכל התגובות
    x