בארץ

דואר אדום ועידות

בארץ

מכונת העצמאות

אחרי שהבינה המלאכותית הזניקה את העולם הדיגיטלי קדימה, טובי החוקרים רוצים לפצח את האתגר האמיתי: לגרום למחשב ללמוד לגמרי לבד, בלי עזרה אנושית. "אם נצליח לפתח מערכות כאלה, הן יבינו מה בני אדם אומרים טוב יותר מבני האדם עצמם", אומר למוסף כלכליסט לי דנג, מדען הבינה המלאכותית הראשי של מיקרוסופט, שמתחרה לצד גוגל, פייסבוק ואלון מאסק באחד המירוצים הטכנולוגיים החשובים אי פעם

נמרוד צוק 17:00 15.07.16

תגיות:

במבט ראשון, ההודעה על העסקה בין טוויטר ל־Magic Pony נראתה די שגרתית: הרשת החברתית, מהגדולות בעולם כיום, הודיעה ב־20 ביוני כי תרכוש את הסטארט־אפ הבריטי האלמוני ב־150 מיליון דולר. לא רכישה קטנה, אבל גם לא אקזיט השנה בעולם ההייטק. אלא שבמבט שני העסקה הזאת היתה הכל חוץ מרגילה. למג'יק פוני המסתורית, שהוקמה רק לפני כשנה וחצי, אין מוצר, משתמשים, או אפילו מודל עסקי. טוויטר היא לא גוגל או פייסבוק: אחרי כמה רבעונים של דשדוש, מצבה העסקי והפיננסי לא מאפשר לה לפזר כספים לחינם. אולם מה שידוע על הטכנולוגיה של החברה הנרכשת, שמגובה ב־20 פטנטים, מסביר את העניין האישי שגילה בה מנכ"ל טוויטר ג'ק דורסי.

המערכת שפיתחה מג'יק פוני נראתה עד לאחרונה כלקוחה מסרטי מדע בדיוני, שמאחוריהם עומדים תסריטאים שלא מבינים איך באמת טכנולוגיה עובדת. היא משפרת תמונות וסרטונים באיכות ירודה, ומוסיפה להם פרטים יש מאין. תמונת פנים מפוקסלת הופכת חדה, וצילום של חלק קטן ומטושטש מקיר לבנים ייהפך לתמונה אמינה ומפורטת להפליא של הקיר כולו. הטכנולוגיה שעליה נשען ההישג המרשים מעניינת אפילו יותר: היא מבוססת על בינה מלאכותית מתקדמת במיוחד, מהסוג המכונה בז'רגון המקצועי "למידה עמוקה בלתי מונחית" (Deep Unsupervised Learning).

דנג. מהפכת הבינה המלאכותית בלתי נמנעת, והעובדים יצטרכו להתאים את עצמם אליהצילום: עמית שעל

מאחורי הכינוי המעורפל הזה מסתתרת, כך נראה, אחת מפריצות הדרך הגדולות שעולם המחשוב צפוי לחוות בשנים הקרובות. אם כיום הבינה המלאכותית תלויה במשוב אנושי מתמיד, שמצריך לא מעט עובדים ויוצר לא מעט מגבלות, הרי שטכנולוגיות כמו אלה של מג'יק פוני פועלות ללא מגע יד אדם. המערכת שלה סורקת כמות אדירה של תמונות וסרטונים, מבינה בכוחות עצמה את האלמנטים הכלולים בהם, מוצאת את האלמנטים האלה באינטרנט ברזולוציה גבוהה יותר, מרכיבה תמונות חדשות ואיכותיות יותר ומשפרת את ביצועיה כל הזמן. אם היא אכן תפעל כמצופה ממנה, 150 מיליון הדולרים ששולמו תמורתה יהיו עשויים להיראות כמו סכום פעוט.

והלמידה הבלתי מונחית לא תעצור בזיהוי תמונות. טובי מומחי הבינה המלאכותית שוקדים כיום במרץ על פיתוח התחום והשגת פריצות דרך מחקריות, כדי ליצור מגוון אדיר של יישומים עתידניים. למשל, מכונית שתדע לא רק לנהוג בעצמה אלא גם להסתגל למצבים חדשים, כמו מזג אוויר קשה במיוחד, בזמן נסיעה; תוכנות שיחקו שיחה אנושית בדיוק מרשים, עד כדי כך שיהיה קשה להאמין שאין אדם בצד השני; רובוטים שילמדו בעצמם להכין קפה או לסדר את הבית, בלי שתוכננו מראש לעשות זאת, ועוזרות קוליות בסגנון סירי וקורטנה שיידעו למלא בקשות מורכבות ואינדיבידואליות בלי להתבלבל. שלא לדבר על פיתוחים שכיום עדיין קשה לדמיין, ואולי אפילו, בעתיד הרחוק יותר, תוכנות שישיגו את מה שנחשב לגביע הקדוש של הענף: בינה מלאכותית "חזקה", שיכולות הלימוד שלה כלליות, מגוונות ורחבות, והיא מתקרבת ביכולותיה ובאופיה לאלה של בני האדם, ובתחומים מסוימים אף עוקפת אותו.

כשההבטחות הטכנולוגיות גדולות כל כך, מובן מאליו שטוויטר אינה לבדה במירוץ. גוגל, מיקרוסופט, פייסבוק, יזם־העל אלון מאסק ולא מעט סטארט־אפים וחוקרים באקדמיה — כולם עובדים בימים אלה על פיצוח אתגר הלמידה הבלתי מונחית. "קח לדוגמה את נושא הדיבור", אומר בראיון ל"מוסף כלכליסט" לי דנג (Li Deng), מדען הבינה המלאכותית הראשי של מיקרוסופט ואחד מחוקרי הבינה המלאכותית הבכירים בעולם. "קיימות כיום בעולם מיליוני שעות של דיבור מוקלט. זה משאב אדיר, אבל אי אפשר להשתמש בכולו כדי לשפר מערכות ממוחשבות שמנתחות דיבור. העבודה האנושית שפרויקט כזה דורש הופכת אותו ליקר מדי. לכן אנחנו מחפשים דרכים לעקוף את המגבלה הזאת, ולעשות שימוש במידע בלי צורך במשוב מצד עובדים בשר ודם. כך יהיה אפשר ליצור טכנולוגיה שתזהה דיבור אנושי טוב יותר מהמוח האנושי".

מנכ"ל מיקרוסופט סאטיה נאדלה פוגש חבר. כל חברת טכנולוגיה רוצה להיות הראשונה שתפצח את אתגר הלמידה הבלתי מונחיתצילום: אנדרו פיקאפ / מיקרוסופט

התינוק הממוחשב נהפך לילד

בשנים האחרונות רשם ענף הבינה המלאכותית התקדמות יוצאת דופן, שהפכה אותו מתחום אזוטרי ואקדמי של מדעי המחשב לטכנולוגיה יישומית שנוכחת כמעט בכל מקום. היכולת הממוחשבת לחקות את הבינה האנושית אחראית לשורה ארוכה של אלגוריתמים שימושיים: היא זו שהפכה שירותי תרגום ממוחשב, כמו גוגל טרנסלייט, ליעילים באמת; היא מסייעת לסמארטפון להבין מה אנחנו אומרים; היא עוזרת לאמזון לנחש מה אנחנו רוצים לקנות, ובוחרת אילו מודעות פייסבוק תציג בפנינו; היא מאפשרת לסוכנות הידיעות AP להעביר דיווחים על משחקי ספורט בלי כתב אנושי; והיא מקלה את פיתוח הרובוטים שיודעים להתמצא במרחב, וכבר מתחילים להחליף מחסנאים בשר ודם.

המהפכה הזאת נובעת מכמה תהליכים שמזינים זה את זה. אחרי עשרות שנים של גישושים, בעשור הנוכחי הבינו החוקרים כיצד לבנות באופן אפקטיבי ושימושי רשתות נוירונים — מודלים חישוביים שמחקים את אופן פעולת המוח האנושי, וזאת באמצעות חיבור יחידות חישוב רבות שהקשרים ביניהן מדמים את פעילות הנוירונים במוח. במקביל גדל מאוד כוח המחשוב הזמין, בין היתר בזכות המעבר לענן, מה שאפשר לחוקרים לבחון את המודלים החדשים בשטח. כשענקיות הטכנולוגיה נכנסו לתמונה והחלו להשקיע מיליארדי דולרים בתחום, ופלטפורמות כמו ווטסון של IBM אפשרו לחוקרים, לסטארט־אפים ולחובבים לפתח יישומי בינה מלאכותית מגוונים, כבר היה ברור שזה הדבר הגדול הבא.

מערכת שיפור התמונה שפיתחה מג'יק פוני. לא זקוקה למשוב אנושיצילום: Magic Pony Technology

מבחינה מחקרית, פריצת הדרך הנחשבת מרכזית מכולן היא פיתוח גישת הלמידה העמוקה. גישה זו מתבססת על רשתות נוירונים משוכללות במיוחד, המחולקות לא רק ליחידות חישוב אלא גם לרמות עיבוד שונות, שכל אחת מהן נשענת על קודמתה. כשהמערכת תיתקל בתמונה של כלב, למשל, רמה אחת תזהה צורות עגולות או מלבניות, ורמה גבוהה יותר תדע שהרכב הצורות הבסיסיות הזה מהווה כלב. מאפיין נוסף, וחשוב אף יותר, הוא שאלגוריתמים כאלה יודעים ללמוד מטעויותיהם ולהיהפך לאפקטיביים יותר ככל שעובר הזמן. זו אחת הסיבות שסירי פועלת עתה טוב יותר מבעבר.

אלא שרוב יישומי הבינה המלאכותית המצליחים כיום מתבססים על שיטה שמכונה "למידה עמוקה מונחית" (Deep Supervised Learning), שתלויה מאוד במשוב אנושי. אם מערכת כזאת תתבקש לזהות כלבים ולהבדיל בינם לבין חתולים, בשלב הראשון יצטרכו מפעיליה להזין לתוכה אלפי תמונות שהם חילקו לשתי הקטגוריות, והיא, שתנסה לזהות אותם, תקבל תגובה חיובית או שלילית. כך היא תוכל להעלות את רמת הדיוק, ובעתיד לזהות גם כלבים שלא נתקלה בהם קודם ולהמשיך להשתפר בהתאם לתגובות המשתמשים. לצד ההצלחות העכשוויות, הפוטנציאל של השיטה הזאת מתחיל להיראות מוגבל: היא מאפשרת לבצע היטב משימה אחת מוגדרת, אבל לא ליצור אלגוריתמים שמזכירים באמת בינה אנושית.

תוכנת אלפא־גו של גוגל מנצחת את לי סדול, אחד השחקנים הטובים בעולם. הגדרה ברורה של הצלחה וכישלון מאפשרת למחשבים לבנות אסטרטגיותצילום: אי פי איי

כאן נכנסת לתמונה הלמידה הבלתי מונחית. האלגוריתמים שמתבססים עליה מוותרים על המשוב האנושי: אם הם יידרשו לזהות כלבים וחתולים ולהבדיל ביניהם, הם עשויים לסרוק מיליוני תמונות של חיות המחמד, לזהות עוד ועוד דפוסים שמבדילים בין שתי הקבוצות, להשתפר בכוחות עצמם בהבחנה ביניהם ואף ליצור קבוצות נוספות, כמו סוסים או ציפורים. אם מערכות למידה מונחית מזכירות תינוק שהוריו מציגים בפניו תמונות ואומרים לו מה מופיע בהן, הלמידה הבלתי מונחית מזכירה ילדים גדולים יותר, שמסוגלים להתבונן בעולם וללמוד עליו דברים חדשים בעצמם.

"מערכות הלמידה העמוקה מתמודדות כיום בהצלחה עם אתגרים כמו זיהוי תמונה, עיבוד שפה טבעית ותרגום אוטומטי, אבל כל מערכת כזו דורשת אלפי שעות עבודה כדי לקטלג את המידע שדרוש לאימונה", אומר לי דנג. "בתחום זיהוי התמונה, למשל, אפשר להגיע בשיטה הזאת לשיעור טעויות של 3%. למידה בלתי מונחית תאפשר לרדת לפחות מאחוז אחד". גם אפליקציות הניווט, הוא מסביר, צפויות להשתפר: מערכת שאומנה בעזרת מערך נתונים רחב תדע שנהג שנמצא בישראל ומבקש להגיע למטה מיקרוסופט מתכוון, סביר להניח, למשרדים בהרצליה ולא לקמפוס המרכזי ברדמונד — קומון סנס שאפליקציות ניווט כיום לא תמיד מפגינות. מערכות כאלה יזהו גם מתי הן אינן מבינות את המשתמש כראוי, ויידעו לבקש ממנו מידע נוסף במקום לנחש למה התכוון.

מתוך הסרט Sunspring, שאת התסריט שלו כתבה תוכנת בינה מלאכותית. כדי לבנות סרט אמין באמת יזדקקו תוכנות העתיד לזיכרון ארוך טווחצילום: youtube

ולמיקרוסופט, ברדמונד ובהרצליה, יש תחרות קשה בענף הזה. OpenAI, מעבדת הבינה המלאכותית החדשה שהקימו אלון מאסק וסם אלטמן (נשיא מאיץ הסטארט־אפים הנחשב Y Comibator), המצוידת בתקציב מחקר של מיליארד דולר, מגדירה את פיתוח הלמידה הבלתי מונחית אחת ממטרותיה העיקריות. "אם נצליח להגיע לתוצאות ממש טובות, יוכלו מחשבים ללמוד דברים חדשים בעצמם מעיון בכל המידע שקיים באינטרנט, כפי שבני אדם לומדים מהתבוננות סביבם או מקריאת ספרים", אמר לאחרונה למגזין Wired גרג ברוקמן, אחד ממומחי הבינה המלאכותית, שחלק מהם עזבו משרות בחברות הגדולות ביותר בעמק הסיליקון כדי להצטרף למיזם של מאסק.

מי שזיהתה מוקדם יחסית את הפוטנציאל היא גוגל: כבר ב־2012 הפעילה החברה רשת נוירונים עצומת ממדים שניסתה לזהות פרצופים, חתולים ועצמים אחרים ללא התערבות אנושית, באמצעות דגימת קטעים מסרטוני יוטיוב. כמו ניסויים אחרים בלמידה בלתי מונחית, גם זה הראה שהצלחתן של מערכות כאלה עדיין נופלת מזו של מערכות הנעזרות במשוב אנושי. ובכל זאת, בתעשיית ההייטק מסרבים בתוקף לוותר.

"אני משוכנע שאנחנו זקוקים לטכנולוגיה הזו", אמר ל־MIT Technology Review ג'ף דין, מנהל פרויקט Google Brain, השם שהצמידה ענקית הרשת למאמציה בענף הבינה המלאכותית. יאן לקאן, מקבילו בפייסבוק, מסכים איתו: "כולנו יודעים שזאת הטכניקה האולטימטיבית, ופתרון הקשיים שכרוכים ביישומה יוביל אותנו לשלב הבא". עם זאת, הוא מבהיר שאיש עדיין לא מצא את הנוסחה שתהפוך את הלמידה הבלתי מונחית לאפקטיבית מספיק: "יש לנו כבר את המרכיבים, אבל אין לנו את המתכון. יידרש זמן מה עד שנמצא אותו".

לינקדאין. עסקת הענק נבעה גם מרצונה של מיקרוסופט לחבר אותה לבינה מלאכותית

פחד זה לפוליטיקאים

עד שהמתכון הנכסף שעליו מדבר לקאן יימצא, בענקיות הטכנולוגיה חוקרים במקביל סוג נוסף של בינה מלאכותית, מעין גישת ביניים בין הלמידה המונחית לבלתי מונחית: למידת התגבור העמוקה (Deep Reinforcement Learning). מערכות מהסוג הזה אמנם זקוקות למשוב מתמיד כדי להשתפר, אך מסוגלות לבנות אסטרטגיה מתוחכמת על בסיס התנסויותיהן. לכן הן מתאימות למשימות שניתן להגדיר בהן בקלות הצלחה וכישלון. משחקים, למשל.

לפני כשנתיים הורו חוקרי גוגל ל־Deepmind, מערכת למידה מלאכותית שבבעלותה שפותחה בבריטניה, לשחק שוב ושוב במשחק המחשב הקלאסי "שובר חומות", במשך לילה שלם — 600 משחקים בערך. בתחילת הדרך הצליחה המערכת להבין בעצמה את חוקי המשחק, הישג נאה בפני עצמו, אך פגעה בגמלוניות בלבנה אחת בכל פעם. כשהחוקרים בדקו בבוקר איך היא מתקדמת, הם הופתעו לגלות שהיא הצליחה הרבה מעבר למצופה: המערכת למדה, למשל, לחצוב מנהרה דרך קיר הלבנים, כדי לפגוע בכמה מהן בזו אחר זו. "עכשיו היא משחקת טוב יותר מכל אדם", אמר לכתב העת Nature מייסד Deepmind דמיס הסאביס, שצוותיו הצליחו לאמן את המערכת להשתלט על עשרות משחקים קלאסיים נוספים.

טאי, הבוטית שיצאה משליטה. תוכנות השיחה עדיין לא התפתחוצילום: facebook

וזאת היתה רק ההתחלה. במארס השנה הראתה Deepmind את הפוטנציאל שלה, כשתוכנת אלפא־גו המבוססת עליה ניצחה בטורניר מתוקשר את לי סדול, אחד השחקנים הטובים בעולם במשחק הלוח הסיני גו. היה זה הישג מרשים הרבה יותר מניצחונה של המערכת "כחול עמוק" את אלוף השחמט גארי קספרוב לפני שני עשורים. מספר המהלכים האפשריים בגו גדול בהרבה מאשר בשחמט, מה שהופך את הניסיון לחשב את כולם לבלתי אפשרי. אלפא־גו הוזנה ב־30 מיליון מהלכים מתוך משחקי עבר של אלופי גו, אבל רק אז הגיעה לאימון החשוב באמת — מיליון סיבובי משחק נגד עצמה. התוכנה הצליחה לפתח אסטרטגיות שבני אדם מתקשים לחשוב עליהן, ולחפות על היעדר האינטואיציה שלה ביכולת לבצע מהלכים מאוד לא שגרתיים. "אף פעם לא ראיתי אדם משחק כך", התפייט אלוף גו אחר, פאן הוי (Fan Hui), כשצפה בטורניר. "זה כל כך יפה".

ואם הגישות החדשות כבר מאפשרות לבינה המלאכותית לפלוש לתחומים שנחשבו בעבר נחלת האנושות בלבד, האם בעתיד היא תצליח לפצח את התחום שנחשב האנושי מכולם — פענוח רגשות והפגנתם? מערכות שמזהות אם המשתמש שמח או זועף כבר קיימות, ולהערכת דנג זאת רק ראשית הדרך: "כבר עכשיו מחשבים יודעים לחקות מראית עין של רגשות פשוטים מאוד. הנושא הזה צפוי להתקדם לדעתי, ובתוך שניים או שלושה עשורים נראה מחשבים שיודעים להפגין רגשות באופן אמין. כמובן, לא יהיה מדובר בתודעה של ממש, שגם אם יהיה אפשר לפתחה בעתיד זה ייקח עוד זמן רב מאוד".

אלון מאסקצילום: בלומברג

בזמן השיחה איתו מנסה מומחה הבינה המלאכותית של מיקרוסופט להרגיע את החששות מפני התפתחותה. האזהרות האלה מגיעות בין היתר מכיוונו של אלון מאסק, שלמרות מחקריו בתחום הביע בחודש שעבר חשש שזהו "האיום הקיומי הגדול ביותר", ושמערכות ממוחשבות עתידניות עלולות להתייחס לבני אדם כאל חיית מחמד. מתרחיש אימים אחר, שלפיו הבינה המלאכותית "תשתולל", סבלה מיקרוסופט עצמה בזעיר אנפין: לפני ארבעה חודשים היא נאלצה לנתק מהאינטרנט את תוכנת השיחה האינטליגנטית טאי, לאחר שגולשים גרמו לה בין היתר להפגין דעות נאציות ולכתוב בטוויטר ציוצים בגנות נשים ומיעוטים.

"אולי בעוד 200 או 300 שנה מהיום תגיע הטכנולוגיה לרמת תחכום כזו, שנצטרך להתחיל לדאוג מפניה", משיב דנג לחוששים, "אבל בעשרות השנים הקרובות מדובר לדעתי בהסחת דעת מיותרת מההתקדמות הרבה שעוד צריכה להיעשות. זה יותר עניין לפוליטיקאים או למשפטנים, שאולי צריכים להתחיל להתכונן כבר עכשיו לעתיד הרחוק. מצד שני, כמובן, אנשים שעוסקים בתחום צריכים להיזהר משימוש לרעה בבינה מלאכותית".

ג'ף דין מגוגל. משוכנע בנחיצות הטכנולוגיהצילום: google

לא מעט אנשים חשים שפרנסתם מאוימת בגלל חוקרים כמוך. מה תגיד למי שחושש שהאלגוריתמים שאתה מפתח יגזלו את עבודתו?

"לפני 200 שנה אנשים עדיין השתמשו בסוסים ועגלות לתחבורה. כשנכנסו לשימוש המכוניות הראשונות היו רבים שחששו לפרנסה שלהם, אבל אף אחד לא חושב כיום לחזור לרכוב על סוס. מכיוון שהבינה המלאכותית והשינויים שהיא תביא איתה הם בלתי נמנעים, עדיף לאנשים להתמקד במחשבה כיצד להתאים את הקריירה שלהם למציאות המשתנה, ואיך ללמוד דברים חדשים שיהיו רלבנטיים גם אחרי שמכונות ותוכנות יוכלו לבצע את עבודתם הנוכחית.

"בשלב הראשון חלק מהאנשים ייפגעו מהתהליך, ללא ספק, אבל בראייה רחבה זו תהיה בשורה חיובית מאוד למין האנושי. קח לדוגמה את המכוניות האוטונומיות: הן יפחיתו את תאונות הדרכים ויגבירו את הפרודוקטיביות של מאות מיליוני אנשים, שלא יצטרכו יותר לבזבז זמן על נהיגה, גם אם נהגי המוניות לא יהיו מרוצים מהשינוי. ייתכן שיהיה אפשר למצוא פתרונות שישלבו בין הטכנולוגיה ליכולות האנושיות, ובמקרה הזה הם אפילו עשויים להיות בטוחים יותר ממערכת אוטונומית בלבד, אבל אלה שאלות לפוליטיקאים, לא למדענים".

אוסקר למחשב הטוב ביותר

את דנג פגשתי באולם ההרצאות של מכללת אפקה להנדסה, שבה התקבצו בחודש שעבר בשעת בוקר מוקדמת כ־150 חוקרים, מנהלים ואנשי הייטק לכבוד הכנס הבינלאומי השנתי לעיבוד דיבור של המכללה. דנג, ד"ר להנדסת אלקטרוניקה וביופיזיקאי בהשכלתו, חתום על עשרות פטנטים ועל שמונה ספרים בתחומי הלמידה העמוקה וזיהוי הדיבור. לתפקידו הנוכחי במיקרוסופט הוא קודם בראשית השנה אחרי 16 שנה בחברה, שלהן קדמה קריירה אקדמית מרשימה באוניברסיטאות כמו ווטרלו ו־MIT. את טביעות האצבעות של מחקריו אפשר למצוא כיום במוצרים כמו העוזרת האישית קורטנה, מנוע החיפוש בינג והיכולת החדשה של סקייפ לתרגם שיחות בזמן אמת בשמונה שפות.

סם אלטמן. מחקר במיליארד דולרצילום: בלומברג

גם אם רבים עדיין חושבים על מיקרוסופט בעיקר כחברה שאחראית לווינדוס, אופיס וקונסולת המשחקים אקסבוקס, הרי שבינה מלאכותית נהפכה בשנים האחרונות לאחד מתחומי העיסוק המרכזיים שלה. לצד ההשקעות הנרחבות בזיהוי דיבור (סקייפ, קורטנה), הכריז השנה המנכ"ל סאטיה נאדלה כי החברה תשלב תוכנות שיחה (בוטים) בתוכנותיה, וכן השיק את "פרויקט אוקספורד" — סט כלים רחב עבור מפתחים של יישומי בינה מלאכותית, המאפשרים לשלב בכל תוכנה או אפליקציה יכולות כמו זיהוי פנים, זיהוי דיבור, ראיית מכונה או ניתוח שפה.

בחודש שעבר הודעתם על רכישת הרשת החברתית העסקית לינקדאין ב־26 מיליארד דולר. אתם מתכוונים לחבר בין השירות לבין בינה מלאכותית?

"בוודאי. זו היתה נקודה מרכזית ברכישה של החברה: אחת הסיבות שקנינו אותם היא כדי לחבר בין טכנולוגיות הענן שלנו לבין 400 מיליון המשתמשים שלהם. אפשר לעשות דברים מדהימים באמצעות בינה מלאכותית עם גישה למידע כזה, כמובן אגב שמירה על פרטיות המשתמשים", עונה דנג, אך מסרב לפרט בנוגע לתוכניות ספציפיות.

התרגום הסימולטני בסקייפ עורר לא מעט עניין. כמה זמן יחלוף עד שאוזניות או שעונים חכמים יתרגמו לנו שיחות ברחוב בזמן אמת?

"אני חושב שבתוך חמש שנים נגיע לשם, כשנגיע למידת דיוק מספקת. בעיית ההתמודדות עם מילים יחידות כבר נפתרה ברובה, אבל גם אם המערכת הצליחה לזהות במדויק את כל המילים במשפט מסוים, זה עדיין לא אומר שהיא הצליחה להבין את ההקשר. כשמישהו שואל את המערכת על מחלה מסוימת ומביע בפניה דאגה, למשל, היא אמורה לקחת את זה בחשבון בתשובותיה. זו הבעיה העיקרית שאנחנו מתמודדים איתה כרגע".

זו הסיבה שמוצרים כמו סירי או קורטנה עדיין מתקשים להיות שימושיים?

"בדיוק. בניגוד לנותן שירות אנושי שמצויד בידע מוקדם ורחב ויכול לתת תשובות רלבנטיות, לעוזר ממוחשב יש כרגע ידע מוגבל מאוד על העולם. מוצרים כאלה מנסים להבין את כוונת המשתמש ומה הוא רוצה להשיג, אבל לא תמיד מצליחים. אם כל מה שצריך לעשות הוא להזמין לך כרטיס טיסה זה יכול לעבוד, אבל ברגע שנדרשת הבנה במספר תחומי ידע במקביל הסייענים האלו נתקלים בקשיים". פתרון אפשרי אחד לבעיה הזאת, שהדגים השנה נאדלה, הוא ליצור פלטפורמה שתחבר בין בוטים שונים, שכל אחד מהם מתמחה בתחום מסוים. יחד הם יוכלו להשלים משימה מורכבת, כמו תכנון מלא של חופשה.

אם תיפתר בעיית הבנת ההקשר, בעזרת למידה לא מונחית, למידה מתוגברת או כל גישה אחרת, יוכלו המחשבים לבצע פעולה נוספת שכיום נראית אנושית למהדרין: ליצור. מערכות בינה מלאכותית כבר מתנסות כיום בציור ובכתיבת שירה, כשהתוצאות נעות בין היפה למוזר (ובמקרים רבים משלבות בין השניים), אך הבמאי אוסקר שארפ והחוקר רוס גודווין החליטו לבצע ניסוי נועז בהרבה. בחודש שעבר הם הציגו את סרט המדע הבדיוני הקצר "סאנספרינג" (Sunspring), בכיכובו של תומאס מידלדיץ' מהסדרה "עמק הסיליקון". התסריטאי: מערכת בינה מלאכותית שמכונה בנג'מין.

בנג'מין הוזנה במאות תסריטים של סדרות וסרטי מדע בדיוני קלאסיים משנות השמונים והתשעים, ולמדה לייצר טקסט מקורי התואם את הדפוסים המילוליים השכיחים בהם. התוצאה בת תשע הדקות נראתה כמו מפגש בין בי־מובי לרעיון שדיוויד לינץ' השאיר על רצפת חדר העריכה. הסרט מתרחש בחלל, הדיאלוגים קוהרנטיים למחצה והעלילה מזגזגת בין הסביר לביזארי (אפשר לצפות בסרט בקישור הבא).

"אחת הסוגיות המרכזיות במחקר העכשווי היא לבנות מערכות שיודעות לחשוב באופן ארוך טווח יותר", אומר דנג. "תוכנה כזאת תוכל לכתוב תסריט אגב ראיית היצירה הכוללת, ולא תנסה רק להתאים את המשפט הבא בדיאלוג למשפט הקודם. טכנולוגיה נוספת שהרבה חברות עובדות עליה תאפשר למחשב לפענח קטעי וידיאו במהירות וליצור תיאור טקסטואלי שלהם. כך תוכנת בינה מלאכותית שכותבת תסריט תוכל ללמוד לא רק מהתסריטים של סרטים קודמים, אלא גם מצפייה בסרט עצמו. התוצאה תהיה סרט קוהרנטי הרבה יותר".