$
ניוזלטר חדשות טכנולוגי

פורצי הדרך

המכונה של מיקרוסופט יודעת מה צילמתם

החוקרים של מיקרוסופט יצרו מערכת בינה מלאכותית שיודעת לבחון תמונות ולענות על שאלות מורכבות לגבי התוכן שלהן

נמרוד צוק 16:4530.11.15
חברת מיקרוסופט משקיעה בשנים האחרונות משאבים רבים בפיתוח של בינה מלאכותית, כעת נראה שההשקעה הזו השתלמה. אחרי שראינו מערכות בינה מלאכותית שיודעות לפענח צילומים ולהפוך כל תמונה ליצירת אמנות סוריאליסטית, מגיעה פריצת הדרך הבאה: מערכת שיודעת לבחון תמונות ולענות על שאלות מורכבות בנוגע לתוכן הוויזואלי שלהן, אותה יצרו חוקרי החברה במעבדה באוניברסיטת קרנגי מלון בארה"ב.

 

כאשר המערכת נשאלה, למשל, "מהו הדבר שמושך אדם על עגלה על עפר" היא ענתה "סוסים", וכשנשאלה "מהו צבע הקופסה". בתמונה שהראתה צמחים בתוך עציץ היא ענתה את התשובה המדויקת "אדום". על צילום של מטפסי הרים נשאלה "כמה אנשים מטפסים במעלה ההר עם מקלות טיפוס" והגיבה "ארבעה".

 

כך פועלת הבינה המלאכותית של מיקרוסופט כך פועלת הבינה המלאכותית של מיקרוסופט

 

לבני אדם המטלה הזו אולי נשמעת טריוויאלית, אבל עבור מחשב מדובר במשימה מורכבת שכוללת כמה שלבים: המערכת צריכה קודם כל לאתר את כל העצמים שכלולים בשאלה, להבין קונספטים כגון "ישיבה" או "טיפוס", לנפות את העצמים הלא רלבנטיים שמופיעים בתמונה, ולבסוף לבודד את החלקים הנכונים ולזהות אותם במדויק.

 

פריצת הדרך התאפשרה באמצעות ההתקדמות הרבה שחלה בשנים האחרונות בתחומי ראיית המכונה וניתוח השפה הטבעית. חוקרי מיקרוסופט בחרו בגישה שעושה שימוש במספר שכבות מקושרות של רשתות נוירונים, מאותו סוג המשמש ליצירה אוטומטית של כיתובי תמונה ותרגום טקסטים אוטומטי שאנו מכירים מגוגל ומבינג.

 

לטכנולוגיה החדשה, אומרים במיקרוסופט, יכולים להיות יישומים שדורשים מתן המלצות בזמן אמת וזיהוי מוקדם של צרכים אנושיים, כגון מערכת התרעה לרוכבי אופניים שתורכב על הקסדה ותתריע מפני סכנות. באמצעות הפתרון של החברה היא תוכל לשאול את עצמה תוך כדי רכיבה שאלות רלבנטיות כמו "מהו הדבר מצד שמאל בהמשך הדרך" או "האם יש רוכבי אופניים אחרים שעומדים לעקוף" ולהשמיע באוזני הרוכב אזהרות כאשר היא תזהה מצבי סכנה פוטנציאלית.
בטל שלח
    לכל התגובות
    x