שימו לב, אתר זה עושה שימוש בעוגיות על מנת להבטיח לך את חוויית הגלישה הטובה ביותר. קראו עוד הבנתי
חדשות טכנולוגיה

מבינה עניין: טכנולוגיית הזיהוי הקולי של מיקרוסופט הגיעה לרמת דיוק אנושית

חוקרי הבינה המלאכותית של החברה הכריזו שהטכנולוגיה שפיתחו הגיעה לרמת דיוק של 95% בזיהוי מילים, בדיוק כמו תמלילנים אנושיים מקצועיים. אך זו רק אבן דרך ראשונה בתחום שהשאיפה המרכזית בו היא הבנה ולא זיהוי בלבד

רפאל קאהאן 16:1519.10.16

מיקרוסופט פרסמה אתמול (ג') הודעה על "נקודת ציון היסטורית", אליה הגיעה לטענתה. מחקר שפורסם על ידי חוקרי בינה מלאכותית של החברה סיכם שטכנולוגיית הזיהוי הקולי שלה NIST 2000 מגיעה לרמת דיוק של כ-95%, זאת אומרת כמו זו של תמלילנים מקצועיים שרמת השגיאות שלהם עומדת על כ-5.9%. החברה הסבירה שהטכנולוגיה שלה יכולה כעת לזהות מילים במהלך שיחה באותה רמת דיוק כמו אדם.

 

מדובר אכן בהישג מרשים. אך יש לציין שזיהוי קול אינו הבעיה המרכזית בתחום, השאיפה הסופית הן של מיקרוסופט והן של מתחרות כמו אפל וגוגל היא להגיע להבנה וניתוח של המשפטים שנאמרים. בשלב הנוכחי היתרון היחיד של הטכנולוגיה של מיקרוסופט יהיה לאפשר תמלול יעיל יותר עבור שלל כלי הסיוע שלה כגון קורטנה או כלי סיוע לבעלי מוגבלויות.

 

קורטנה בווינדוס 9. מזהה אבל עדיין לא מבינה קורטנה בווינדוס 9. מזהה אבל עדיין לא מבינה

 

זאת ועוד, החברה לא הרחיבה על היכולת של הטכנולוגיה לזהות שפות או קולות, אלא רק על ההבנה של המילים שנאמרות בתנאי מעבדה. כמובן שיש להמתין ולראות כיצד היא תתמודד עם מצבים מחיי היומיום כמו הבנה של דוברים בעלי מבטא כבד או שיבושי לשון. בנוסף, הטכנולוגיה עדיין לא מסוגלת להבין את ההקשרים ואת משמעות המילים.

 

הבנת המשמעות היא למעשה הפתח שדרכו יהפכו מערכות זיהוי הקול לממשק העיקרי דרכו ננהל את ההתקנים בעתיד. רמת דיוק וזיהוי של 95% מספקת יכולת ראשונית חשובה עבור מערכות אלה. השלב הבא, הבנת המשמעות, יהפוך את הזיהוי לממשק אמיתי שיידע לבצע פעולות על בסיס בקשות.

 

כבר כיום ניתן לבצע פעולות מוגבלות כגון ייזום שיחה או שליחת הודעה בסמארטפונים תוך שימוש במערכות הסיוע הדיגיטליות כגון סירי או גוגל Now. אך סדרה של פקודות שיתבססו על משפט בשפה טבעית עדיין אינו בין הכישרונות שלהן.

בטל שלח
    לכל התגובות
    x