$
כלכליסט-טק

חדש ממיקרוסופט: תרגום שפה בזמן אמת - ובקולו של הדובר

תוכנת התרגום החדשה, שעדיין נמצאת בפיתוח, מסוגלת לתרגם אנגלית לסינית ובינתיים טועה רק במילה אחת מתוך 8, תוך שמירה על חיתוך הדיבור המקורי

כלכליסט 15:54 09.11.12

 

מעבדות מיקרוסופט בארה"ב הדגימו אמש (ה') כלי חדש לתרגום דיבור בזמן אמת. התוכנה מתבססת על למידת סגנון הדיבור והביטויים של המשתמש ותרגומם - ומתרגמת את דבריו באינטונציה האישית שלו. ריק ראשיד, מנהל המחקר העולמי של מיקרוסופט, הדגים את הפיתוח החדש במהלך מצגת שנערכה בטיאנג'ין, סין. דבריו תורגמו באופן שוטף לשפה המנדרינית. מבנה הפעולה של התוכנה נשמע פשוט: היא מזהה מילים ומשפטים, ממירה אותן לטקסט ומתרגמת אותן לשפת היעד – ואז משמיעה אותן תוך שמירה על חיתוך הדיבור בו הוקלטו במקור. בפועל, מדובר בתהליך מורכב מאוד שמסתמך על רשתות עצביות מלאכותיות, שפועלות בדומה לאופן בו המוח האנושי מזהה ומנתח דיבור.

 

הדגמת התוכנה - התרגום הסימולטני מוצג בדקה 07:37

 

הפיתוח של מיקרוסופט הוא כיוון חדש במחקר של החברה בתחום. עד עתה, התמקדו חוקרי מיקרוסופט בפיתוח כלי התאמת דפוסי מלל. הכלי החדש נעזר גם במודלים סטטיסטיים ומאפשר לצמצם את שיעור הטעויות בתרגום מ-25 ל-15%. בהדגמה של ראשיד, למשל, טעתה התוכנה בתרגום של מילה אחת מתוך שמונה. עם זאת, התוכנה זקוקה לחתימת קולו של הדובר, במטרה לנתח את סגנון הדיבור שלו. ראשיד אמר בהדגמה כי התוכנה נזקקה להקלטה של שעה על מנת ללמוד את קולו.

 

תרגום סימולטני הוא תחום שנמצא במחקר ופיתוח במעבדות של חברות רבות, ביניהן גוגל, אפל ואחרות. תרגום סימולטני טבעי הוא אתגר גדול עבור חברות הטכנולוגיה, בשל ההבדלים בין ביטויים שונים בשפות שונות, הקושי שבזיהוי הקשרים במשפט והצורך בעיבוד מהיר ויעיל של הנאמר.

x