סגור
באנר דסקטופ כלכליסט טק
לוגו פייסבוק
פייסבוק (רויטרס)

פייסבוק חושפת פלטפורמת תרגום לכל השפות ומציעה אותה חינם כקוד פתוח

מטא הציגה היום מודל תרגום מכונה חדש שיודע לתרגם כ-200 שפות שונות, ביניהן נדירות שלא נתמכו עד כה. המודל לומד ומייצר תרגומים באיכות גבוהה. מארק צוקרברג: "המודלים יסייעו לתרגום איכותי לשפות אותם מדברים מיליארדי אנשים"

מטא - חברת האם של פייסבוק - הציגה היום (ד') מודל תרגום מכונה חדש שיודע לתרגם כ-200 שפות שונות, ביניהן שפות נדירות שלא נתמכו בידי כלי התרגום הקיימים עד כה. המודל החדש, שפותח תחילה משפה יחידה ובהמשך הורחב למגוון שפות נוספות, יודע ללמוד משפות עם מעט דוגמאות לתרגול ולייצר תרגומים באיכות גבוהה כך לפי הודעת החברה. לדברי מארק צוקרברג, מייסד ומנכ"ל Meta: "הטכניקות והמודלים שאנחנו בונים במסגרת הפרויקט יסייעו לייצר תרגום איכותי לשפות אותם מדברים מיליארדי אנשים ברחבי העולם. המודל שלנו, משתמש ביותר מ-50 מיליארד פרמטרים שונים".
על פי בדיקות שערכה פייסבוק, על כ-10,000 תכנים, נראה כי התרגומים שמייצר המודל מספקים תרגום מדויק יותר בכ-44% בממוצע, לעומת מוצרים קודמים. עם זאת בפייסבוק לא ציינו מול אילו מוצרים בוצעה ההשוואה. על פניו רק לגוגל ולמיקרוסופט יש פלטפורמות תרגום מכונה - כך שסביר להניח שלפחות אחת מהן שימשה כדי לבסס את הבדיקה שלה. כאמור המודל יונגש לשימוש כקוד פתוח, על מנת לאפשר לחוקרים ומפתחים להמשיך ולבנות את הטכנולוגיה ולהרחיב אותה לשפות נוספות.
פרויקט התרגום מבוסס על מיזם עליו היא עובדת כבר תקופה ארוכה לייצר מכונת תרגום אוניברסלית לשפות. המיזם מהווה נדבך חשוב בכל הקשור לשאיפותיה בתחומי המציאות המדומה והמוגברת כגון המטאוורס. שכן שימוש במציאות וירטואלית אינו מוגבל למדינות וסביר להניח שמשתמשים מכל העולם יפעלו בו. תרגום מכונה לא רק מאפשר לפייסבוק להבין יותר טוב את המשתמשים - ובכך לשפר את מערכות הפרסום שלה שמהוות כ-97% מסך הכנסותיה - אלא גם לייעל מוצרי VR ו-AR עתידיים כגון פרויקט משקפי ה-AR שלה.
מומחים בתחום הסבירו בתגובה להודעתה של פייסבוק שמדובר במחקר שאפתני ויסודי, אך גם ציינו שיכול מאוד להיות שחלק מהתרגומים עשויים להיות ברמה נמוכה יותר מאשר בשפות נפוצות יותר. תרגומים לאנגלית, צרפתית, ספרדית ושפות עם מספר גדול של תכנים ככל הנראה יציגו אמינות גבוהה יותר מאשר שפות איזוטריות או שכיחות פחות כגון ליטאית, בולגרית או גיאורגית. "התרומה הגדולה ביותר של המיזם הוא נתונים", כך ציין לאתר The Verge פרופסור אלכסנדר פרייזר, מומחה למחשוב לשוני באוניברסיטת לודוויג מקסימיליאן במינכן, "היתרון העיקרי כאן הוא הוספת 100 שפות שניתן יהיה לתרגם דרך המודל של מטא".
השאיפה של פייסבוק היא להכליל שפות מאוד נדירות במודל שלה. כאלה שהנתונים עליהן כוללים פחות ממיליון משפטים או צברי מילים. אלה כוללות למשל שפות אפריקאיות או הודיות מקומיות שברובן אינן נתמכות על ידי כלי תרגום מכונה מסחריים כיום. "המוטיבציה שלנו היא לייצר טכנולוגיית תרגום שתעבוד עבור כולם", כך אמרה חוקרת AI במטא, אנג'לה פאן, שעובדת על הפרויקט. "תרגום לא תמיד עובד עבור שפות שאנחנו דוברים וזו אחת השאיפות שלנו", אמרה.
תרגום מהווה את אחת הבעיות העיקריות בעולם הבינה המלאכותית והמחשוב כיום. מדובר בשאיפה עתיקה ששורשיה נעוצים עוד בימי קדם - כפי שמלמד אותנו סיפור מגדל בבל התנכ''י. אבל לתרגום מדויק יש גם השפעות על חיי היום-יום שלנו כאן ועכשיו. כך למשל למד זאת על בשרו פועל בניין מזרח-ירושלמי פלסטיני לפני כמה שנים שנעצר על ידי משטרת ישראל בחשד לתכנון פיגוע דריסה עם הטרקטור שלו. הסיבה? מערכת התרגום האוטומטית של פייסבוק טעתה בתרגום פוסט שהעלה עם ברכת בוקר טוב בערבית תורגם ל"תקפו אותם" בעברית או "הכאיבו להם" באנגלית. מיותר לציין שהחשוד שוחרר לאחר כמה שעות כשהמשטרה ביצעה את הבדיקה עם קצין דובר ערבית שאישר את הטעות.
למרות שהמעורבות של חברות ביג-טק במיזמי תרגום קשורה כמובן לשיקולים מסחריים גרידא. המהלך של מטא, הגם שמועיל לה, יכול באמת לספק מענה למיזמים אוניברסליים כגון ויקיפדיה שתוכל כך לתרגם יותר תכנים וערכים לשפות נדירות יותר וכך לסייע בהפצת ידע בקלות ובחינם שזו מטרתה. עם זאת יש לקחת בחשבון שהבסיס ללא מעט תרגומי מכונה מגיע בחלק גדול מהמקרים של שפות נדירות יותר מעובדי הייטק שהיגרו לארה"ב. אלה כמובן מוטים תרבותית ויכול מאוד להיות שנקודת המבט שלהם אינה דומה לזו של דוברי השפות במדינות עצמן.
ועדיין, היוזמה של מטא לשחרר את המודל כקוד פתוח בהחלט מחזקת את היכולת של חוקרים לעסוק במודלי תרגום מכונה בצורה יותר יעילה ולסייע לאקדמיה לקדם את המחקר בתחום בעלויות נמוכות בהרבה משימוש בכלים מסחריים. פייסבוק אף החלה בתכנית מלגות מחקר בתחום למדענים שלא יכולים לממן את הפרויקטים שלהם בתחום. יש לקוות שהיוזמה הזו תוכל לסייע לנו בייצור מתרגם אוניברסלי יעיל לפחות כמו בסדרת המד''ב מסע בין כוכבים או דג בבל המופיע בסדרת מדריך הטרמפיסט לגלקסיה. שאמנם יעיל, אבל דורש להחדיר את הדג לאוזן כדי שיפעל כראוי.