$
חדשות טכנולוגיה

תרגום בגוף התמונה: מפתח Word Lens מספר על ההצלחה

מאחורי האפליקציה המדוברת לאייפון, שמתרגמת בזמן אמת טקסטים דרך המצלמה, עומד מפתח עצמאי מסן פרנסיסקו בשם אוטביו גוד. בראיון ל"כלכליסט" הוא מסביר איך הטכנולוגיה המתוחכמת עובדת, ומדוע עברית היא שפה שתוכל להשתלב במערכת בקלות

שי ענבל 15:0130.12.10

את הרעיון ל-Word Lens, אחת האפליקציות החדשניות והמדוברות ביותר כיום לאייפון (להורדה בחינם מהאפסטור), הגה אוטביו גוד בעת טיול לגרמניה ב־2008. מתכנת המשחקים מסן פרנסיסקו, שבסך הכל רצה לדעת מה כתוב על הכרכים בחנות הספרים שבה ביקר, התפטר בתוך זמן קצר מעבודתו בחברת סגה והקדיש את השנתיים וחצי הבאות לפיתוח.

 

התוצאה: אפליקציה שיודעת לקרוא מילים דרך עדשת המצלמה ולתרגם אותן בזמן אמת, הכוללת טכנולוגיה שמשלבת בין OCR (זיהוי אופטי של תווים, או Optical Character Recognition) ו־Augmented Reality (מציאות מועשרת, או רבודה).

 

"לא ממש ידעתי איך אפשר לעשות את זה”, מספר גוד (36) בראיון ל"כלכליסט". "פשוט חשבתי שיהיה נחמד אם יהיה אפשר לצלם את הטקסט בטלפון הסלולרי, שיזהה ויתרגם אותו. כשחזרתי לארה"ב התחלתי לדבר עם אנשים על הרעיון. התברר לי שהבסיס הוא בסך הכל גרפיקה ממוחשבת, לא קסם".

 

"התחלתי לעבוד על תוכנת מחשב שתפענח אותיות בצילומים. הרעיון לתרגום בזמן אמת הגיע רק לאחר שהתעייפתי מלחבר כל פעם את המצלמה למחשב ולהעתיק קבצים. חיברתי את מצלמת הווידיאו למחשב, ואחרי שראיתי את הפענוח עובד תוך כדי הצילום פשוט נפעמתי, זה היה מדהים. לא היתה חזרה אחורה".

 

התוכנה פותחה מראש ל־PC כך שיהיה אפשר בקלות יחסית להעביר אותה לפלטפורמות אחרות, ומערכת ההפעלה של האייפון היא הפלטפורמה הראשונה שבה הושקה. האפליקציה ניתנת להורדה בחינם, ורכישה של חבילת תרגום (כרגע אפשר לתרגם רק מספרדית לאנגלית ולהיפך) עולה 5 דולרים.

 

אוטביו גוד מציג את היישום שפיתח. "המטרה לא היתה להוציא מוצר מושלם" אוטביו גוד מציג את היישום שפיתח. "המטרה לא היתה להוציא מוצר מושלם"

 

ההשקעה הוחזרה בתוך שבועיים

 

"הבסיס לאפליקציה היה מנגנון OCR, שבו המחשב פשוט קורא אותיות בתמונה וממיר אותן לתווים. הבעיה היא שרוב תוכנות ה־OCR היום משמשות בעיקר לסריקת מסמכים. אני הייתי צריך ליצור OCR לעולם האמיתי: כלומר, התוכנה צריכה לזהות, למשל, את ההבדל בין אות לבין עץ, ואם יש חלון ברקע - צריך לדעת להתעלם ממנו. יש כאן אתגר של ממש.

 

"אחרי שה־OCR מסיים את העבודה ומזהה את האותיות, מדובר פשוט בחיפוש במילון. כשאתה רוכש שפה באפליקציה של Word Lens, אתה מוריד את כולה למכשיר, כך שאפשר להשתמש בה בלי חיבור לרשת".

 

גוד מסרב למסור נתונים על היקף ההורדות או המכירות של האפליקציה, אולם לדבריו כבר עכשיו, קצת יותר משבועיים לאחר השקתה, היא הצליחה להחזיר את עלויות הפיתוח. לא מדובר רק בעבודה במשרה מלאה שלו, אלא גם בשכירת מתכנת נוסף בשם ג'ון דוויז, שעוסק בעיקר בהמרה של תוכנת ה־PC לאפליקציית אייפון.

 

"שנינו מגיעים מאותו רקע", אומר גוד. "ג'ון עבד ב־Electronic Arts. הפרויקט האחרון שלו היה המשחק Spore. אני עבדתי בחברת משחקים קטנה בשם Secret Level שנמכרה לסגה ב־2006”. השניים הקימו יחד את חברת Quest Visual, ו־Word Lens היא האפליקציה הראשונה של החברה. למעשה, מדובר בעסק משפחתי כמעט: אמו של גוד, שבקיאה בשפות רבות, סייעה בנושא התרגום, ואחיו צילם את סרטון הפרסומת של האפליקציה שזכה לכמעט 3 מיליון צפיות ביוטיוב.

 

 

אתה בטח שמח על ההחלטה להתפטר מסגה ולפתח את Word Lens

“לחלוטין. סיקרן אותי מאוד לדעת מה תהיה התגובה לאפליקציה, ונראה שהיא בעיקר חיובית וזה משמח אותי מאוד, מפני שעבדנו עליה קשה מאוד במשך זמן רב. לא היה לי מושג מה תהיה תגובת האנשים, מפני שאין בשוק שום אפליקציה דומה לזה. Word Lens היא לא מושלמת - אבל המטרה לא היתה להוציא מוצר מושלם, אלא להוציא מוצר שימושי".

 

היתה לך תוכנה ב־PC. למה החלטת לפתח את האפליקציה דווקא לאייפון ולא לאנדרואיד, למשל?

“רצינו מוצר מוגמר, אז היינו חייבים לבחור בפלטפורמה אחת. האפסטור הוא כיום המקום הטוב ביותר למשתמשים שהם מאמצים מוקדמים (Early Adopters). חשבתי שאם נוכל להצליח שם, נוכל להגיע מהר מאוד לידיים של תיירים - קהל היעד הטבעי של Word Lens".

 

"התחלנו כבר לשחק קצת עם אנדרואיד, וזו הפלטפורמה הבאה שבתכנון, אבל מפני שאנחנו רק שני אנשים, נצטרך לקחת אדם נוסף שיפתח את גרסת האנדרואיד. טרם עשינו זאת".

 

דרוש סלולרי מהיר

 

“Word Lens היא ללא ספק הדבר הכי מאתגר מבחינה טכנולוגית שעבדתי עליו עד כה", אומר גוד, “ואני חושב שעיקר הקושי היה מפני שהכל צריך לעבוד בטלפון סלולרי. מכשיר כמו אייפון 4 הוא בעל עשירית מכוח העיבוד של הלפטופ שלי. האייפון הוא לא מחשב מהיר במיוחד: הוא מהיר בשביל טלפון, אבל בהשוואה למכשירים אחרים הוא די איטי.

 

"לקח המון זמן והמון שורות קוד כדי שהכל יעבוד בצורה סבירה, ומי שמתנסה באפליקציה יודע שהיא יכולה להיות איטית מפעם לפעם. בגלל זה האפליקציה עצמה בחינם ואפשר באמצעותה להתנסות בהדגמות. זה נועד לתת מושג לאנשים במה מדובר ולתאם ציפיות. אין לי אינטרס להונות אף אחד".

 

שיטת התרגום של Word Lens. להגדלה  

 

אז איך מתכוונים ב-Word Lens לשפר את האפליקציה? "יש המון דברים שאפשר לעשות", אומר גוד. "אנחנו נשפר את יכולת הקריאה שלה, את המהירות ואת התרגום. כשטלפונים חדשים ייצאו, הם יספקו את השדרוג הכי גדול, כי כשיש מכשיר עם מצלמה טובה יותר, זה עוזר מאוד. אז ככל שטכנלוגיית מצלמות הטלפון תשתפר, כך גם Word Lens תשתפר, ואני לא חושב שזה ייקח יותר מדי זמן".

 

מה לגבי זיהוי שפות נוספות מלבד ספרדית ואנגלית?

“אני חושב שבקרוב מאוד נוכל להטמיע עוד שפות, בעיקר שפות עם אותיות לטיניות כמו צרפתית. הכנסה של שפות אסיה כמו סינית או של המזרח התיכון תהיה קשה יותר".

 

כמו עברית.

גוד צוחק. "עוד לא יצא לי להתעמק בעברית, אבל ממה שהתרשמתי אין הרבה אותיות, והן נפרדות אחת מהשנייה כשהן בתוך מילה, בניגוד לאותיות הערביות. זה הופך את המלאכה לקלה הרבה יותר".

בטל שלח
    לכל התגובות
    x