$
מכשירים ומדריכים

החיפוש הקולי פוגש את העברית

גוגל הוסיפה את העברית והערבית למערכת החיפוש הקולי באנדרואיד ובאייפון, והתוצאות מוצלחות - בעיקר כשהחיפוש קצר. האם גם סירי מתקרבת?

עומר כביר ואיתי שמושקוביץ 11:1107.12.11

גוגל השיקה אתמול (ג') יכולות חיפוש קוליות בעברית ובערבית, באפליקציית האייפון שלה וביישום החיפוש במכשירי אנדרואיד. כפי שנחשף במרץ ב"כלכליסט", בחודשים האחרונים אספה גוגל דגימות קול בעברית מאזרחים ישראלים, כהכנה להשקת שירותי שליטה קולית שונים. לדברי החברה, בהליך זה נאספו יותר ממיליון דגימות קול בעברית ובערבית.

 


 

כדי להשתמש ביכולת זו, משתמשי אייפון צריכים להוריד את אפליקציית Google Search מחנות האפליקציות של אפל. משתמשי אנדרואיד יכולים לגשת אליה דרך ווידג'ט החיפוש במסך הבית שלהם, או להתקין את אפליקציית Voice Search מהאנדרואיד מרקט.

 

כרגע ניתן לבצע רק חיפוש ברשת באמצעות האפליקציה, ולא להשתמש ביכולות שליטה קוליות אחרות שמציעה גוגל למשתמשי אנדרואיד באנגלית, כמו חיוג לאיש קשר או ניווט. בנוסף, יכולות החיפוש הקולי בעברית זמינות רק בסמארטפון, אף שגוגל מציעה חיפוש קולי באתר שלה גם בדפדפן כרום. גם תכונה זו זמינה רק באנגלית.

 

זוהי, למעשה, הפעם הראשונה שבה אפשר לבצע חיפוש קולי של ממש בעברית. עד היום יכולנו להגדיר שמות של אנשי קשר בדיבוריות או מכשירים שונים כדי לחייג אליהם במהירות, אבל חיפוש קולי ברשת מסוג זה עוד לא היה - בטח שלא במערכת גדולה ופופולרית.

 

המשפטים מתארכים - החיפוש מסתבך

 

אז איך זה עובד? כבר בבואנו להגדיר את השירות נתקלנו בבעיה - האפשרות להגדיר חיפוש קולי בעברית לא הופיעה בשפות המוצעות לבחירה באפליקציית האייפון. רק לאחר ששינינו את שפת הממשק של המכשיר לעברית ופתחנו מחדש את האפליקציה, הופיעה האפשרות לבצע חיפוש בעברית ולצדה גם בערבית. גם באנדרואיד, המערכת מגדירה את שפת החיפוש לפי שפת הממשק של המכשיר, כך שבעלי המכשירים צריכים לעבוד עם תפריטים בגרסה עברית כדי שיוכלו לבצע חיפוש קולי בעברית.

 

התוצאות של יכולת החיפוש הקולי עצמה מראות שיש מקום לשיפור: האפליקציה אמנם מזהה במהירות ובאופן מדויק מונחי חיפוש קצרים בני מילה או שתיים ("שלום" או "מסעדה יפנית"), וגם גופים כמו "פייסבוק", "כלכליסט" ו־"ynet", ואפילו שמות של חברי מערכת טכנולוגי שאיתם הצליח החיפוש הקולי להתמודד בקלות. עם זאת, הביצועים לא היו מושלמים. את המילה "פרעוש", משום מה, התקשתה האפליקציה לזהות (הזיהוי הכי קרוב היה "פרוש"), וארנולד שוורצנגר זוהה משום מה כ"האות שוורצנגר".

 

ככל שהמשפטים התארכו, המערכת התקשתה להתמודד והפכה לבלתי שמישה. המשפט "הכלב החום נבח על התנין האדום" זוהה כ"הכלב החום ובהחלט המיני האדום". בגוגל אומרים שהזיהוי ישתפר ככל שיגבר השימוש בו.

 

אז ההתחלה היא אמנם בסיסית יחסית, אבל זה טיבן של התחלות ועם הזמן המערכת תשתכלל ותציע את כל האפשרויות שקיימות כבר באנגלית. בהמשך אפשר לצפות לגיור שאר השירותים הקוליים שמציעה גוגל, מחיפוש קולי בדפדפן, דרך הכתבת SMS ועד שירות Google Voice שיודע בין היתר להפוך הודעות קוליות להודעות טקסט.

 

גם סירי בדרך? "גייסנו 300 איש להקלטות"
העוזרת הווירטואלית סירי העוזרת הווירטואלית סירי צילום: בלומברג

 

אבל גוגל לא לבד בעסק הזה: בשבוע הבא יגיע לכאן באופן רשמי האייפון 4S ואיתו גם מערכת סירי (Siri), שעדיין לא תומכת בעברית, עם דגש על עדיין. בסירי הסיפור שונה לחלוטין: לא סתם חיפוש או הקראת פקודות מוכתבות מראש, אלא דיבור חופשי לחלוטין אל הטלפון, שפשוט מבין את מי שמדבר אליו. סטיב ג'ובס אהב להגדיר כל מכשיר ותכונה של אפל כ"קסומים" וסירי אכן מתקרבת להגדרה הזאת.

 

לפי דיווחים שהתפרסמו בימים האחרונים, חברת Nuance האמריקאית, שהטכנולוגיה שפיתחה משמשת את סירי, אוספת בימים אלה דגימות קול בעברית ממשתמשים ישראלים.אחד מהעובדים שהיו אמונים על תפעול המקליטים, אשר חתם על חוזה סודיות וביקש להישאר בעילום שם, סיפר ל"כלכליסט" על יום הקלטות כזה, שנערך לאחרונה בפקולטה לחקלאות ברחובות של האוניברסיטה העברית.

 

"גייסנו 300 אנשים בגיל 17 עד 55", הוא סיפר. "ביצענו כמה סשנים, שכללו שעה וחצי הקלטות במקום סגור ושעה וחצי הקלטות במקום פתוח, עם כל רעשי הסביבה. הם הקריאו 60 פקודות כמו 'התקשר לעומר בנייד', 'התקשר למישהו מהמשפחה כדי להודיע לו הודעה משמחת', 'תכנן תוכנית נסיעה', 'תכנן יציאה לקונצרט'. היו גם שאלות שעסקו באקטואליה ובניווט, כמו 'נווט מעיר לעיר".

 

סירי והחיפוש הקולי של גוגל מחזקות שתיהן את המגמה של מעבר לממשק משתמש טבעי, או NUI (ראשי תיבות של Natural User Interface). האייפון היה אחד ממבשריו, עם המעבר למסך מגע במקום לחצנים ומקשים ותנועות פשוטות להגדלת תמונות.

 

קינקט של מיקרוסופט לקח את העסק צעד קדימה: תשומת הלב הופנתה אל המשחק ללא צורך בבקר שליטה כלשהו, בעזרת זיהוי תנועות הגוף של השחקנים.אבל מיקרוסופט משלבת במערכת גם זיהוי קולי ומתכננת להשתלט על הסלון הביתי בעזרת קונסולת אקסבוקס - אז נדפדף באוויר בין תוכניות ונדבר אל המכשיר כדי לחפש תוכן לצפייה. ההשקה הצנועה יחסית אתמול והדיווחים על עבודת תרגום של סירי לעברית נותנים תקווה שכל החידושים האלה יגיעו גם אלינו.

בטל שלח
    לכל התגובות
    x