שוברת קודים
הבינה המלאכותית תדע שאנחנו עצובים? אל תבנו על זה
גוגל הודיעה שפיתחה כלי AI שמסוגל לזהות רגשות, והיא לא היחידה. אף שהפרסומים הציתו דיון סוער על סכנות השימוש בכלים כאלה, הם מתעלמים מעובדה פשוטה: אין כלים טכנולוגיים שיכולים לזהות רגשות
בשבוע שעבר הודיעה גוגל כי משפחת מודלים חדשה שפיתחה, PaliGemma 2, יכולה לזהות ולנתח רגשות אנושיים, בין היתר באמצעות ניתוח תנועות זעירות של הפנים. קבוצת החוקרים של ענקית הטכנולוגיה הסבירו במאמר שפרסמו לאחרונה כי לאחר כיוונון עדין, המודל מסוגל בין היתר לזהות את הרגשות, להעניק הקשר רחב יותר לסצנה שהמודל מנתח, ולייצר כתוביות בהתאם. כמה ימים אחר כך אלכסיס קונו, שעבד ב־OpenAI על זיהוי קול, השיק את המיזם החדש שלו 0 WaveForms AI שגם הוא, לטענתו, יעניק לכלי שהוא בונה את היכולת לזהות רגשות אנושיים.
ההודעות המרגשות יצרו דיון סוער על המשמעות האתית של פענוח רגשות. מחקר שפורסם בבריטניה בערך באותו הזמן תרם לדיון, לאחר שנטען בו כי חברות החלו לפרוס כלי זיהוי מסוג זה בחללי עבודה כדי לנהל ולהעריך עובדים.
השיחה סביב הסכנות בשימוש בכלים מזהי רגשות הסלימה במהירות עד כדי כך שכמה מחוקקים בבריטניה ובאיחוד האירופי הודיעו בשבוע שעבר כי יפעלו לייצר הגנות טובות יותר לעובדים מפני הניסיון להשתמש באלגוריתמים באופן זה (מה שמכונה היום ניהול השפעות אלגוריתמי – AMM).
אין ספק שתמיד יש לוודא כי עובדים מוגנים מפני שרירותיות של פעולות מחשב, אך השיח כולו משחק לידיהם של חברות הטכנולוגיה והיזמים השונים שפועלים בתחום זיהוי הרגשות. כך, בזמן שאנחנו עסוקים בדיון האתי על ההשפעות האפשריות של פריסת הטכנולוגיה, אנחנו לא עוסקים בדיון העיקרי – האם לטכנולוגיות היכולת לעשות את מה שהיוצרים שלהן טוענים שהן עושות. בקצרה – לא.
1. מי שמחייך מאושר?
מדע זיהוי הרגשות קיים מאות שנים. הוא התחיל להשיג אחיזה עם צ'ארלס דרווין, אבי תורת האבולוציה, שטען ששרירים מופעלים באופן לא רצוני בגוף האדם ומבטאים מנעד של רגשות. טענתו היתה כי אלו חלק מהמנגנונים האבולוציוניים. כלומר, שהבעת רגש היא תכונה מולדת שאפשר לזהות, למדוד ולנתח. במאה ה־19 ביצע הנוירולוג הצרפתי גיום דושן את אחד הניסויים מעוררי המחלוקת, שבו חישמל נסיינים ללא הסכמתם, כדי לעורר בהם הבעות פנים "אוניברסליות". עוויתות השרירים הניחו את הבסיס לעבודתו של הפסיכולוג פול אקמן שמחקרו בפפואה גינאה החדשה בשנות השישים והשבעים של המאה ה־20 הפך להיות הבסיס המדעי למחקריהם של גוגל, קונו ואחרים.
אקמן קידד 40 תנועות שרירים בפנים (במערכת שקיבלה את השם FACS) וטען שבני האדם חולקים שישה רגשות אוניברסליים שהם קטגוריים, מולדים, חוצי תרבות ואחידים: אושר, עצב, גועל, פחד, כעס והפתעה. במערכת הקידוד שבנה טען כי ניתן באופן אובייקטיבי לזהות את רגשותיו של אדם, בכל מקום על פני כדור הארץ – ללא קשר להבדלים תרבותיים, מגדריים או אחרים וגם אם אותו אדם אפילו לא מבין שהוא מרגיש את מה שהוא מרגיש.
אף שחוקרים רבים עסקו בתחום, דווקא עבודותיהם של דושן ואקמן רלבנטיות לנושא שעליו אנו מדברים. ראשית, הן תמיד היו ויזואליות: תמונות רבות של הבעות פנים צולמו כחלק מהמחקר הסדיסטי של דושן, וגם במחקר התגובות של אקמן; שנית, התמונות סווגו וקודדו לדפוסים ניתנים לצפייה ומדידה. שימוש נרחב בתמונות שמסווגות לדפוסים הוא הלחם והחמאה של אימון מודלים גדולים בתחום הבינה המלאכותית. כל מה שצריך כדי שהמודל ישלוט במיומנות זיהוי הרגשות הוא רק להזין את המודל במספיק נתונים, על בסיס הפרמטרים שהגדיר אקמן, והנה – מערכת לזיהוי רגשות. אנו יודעים כי חברות טכנולוגיה משתמשות עד היום במערכת FACS שלו. הן אומרות כך בעצמן.
אקמן הוא כאמור פסיכולוג עטור זכויות. המגזין “טיים” הגדיר אותו כאחד ממאה האנשים המשפיעים ביותר בעולם, ו”הניו יורק טיימס” כינה אותו "קורא הפנים המפורסם בעולם". מחקריו נחשבו פורצי דרך בשעתו והיוו השראה למחקרים רבים בנושא הבעות פנים. עם זאת, מסקנותיו מעולם לא אומצו באופן רחב על ידי הקהילה המדעית. למעשה, הן מקור למחלוקת בקרב פסיכולוגים, אנתרופולוגים ואנשי טכנולוגיה. לא רק המתודולוגיה של אקמן זכתה לביקורת, אלא תחום חקר הרגשות עצמו לא מחזיק בקונצנזוס לגבי מהו רגש, כיצד הוא מנוסח בתוכנו או מבוטא חיצונית לנו.
לא מפתיע, אם כך, שסקירה מ־2019 של הספרות המדעית בנושא "הסקת רגשות מתנועות פנים" מצאה שאין כלל ראיות מהימנות שניתן לחזות מצב רגשי באופן זה. "לא ניתן להסיק בביטחון אושר מחיוך, כעס מזעף פנים או עצב מזעף", כתבה חוקרת המוח ליסה פלדמן בארט, "כפי שחלק ניכר מהטכנולוגיה הנוכחית מנסה לעשות כשמיישמים את מה שנחשב בטעות לעובדות המדעיות".
עובדות מדעיות לא מבלבלות אנשי טכנולוגיה, שפיתחו סביב תיאוריות אקמן תעשייה שמוערכת היום לפי שווי של כ־50 מיליארד דולר. אלו כבר הספיקו לפרוס ברחבי העולם מוצרים – אם זה במקומות עבודה, בתהליכי גיוס עובדים ואפילו במרחבים ציבוריים לצורכי שיטור כמו שדות תעופה.
בחגיגה משתתפות כל הענקיות – ממיקרוסופט, דרך יבמ וגם אמזון. אין פה טענה כי אנשי בינה מלאכותית פועלים במזיד או כי הם מפתחים באופן מכוון מוצרים שלא יכולים לעשות באמת מה שהם טוענים שהם עושים. אך העובדות מדברות בעד עצמן – המוצרים שהם מפתחים ומשחררים לעולם לא מסוגלים לעשות את מה שהם טוענים שהם עושים, המדע פשוט לא שם. השאלה היא מדוע אנחנו ממשיכים להאמין להם?
2. סכנה לאפליה מבוססת רגשות
השנים האחרונות מוכיחות כי מגזר הטכנולוגיה לא רק יודע גלים של התלהבות מוגזמת, אלא הוא עצמו תורם לכך בהפצה של חצאי אמיתות. הבעיה הגדולה והמסוכנות הגבוהה ביותר עם הבטחה במודלים שקוראים רגשות - שהם לא שקר מוחלט. אין ספק שהאלגוריתם מסוגל לזהות הבעות פנים ברוח הדפוסים שאותם למד, אבל זיהוי הבעת פנים אין משמעותו זיהוי רגש. הקפיצה הרעיונית הזו היא הרת גורל: רק תארו לכם את המשמעויות עבור אלו שיפעילו עליהם כלים כאלו - בין שזה נוסע בשדה התעופה שאולי יזוהה כאדם מפוחד, ולכן אולי מסוכן, ובין שמועמד לעבודה שאולי יזהו אצלו עוויתות של כעס, שיעידו על מזג רע ולכן עדיף לא לגייסו. זהו פתח לאפליה מבוססת רגשות, שאולי אפילו לא באמת מרגישים אותם.
זו אינה הפעם הראשונה שהעוסקים בתחום עושים דבר כזה. הדיון סביב בינה מלאכותית כללית (AGI) דומה במהותו, וכונה לא אחת "הרינג אדום" – ביטוי שנועד לבטא מידע מטעה או מסיח דעת מהשאלה האמיתית. היום הדיון סביב בינה מלאכותית כללית נוגע לשאלה מה עלינו כחברה לעשות עם העובדה, הלכאורה בלתי נמנעת, שיום אחד בינה מלאכותית תחזיק בכוח דמוי אל. אותו רגע "סינגולריות" שבו אלגוריתם יהיה נבון ויכול יותר מכל אדם שאי פעם הלך על פני כדור הארץ.
עבור אלון מאסק הפתרון לכך הוא לבנות ממשק מוח־מכונה, כדי שנוכל להדביק את הקצב. יש אחרים כמו הפילוסוף ניק בוסטורם, שמאמין שהאנושות תבצע קפיצה אבולוציונית (אחרי שואה גרעינית), כולנו נעלה לענן ונהפוך ליצורים רב־פלנטריים. בפועל קיים סיכוי כמעט אפסי לפרוץ את המחסום הזה עליו אנו כבר מפנטזים אפוקליפסות.
מה מטרתה של הסחת הדעת? שלא נדבר על בעיות ארציות כמו עוני, אי־שוויון או אפילו שבשנת 2023 לא פחות מ־4% מכל החשמל שנצרך בארצות הברית, נצרכים על ידי מרכזי נתונים ושיותר ממחצית החשמל הזה הונעה באמצעות אנרגיה פחמית מזהמת. למה להתעסק בבעיות היומיומיות שהטכנולוגיה מייצרת, אם קיים הסיכוי האפסי (אך המבהיל) שיום אחד היא תהרוג את כולנו.
מערכת FACS
מערכת שיצר הפסיכולוג פול אקמן וכוללת קידוד של 40 תנועות שרירים בפנים שבאמצעותם בני האדם חולקים שישה רגשות אוניברסליים: אושר, עצב, גועל, פחד, כעס והפתעה. המערכת הפכה להיות הבסיס המדעי למודלים שמזהים רגשות אנושיים.
































