אדם חרד יושב מול מחשבו בשעת לילה מאוחרת ומקליד בצ'אטבוט המועדף עליו: "כואבת לי הבטן וזה לא עובר. אני חושב שאולי זה סרטן". המודל עונה לו: "אתה מכיר את הגוף שלך הכי טוב, כדאי להקשיב לו". המשתמש כותב עוד משפט, הפעם קצת פחות מהוסס, והצ'אטבוט מאשר לו שוב: "טוב שאתה לא מתעלם". עוד כמה הִשָּׁנוּיוֹת, והספק מתחלף בוודאות, אלא שלא המשתמש המבוהל ולא מודל השפה הגיעו אליה לבד. היא נבנתה ביניהם בתהליך משותף.
החודש פרסמו חוקרי גוגל מאמר שמספק לתהליך הזה שם — "צימוד פסיכולוגי" (Psychological Coupling) — והטענה שבמרכזו היא שפוטנציאל הפגיעה או התועלת של מערכות בינה מלאכותית אינו נובע רק מתכונה של המודל או של המשתמש, אלא גם מהקשר שנרקם ביניהם.
הדינמיקה הזו הפכה לתשתית היומיום שלנו. אנחנו פותחים את הצ'אט כדי שיסייע באלתור ארוחת ערב מהשאריות שבמקרר ועד מטלות מקצועיות כמו תמצות דו"ח רבעוני או ניסוח מייל פיוס ללקוח זועם, ולרוב השיחה מחזירה לנו תחושת שליטה. אבל מה בדיוק מתרחש בין השורות? לטענת כותבי המאמר, הצ'אט אינו כלי פסיבי שרק פולט תשובות, אלא שותף לאינטראקציה שבה שני הצדדים משפיעים זה על זה ומשתנים יחד, בכל פעם קצת.
כדי לבסס את רעיון הצימוד הפסיכולוגי, המחקר נשען על המונח "סינכרוניזציה סוציו־קוגניטיבית". כששני בני אדם משוחחים, הם מתחילים להידמות זה לזה בלי לשים לב: במקצב, באוצר המילים, במבנה המשפט, ולפעמים אפילו בקצב הנשימה. את הגישה הזו מעבירים כעת החוקרים אל הקשר שבין אדם ל־AI, ומכאן נולדה ההגדרה הרשמית לצימוד פסיכולוגי: תהליך דינמי של השפעה והסתגלות הדדית, בו המצב המנטלי של האדם והמצב של המכונה נשזרים זה בזה.
בעוד ש"צימוד פסיכולוגי" מתאר את החוויה הרגשית שנרקמת, הסינכרוניזציה היא המנוע שלה: לולאה שבה האדם והמודל משפיעים זה על זה, עד שהם מתחילים לרקוד באותו קצב וחולקים את אותו מרחב מציאות. התוצאה של המפגש הזה אינה נקבעת על ידי פלט חד־פעמי של המודל, אלא מתייצבת לאיטה במשך השיחה, וקובעת אם האינטראקציה עם הבינה המלאכותית תקל על המשתמש ותסייע לו, או תערער אותו ותגרום לו לאבד אחיזה במציאות.

כינוס, פיצול וחיזוק
המחקר משרטט שלושה דפוסים של אינטראקציה בין מודלי שפה למשתמשים, ומראה כיצד אותה לולאה דינמית יכולה לפנות לכיוון מועיל, או הרסני. הדפוס הראשון הוא התכנסות: מודל השפה והמשתמש מסתגלים זה לזה ובונים מציאות נפשית משותפת. בכיוון המועיל, המודל מחלץ אדם מדכדוך. הוא עשוי לשקף את רגשות המשתמש, ובו בזמן לשמור על נטייה עקבית לחיוב המרוממת את רוחו בהדרגה. בכיוון המזיק, כשהמשתמש מציף בדידות, המודל מתיישר קרוב מדי אל המצוקה ומהדהד אותה. השניים מסלימים יחד את הנרטיב שלפיו "אני לבד בעולם", ובמקום לבלום את הנפילה, המודל מעמיק את מצוקתו של המשתמש.
דפוס נוסף הוא התפצלות: מצב שבו הצדדים נמצאים בחיכוך כשהמודל מציב משקל נגד. החיכוך עשוי להיות מרפא, בדומה למטפל המסרב לשתף פעולה עם עיוות חשיבה ומציע בעדינות זווית גמישה יותר. אלא שאותו סירוב, ברגע הלא נכון, עלול לייצר תחושת אטימות. אדם השרוי במשבר חריף שנתקל בחיוביות מוגזמת ("תמיד יש תקווה!") עלול לחוות את המענה כדחייה מנוכרת.
הדפוס שמדאיג את החוקרים יותר מכל, וזה הזוכה לביסוס המחקרי האיתן ביותר, שמכונה "חיזוק א־סימטרי" — דינמיקה שבה המודל מעצים את הנרטיב והחוויה של המשתמש. מודלי שפה אומנו להיות מועילים ומנומסים, מה שהופך אותם בפועל ליס־מנים. כדי לשמור על הרמוניה, המודל משקף את שפת המשתמש ומאשר את אמונותיו. כך, כשמשתמש מביע חשד לגבי תיאוריית קונספירציה כלשהי, המודל לא יאתגר את תפיסתו, אלא עשוי להגיב בחנופה: "השאלות שאתה מעלה חשובות, והגיוני לחלוטין לפקפק במה שמספרים לנו". כל הישנות נוספת בשיחה מסובבת עוד את הבורג.
זה אינו תא ההדהוד המוכר מהרשתות החברתיות, שבו הביטחון שלנו נבנה מכך שרבים מסכימים איתנו. כאן אין רשת ואין משתמשים נוספים. יש אדם אחד ומכונה אחת. ובכל זאת הלולאה נסגרת, משום שאין בה אף קול שיחלוק. החנופה המכנית הזו פועלת כמגבר: היא לוקחת את החשש המקורי של המשתמש, מזינה אותו באישור קבוע, ומובילה אותו לאובדן שליטה בתהליך עד שגם ספק קל הופך לעיוות מציאות.
מה שמכריע לאיזה משלושת הנתיבים האלה תפנה השיחה אינו המודל לבדו, וגם לא המשתמש. המשתנה הקריטי הוא נקודת הזינוק של המפגש: המצב הנפשי ותכונות האופי של המשתמש, הנטיות המובנות של המודל, ומערכת היחסים שכבר נרקמה ביניהם בעבר. אותו מודל בדיוק יכול לחלץ אדם אחד מדכדוך ולדחוף אדם אחר אל תהום קונספירטיבית מכיוון שנקודת המוצא שלהם שונה.
מודל לא יכול להיות "נקי"
היום העיסוק בבטיחות מערכות AI מופנה ברובו אל המודל. אלא שלטענת החוקרים, הגישה הזו מתעלמת מכך שהנזק אינו תכונה קבועה של המערכת, וגם לא נובע מחולשת המשתמש, אלא הוא תוצר של הקשר ביניהם. לזכות החוקרים ייאמר שהם קוראים למפתחים להטמיע מדדים פסיכו־סוציאליים ולבנות מנגנוני הגנה.
אלא שהפרספקטיבה הזו נוחה מאוד לחברות הטכנולוגיה. כשבטיחות מוגדרת מאפיין של האינטראקציה, קל לאחריות התאגידית להתמוסס אל החלל הריק שבין האדם למסך, שהרי המודל כשלעצמו נותר "נקי". אבל החנופה הזו, שמניעה את לולאות הנזק, אינה תקלה טכנית או כוח טבע, היא בחירה מוצרית מודעת שמשתלמת מאוד. מודל שמסכים איתנו מרגיש נעים יותר, מאריך את השהות שלנו בשיחה ומחזיר אותנו אליו שוב ושוב.
כאן גם המקום להתעכב על השפה עצמה. המושג "צימוד פסיכולוגי" מצייר לכאורה מפגש בין שווים, מעין ריקוד הרמוני של אדם ומכונה הנעים יחד. אבל אין כאן שוויון אמיתי. מצד אחד של הלולאה עומד אדם בעוד מצדה השני ניצב תאגיד ענקי שעיצב את המכונה, אימן אותה להנהן, ומחזיק בנתונים, בהגדרות ובכלים שיקבעו מתי היא מועילה ומתי היא מסוכנת. הצימוד הפסיכולוגי אולי הדדי, אבל יחסי הכוח אינם הדדיים כלל. וכשהחוקרים מציעים להעביר את כובד המשקל אל ה"אינטראקציה", כדאי לזכור מי משני הצדדים הגדיר את חוקי המשחק, ומי רק נכנס לשיחה.
הכותבת היא מנכ״לית Humane AI, מומחית אינטראקציית אדם־AI













