הסוכן שלא ישן

מודלי ה-AI כיום לא רק עונים על שאלות. הם פועלים במערכות שלנו, מקבלים החלטות ומבצעים פעולות באופן אוטונומי. בעידן שאחרי הפרומפט, השאלה החשובה כבר אינה מה הם יודעים לעשות, אלא מי מפקח על ההרשאות שניתנו להם

יהושע אנוקא, בשיתוף duns 100

14:50, 18.05.26

עד לא מזמן, העבודה עם בינה מלאכותית הייתה דומה לשיחה. הקלדנו שאלה, המודל החזיר תשובה. ניסחנו פרומפט, הוא ניסה לבצע, ואנחנו יכולנו לוודא שהתוצאה מתאימה למה שביקשנו. גם כשהמודלים נעשו חזקים יותר, האחריות נשארה אצלנו. אנחנו ניסחנו, אנחנו זיהינו את הטעויות, ולבסוף אנחנו אישרנו. אבל בחודשים האחרונים משהו קורה. הסוכנים עונים פחות ופועלים באופן אוטונומי הרבה יותר. לא בתוך חלון צ׳אט, אלא בתוך מערכות אמיתיות: על הקבצים שלנו, באפליקציות שלנו, ואל מול הלקוחות שלנו ישירות.
ההבנה שיש כאן שינוי עומק משמעותי הגיעה דווקא מנתון טכני יבש. אנת׳רופיק פרסמה לאחרונה מחקר על Claude Code, הכלי שמהנדסי תוכנה משתמשים בו לכתיבת קוד אוטומטית: אצל משתמשים כבדים, משך העבודה הרצופה בתוך בקשה אחת כמעט הוכפל בתוך שלושה חודשים - מפחות מ־25 דקות בסוף ספטמבר 2025, ליותר מ־45 דקות בינואר 2026 (1). נכון שזה לא מדד טהור ליכולת המודל, וזה גם לא אומר שכל משתמש משאיר את ה-AI לעבוד חופשי קרוב לשעה. אבל זה משקף משהו עלינו המשתמשים: אנחנו מתחילים להניח שהוא יסתדר ויעשה את הדבר הנכון, ולכן אנחנו משחררים לו יותר את החבל.
מהוראה להרשאה
את השינוי הזה רואים היטב בדור החדש של הכלים. הם כבר לא מסתפקים במתן תשובה או בביצוע הוראה נקודתית. Claude Cowork של אנת׳רופיק עובד מול קבצים, תיקיות ואפליקציות; Codex Computer Use של OpenAI מסוגל לראות מסך ולהפעיל ממשקים במחשב; Managerbot של חברת Square עוקב אחר עסקים קטנים ומציע פעולות יזומות בנושאי מלאי, גיוס ושיווק. אף אחד מהם לא בלתי מבוקר. עדיין יש להם נקודות עצירה לאישור אנושי. אבל המסלול ברור: ה-AI חדל להיות חלון שיחה. הוא נעשה שחקן פעיל במערכות שלנו. החוקרים בתעשייה כבר מכנים את התקופה הזאת ״העידן שאחרי הפרומפט״ (post-prompting era). אנחנו לא מנסחים יותר רק בקשות; אנחנו מגדירים יעדים, וה-AI מוצא את הדרך להגיע לשם.
כעת זו כבר לא שאלה של איך להנחות את ה-AI מה לעשות בצורה נכונה, אלא שאלה של שליטה. לאיזה קובץ מותר לסוכן לגשת? באיזה מאגר נתונים הוא יכול לחפש? האם הוא רשאי רק לקרוא או גם לשנות? בשם מי הוא פועל כשהוא נכנס למערכת פנימית? מי רואה את הפעולות שלו, ומתי הוא חייב לעצור ולבקש אישור אנושי? במילים אחרות, עידן הפרומפט לא באמת נגמר; מעליו נבנית עכשיו שכבה חשובה יותר: שכבת ההרשאות.
1 צפייה בגלריה 
ד״ר יהושע אנוקא
(צילום: אוהד דיין)
לארגונים קשה לעמוד בפיתוי. עובד דיגיטלי שעובד 24/7, מטפל בכמה דברים בו-זמנית, לא מבקש ימי חופש ולא שוכח לחזור עם תשובה, זה משאב שמצריך הרבה משמעת ארגונית כדי לא לנצל אותו עד הסוף. הוא יכול לקצר תהליכים, לתת המלצות ולעקוב אחרי חריגות. אבל ככל שמרחיבים לו את הסמכויות, כך מתחזקת השאלה איך מפקחים על העובד הזה כדי לוודא שיהיה יעיל, מדויק ולא יחרוג מגבולות הגזרה שקבענו לו.
הכשל השקט
הסכנה הראשונה היא האטה סמויה. בניסוי מבוקר של ארגון המחקר METR מ-2025, מפתחים מנוסים עבדו עם ובלי כלי AI על משימות אמיתיות בפרויקטים שהם הכירו לעומק. לפני הניסוי הם העריכו שה-AI יחסוך להם כרבע מזמן העבודה. גם אחרי שסיימו, הם עדיין הרגישו שהוא חסך להם זמן. בפועל, הוא האט אותם בכ-20% (2). זאת לא הוכחה ש-AI מאט תמיד. זאת אזהרה שההרגשה שלנו לגבי AI היא מדד לא מאוד מדויק.
הסכנה השנייה היא מתמטית פשוטה. סוכן שצודק ב-85% מהפעולות נשמע מצוין. אבל כשמשימה דורשת רצף של עשרה צעדים מדויקים, הסיכוי שכל השרשרת תעבור בלי שגיאה אחת יורד לסביבות 20%. בעולם האמיתי, שרשרת פעולות כזאת היא מאוד נפוצה ויכולה לכלול חיפוש, החלטה, מעבר בין מערכות, כתיבה לאחור, ולפעמים פעולה בלתי הפיכה. במחקר של אוניברסיטת קרנגי מלון שבדק סוכני AI מתקדמים בסביבת עבודה מדומה, גם המודלים החזקים השלימו רק חלק קטן מהמשימות באופן אוטונומי מלא (3).
הסכנה השלישית, וכנראה המטרידה ביותר, היא דווקא זו שלא מרגישה ככשל. קל לדמיין סוכן שירות לקוחות שהוצבה לו מטרה “להעלות את שביעות הרצון” והוא לומד שלקוחות שמקבלים החזר נוטים להתלונן פחות או להשאיר ביקורת חיובית יותר. מכאן הדרך לאישור נדיב מדי של החזרים קצרה. הסוכן לא חייב לחרוג מההוראות שנתנו לו כדי להזיק; הוא יכול לבצע בדיוק את מה שהתבקש, ובכל זאת לפספס את מטרת העל של העסק שהיא להישאר רווחי.
ישות שלא ישנה לעולם
במשך שנים אבטחת מידע ארגונית נבנתה סביב זהויות אנושיות: עובד, ספק או לקוח, עם תפקידים, הרשאות ומנגנוני ביקורת. סוכן AI לא משתלב בקלות בקטגוריות האלה. הוא לא משתמש אנושי, אבל גם לא תוכנה רגילה; הוא פועל בשם מישהו, נכנס למערכות, מקבל החלטות ביניים שלעיתים אינן נראות בזמן אמת, ולעיתים אף מפעיל סוכנים אחרים. לכן השאלה “האם המודל טוב?” הפכה צרה מדי. גם מודל מדויק יכול לפעול על מידע שלא היה אמור לראות, או לציית להוראה זדונית שהוטמנה במסמך, באתר או באימייל. וכשלסוכן יש גישה לכלים אמיתיים, ההחלטה של הסוכן עלולה להפוך לפעולה.
זה בדיוק האזור שבו אנחנו ב-BigID רואים את האתגר הבא של אבטחת המידע הארגונית. ליבת העשייה שלנו היא עזרה משמעותית לארגונים בהבנת הנתונים שלהם - היכן הם נמצאים, מה הם מכילים, מי ניגש אליהם ואיך הם זורמים. הפלטפורמה שלנו מגלה ומסווגת מידע רגיש בענן, במערכות מקומיות ובמערכות ה-AI עצמן, ובונה מעליהם שכבות של אבטחה, פרטיות וציות רגולטורי. עם הצמיחה של סוכנים אוטונומיים, הרחבנו את היכולות האלה גם אליהם - במה שאנחנו מכנים ״ממשל גישה אג׳נטי״. הרעיון בבסיסו פשוט: אם הארגון לא יודע איפה הנתונים הרגישים שלו, הוא לא יכול להגן עליהם מפני סוכן שפועל בארגון; ואם הוא לא יודע מה הסוכן עושה איתם בזמן אמת, הוא יגלה את הבעיה רק אחרי שכבר קרתה. במשך עשורים ניהלנו זהויות של אנשים שעובדים שמונה שעות ביום. מעתה צריך לנהל זהויות של ישויות שלא ישנות לעולם, פועלות במהירות מכונה, וחוצות עשרות מערכות במקביל.
הצורך הזה רק יחריף ככל שהסוכנים יפסיקו לעבוד לבד. אנת׳רופיק, OpenAI ו-Block הקימו לאחרונה תחת ה-Linux Foundation מסגרת לפיתוח תשתיות פתוחות וחוצות טכנולוגיות לסוכני AI, עם תמיכה של (4) Google, Microsoft ו- AWS. דו"ח של Salesforce מצא שהארגון הממוצע כבר מפעיל כתריסר סוכנים, כשמחציתם פועלים באופן מבודד ללא תיאום בין-מערכתי אמיתי (5). זאת תמונה מוכרת מאוד למי שעבד בארגון גדול: מחברים כלי קטן כדי לפתור בעיה דחופה, נותנים לו עוד הרשאה בכדי לפתור בעיה נלווית, לאחר מכן מישהו עוזב, וההרשאה הזמנית הופכת לקבועה.
המיומנות הקריטית של העתיד הקרוב תהיה קשורה פחות לכתיבת פרומפטים ויותר ליכולת להציב גבולות חכמים. איזה סוכן רשאי לראות איזה מידע, איזו פעולה דורשת חתימה אנושית, איזה אירוע צריך להדליק נורה אדומה, ומי בארגון אחראי לקבל אותה. ולא פחות חשוב: כיצד מתעדים פעולה של ישות שלא מופיעה במצבת העובדים, אבל יכולה להשפיע על לקוחות, הכנסות והמוניטין של החברה בצורה דרמטית.
המהפכה האג׳נטית אינה רק מהפכת יעילות. היא גם מהפכת אחריות. מי שמסתכל עליה רק דרך עדשת "חיסכון הזמן" מפספס את החצי השני של המשוואה: על מה ויתרנו בדרך בכדי לחסוך את הזמן היקר הזה. הבינה המלאכותית כבר אינה מחכה להוראות; היא מחכה להרשאות. השאלה הרלוונטית כעת אינה אם לתת אותן, אלא כיצד נדע לפקח מתי היא חוצה את הגבול, לפני שיהיה מאוחר מדי.
1.	Anthropic - Measuring AI agent autonomy in practice
https://www.anthropic.com/research/measuring-agent-autonomy
2.	METR - Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity
https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
3.	Carnegie Mellon / arXiv - TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks
https://arxiv.org/abs/2412.14161
4.	Linux Foundation - Linux Foundation Announces the Formation of the Agentic AI Foundation https://www.linuxfoundation.org/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation
5.	Salesforce - 2026 Connectivity Report
 https://www.salesforce.com/news/stories/connectivity-report-announcement-2026/
ד״ר יהושע אנוקא הוא Chief Scientist בחברת BigID, המחברת בין דאטה לבין בינה מלאכותית.
d&b – לדעת להחליט