סוכני AI: העתיד כבר כאן, אז למה אנחנו מחכים?
תארו לעצמכם בוקר שבו אתם מתעוררים מבלי צורך להפעיל שעון מעורר. הסוכן האישי שלכם כבר יודע כמה שעות שינה נדרשות לכם ודואג להתאים את ההתראה בהתאם. בזמן שאתם פותחים את העיניים, הוא כבר סידר את הלו"ז, מכר מניות בסיכון גבוה, רכש כרטיסי טיסה במחיר הזול ביותר, ודאג לבדוק שתוכלו לצאת לחופשה יחד עם בן או בת הזוג. נשמע חלום רחוק? לא בטוח.
מודלי שפה גדולים מתפתחים במהירות מסחררת. אם בשנת 2019 מודלים כמו GPT-3 היו חכמים כמו תלמיד בבית ספר יסודי , ב 2023 למודל GPT-4 כבר היתה אינטליגנציה של תלמיד בתיכון וב 2025 מודלים כמו O-1 של OpenAI או R-1 של המתחרים הסינים DeepSeek כבר חכמים יותר מרובינו. הם עוקפים את רוב בני האדם במבחני אינטליגנציה, ובאופן מפתיע גם במבחני אמפתיה ואפילו במבחני הומור.
הקפיצה האחרונה ביכולות המודלים האלה, שהם כבר לא ממש מודל אחד אלא מערכת שלמה שמורכבת לפעמים מכמה מודלים, היא ממש יכולת החשיבה שלהם. אם תעקבו אחרי התשובות של O1 או R1 תוכלו לראות ממש את תהליך החשיבה שלהם. הם לא ממהרים לספק את התשובה, הם חושבים על תהליך, הם מעלים השערות ומנסים לאושש או להפריך אותן לפי סדר הגיוני עד שלבסוף הם מגיעים לתשובה המבוקשת.
אז יש לנו "מוח" שאנחנו יכולים להשתמש בו. אפשר למוח הזה להוסיף "רגליים". אפשר לתת למוח הזה גישה למסמכים שלנו. כשהוא לא בטוח בתשובה, אפשר להגיד לו "בוא תסתכל גם במסמכים האלה".. המודלים האלה אומנו על מידע עצום, כמעט כל המידע הזמין באינטרנט, אבל לוקח זמן לאמן אותם, ואם ישנו מידע חדש הם לא יכולים להיות מודעים אליו. אם יש מידע סודי של הארגון שלי, גם הוא לא היה נגיש למודל שלי. ולכן אפשר לאפשר למודל לגשת גם למידע הזה. זו טכניקה שנקראת Retrieval Augmented Generation (או בקיצור RAG), אבל אין צורך לעצור שם, ניתן לאפשר למודל לחפש ישירות באתרים ספציפיים מעודכנים, המודל יכול לדלות מידע עדכני על ידי שימוש בפונקציות מוכנות מראש (API). כך המודל יידע בזמן אמת את מחיר המניות, את מזג האויר העכשווי בארצות רחוקות ובעצם את כל מה שאנחנו בני האדם יכולים לדעת ועוד, רק מהר יותר ובצורה אוטומטית.
ל"מוח" שלנו יש כבר "רגליים" עכשיו אפשר להוסיף לו "ידיים". לא מסובך לתת למודל את האפשרות לשלוח מייל, הודעת טקסט, או אפילו לעשות צ'ט מלא במקומנו. אין שום מגבלה טכנולוגית לאפשר לו לבצע פעולות בחשבון הבנק שלנו, בחשבון המניות שלנו, בחשבון האמזון שלנו ועוד. כל מה שאנחנו בני האדם עושים דרך מחשב גם הוא יכול לעשות.
זהו, יש לנו מערכת אוטונומית שלמה. יש לה מוח רגליים וידיים. יש לנו סוכן בינה מלאכותית.
כשאני שואל את הסוכן שאלה או מטיל עליו מטלה, הוא קודם כל מגבש תוכנית פעולה. הוא יודע איזה "כלים" יש ברשותו, והוא מחליט איך להפעיל אותם אחד אחרי השני בסדר מסויים כדי לבצע את כל העבודה.
אז למה בעצם אין לנו עדיין סוכן אישי שעושה את כל זה? מדוע אנחנו ממשיכים לבצע משימות שיכולות להתבצע בקלות על-ידי מערכות AI?
האתגרים שבדרך
יש שלוש סיבות מרכזיות לכך שסוכני הבינה המלאכותית עדיין אינם חלק מחיינו היומיומיים:
1. אתגר טכנולוגי: פיתוח סוכן AI בסיסי הוא משימה פשוטה יחסית, אך יצירת מערכת ברמה מסחרית שתשרת מיליוני משתמשים היא כבר סיפור אחר לגמרי. נדרשת מערכת גמישה, מבוזרת, מאובטחת, וברת-תחזוקה. אמנם קיימות יוזמות בקוד פתוח המנסות לענות על הצורך הזה, אך הדרך עוד ארוכה.
2. אמון ובקרה: לפני שנפקיד את חיינו בידי סוכנים חכמים, אנחנו צריכים לוודא שהם יודעים מתי לעצור. אף אחד לא רוצה לגלות שהסוכן קנה עבורו קרקע חקלאית באקראי או שלח מייל זועם לבוס. נדרשים מנגנוני בקרה קפדניים שיבטיחו שהסוכן יפעל בהתאם להנחיות שלנו.
3. מוסר וערכים: כיצד נוודא שסוכני הבינה המלאכותית יפעלו בצורה מוסרית? אנחנו עצמנו מתקשים להבדיל בין אמת לפייק, בין מוסרי ללא מוסרי. כיצד נגדיר קווים אדומים עבור מכונות אוטונומיות? זהו אתגר מהותי שאסור להתעלם ממנו.
אז מה הלאה?
הטכנולוגיה כבר כאן, ואיתה האפשרות לשנות את חיינו מן הקצה אל הקצה. בעתיד הלא רחוק, סוכני הבינה המלאכותית לא רק יסייעו לנו אלא יהפכו להיות חלק בלתי נפרד מחיינו. אך לפני שזה יקרה, עלינו להתמודד עם האתגרים ולהבטיח שהמעבר לעולם שבו AI מנהל עבורנו משימות יהיה חלק, בטוח ומבוקר.
השאלה היא לא אם זה יקרה, אלא מתי. והאם נהיה מוכנים ברגע שזה יגיע?
גיא טמיר הוא אוונגליסט טכנולוגיות באינטל