סגור
באנר דסקטופ כלכליסט טק
מטה מטא בקליפורניה
מטה מטא בקליפורניה (צילום: Benjamin Fanjoy/Bloomberg)

סוכני ה־AI התייקרו, אמזון ומטא דורשות מהעובדים להפחית את השימוש בהם

חברות שהיו חלוצות באימוץ כלי בינה מלאכותית, בהן גם וולמארט, סיסקו ואובר, החלו להציג מכסות או לאמץ חלופות סיניות זולות אחרי שתקציבי AI הסתיימו לפני סוף השנה. סיבה מובילה להתייקרות: ענקיות כמו אנתרופיק ו־OpenAI שינו את שיטת התמחור 

חברות שמיהרו להפקיד בידי עובדיהן כלי בינה מלאכותית מתחילות למתן את השימוש בהם, זאת ברקע התייקרות העלויות, המתחילות לאתגר את תקציבי התאגידים. אמזון, וולמארט, סיסקו, אובר ומטא, הנמנות עם החברות החלוצות באימוץ הכלים הללו, מציגות בימים אלה מכסות לשימוש בהם, יוצאות נגד שימוש מוגזם, או לחילופין מקדמות כלי AI זולים יותר עבור עובדיהן, זאת בניסיון לשמור על שליטה בהוצאות בתחום.
השינוי מסמן שלב חדש באימוץ כלי בינה מלאכותית בידי תאגידים. בעוד העובדים הרחיבו שימוש מצ'אטבוטים לסוכני AI המסוגלים לבצע משימות מורכבות באופן אוטונומי, אבל דורשים הרבה יותר כוח מחשוב, חברות נאלצות עתה לבחון בדקדקנות האם כל משימה אכן שווה את עלויות השימוש בכלים הללו.
המגמה הזו החריפה לאחר שענקיות כמו אנתרופיק ו־OpenAI העבירו חלק מהשירותים שהן מעניקות ממתכונת של מנויים לחישובי עלות מבוססי טוקנים — שמתחקים אחר מספר יחידות הדאטה שעוברים עיבוד בידי מודלים. השינוי הזה חשף חברות באופן ישיר יותר לעלות של כל משימה הנעשית באמצעות אוטומציה.
"עלויות מחשוב מתחילות עתה להגיע לתודעה של סמנכ"לי הכספים וחברי ההנהלה. צרכנים ועסקים קיבלו את המסר שבינה מלאכותית היא זולה או חינמית, וזה ממש לא המצב", ציין קוסטי פריקוס, מנהל מחלקת בינה מלאכותית גנרטיבית בחברת דלויט.
סם אלטמן, מנכ"ל OpenAI אמר מוקדם יותר החודש, כי עלויות מתבררות עתה כ"עניין עצום" עבור צרכנים השנה. "הנושא הזה מעולם לא עלה בשנה שעברה. אנשים היו מרוצים לחלוטין עם הסכום שהם הוציאו". נשיא אובר וסמנכ"ל הכספים אנדרו מקדונלד אמר כי זה הופך "קשה יותר להצדיק" את ההוצאות על טוקנים של AI. "קשה מאוד להחליט מתי אנחנו באמת מייצרים פיצ'רים שהם יעילים יותר ב־25% עבור הלקוחות ומתי זה הופך להיות מיותר", אמר באחרונה בפודקאסט. חברת שיתוף הנסיעות משיתה עתה מכסות שימוש ומגבילה את העובדים ל־1,500 דולר בחודש בהוצאות על טוקנים לכל אחד מכלי ה־AI, זאת לאחר שכילו עד חודש אפריל את תקציב ה־AI לשנת 2026 כולה.

סכנה למחסור בשבבים

ענקית הקמעונאות האמריקאית וולמארט הגבילה גם היא את השימוש באחד מסוכני ה־AI הפנימיים שלה, זאת לאחר שהטילה מכסה על מספר הטוקנים שמותרים לשימוש לכל עובד.
סורש קומאר, סמנכ"ל טכנולוגיות גלובלי ראשי של הרשת, אמר כי השימוש בפלטפורמת Code Puppy של החברה פשוט הרקיע שחקים. "זו הזדמנות כעת עבורנו לקחת צעד אחורה", אמר, בהוסיפו כי העובדים קיבלו משימה לזהות את הכלים הנכונים עבור המשימות השונות. Code Puppy הוא כלי AI שמאפשר לבנות תוכנה באמצעות שיחה עם AI, במקום לכתוב כל שורת קוד לבד.
ג'יטו פאטל, נשיא וסמנכ"ל מוצר ראשי בסיסקו, אמר כי חברות נאלצות עתה לאזן בין השאיפה להשתמש בסוכנים לבין העלות והזמינות של טוקנים. "ההיקף של התשתיות הדרושות לסוכן גבוה משמעותית לעומת צ'אטבוט", ציין פאטל. "עבור כל בן אדם יכולים להיות לך עשר, 100, או במקרים קיצוניים גם אלף סוכנים. הם פשוט ממשיכים לעבוד וזה נוגס בנתח מהמחשוב".
בתחזית שמסרו בחודש שעבר הזהירו אנליסטים בגולדמן זאקס כי השימוש בסוכני AI יביא לזינוק של פי 24 בצריכת הטוקנים עד 2030 וכי העלייה העצומה בביקושים תחמיר את המחסור בשבבים במהלך 12 עד 18 החודשים הבאים.
בעוד השימוש בטוקנים וההוצאות על AI בידי עסקים ממשיכים לתפוח, המאמצים להוריד עלויות עלולים להשפיע על קצב הצמיחה של מעבדות ה־AI הגדולות בעולם כמו אנתרופיק ו־OpenAI, הנערכות לצאת להנפקה ראשונה לציבור בהמשך השנה, לפי הערכות שווי של טריליוני דולרים.
מאז תחילת השנה, מודלי AI סיניים עקפו את אלה האמריקאים בצריכת טוקנים, כך לפי נתונים של פלטפורמת האגרגציה OpenRouter, המאפשרת למשתמשים גישה למגוון מודלי AI.
האנרגיה הזולה יותר של סין והמודלים היעילים יותר שלה מאפשרים למעבדות ה־AI במדינה לגבות מחירים נמוכים יותר עבור טוקנים לעומת חברות מובילות אמריקאיות, מה שנותן לסין יתרון חדש בשדה הקרב של ה־AI.
גם חברות קטנות יותר חשות את לחץ המחירים. חברת התוכנה Workato אמרה כי השימוש שלה ב־AI זינק בחדות, אחרי ש־1,300 העובדים שלה החלו להשתמש בסוכני AI בקיץ שעבר. "זה תפס כמו אש בשדה קוצים, אנשים התחילו ממש לשנות את אופי המשרה שלהם בעזרת סוכנים", ציין סמנכ"ל מידע ראשי, קרטר בוסי.
אבל החברה חטפה הלם כאשר אנתרופיק עברה לשיטת גביית כספים מבוססת טוקנים בחודש מאי. "ההוצאות שלנו זינקו פי שבעה ביום הראשון ואני כאילו, שיט, יצרנו מפלצת", אמר בוסי. "חברות של מודלי שפה גדולים סבסדו את כל השימוש שלנו וזה הפסיק. תמחור מבוסס משתמשים מגן עליך".
במקום להגביל את הגישה, בוסי מנסה למתן את ההוצאות ומנצל עתה פגישות עבודה דו־שבועיות בנושא AI כדי לקדם רעיונות לחיסכון, כמו, למשל, תיעדוף של המודלים הוותיקים והזולים יותר של אנתרופיק. "במקום חדשנות, בואו נדבר על אחריות פיננסית בתחום ה־AI", הוא אמר.

"לא תמיד צריך מודל חלוצי"

גם חברות גדולות יותר החלו לנקוט אסטרטגיה דומה לגבי אימוץ AI. אמזון הזהירה עובדים בחודש שעבר, כי עליהם להפסיק "להשתמש ב־AI רק כדי להשתמש ב־AI", זאת אחרי שמהנדסים התחילו למנף את הסוכנים כדי לטפס במעלה טבלאות הדירוג של החברה.
החברה נאלצה לשנות את גישתה למדידת קצב אימוץ הכלים, בניסיון לרסן הוצאות הנובעות משימוש לא הולם. מטא נקטה מהלכים דומים באפריל. אמזון וגם מטא בנו והפיצו מודלים משל עצמן, אבל מסתמכות על חברות צד שלישי כמו אנתרופיק עבור מודלים וכלים כמו קלוד קוד. קבוצות ופלטפורמות AI מנסות לשמר את האימוץ של הכלים באמצעות הרחקת המשתמשים ממודלים חדשניים יקרים, כאשר אלה אינם נחוצים, והחלפתם בגרסאות זולות יותר.
קייל דייגל, סמנכ"ל תפעול ב־GitHub אמר כי מיקרוסופט יצרה קשר עם לקוחות לקראת יישום שינויים במודל התמחור על מנת לבדוק מול מפתחים את השינויים המתאימים.
"השאלה עבור המשתמש היא, 'אילו מודלים מתאימים ביותר למשימה'? אתה לא תמיד מחפש אחר מודל חלוצי", הוסיף.
מיקרוסופט וספקיות אחרות של פלטפורמות AI, כולל אמזון וגוגל, כבר הפיצו כלים שמנתבים את השאלות והמשימות של לקוחות למודל הרלוונטי ביותר מתוך סדרה שנבחרה על ידי הלקוחות — זאת כדי לשלוט בעלויות באופן אפקטיבי יותר.
בינתיים, ישנן חברות שהנחו את עובדיהן להשתמש במודלים עם קוד פתוח שניתנים לתפעול על השרתים שלהן או באמצעות מחשבים אישיים, מה שמאפשר לצמצם את העלויות שהם משלמים למעבדות AI וספקי שירותי ענן.
אבל לקוחות בוחנים עדיין את העלויות הגבוהות יותר אל מול הבטחותיהם למשקיעים בנוגע להשפעת ה־AI על השורה התחתונה ועל פריון העבודה. "המהנדסים שלנו רוצים יותר טוקנים. אנחנו צריכים למצוא דרך לממן את זה", ציין פאטל, מסיסקו.