סגור
גג עמוד techtalk דסק
TechTalk

ללמוד לנהל את הענן מבלי לאבד שליטה

המירוץ להטמעת בינה מלאכותית גנרטיבית בארגונים יצר נקודת עיוורון אסטרטגית. בזמן שצוותי הפיתוח והמוצר מתמקדים ביכולות של המודלים, דרג הניהול מתחיל לזהות דפוס מדאיג שכן אימוץ הבינה המלאכותית הופך למנוע צמיחה אדיר להוצאות הענן, לעיתים ללא בקרה או נראות מספקת. האתגר האמיתי אינו רק איזה מודל לבחור, אלא איך לבנות תשתית ענן שתתמוך ב-AI בלי שהעלויות והמורכבות התפעולית יערערו את היציבות הארגונית.
מודלים מתקדמים, דוגמת אלו של חברת Anthropic או סדרת Claude 3.5, מציעים יכולות הסקה פנומנליות, אך הם נשענים על צריכת משאבים אינטנסיבית. עבור ארגון המטמיע מודלים כאלו דרך ה-API או בפריסה מקומית על גבי תשתית הענן שלו, כל שאילתה היא שורת רווח והפסד. לפי תחזיות של חברת Gartner, עד סוף שנת 2025, כ-30% מפרויקטי ה-GenAI ייזנחו לאחר שלב הוכחת ההיתכנות. הסיבה המרכזית אינה איכות המודל, אלא חוסר היכולת לשלוט בעלויות המחשוב והאחסון בענן שנוצר סביבם.
המציאות הטכנולוגית משתנה בקצב כזה ש ארגונים רבים לוקחים מודל מתקדם ומתחילים לעבוד איתו במהירות, אך מגלים באיחור שהתהליך אינו מאובטח, שהמידע הארגוני חשוף ושהעלויות יוצאות משליטה. בנוסף, פרויקטים רבים נתקעים בשלב ה-PoC או מיושמים בצורה לא מבוקרת. לכן, כדי להשתמש בכלים הללו, לא מספיק להפעיל את המודל אלא צריך לדעת לנהל את הממשק שלו מול הענן. ארגונים צריכים לעבור מעבודה בשיטת ניסוי וטעייה למערכת סדורה המגדירה מה ניתן לעשות ומה לא, תוך שמירה על גמישות מרבית מול שוק שמשתנה במהירות.

עקרונות מובילים למשילות בענן

כדי לאפשר לארגון לצמוח עם הטכנולוגיה מבלי לאבד את המושכות, יש להטמיע שלושה עקרונות:
1. ניהול כלכלת טוקנים (Tokenomics): בעולם הענן המסורתי, התרגלנו למדוד ולנהל צריכת זיכרון וכוח עיבוד. אך, בעולם ה-AI, יחידת המדידה היא הטוקן. ניהול נכון מחייב בניית שכבת ניטור ייעודית המכמתת את צריכת המשאבים הללו ומשייכת אותם ברמת הפרויקט או המחלקה הארגונית. אחת הדרכים האפקטיביות ביותר לשלוט בעלויות אלו היא שימוש בטכנולוגיית RAG, במקום להזרים כמויות עצומות של מידע למודל, המערכת שולפת רק את רכיבי הנתונים הרלוונטיים ביותר לשאילתה. זהו אינו רק כלי לשיפור דיוק התוכן, אלא מהלך כלכלי מהותי המצמצם משמעותית את נפח הנתונים המועבר לענן.
1 צפייה בגלריה
ורה שולמן מנכ"לית Profisea פרופיסי
ורה שולמן מנכ"לית Profisea פרופיסי
ורה שולמן
(צילום: רמי זרנגר)
2. אסטרטגיית ריבוי עננים וארכיטקטורה היברידית: הסתמכות על מודל יחיד או ספק ענן בודד היא סיכון אסטרטגי שארגונים לא יכולים להרשות לעצמם. בניית תשתית ענן גמישה היא המפתח לשמירה על חופש פעולה, היא מאפשרת להריץ משימות מורכבות על מודלים עתירי ביצועים כמו אלו של אנתרופיק, בסביבה מאובטחת, ובמקביל לנתב משימות פשוטות יותר למודלים רזים וזולים יותר. המטרה היא למנוע מצב של "נעילת ספק" (Vendor Lock-in), שבו הארגון הופך שבוי של תשתית אחת. גמישות כזו לא רק מבטיחה המשכיות עסקית במקרה של תקלות, אלא גם מעניקה לארגון כוח מיקוח ממשי מול ענקיות הענן בשמירה על רמת המחירים.
3. אוטומיזציה וניהול פיננסי ל-AI: הדינמיות של הבינה המלאכותית מחייבת מעבר לניהול תשתיות אוטונומי. לא ניתן לנהל את משאבי הענן הנדרשים ל-AI בצורה ידנית. הטמעת כלי אופטימיזציה שיודעים להקצות משאבים בזמן אמת, לזהות חריגות בצריכה ולבצע עצירה של תהליכים לא יעילים, היא הכרחית. מחקרים של IDC מצביעים על כך שארגונים המשלבים כלי ניטור ובקרה ייעודיים לתשתיות ה-AI שלהם, משיגים יציבות מערכתית גבוהה ב-25% וחיסכון ניכר בהוצאות התפעוליות.

היכולת לאמץ מודלים מתקדמים בלי לאבד שליטה דורשת שינוי תפיסתי

ה-AI הוא לא רק אפליקציה, הוא עומס עבודה חדש ותובעני על הענן. השאלה שצריכה להעסיק את מקבלי ההחלטות אינה רק איזה מודל יכתוב קוד טוב יותר, אלא האם תשתית הענן שלהם מוכנה ליום שבו הבינה המלאכותית תהפוך מצריכה נקודתית ללב הפעילות הארגונית. השליטה וניהול הענן לא יגיעו מהחלטה שמרנית לצמצם את השימוש במודלים מתקדמים, אלא מהיכולת להנדס את התשתית מראש סביב יעילות ודיוק. בסביבה עסקית שבה הענן הוא מרכיב מרכזי בהוצאות התפעוליות, ארגונים שישכילו לייעל את תשתיות הענן שלהם במקביל להטמעת המודלים, יוכלו להפוך את הבינה המלאכותית מנטל תקציבי לנכס אסטרטגי שמוביל את השוק.
ורה שולמן היא מנכ"לית Profisea (פרופיסי) המפתחת פתרונות לניטור, ניהול ואופטימיזציה של תשתית הענן הציבורי