הציע לרכוש את צים ב־4.5 מיליארד דולר - והבית שלו לפני עיקול

גולן חזני

טיסות חינם, נקודות וקאשבק: איזה כרטיס אשראי נותן יותר?

שקד גרין ערבה

"הגדלנו את החשיפה לטכנולוגיה, שבבים ומזרח אסיה, וזה עבד"

אלמוג עזר

בורסת ת"א ירדה ב-2.2% - מניות הפיננסים נסגרו באדום, מדד הביטוח נפל ב-5.8%

שיר רייטר

היחלשות הדולר: באוצר מעריכים - בקרוב תגובש חבילת סיוע להייטק

שלמה טייטלבאום

האוזן השלישית עוברת למתחם סטריט סנטר בתל אביב

דרור ניר קסטל, מרכז הנדל"ן

מכה נוספת לנושי חברת מחנות הקיץ: אג"ח סימד הועמדו לפירעון מיידי

אלמוג עזר

הנצפות ביותר בערוץ

תלמדו מהמנכ"לים: כך תשיבו על השאלות הנפוצות בריאיונות עבודה

"הולכים על הראש של מיקרוסופט": חברת סייבר חדשה נחשפת בגיוס ענק

שנה לאחר שגייסה 120 עובדים והפיקה סרט הוליוודי: ארטליסט מפטרת 40% מכוח האדם

סרטונים מומלצים

ה־AI הוא רק תירוץ: חולשת הדולר גורמת לפיטורים ולעצירת גיוסים בהייטק

סכנה בת 80 שנה: כך המציאו הנאצים את עיר הטילים של איראן

TechTalk

ללמוד לנהל את הענן מבלי לאבד שליטה

ורה שולמן

15:21, 16.03.26

המירוץ להטמעת בינה מלאכותית גנרטיבית בארגונים יצר נקודת עיוורון אסטרטגית. בזמן שצוותי הפיתוח והמוצר מתמקדים ביכולות של המודלים, דרג הניהול מתחיל לזהות דפוס מדאיג שכן אימוץ הבינה המלאכותית הופך למנוע צמיחה אדיר להוצאות הענן, לעיתים ללא בקרה או נראות מספקת. האתגר האמיתי אינו רק איזה מודל לבחור, אלא איך לבנות תשתית ענן שתתמוך ב-AI בלי שהעלויות והמורכבות התפעולית יערערו את היציבות הארגונית.
מודלים מתקדמים, דוגמת אלו של חברת Anthropic או סדרת Claude 3.5, מציעים יכולות הסקה פנומנליות, אך הם נשענים על צריכת משאבים אינטנסיבית. עבור ארגון המטמיע מודלים כאלו דרך ה-API או בפריסה מקומית על גבי תשתית הענן שלו, כל שאילתה היא שורת רווח והפסד. לפי תחזיות של חברת Gartner, עד סוף שנת 2025, כ-30% מפרויקטי ה-GenAI ייזנחו לאחר שלב הוכחת ההיתכנות. הסיבה המרכזית אינה איכות המודל, אלא חוסר היכולת לשלוט בעלויות המחשוב והאחסון בענן שנוצר סביבם. 
המציאות הטכנולוגית משתנה בקצב כזה ש ארגונים רבים לוקחים מודל מתקדם ומתחילים לעבוד איתו במהירות, אך מגלים באיחור שהתהליך אינו מאובטח, שהמידע הארגוני חשוף ושהעלויות יוצאות משליטה. בנוסף, פרויקטים רבים נתקעים בשלב ה-PoC או מיושמים בצורה לא מבוקרת. לכן, כדי להשתמש בכלים הללו, לא מספיק להפעיל את המודל אלא צריך לדעת לנהל את הממשק שלו מול הענן. ארגונים צריכים לעבור מעבודה בשיטת ניסוי וטעייה למערכת סדורה המגדירה מה ניתן לעשות ומה לא, תוך שמירה על גמישות מרבית מול שוק שמשתנה במהירות.
עקרונות מובילים למשילות בענן
כדי לאפשר לארגון לצמוח עם הטכנולוגיה מבלי לאבד את המושכות, יש להטמיע שלושה עקרונות:
1. ניהול כלכלת טוקנים (Tokenomics): בעולם הענן המסורתי, התרגלנו למדוד ולנהל צריכת זיכרון וכוח עיבוד. אך, בעולם ה-AI, יחידת המדידה היא הטוקן. ניהול נכון מחייב בניית שכבת ניטור ייעודית המכמתת את צריכת המשאבים הללו ומשייכת אותם ברמת הפרויקט או המחלקה הארגונית. אחת הדרכים האפקטיביות ביותר לשלוט בעלויות אלו היא שימוש בטכנולוגיית RAG, במקום להזרים כמויות עצומות של מידע למודל, המערכת שולפת רק את רכיבי הנתונים הרלוונטיים ביותר לשאילתה. זהו אינו רק כלי לשיפור דיוק התוכן, אלא מהלך כלכלי מהותי המצמצם משמעותית את נפח הנתונים המועבר לענן.
1 צפייה בגלריה 
ורה שולמן 
(צילום: רמי זרנגר)
2. אסטרטגיית ריבוי עננים וארכיטקטורה היברידית: הסתמכות על מודל יחיד או ספק ענן בודד היא סיכון אסטרטגי שארגונים לא יכולים להרשות לעצמם. בניית תשתית ענן גמישה היא המפתח לשמירה על חופש פעולה, היא מאפשרת להריץ משימות מורכבות על מודלים עתירי ביצועים כמו אלו של אנתרופיק, בסביבה מאובטחת, ובמקביל לנתב משימות פשוטות יותר למודלים רזים וזולים יותר. המטרה היא למנוע מצב של "נעילת ספק" (Vendor Lock-in), שבו הארגון הופך שבוי של תשתית אחת. גמישות כזו לא רק מבטיחה המשכיות עסקית במקרה של תקלות, אלא גם מעניקה לארגון כוח מיקוח ממשי מול ענקיות הענן בשמירה על רמת המחירים.
3. אוטומיזציה וניהול פיננסי ל-AI: הדינמיות של הבינה המלאכותית מחייבת מעבר לניהול תשתיות אוטונומי. לא ניתן לנהל את משאבי הענן הנדרשים ל-AI בצורה ידנית. הטמעת כלי אופטימיזציה שיודעים להקצות משאבים בזמן אמת, לזהות חריגות בצריכה ולבצע עצירה של תהליכים לא יעילים, היא הכרחית. מחקרים של IDC מצביעים על כך שארגונים המשלבים כלי ניטור ובקרה ייעודיים לתשתיות ה-AI שלהם, משיגים יציבות מערכתית גבוהה ב-25% וחיסכון ניכר בהוצאות התפעוליות.
היכולת לאמץ מודלים מתקדמים בלי לאבד שליטה דורשת שינוי תפיסתי
 ה-AI הוא לא רק אפליקציה, הוא עומס עבודה חדש ותובעני על הענן. השאלה שצריכה להעסיק את מקבלי ההחלטות אינה רק איזה מודל יכתוב קוד טוב יותר, אלא האם תשתית הענן שלהם מוכנה ליום שבו הבינה המלאכותית תהפוך מצריכה נקודתית ללב הפעילות הארגונית. השליטה וניהול הענן לא יגיעו מהחלטה שמרנית לצמצם את השימוש במודלים מתקדמים, אלא מהיכולת להנדס את התשתית מראש סביב יעילות ודיוק. בסביבה עסקית שבה הענן הוא מרכיב מרכזי בהוצאות התפעוליות, ארגונים שישכילו לייעל את תשתיות הענן שלהם במקביל להטמעת המודלים, יוכלו להפוך את הבינה המלאכותית מנטל תקציבי לנכס אסטרטגי שמוביל את השוק.
ורה שולמן היא מנכ"לית Profisea (פרופיסי) המפתחת פתרונות לניטור, ניהול ואופטימיזציה של תשתית הענן הציבורי 

תגיות:

תשתית ענן

Tokenomics