סגור
באנר דסקטופ כלכליסט טק
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה (צילום: David Paul Morris/Bloomberg)

הוועידה השנתית של אנבידיה: חשפה את מעבד ה-AI בלקוול אולטרה

המייסד והמנכ"ל ג'נסון הואנג ניסה להרגיע את החששות בשוק ביחס לגורל החברה שאיבדה טריליון דולר בשווי השוק תוך חודשיים; בלקוול אולטרה צפוי להגיע לשוק במחצית השנייה של השנה; כן חשפה את דיינמו - סביבת תוכנה בקוד פתוח לניהול שלב ההיסק של מודל AI, שפותח במרכז החברה ביקנעם

האם אנבידיה תשרוד את השיבוש של דיפסיק (DeepSeek) הסינית? הערב (ג') מקיימת ענקית הטכנולוגיה את ועידת המפתחים השנתית שלה באצטדיון SAP Center בסן חוזה, קליפורניה, והיא כוללת את הנאום המרכזי של המייסד והמנכ"ל ג'נסן הואנג.

הואנג הבהיר שלמרות כניסת דיפסיק, הביקוש לכוח מחשוב של מערכות AI רק יגדל: "דרישות המחשוב של AI יותר חסונות, ומאיצות במהירות. כמות המחשוב שאנחנו צריכים בגלל סוכני AI ומודלים חושבים הם פי 100 מכפי שחשבנו בזמן הזה בשנה שעברה. מודל AI חושב מפרק בעיה לשלבים, בוחן דרכים שונות לטפל בה, אולי פותר אותה בדרכים שונות, ובוחר את התשובה הטובה ביותר, ואז גם מוודא שזו התשובה הטובה ביותר. בעבר, ChatGPT לא ידע להתמודד עם שאלות מורכבות, כי ביצע רק ניסיון אחד לענות על כל שאלה. מודל חושב חושב צעד צעד ועושה שימוש בטכניקות שונות. כתוצאה, היקף התכנים (טוקנים) שמיוצר גדל משמעותית. המודלים מורכבים יותר, מייצרים פי 10 יותר טוקנים ואנחנו צריכים הרבה יותר כוח מחשוב. גדול בצורה דרמטית מבעבר".
ההכרזה המצופה ביותר היתה על הדור הבא של מעבדי ה-AI של החברה – בלקוול אולטרה (Blackwell Ultra), שיגיע לשוק במחצית השנייה של השנה. מעבדי AI הם המנוע של מהפכת הבינה המלאכותית הגנרטיבית (GenAI). אנבידיה שולטת ביד רמה באספקת מעבדים אלו, עם נתח שוק שמוערך בכ-80%, והם נמצאים בלב ההצלחה הקולוסאלית של החברה בשנים האחרונות. עם זאת, מאז חשפה דיפסיק (DeepSeek) הסינית בינואר את מודל ה-GenAI החושב שלה R1, שמציג ביצועים דומים למודלים של חברות מובילות אך שאומן בשבריר מכוח המחשוב שדרשו אותם מודלים, מתמודדת אנבידיה עם חששות מירידה לביקוש במעבדי ה-AI שלה. חששות אלו נמצאים ברגע אובדן שווי שוק של אנבידיה בהיקף של כטריליון דולר מאז נחשף המודל.

3 צפייה בגלריה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
הצגת הבלקוול
(צילום: David Paul Morris/Bloomberg)

בלקוול אולטרה, אומרת אנבידיה, פותח על מנת לספק מענה לסגמנט ההפעלה של המודל (שמכונה Inference או היסק) של פעילות מודלי AI. השבב, בעוצמה של 288 גיגה-בייט, יהיה הבסיס לארון שרתים חדש בשם GB300 NVL72 עם 72 שבבי בלקוול אולטרה ו-36 שבבי מחשב (CPUs). הוא מציג שיפור של פי 1.5 בכוח ההסקה לעומת הדור הקודם, ופי 35 לעומת דור השבבים שלפניו (שהם עדיין הנפוצים בשוק), ושיפור של פי 30 ביעילות האנרגטית לעומת הדור הקודם. 5 ארונות שרתים כאלו יהיו שווים בערך לכל עוצמת המחשוב של מחשב-העל של אנבידיה ישראל-1 (אחד מ-35 מחשבי-העל החזקים בעולם). שבבי התקשורת של ארון השרתים פותחו במרכז המו"פ של אנבידיה ביוקנעם.
"הבינה המלאכותית עשתה זינוק אדיר", אמר הואנג, בוועידת המפתחים. "Reasoning וסוכני AI דורשים כמויות עצומות פי כמה וכמה של כוח מחשוב. פיתחנו את בלקוול אולטרה בדיוק עבור הרגע הזה. מדובר בפלטפורמה ורסטילית אחת שיכולה לבצע קדם-אימון, בתר-אימון והיסק במודלי AI חושבים באופן קל ויעיל״.
לגבי מפת הדרכים של החברה לשנתיים הקרובות: במחצית השנייה של 2026 מתעדת אנבידיה להשיק את דור חדש של מעבדי AI בשם רובין, ושנה לאחר מכן את רובין אולטרה. לצידם מתעדת אנבידיה להשיק מעבד מחשב (CPU) חדש בשם Vera, שתוכנן במרכז המו"פ של החברה ביקנעם. למעבד זה 88 ליבות בארכיטקטורה של Arm, ומתג תקשורת NVLink-2C2, שתוכנן גם הוא ביקנעם.
במהלך האירוע חשפה אנבידיה את דיינמו (Dynamo), סביבת תוכנה בקוד פתוח לניהול שלב ההיסק של מודל AI, שפיתחה החברה בישראל. המערכת מאפשרת לשפר ביצועים, להפחית עלויות תפעול ולקצר זמני תגובה של מודלים חושבים, באמצעות שימוש יעיל, חכם ומבוזר יותר במעבדי ה-AI בדאטה-סנטר. המערכת מאפשרת לעשות שימוש בעד אלף מעבדי AI בו-זמנית למענה לפרומפט אחד, לשפר עד פי 30 את הביצועים של מודלים חושבים מתקדמים כמו R1 ולייעל את תהליך ההיסק של המודל בצורה יעילה באמצעות זיהוי. הוא מאפשר להשתמש בעד אלף GPU על פרומפט אחד (בהתאם למורכבות של הפרומפט). היכולת הזו מאפשרת להאיץ עד פי 30 את הביצועים של מודלים מתקדמים כמו R1 תוך שימוש באותו כוח מחשוב.

3 צפייה בגלריה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
(צילום: David Paul Morris/Bloomberg)
בוועידת CES בינואר הכריזה אנבידיה על Project Digits – מחשבי-על שולחניים שיאפשרו לחוקרים ולפתח ולבדוק מודל AI בצורה מקומית. בוועידה היום חשפה החברה את המוצרים הראשונים בפרויקט. DGX Spark, שאנבידיה מכנה "מחשב-העל הקטן בעולם ל-AI", מבוסס על בלקוול ומסוגל לבצע עד ל-1,000 טריליון פעולות עיבוד AI בשנייה לצורך אופטימיזציה (Fine Tuning) או הסקה (Inference) של מודלים חושבים. הוא זמין לרכישה כבר עכשיו ויגיע ללקוחות ביולי. המחשב השני, DGX Station, הוא האח הגדול של Spark וכבר עושה שימוש בבלקוול אולטרה. הוא יהיה זמין רכישה בהמשך השנה. שני המחשבים עושים שימוש בשבבי תקשורת שפותחו בישראל.

הפיתוחים של המרכז ביקנעם - בלב האירוע

חלק משמעותי נוסף באירוע הפתיחה של הואנג עסק בפתרונות שבבי התקשורת של החברה, שהפיתוח שלהם מובל על ידי מרכז המו"פ ביקנעם. ההכרזה המשמעותית בהקשר זה היתה שבבי סיליקון פוטוני, שלדברי אנבידיה מייצרים מהפכה בפתרונות תשתיות תקשורת בדאטה-סנטרים
שבבי או מתגי תקשורת הם חלק מהותי בדאטה-סנטר, שכן אם המעבדים השונים בשרתים לא יכולים לתקשר זה עם זה ועם שרתים אחרים במהירות עצומה, אין משמעות לכוח המחשוב שלהם. אחד מצווארי הבקבוק בתשתית הזו הוא הממיר האופטי, שמחשב בין כל שבב AI למתגי תקשורת וממיר את האור מהסיב האופטי לחשמל בעבור שבב ה-AI, ולהפך. ממירים אלו צורכים 10% מכוח המחשוב בדאטה-סנטר. בדאטה-סנטר עם 400 אלף שבבי AI, יש 2.4 מיליון ממירים אופטיים שצורכים 40 מגה-ווט אנרגיה.

3 צפייה בגלריה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
מנכ"ל אנבידיה ג'נסן הואנג בוועידה השנתית של החברה
הואנג במהלך האירוע
(צילום: David Paul Morris/Bloomberg)
שבבי הסיליקון הפוטוני (Silicon Photonics) שחשפה אנבידיה – QuantomX ו-SpectrumX – מייתרים את הצורך בממירים אופטיים ומעבירים את הליך המרת האור לחשמל לתוך שבב התקשורת עצמו. באופן זה, אומרת אנבידיה, ניתן להשיג שיפור פי 3.5 ביעילות האנרגטית, שיפור של פי 10 בעמידות הרשת (פחות נקודות כשל ברשת שבהן יכול להיעלם מידע), ושיפור של 30% בזמן ההקמה של דאטה-סנטרים. SpectrumX יגיע לשוק במחצית השנייה של 2025 ו-QuantomX שנה לאחר מכן.
לדברי אנבידיה, פתרון זה יאפשר להגדיל משמעותית את כוח המחשוב של דאטה-סנטרים, לדחוס הרבה יותר כוח מחשוב לאותן יחידות של צריכת אנרגיה ומרחב פיזי, ותיאורטית להקים דאטה-סנטרים עם מיליון שבבי AI (דבר שלא אפשרי מעשית עם ממירים אופטיים). מדובר בהישג פיתוחי משמעותי, תוצאה של מאמצים שהחלו לפני יותר מחצי עשור, עוד בטרם רכשה אנבידיה את מלאנוקס והפכה אותה לבסיס למרכז המו"פ המקומי שלה.
"מפעלי בינה מלאכותית הם של דאטה-סנטרים בקנה מידה גדול באופן קיצוני, ויש להמציא מחדש את תשתית הרשת כדי לעמוד בקצב", אמר הואנג. "על ידי שילוב סיליקון פוטוני ישירות במתגים, אנבידיה מנפצת את המגבלות הישנות של רשתות בקנה מידה גדול, ופותחת את השער למפעלי בינה מלאכותית של מיליון שבבי AI".
פיתוח אחר של אנבידיה עוסק בסוכני בינה מלאכותית (Agentic AI), מודלים שמסוגלים לבצע פעולות אוטונומיות ומשמשים, למשל, בהפעלת מוקדי שירות לקוחות. אנבידיה הציגה מודל AI חושב שפיתחה על בסיס מודל השפה הגדול (LLM) של מטא, Llama, שמיועד לסייע לחברות שמפתחות סוכני AI. בטכנולוגיה זו, שגם בפיתוחה היה מעורב מרכז המו"פ בישראל, כבר משתמשות חברות כמו מיקרוסופט, סיילספורס ואמדוקס.
תחום נוסף שאנבידיה והואנג להוטים לקדם הוא מערכות רובוטיות, או כמו שמכנה החברה AI פיזי (Physical AI), ובפרט רובטים דמויי אדם. בהקשר זה הציגה החברה עם Isaac GR00T N1, מודל בסיס לרובוטים הומוניאידים בקוד פתוח, שעבר כבר את שלב האימון הבסיסי ומונגש לחברות שמבקשות לפתח רובוטים כאלו ויכולות להשתמש במודל על מנת לקצר משמעותית את הליכי הפיתוח והאימון של מודל ההפעלה של הרובוטים שלהן.
לדברי החברה, המודל כולל ארכיטקטורת מערכת-כפולה, ששואבת מהקוגניציה האנושית. "מערכת-1" היא מודל שחושב מהר, ומדמה רפלקסים ואינטואיציה אנושיים. "מערכת-2" היא מודל שחושב לאט עבור קבלת החלטות שיטתית ומכוונת. מערכת-2 חושבת על הסביבה ועל ההוראות שקיבלה, על מנת לתכנן את הצעדים הבאים, בשעה שמערכת-1, מנגד, מתרגמת את התוכניות האלו לתנועות מדויקות של הרובוט.
הכותב הוא אורח אנבידיה בוועידה