סגור
באנר דסקטופ כלכליסט טק
צ'ט גיפיטי ChatGPT from OpenAI
ChatGPT from OpenAI (Photo:aileenchik/Shutterstock)

OpenAI מגיבה לאיום הסיני: משיקה לראשונה מודלי AI בקוד פתוח חלקית

לראשונה מאז חשיפת ChatGPT, מפרסמת OpenAI מודלים חדשים שחושפים חלק מהפרמטרים הפנימיים – זאת בתגובה לתחרות הגוברת מצד מודלים פתוחים מסין. לדברי החברה, המהלך נועד לאפשר הרצה מקומית ולקדם את הדור הבא של פיתוחי AI, אך החשש משימוש לרעה עדיין מרחף מעל התעשייה

לראשונה מאז חשיפת ChatGPT משיקה OpenAI מודלים בקוד פתוח חלקית. "זה יסייע לנו להתקדם לפריצת הדרך הבאה", אמר נשיא ומייסד החברה, גרג ברוקמן, לניו יורק טיימס.
אף שהחלה את דרכה כמוסד ללא מטרות רווח, ואף השיקה את המודלים הראשונים שלה בקוד פתוח, מאז שחשפה את ChatGPT בסוף 2022 כל המודלים של OpenAI היו זמינים בקוד סגור בלבד. כלומר, גורמים חיצוניים לא היו יכולים "להרים את מכסה המנוע", לבחון, להבין ולשנות את הקוד שביסוד המודל. בחברה טענו שעברו למודל סגור על רקע חששות בטיחות, ומומחים שונים הזהירו גם הם מהסכנות של מודלים פתוחים שאין דרך לפקח על השימוש שנעשה בהם.
ואולם, המצב השתנה כשדיפסיק (DeepSeek) השיקה בקוד פתוח מודל AI חושב, שהיה דומה ביכולותיו למודלים של OpenAI וחברות מערביות אחרות. ההשקה הרעידה כמה מתפיסות היסוד של האקוסיסטם, ואלצה חברות לשקול מחדש אסטרטגיות ושיטות פעולה מושרשות. הסכנה של מודלי קוד פתוח הפכה למשנית לסכנה של אבדן הבכורה של ארה"ב בתחום לסין.
ועתה, מגיבה OpenAI לסכנה זו עם השקה של שני מודלים חדשים בקוד פתוח חלקית, במטרה לתת מענה למודלים הפתוחים של דיפסיק ושל חברות אחרות. המודלים לא מונגשים בקוד פתוח מלא, ורק הפרמטרים שלהם זמינים באופן שקוף. בפרט, החברה חושפת את הערכים המספריים של המודלים ואת ההתאמות שהם עברו בהליך האימון שלהם, מה שיאפשר למפתחים להבין אותם טוב יותר ולבצע בהם התאמות. עם זאת, היא לא חושפת את מידע האימון שלהם, ולכן הם לא עונים להגדרה של מודלים בקוד פתוח באמת.
המודלים, gpt-oss-120b ו-gpt-oss-20b, לא מציגים ביצועים מתקדמים כמו אלו של המודלים העצמתיים ביותר של OpenAI, אבל לדברי החברה הם עדיין מדורגים בין המודלים המובילים בעולם לפי מבדקים מקובלים. הם מסוגלים לג'נרט טקסט, ולבצע מטלות כמו כתיבת קוד וחיפוש ברשת, אך לא לג'נרט תמונות או וידאו. המודלים יהיו זמינים בפלטפורמת Hugging Face, שמארחת מודלי ותוכנות AI. "אם אתה מוביל בקוד פתוח, זה אומר שבקרוב תוביל ב-AI", אמר מנכ"ל Hugging Face, "זה מאיץ התקדמות".
לדברי OpenAI, היא השיקה את המודלים מכיוןן שעסקים ופרטים מסוימים מעדיפים להריץ טכנולוגיות אלו בסביבה מקומית. את gpt-oss-20b ניתן להריץ על מחשב נייד עם זיכרון של 16 ג"ב. gpt-oss-120b דורש מעבד AI של 80 ג"ב. בחברה מקווים גם ששימוש במודלים הפתוחים והחינמיים ידחוף משתמשים לעבר המודלים בתשלום המתקדמים יותר שלה. "אם אנחנו מספקים מודל, אנשים משתמשים בנו", אמר ברוקמן לניו יורק טיימס. "הם תלויים בנו לספק את פריצת הדרך הבאה. הם מספקים לנו משוב ודאטה ומה שדרוש כדי לשפר את המודל. זה עוזר לנו לרשום התקדמות נוספת".
עם זאת, הסכנות שמייצרים מודלי קוד פתוח – החל משימוש בהם ליציר והפצה של פייק ניוז והסתה, עבור בפיתוח כלים למתקפות סייבר ועד חששות, תיאורטיים יותר, של שימוש בהם בפיתוח נשק ביולוגי, תמרון ופגיעה בשוק המניות או שיבוש פעילות עסקית וממשלתית – עדיין קיימים. ברוקמן ציין בהקשר זה שמדובר בסכנה שקיימת עם כל טכנולוגיה עוצמתית, וש-OpenAI השקיעה חודשים ושנים בבנייה ובבחינה של המודלים במאמץ להפחית את הנזק שהם עלולים לגרום.