הפרויקט החדש של מייסד OpenAI יאפשר לכם לערוך סיעור מוחות בין כמה מודלים
אנדריי קרפטי, אחד ממייסדי OpenAI, פיתח כלי בקוד פתוח שמאפשר להפעיל מספר מודלי שפה במקביל, לאסוף את תשובותיהם ולבקש מהם לדרג זה את זה. הכלי כולל את המודלים המובילים בשוק - GPT-5.1, ג'מיני 3 פרו, קלוד סונט 4.5 וגרוק 4 - ומייצר בסופו של דבר תשובה משולבת אחת. איזה מודל דורג כטוב ביותר?
אנדריי קרפטי, אחד ממייסדי OpenAI, שיתף לאחרונה פרויקט שעליו עבד ומאפשר לערוך סיעור מוחות בין כמה מודלי שפה וכך לקבל את התשובה הטובה ביותר. קרפטי שחרר את הפרויקט בקוד פתוח - והוא זמין בגיטהאב.
בין המודלים ב-LLM Council ניתן למצוא את GPT-5.1 של OpenAI, ג'מיני 3 פרו של גוגל, קלוד סונט 4.5 של אנתרופיק וגרוק 4 של xAI. כך, במקום לבחור במודל המועדף עליכם, תוכלו לקבץ אותם ל"מועצת מודלי שפה" משלכם. מדובר באפליקציה שנראית כמו ChatGPT, אך למעשה שולחת את השאילתה שלכם למספר מודלי שפה, מבקשת מהם לדרג את התשובות אחד של השני ולבסוף "יו"ר המועצה" מייצר את התשובה הסופית.
אז איך זה עובד? בשלב הראשון, האפליקציה אוספת את חוות הדעת של כל "חברי המועצה", ומציגה אותן למשתמש כך שיוכל לבדוק כל אחת מהן בנפרד. בשלב השני, כל מודל שפה מקבל את תשובותיהם של המודלים האחרים באופן אנונימי ומתבקש לדרג אותן. בשלב השלישי כל התשובות מאוגדות לתשובה אחת המוצגת למשתמש.
בפוסט ב-X כתב קרפטי כי הוא עבד על הפרויקט כ"פרויקט וייב קודינג (קידוד עם AI - רב"ש) כיפי ליום שבת". קרפטי ציין כי "לעתים קרובות למדי, המודלים מוכנים באופן מפתיע לבחור בתשובה של מודל אחר כעדיפה על שלהם". למשל, במשימה של קריאת ספרים "הם משבחים באופן עקבי את GPT-5.1 כמודל הטוב והתבוני ביותר, ובוחרים באופן עקבי את קלוד כמודל הגרוע ביותר".
אולם לדברי קרפטי, "אני לא משוכנע ב-100% שזה תואם את ההערכה האיכותית שלי. לדוגמה, מבחינה איכותית אני מוצא את GPT-5.1 קצת יותר מילולי ומרחיב, ואת ג'מיני 3 קצת יותר מרוכז ומעובד. קלוד תמציתי מדי בתחום הזה".
אנדריי קרפטי היה בין המייסדים של OpenAI, עד שעבר לטסלה ב-2017, שם שימש כמנהל תחום ה-AI. בפברואר 2023 חזר קרפטי ל-OpenAI, ועזב אותה שוב שנה לאחר מכן. כיום הוא עומד בראש חברת Eureka Labs אותה ייסד, שעוסקת ב-AI בחינוך. קרפטי הוא גם זה שטבע את המונח "וייב קודינג" המשמש בפי רבים כיום.






























