המתנות של אנבידיה מעוותות את נתוני המשק

אדריאן פילוט

השוק שמגלגל 2 טריליון דולר בחודש עושה עלייה לישראל

שקד גרין ערבה

סוף לפטור הבריטי: המהלך שישים קץ לתופעת הבניינים הנטושים?

אמיתי גזית

אחרי 40 שנה בענף: חברת הבנייה הוותיקה קרסה לאחר חובות של 107 מיליון שקל

ליטל דוברוביצקי

אחרי הלחץ הרגולטורי: ריינאייר תאפשר להורים לשבת לצד ילדיהם מבלי לשלם

חדשות חוץ

נסיגה חזקה בשקל: הדולר על 3 שקלים, היורו מעל 3.42

מיקי גרינפלד

בזק הודיעה על רכישה עצמית של מניות ב-800 מיליון שקל

עומר כביר

הנצפות ביותר בערוץ

רחפני תקיפה: 6 טרנדים מסוכנים מאוקראינה שעלולים להגיע ללבנון

בדרך לניהול הכסף של ההייטקיסטים: הייטקזון קונה בית השקעות

פיטורי ה-AI מגיעים גם לאלמנטור: נפרדת מ-100 עובדים, 30% מכוח האדם

סרטונים מומלצים

סאקר 358: הכטב"מ האיראני שטרף את האפאצ'י ומסכן גם מטוסי נוסעים

צדות מיכליות, חומקות מהאפאצ'י: סירות הקרב המפתיעות של איראן

LLM Council (צילום: Andrej Karpathy, X)

הפרויקט החדש של מייסד OpenAI יאפשר לכם לערוך סיעור מוחות בין כמה מודלים

אנדריי קרפטי, אחד ממייסדי OpenAI, פיתח כלי בקוד פתוח שמאפשר להפעיל מספר מודלי שפה במקביל, לאסוף את תשובותיהם ולבקש מהם לדרג זה את זה. הכלי כולל את המודלים המובילים בשוק - GPT-5.1, ג'מיני 3 פרו, קלוד סונט 4.5 וגרוק 4 - ומייצר בסופו של דבר תשובה משולבת אחת. איזה מודל דורג כטוב ביותר?

רני בן שאול

16:47, 24.11.25

אנדריי קרפטי, אחד ממייסדי OpenAI, שיתף לאחרונה פרויקט שעליו עבד ומאפשר לערוך סיעור מוחות בין כמה מודלי שפה וכך לקבל את התשובה הטובה ביותר. קרפטי שחרר את הפרויקט בקוד פתוח - והוא זמין בגיטהאב. 
בין המודלים ב-LLM Council ניתן למצוא את GPT-5.1 של OpenAI, ג'מיני 3 פרו של גוגל, קלוד סונט 4.5 של אנתרופיק וגרוק 4 של xAI. כך, במקום לבחור במודל המועדף עליכם, תוכלו לקבץ אותם ל"מועצת מודלי שפה" משלכם. מדובר באפליקציה שנראית כמו ChatGPT, אך למעשה שולחת את השאילתה שלכם למספר מודלי שפה, מבקשת מהם לדרג את התשובות אחד של השני ולבסוף "יו"ר המועצה" מייצר את התשובה הסופית.
As a fun Saturday vibe code project and following up on this tweet earlier, I hacked up an **llm-council** web app. It looks exactly like ChatGPT except each user query is 1) dispatched to multiple models on your council using OpenRouter, e.g. currently:

"openai/gpt-5.1",… https://t.co/gKvRibPLVe pic.twitter.com/yljZu0Vr8n
— Andrej Karpathy (@karpathy) November 22, 2025 

אז איך זה עובד? בשלב הראשון, האפליקציה אוספת את חוות הדעת של כל "חברי המועצה", ומציגה אותן למשתמש כך שיוכל לבדוק כל אחת מהן בנפרד. בשלב השני, כל מודל שפה מקבל את תשובותיהם של המודלים האחרים באופן אנונימי ומתבקש לדרג אותן. בשלב השלישי כל התשובות מאוגדות לתשובה אחת המוצגת למשתמש.
בפוסט ב-X כתב קרפטי כי הוא עבד על הפרויקט כ"פרויקט וייב קודינג (קידוד עם AI - רב"ש) כיפי ליום שבת". קרפטי ציין כי "לעתים קרובות למדי, המודלים מוכנים באופן מפתיע לבחור בתשובה של מודל אחר כעדיפה על שלהם". למשל, במשימה של קריאת ספרים "הם משבחים באופן עקבי את GPT-5.1 כמודל הטוב והתבוני ביותר, ובוחרים באופן עקבי את קלוד כמודל הגרוע ביותר".
אולם לדברי קרפטי, "אני לא משוכנע ב-100% שזה תואם את ההערכה האיכותית שלי. לדוגמה, מבחינה איכותית אני מוצא את GPT-5.1 קצת יותר מילולי ומרחיב, ואת ג'מיני 3 קצת יותר מרוכז ומעובד. קלוד תמציתי מדי בתחום הזה".
אנדריי קרפטי היה בין המייסדים של OpenAI, עד שעבר לטסלה ב-2017, שם שימש כמנהל תחום ה-AI. בפברואר 2023 חזר קרפטי ל-OpenAI, ועזב אותה שוב שנה לאחר מכן. כיום הוא עומד בראש חברת Eureka Labs אותה ייסד, שעוסקת ב-AI בחינוך. קרפטי הוא גם זה שטבע את המונח "וייב קודינג" המשמש בפי רבים כיום. 

תגיות: