"איזון בין עלות לביצועים": אנתרופיק משיקה מודל חדש מסדרת קלוד סונט
Claude Sonnet 5 מציע ביצועים קרובים לאופוס 4.8 בעלות נמוכה משמעותית, וזול יותר גם מ-GPT-5.5 של OpenAI ומ-Gemini 3.1 Pro של גוגל. באנתרופיק מציינים כי המודל מסיים משימות אייג'נטיות מורכבות מקצה לקצה ומפגין פחות הזיות וחנפנות מקודמו, אך עדיין נחות מאופוס ומיתוס
אנתרופיק השיקה הערב את קלוד סונט 5 (Claude Sonnet 5) - גרסה חדשה וחזקה יותר בסדרת סונט, המודל הבינוני של קלוד, עם יכולות אייג'נטיות משופרות. "הוא יכול לבנות תוכניות, להשתמש בכלים כמו דפדפנים וטרמינלים, ולפעול באופן אוטונומי ברמה שעד לפני כמה חודשים בלבד דרשה מודלים גדולים ויקרים יותר", נכתב בפוסט בבלוג של אנתרופיק. המודל החדש זמין כעת לכל המשתמשים, גם החינמיים (עם מכסה מוגבלת יותר ממנויים משלמים).
סונט 5 מבטיח ביצועים קרובים לאלו של אופוס 4.8, המודל המתקדם של קלוד, אך בעלויות נמוכות בהרבה. לרגל ההשקה, המחיר של סונט 5 יעמוד על 2 דולרים למיליון טוקנים בקלט ו-10 דולרים למיליון טוקנים בפלט עד 31 באוגוסט, ולאחר מכן המחיר יקפוץ ל-3 דולרים למיליון טוקנים בקלט ו-10 דולר למיליון טוקנים בפלט. משמע, סונט 5 זול יותר גם מ-GPT-5.5 של OpenAI ומ-Gemini 3.1 Pro של גוגל (הוא עדיין יקר יותר מ-Gemini 3.5 Flash).
המודל החדש גם מציג שיפורים משמעותיים לעומת קודמו, סונט 4.6, שהושק בפברואר, במיומנויות כמו הסקה, שימוש בכלים, תכנות וידע, כך לפי אנתרופיק. "אופוס 4.8 הוא עדיין המודל המועדף לדיוק גבוה יותר במשימות הללו, אך סונט 5 מספק למפתחים אפשרויות זולות יותר שהן באיכות גבוהה בהרבה ממה שהיה זמין בעבר", אומרים באנתרופיק. "בין סונט 5 ל-אופוס 4.8, משתמשים יכולים לכוונן את רמת המאמץ כדי למצוא את האיזון הנכון בין עלות לביצועים".
לפי אנשי מקצוע שבדקו את המודל וצוטטו בפוסט בבלוג, סונט 5 גם מצטיין בסיום משימות מורכבות שבהן גרסאות קודמות של המודל היו עוצרות באמצע, והוא "בודק את הפלט שלו בעצמו בלי שמבקשים זאת ממנו במפורש". לדברי דניאל שפרד, מהנדס בכיר בזאפייר, "נתנו ל-Claude Sonnet 5 משימה דו-שלבית - לעדכן את רמות החשבונות בסיילספורס, לשלוח הודעת השקה ללקוחות ארגוניים - והוא סיים אותה מקצה לקצה. בעבר זה היה נתקע באמצע. לאוטומציה יומיומית, זו החלטה ברורה".
מבחינת בטיחות, המודל החדש גם מציג שיעור נמוך יותר של "התנהגויות לא רצויות", כמו שיתוף פעולה עם ניצול לרעה והטעיה, לעומת קודמו, מה שהופך אותו לבטוח יותר לשימוש בהקשרים סוכניים. הוא גם סובל מפחות הזיות ומפגין התנהגות חנפנית בשיעור נמוך יותר מ-סונט 4.6.
עם זאת, הוא לא ברמה של אופוס 4.8 וקלוד מיתוס מבחינת התנהגות שאינה תואמת את כוונות המשתמש (misaligned). "ההערכות גם מראות שיש לו יכולת נמוכה בהרבה לבצע משימות סייבר מסוכנות בהשוואה למודלי אופוס הנוכחיים שלנו", נכתב בפוסט בבלוג.
השקת המודל החדש מגיעה אחרי שהממשל האמריקאי החליט להגביל את הפצתם של קלוד מיתוס וקלוד פייבל, המודלים החזקים ביותר של אנתרופיק, בשל חששות ביטחוניים מיכולותיהם המתקדמות, בעיקר בתחומי סייבר. לפני מספר ימים אפשר הממשל לשחרר את מיתוס ליותר מ-100 גופים בארה"ב.































