סגור
באנר דסקטופ כלכליסט טק
אנציקלופדיה בריטניקה
אנציקלופדיה בריטניקה (צילום: PxHere)

אנציקלופדיה בריטניקה תובעת את OpenAI: "העתיקה כמעט 100 אלף מאמרים"

בריטניקה ומרים-וובסטר טוענות כי ChatGPT מג'נרט תשובות שמחקות את תכניהן מילה במילה, ובכך גוזל את התעבורה לשירותיהן. OpenAI דוחה את הטענות: "המודלים מאומנים על מידע זמין פומבית על בסיס שימוש הוגן"

אנציקלופדיה בריטניקה והחברה הבת מרים-וובסטר תובעות את OpenAI בטענה שחברת ה-AI עושה שימוש לא חוקי בערכים ובהגדרות המילוניות שלהן באימון ובהפעלה של המודלים שלה.
"ChatGPT מבוסס על טרמפ שלקחו המשיבים על תוכן אמין ואיכותי – שנוצר על ידי עבודה מסורה של חוקרים, כותבים, עורכים ויוצרים אנושיים – באמצעות קניבליזציה של התעבורה עם סיכומי AI של התוכן של המבקשים עצמם", נכתב בתביעה שהוגשה ביום שישי לבית משפט פדרלי מחוזי במנהטן.
OpenAI וחברות אחרות בתחום מתמודדות עם שורה של תביעות זכויות יוצרים שהגישו סופרים, אמנים, מו"לים וגופי חדשות. במרכזן, הטענה שהמודלים אומנו על הספרים, היצירות והידיעות שלהם, ושהחברות השתמשו בידע זה על מנת לשפר את המודלים, תוך הפרת זכויות יוצרים ובלי לספק פיצוי הולם ליוצרים.
בתביעה שהגישו, טוענות בריטניקה ומרים-וובסטר לא רק להפרת זכויות יוצרים, אלא גם לכך שפעילות הצ'טבוט של OpenAI, שמבוססת על הערכים וההגדרות שלהן, מביאה לפגיעה בתעבורה לשירותיהן. "ChatGPT גוזל ממו"לים מקוונים הכנסות באמצעות ג'ינרוט תשובות לשאלות משתמש שמחליפות, ומתחרות ישירות, עם התוכן שלהם. על מנת לבנות מוצרים חלופיים, המשיבים עסקו בהעתקה מאסיבית של תוכן מוגן בזכויות יוצרים בלי אישור או פיצוי", נטען בתביעה.
לטענת בריטניקה, לצורך אימון ChatGPT העתיקה OpenAI כמעט 100 אלף מאמרים מקוונים מהאנציקלופדיה. "באופן צפוי, בתגובה לשאילתות משתמשים ChatGPT מג'נרט תשובות שמעתיקות או מחקות, לעתים מילה במילה, את התוכן של המבקשות".
כך, לדוגמה, במענה לפרומפט שביקש להציג את התוכן המדויק של הערך "חינוך" מבריטניקה, ChatGPT ג'ינרט תשובה כמעט זהה לערך. ובמענה לפרומפט "איך מרים-וובסטר מגדיר 'גניבה ספרותית'", ChatGPT הגיב עם ההגדרה המדויקת מהמילון. הצ'טבוט שמח גם לצטט את המקורות בפרומפטים שלו שכללו התייחסות ישירה למוצרי התובעות. במענה לפרומפט "ספר לי 'עשרה דברים שאני צריך לדעת על הדו-קרב בין המילטון לבר, לפי בר (במחזמר) המילטון'", ChatGPT בחר ציטוטים מדויקים מתוך מאמר של בריטניקה עם כותרת דומה.
טענה נוספת עוסקת בהזיות של ChatGPT: "המשיבים גם מפרים את הסימנים הרשומים של המבקשות כ-ChatGPT מג'נרט תוכן מומצא, ומייחס אותו למבקשות. המשיבים גם מפרים זכויות יוצרים כאשר ChatGPT משמיט תוכן בלי לציין השמטות אלו, ומציג העתקים לא שלמים ולא מדויקים לצד הסימנים הרשומים של המבקשות". מ-OpenAI נמסר בתגובה לרויטרס: "המודלים שלנו מניעים חדשנות, ומאומנים על מידע זמין פומבית על בסיס שימוש הוגן".