סגור
באנר דסקטופ כלכליסט טק
פנאי שרה סילברמן
שרה סילברמן. מה ששלי ( צילום: אי פי אי)

אמנים נגד AI: המלחמה בעיצומה

שרה סילברמן והסופרים ריצ'רד קדרי וכריסטופר גולדן הגישו תביעות נגד מטא ו-OpenAI בגין הפרת זכויות יוצרים. "עסקי הבינה המלאכותית בשווי מיליארדי דולרים שלהם נבנו על צירת רווחים מהנתונים האישיים של משתמשי אינטרנט". גלגלי המהפכה הגנרטיבית, מסתמן, חייבים להאט

בחודשים האחרונים הוגשו תביעות שונות נגד חברות שמפתחות מוצרי בינה מלאכותית גנרטיבית. האחרונה שביניהן הוגשה על ידי הקומיקאית שרה סילברמן ושני סופרים (ריצ'רד קדרי וכריסטופר גולדן) שהגישו תביעות על הפרת זכויות יוצרים נגד מטא ו-OpenAI. השלושה טוענים כי החברות השתמשו בחומרים שלהם, המוגנים בזכויות יוצרים, כדי לאמן את הצ'אטבוטים שלהן. "הסיכומים טועים בכמה פרטים", אך עדיין מראים ש-ChatGPT "שומר ידע על עבודות מסוימות במערך ההדרכה", נכתב בתביעה.
תביעה זו ואחרות מבקשות לאתגר את ההנחה הטבעית של הפועלים בתחום כי האינטרנט הוא לא רק נחלת הכלל הדיגיטלית, אלא גם מקור ממנו ניתן לשאוב מה שרוצים, ללא כל הגבלה או רשות. "הנתבעים התעשרו שלא בצדק על ידי גניבת המידע האישי שביצעו, שכן עסקי הבינה המלאכותית בשווי מיליארדי דולרים שלהם, לרבות ChatGPT ואחרים, נבנו על קצירה ויצירת רווחים מהנתונים האישיים של משתמשי אינטרנט", נכתב בתביעה אחרת שהוגשה בקליפורניה בשלהי יוני נגד OpenAI ובעלת המניות הגדולה שלה מיקרוסופט, שכוללת דרישה לפיצויים בהיקף של 3 מיליארד דולר.
השתיים נאשמות על ידי 13 תובעים אנונימיים כי אספו ללא אישור או תשלום נתונים אישיים מהאינטרנט, לרבות שמות, פרטי קשר, כתובות דוא"ל, פרטי תשלום ופוסטים ברשתות החברתיות. שם גם משווים את החברה ל-Clearview AI, שהפכה ידועה לשמצה לאחר שאספה תמונות מהרשתות החברתיות כדי לבנות מערכות זיהוי פנים שמכרה למשטרה. Clearview AI נתבעה גם היא על הפרת פרטיות ובעקבות זאת החברה הפסיקה להציע את שירותיה.
בכתב התביעה, התובעים מבקשים שורה של סעדים. ראשית, לחשוף אילו נתונים נאספים וכיצד נעשה בהם שימוש, אחר כך לחייב את OpenAI ואת מיקרוסופט לפצות את התובעים על הנתונים הגנובים שלהם בהיקף של 3 מיליארד דולר, ולבסוף לאפשר למשתמשים את הזכות לבטל את הסכמתם לכל איסוף נתונים. במקרה יוצא דופן אחד במרץ שנה שעברה, חברת שומרי משקל העולמית נדרשה על ידי ה-FTC למחוק את האלגוריתם שפיתחה מכיוון שהתבסס על קצירת נתונים אסורה.
בנובמבר הוגשה נגד השתיים גם תביעה ייצוגית על ידי מתכנתי GitHub שטענו ש-GitHub Copilot - כלי בינה מלאכותית בבעלות מיקרוסופט - הפר את רישיונות הקוד הפתוח שלהם והשתמש בקוד שלהם להדרכה ללא רשותם. בשלהי יוני הוגשה תביעה ייצוגית נוספת, הפעם רק נגד OpenAI, בגין הפרת זכויות יוצרים. על ידי שני סופרי רבי מכר אמריקאים - מונה אווד ופול טרמבלי. השניים טוענים כי OpenAI אימנה את המודלים שלה בין השאר על הספרים שלהם (לפחות שניים מהם), המוגנים בזכויות יוצרים.
התובעים טוענים כי משום ש-OpenAI מודה שאימנה את המודלים שלה על קורפוסים ענקיים של ספרים - וכאלה קיימים בגישה חופשית רק בספריות צללים (אתרי אינטרנט פיראטיים שמהווים מאגרי מאמרים וספרים אלקטרוניים). "מכיוון שמודלי השפה של OpenAI אינם יכולים לתפקד ללא המידע האקספרסיבי שהופק מיצירות התובעים (ואחרים) ונשמר בתוכם", נכתב בתביעה, "מודלי השפה של OpenAI מפרים בעצמם יצירות נגזרות, שנוצרו ללא רשות התובעים ותוך הפרה של זכויותיהם הבלעדיות לפי חוק זכויות יוצרים".
את התביעה מייצג אותו משרד עו"ד שמייצג גם שורה ארוכה של אמנים שתבעו בינואר האחרון כמה פלטפורמות של הפיכת טקסט לתמונה, בהן Stability AI , MidJourney ו־DeviantArt בגין השימוש שלהן ב־StableDiffusion. לפי כתב התביעה, Stable Diffusion לקחה עבודות קיימות של אמנים והשתמשה בהן כנתוני אימון עבור המודל שלה, שבתורו יוצר נגזרות לאותן יצירות, לפעמים בכוונה באופן שמחקה את סגנונם הייחודי של האמנים, ומתחרה מולם כך בתחומם שלהם. לדברי התובעים, כ־5 מיליארד תמונות נלקחו ללא הסכמתם של אמנים שונים - מה שמהווה הפרה מאסיבית של חוק זכויות יוצרים עבור מיליונים. האמנים מבקשים לפיכך כי בטרם קצירת יצירותיהם לאימון המודל החברה תידרש להשיג את הסכמתם המפורשת ולשלם על הפעילות.
תביעות פרטניות אלה מצטרפות לצבר הולך וגדל של הליכים משפטיים ורגולטוריים אחרים. באיטליה, לדוגמה, חסמו את השימוש ב-ChatGPT כאמצעי זהירות, והרגולטורים בצרפת, גרמניה, אירלנד וקנדה חוקרים את האופן שבו OpenAI אוספת ומשתמשת בנתונים. החשש המשותף לכולם הוא שהחברה מפרה כללי יסוד שכוללים את זכותם של משתמשים על הנתונים שלהם, כמו גם את הכוח לתקן או למחוק נתונים בהם משתמשים. בעקבות הליכים אלה, הודיעה OpenAI כי היא "פועלת להסיר מידע אישי מנתוני ההדרכה על פי בקשה במידת האפשר".
מבול התביעות הסזה לא מגיע בהפתעה. עד כה אימון של מודלים גדולים לא כלל בסופם פלט "יצירתי" או לפחות כזה שמתיימר להיות חדש. האימון גם לא כלל מוצרים ששווקו אחר כך לציבור הרחב כדי שיוכל לעשות בו כרצונו ולהפיק תוצרים שמתחרים באופן ישיר עם עבודתם של אלו שעבודתם שימשה את נתוני המודל.
לנקודה זו בדיוק נדרשו רגולטורים ברחבי העולם ורובם ככולם מחזיקים בדעה שעד כה השימוש במידע שנקצר מהאינטרנט חסה תחת רעיון "שימוש הוגן". גם בישראל, גילוי דעת מיוחד ממשרד המשפטים פורסם בנושא בקיץ האחרון ושם נקבע כי "שימוש בתכנים מוגנים לשם אימון מכונה יהווה שימוש הוגן". עם זאת, גם בגילוי דעת זה וגם באחרים מציינים כי דבר זה אינו תקף בנוגע לשימוש ביצירות בודדות שנועדו "להתחרות ביוצרים אלו בשווקים שהם פועלים".
האם אתגרים רגולטוריים מסוג זה יחנקו את החדשנות? אם תשאלו את החוקרת קאריסה וליז, התשובה לא נחרצת. "חדשנות שמובילה לשחיקת הזכויות והדמוקרטיה אינה קידמה", היא כותבת, "ניתן לעצב אחרת בינה מלאכותית, לא גרוע יותר, רק בהתאם לזכויות בדמוקרטיות ליברליות".