סגור
דאנס 100

זכויות יוצרים ו-AI: האם מכונות יכולות לחלום על שימוש הוגן?

שבוע השימוש ההוגן החל בפברואר הוא הזדמנות טובה להרהר בשאלה אשר מעסיקה בתי משפט שונים ברחבי העולם – האם למידת מכונה לצורך אימון מודלים של בינה מלאכותית מהווה שימוש הוגן או הפרת זכויות יוצרים?

ספרו הידוע של פיליפ ק. דיק "האם אנדרואידים חולמים על כבשים חשמליות", עוסק בשאלה מהי המשמעות של להיות בן אנוש, לעומת מכונה. נראה כי בימים אלו סוגיה דומה עולה בתחום זכויות היוצרים, ובפרט בשאלה האם למידת מכונה לצורך אימון מודלים של בינה מלאכותית, באמצעות שימוש ביצירות מוגנות, מהווה הפרת זכויות יוצרים, או שמא גם מכונות יכולות לעשות שימוש הוגן ביצירות?

שימוש הוגן ביצירות מוגנות

עיקרון בסיסי בזכויות יוצרים, הוא כי על מנת לעשות פעולות מסוימות ביצירה מוגנת (ספר, סרט, תצלום או כתבה בעיתון למשל), יש לקבל את רשותו של בעל זכות היוצרים באותה היצירה, ועשיית פעולה מאלו המפורטות בחוק (כמו העתקה או העמדה לרשות הציבור) ללא רשות כאמור, תהווה הפרת זכות יוצרים.
על אף הכלל האמור, קיימים בחוק שימושים מותרים, אשר אינם מצריכים קבלת רשות מבעל הזכויות ביצירה. אחד מאותם שימושים מותרים מכונה בחוק "שימוש הוגן". דוקטרינת השימוש ההוגן מאפשרת שימוש ביצירה לרשימה לא סגורה של מטרות, כגון לימוד עצמי, מחקר, ביקורת, סקירה, דיווח עיתונאי, הבאת מובאות, או הוראה ובחינה על ידי מוסד חינוך. יחד עם זאת, אין די בשימוש לשם מטרה מסוימת, אלא יש לבחון האם השימוש שנעשה בפועל הוא הוגן.
לשם כך, נבחנים בין היתר מטרת השימוש ואופיו, אופי היצירה שבה נעשה השימוש היקף השימוש, מבחינה איכותית וכמותית, ביחס ליצירה בשלמותה והשפעת השימוש על ערכה של היצירה ועל השוק הפוטנציאלי שלה. מדובר במבחנים שיובאו לישראל מהדין האמריקאי, ולצידם קיימים מבחנים נוספים יצירי הפסיקה המקומית. לשם המחשה, אין צורך להציג סרט במלואו במסגרת מתן ביקורת עליו, לכן ייתכן כי שימוש נרחב מדי בסרט ייחשב לשימוש מפר ולא הוגן. לפיכך, לא די במטרה כמו ביקורת, לימוד או מחקר, השימוש עצמו צריך להיות הוגן.
מבחן מרכזי בקביעת הוגנות השימוש, אם כי לא היחיד, הוא האם מדובר בשימוש טרנספורמטיבי. כלומר, שימוש ביצירה באופן שמשנה אותה ונותן ליצירה החדשה משמעות חדשה או מטרה שונה מזו של היצירה המקורית. אחד המקרים הידועים של שימוש טרנספורמטיבי הוא פארודיה, קרי יצירה חדשה שמשתמשת ביצירה הקודמת על מנת למתוח עליה ביקורת. כדי להבין טוב יותר את יישום דוקטרינת השימוש ההוגן, נציג להלן מספר מקרים מן ארץ ומן העולם, שבהם קבעו בתי המשפט כי מדובר בשימוש הוגן.
בשנת 2000, נפסק בארה"ב בבעניין Nunez v. Caribbean Int'l News Corp., כי הצגת תצלומי דוגמנות חושפניים של מלכת היופי של פורטו ריקו בעיתון, על מנת לדווח על הסערה הציבורית והמחלוקת שעוררו, מהווה שימוש הוגן. באותו המקרה נקבע כי "התצלומים הם הסיפור".
קביעה דומה ניתנה בישראל בשנת 2023, בעניין ג'ייסון דונילי נ' הוצאת עתון הארץ בע"מ. באותו המקרה הוצג באתר ובעיתון "הארץ" צילום מסך מתוך אתר ה- Daily Mail עם תמונתו של אהוד ברק עוטה "חם-צוואר" מחוץ לביתו של ג'פרי אפשטיין בניו יורק, במסגרת דיווח על תביעת הדיבה שברק איים להגיש כנגד העיתון הבריטי שפרסם את התצלום במקור, וטען כי ברק כביכול ניסה להסתיר את פניו.
1 צפייה בגלריה
עו"ד רם פרייס סיטון דן אנד ברדסטריט
עו"ד רם פרייס סיטון דן אנד ברדסטריט
עו"ד רם פרייס סיטון
(קרדיט: סטיב ארד-אלן)
הצלם טען כי העיתון הפר את זכויות היוצרים שלו, בעוד שהעיתון טען בין היתר כי מדובר בשימוש הוגן. בית המשפט דחה את התביעה וקבע כי מדובר בשימוש הוגן למטרת דיווח עיתונאי על תביעת הדיבה העתידית של ברק. נפסק כי "התמונה מגלמת בחובה את הסיפור" (האם ברק ניסה להסתיר את פניו, או שמא מדובר בפריט לבוש תמים?), וכי ללא הצגת התמונה "הדיווח העיתונאי ייצא חסר". יוער, כי במסגרת מבחני ההוגנות, נלקחה בחשבון גם העובדה כי התמונה הוצגה במסגרת צילום מסך, שאינו מהווה תחליף לתצלום המקורי.
פסק דין מעניין נוסף ניתן בארצות הברית בשנת 2015, בעניין Authors Guild, Inc. v. Google, Inc.. באותו המקרה, נקבע שפרויקט סריקת הספרים של גוגל מהווה שימוש הוגן, בין היתר משום שגוגל יצרה משהו חדש (מנוע חיפוש הספרים Google Books), שאינו בא להחליף את הספרים עצמם, אלא מאפשר למשתמשים חיפוש תוך הצגה מוגבלת מאוד של קטעים קצרצרים מהטקסט.
נעיר, כי שימוש מסחרי נוטה להיחשב כלא-הוגן, אך ישנם מקרים בהם שימוש על ידי גורם מסחרי עדיין יכול להיחשב להוגן ומדובר רק בשיקול אחד מתוך מספר שיקולים.

שימוש הוגן ולמידת מכונה

בימים אלו, נדונה בעולם שאלה לא פשוטה. האם שימוש ביצירות מוגנות לצורך אימון מודלים של בינה מלאכותית הוא מותר, או שמא מדובר בהפרת זכויות יוצרים? בתמצית יצוין, כי במסגרת תהליך למידת המכונה, מודלים של בינה מלאכותית מנתחים מערכי נתונים, שפעמים רבות מכילים מיליארדי יצירות מוגנות (תצלומים, ציורים, ספרים, כתבות, שירים ועוד) שנלקחו מהמרשתת באמצעות תהליך של כריית נתונים (Data Mining). ניתן לחלק את התהליך לשלושה חלקים: יצירת מערך הנתונים, אימון המודל על סמך מערך הנתונים והזנת פרמטרים למודל לצורך קבלת פלט (למשל שאילתה ל- ChatGPT).
ראינו מקודם, שמחקר ולימוד עצמי הם חלק מהמטרות שניתן לעשות לשמן שימוש הוגן, אך ראינו גם שמבחני ההוגנות עוסקים בין היתר בהיקף השימוש שנעשה ביחס ליצירה בשלמותה ובהשפעה של השימוש על ערכה של היצירה ועל השוק שלה.
אפשר לטעון כי בלמידת מכונה השימוש ביצירות נעשה לתכלית של למידה ומחקר, כי ממש כמו שבני אדם לומדים מיצירות קודמות על מנת לפתח את מיומנותם, כך עושה גם "המכונה", וכל עוד התוצרים של הלמידה אינם מהווים העתקה, אין לשלול את ההוגנות של תהליך הלמידה עצמו. אפשר כמובן לטעון גם שזכויות היוצרים אינן צריכות לעצור את הקידמה ואת היתרונות העצומים הגלומים בפיתוח בינה מלאכותית, כי לא ניתן לפנות באופן יעיל לכל בעל זכות יוצרים במיליארדי יצירות, וכי מדובר בשימוש טרנספורמטיבי, היוצר משהו חדש אשר מטרתו שונה באופן מהותי מהמטרה שלשמה נועדה היצירה המקורית, ממש כמו בעניין גוגל לעיל.
מנגד, באותו האופן ניתן לטעון כי מדובר בהעתקה של מילארדי יצירות בשלמותן וכי עצם היקף ההעתקה העצום, צריך לבדו לשלול את הוגנות השימוש, וכן כי מדובר בשימוש שנעשה למטרות מסחריות על מנת לפתח מוצרים שונים בתשלום אשר ייתכן ויתחרו בבוא היום ביוצרים עצמם ויפגעו בערך יצירותיהם באותו השוק. פגיעה בערך היצירות בהיקף נרחב, עלולה לגרור פגיעה לא רק ביוצרים, אלא גם בעצם התמריצים ליצירה אנושית חדשה.
אכן, כאשר בוחנים את אותם המוצרים העתידיים עוסקים אנו כבר בשלב התוצר ולא בשלב הלמידה, אך אפשר בהחלט לטעון כי ההפרדה בין השלבים היא מלאכותית, וכי ראוי לקחת בחשבון את התוצרים המסתברים, כבר בעת בחינת הוגנות תהליך הלמידה.

טיול קצר אל ארצות הים ובחזרה

בימים אלו הסוגייה מעסיקה בתי משפט שונים ברחבי העולם. כך למשל, בארצות הברית מתנהלת בימים אלו תביעה של הניו-יורק טיימס נגדOpenAI ומיקרוסופט. התובעת טוענת בין היתר, כי הנתבעות עשו שימוש במיליוני מאמרים שלה לצורך אימון המודלים של ChatGPT ו- Copilot, וכי בהזנת שאילתות מסוימות, ניתן לקבל תוצאות המהוות העתקה של מאמריה. מנגד, הנתבעות טוענות כי מדובר בשימוש הוגן, בין היתר מאחר שמדובר בשימוש טרנספורמטיבי, שכן השימוש במאמרים היה למטרת למידת מכונה לצורך יצירת טכנולוגיה חדשה של מודלי שפה. בבבקשה שהגישה לאחרונה, טענה מיקרוסופט כי "למרות טענותיה של התובעת, חוק זכות יוצרים אינו מהווה מכשול עבור המודלים האמורים, יותר מאשר מקלט הוידאו (או נגן הפסנתר, מכונת הצילום, המחשב האישי, האינטרנט ומנועי החיפוש)". העניין כאמור טרם הוכרע וצפויות להיות לו השלכות משמעותיות על תעשיית הבינה המלאכותית.
בניגוד לארצות הברית וישראל, בגרמניה אין הגנה גמישה ורחבה של "שימוש הוגן", אלא רשימה סגורה של שימושים מותרים. אחד מאותם השימושים הוא כריית נתונים לצרכי מחקר לא מסחרי. ממש לאחרונה, פסק בית המשפט האזורי של המבורג בעניין Robert Kneschke v. LAION e.V., כי בניית מערך נתונים הכולל גם יצירות מוגנות, אשר נועד לאמן מודלים של בינה מלאכותית, היא מותרת, כאשר יוצר המערך פעל ללא מטרת רווח והעמיד את מערך הנתונים שיצר לרשות הציבור במרשתת בחינם.
באותו המקרה תבע צלם ארגון ללא מטרת רווח, בטענה כי האחרון כלל במערך הנתונים שיצר את אחד מתצלומיו, אותו הוריד מהמרשתת (בתהליך כריית מידע), ללא הסכמתו. בית המשפט הבחין בין שלושה שלבים: יצירת מערך הנתונים, אימון מודלים על סמך מערך הנתונים ושימוש במודל באופן שיוצר פלט העלול להיות דומה לתצלום שנכלל במערך הנתונים.
בית המשפט בגרמניה קבע, כי אין די בכך שייתכן ובעתיד מודל כלשהו שאומן באמצעות מערך הנתונים עלול לייצר תוצאה דומה לתצלום, וכי בנסיבות המקרה שבפניו, שלב יצירת המערך מהווה כריית מידע מותרת לצורך מחקר מדעי לא מסחרי. יצוין, כי קיימים בחוק הגרמני חריגים נוספים לכריית מידע שלא למטרות מחקר מדעי, אך הם כפופים לאפשרות של בעלי הזכויות להתנגד לכרייה (Opt-out).
כאן בישראל, משרד המשפטים פרסם בדצמבר 2022, חוות דעת לפיה שימוש ביצירות מוגנות לצורך אימון מודלים של בינה מלאכותית, יהווה לרוב שימוש הוגן, בין היתר למטרת מחקר ואף לימוד עצמי, שכן לפי חוות הדעת, בין היתר: "לימוד מכונה מקביל הוא לתהליך אנושי של לימוד עצמי אינדוקטיבי. זו גם זו נעשות באמצעות למידה מדוגמאות".
לדעת הכותב, המסקנה העולה מחוות הדעת היא מרחיקת לכת. הרצון לייצר וודאות משפטית עבור תעשיית הבינה המלאכותית הוא מובן, אך כפי שראינו לעיל, המטרה שלשמה נעשה השימוש, מהווה רק את התחלת הניתוח בשאלה האם מדובר בשימוש הוגן, וניסיון לערוך ניתוח של מבחני ההוגנות בצורה תיאורטית, עלול לצאת חסר. זאת במיוחד, כשבחוות הדעת הודגש כי היא אינה עוסקת בתוצרי הבינה המלאכותית, אלא רק בשלב הלמידה.

זמנים מעניינים ומאתגרים

דיני זכויות היוצרים נועדו לייצר איזון בין זכויותיהם של היוצרים וזכויותיהם של המשתמשים. אף זכות אינה מוחלטת, והמקרים שבהם תגבר זכות אחת על רעותה, תלויים בנסיבות ובערכים חברתיים.
בינה מלאכותית מהווה "חדשנות משבשת", אשר מערערת את האיזונים הקיימים. כיצד ניתן לשמור על האיזון באופן שבו נוכל ליהנות מהקדמה הטכנולוגית, אך לא נגדע את התמריצים החשובים ליצירה האנושית? האם הפתרון הוא בהכרה כי למידת מכונה מהווה בהכרח שימוש הוגן? אולי גישה כמו זו שעלתה מפסק הדין בגרמניה, במסגרתו נבחנו שיקולי היעדר מסחריות כבר בשלב יצירת מערך הנתונים, היא מאוזנת יותר? (על אף שבית המשפט הקפיד להפריד בין שלב יצירת מערך הנתונים, שלב הלמידה ושלב התוצר). יהיו גם מי שיטענו, כי "שביל הזהב" מצוי בהתחשבות בתוצרים כבר ביישום מבחני ההוגנות של השימוש ההוגן על שלב הלמידה. אין פתרון פשוט וקל.
ייתכן שעד לשבוע השימוש ההוגן בשנה הבאה יינתנו פסקי דין נוספים בסוגיה, ייתכן שגם הרגולציה והחקיקה המקומית והבינ"ל תתקדמנה, אך כדרכו של המשפט, הוא אינו עומד בקצב התפתחות הטכנולוגיה ולפנינו זמנים מעניינים ומאתגרים.
מאת עו"ד רם פרייס סיטון, עו"ד בקבוצת לוצאטו, קבוצת הקניין הרוחני הוותיקה והמובילה בישראל החוגגת 156 שנים להיווסדה, ומתמחה בתחומי הקניין הרוחני לרבות זכויות יוצרים.
d&b – לדעת להחליט