הזוכה בנובל בפיזיקה: "לא הצלחתי לקבל קידום בגוגל, וזה הרגיש לי מוזר מאוד"

מעיין כהן-רוזן

הדרך לפנטהאוז ב-21 מיליון שקל: כך עובדת מכונת המזומנים של מחבר "השקעות לעצלנים"

אלמוג עזר

עד 26 אלף שקל למשפחה: עלות המסים הסמויים של סמוטריץ' כבר ניתנת לחישוב

שקד גרין ערבה

"מחשוב קוונטי יהפוך לכלי הכי משפיע והכי מסוכן שהיה לנו אי פעם"

מעיין כהן-רוזן

סמסונג הציגה מכשיר שמתקפל לשלושה חלקים - ב-2,440 דולר

חדשות חוץ

אחרי יותר מ-7 שנים: אושרה התוכנית שתאפשר להשלים את מסילת הרכבת הרביעית באיילון

חופית כהן אולאי

אחרי זינוק של 145% השנה, דוראל מגייסת חצי מיליארד שקל מהמוסדיים בגיוס בזק

גולן חזני

הנצפות ביותר בערוץ

"מחשוב קוונטי יהפוך לכלי הכי משפיע והכי מסוכן שהיה לנו אי פעם"

עד כמה מסוכן חיל האוויר הסעודי - ועבור מי?

מנכ"ל סופטבנק על מכירת מניות אנבידיה: "בכיתי"

סרטונים מומלצים

האוויר החם נע במעגל, ובועת ה־AI מתנפחת לממדים חסרי תקדים

החמקן של השכן: מה יקרה כשגם טורקיה, קטר וסעודיה יקבלו F35?

עוד בכלכליסט

תמונה שנוצרה ב־DALL-E 2. אחרי עיבוד הנתונים, מוסרת כל תביעה לבעלות (צילום: בלומברג)

שוברת קודים

לחשוף את אמנות ההסתרה: מחולל התמונות DALL-E 2 לא נוצר יש מאין

מחולל התמונות ש־OpenAI הפכה לזמין עבור מיליון משתמשים חדשים מבוסס על 650 מיליון תמונות שנקצרו מהאינטרנט. החברה מסתירה את יוצריהן, ומוכרת אשליה שהיא המקור לדברים

ויקי אוסלנדר

06:20, 02.08.22

חברת OpenAI הודיעה שתפתח את השימוש ב־DALL-E 2, תוכנה שהופכת טקסט לתמונה, למיליון אנשים חדשים ברשימת ההמתנה שלה. 
לפי החברה, משתמשים יקבלו בחודש הראשון 50 נקודות קרדיט במתנה ו־15 נקודות קרדיט כל חודש לאחר מכן. קרדיט אחד מאפשר שימוש אחד בתוכנה - שליחת הודעת טקסט שממנה יופקו ארבע תמונות. מי שיבחר יוכל לרכוש תמורת 15 דולר 115 קרדיטים נוספים, תמחור שעוד צפוי להתפתח ככל שהמוצר ימשיך ויתפתח. ב־OpenAI עוד הודיעו שהתוצרים שיופקו יהיו מותרים לשימוש מסחרי בין היתר, כך כתבו, כדי "לאייר ספרי ילדים, ליצור אמנות לניוזלטרים, דמויות למשחקים וסטוריבורד לסרטים".
ההודעה התקבלה בשמחה גדולה. מאז אפריל האחרון נתנה OpenAI גישה ללא עלות ל־100 אלף משתמשים שהפיצו את תוצרי התוכנה באופן נרחב ופומבי למדי. רבים אחרים ראו ורצו גם לעצמם הזדמנות להשתעשע במה שנראה כמו מחולל תמונות מוצלח למדי. אך שימוש, ועוד אחד מסחרי, מעלה שאלות מגוונות, בעיקרן של נגישות לכלים חדישים וניהול תוכן, ושאלה נוספת צריכה להישאל בנוגע לחלוקת הרווחים מהמודל. 
1 צפייה בגלריה 
התוכן ש־DALL-E 2 מייצר הופך את התרומה האנושית בלתי נראית
(איור: יונתן פופר)
אינטואיטיבית, אולי, יש שיחשבו שאין על מה לדבר, שהרי כפי שההיגיון הבריא מכתיב והמימרה המפורסמת מסבירה - מי שטרח בערב שבת יאכל בשבת. זאת אומרת שבשל עבודתם הקשה, המאומצת והנחושה של הצוות ב־OpenAI שבנה ושכלל את DALL-E 2, ומשום שכל עלויות אירוח המודל ועיבוד הבקשות יוצאות מכיסה של החברה, ראוי שכל הרווחים יגיעו ל־OpenAI. אך האם באמת כל מי שעבד וטרח אכן מתוגמל? 
זו עובדה מוסכמת כי מודל בינה מלאכותית טוב רק כמו הנתונים שבהם הוזן, ובכל זאת כשאנחנו מתבוננים במוצרים שמופקים מנתונים אלו אנו לא מתעכבים על מקורותיהם, בעליהם או העבודה שנעשתה כדי לייצר, לאסוף, למיין ולתייג אותם. זה לא מתרחש במקרה, ברמה תאגידית החברות שמפתחות ובונות את המוצרים, המערכות והמודלים הללו משקיעות אנרגיה רבה כדי להסתיר באופן אסטרטגי את שרשרת הייצור שלהן, מה שנקרא – סוד מסחרי.
זו שרשרת מורכבת במיוחד של ייצור שכוללת איסוף, אחזקה ומיון של נתונים, שעוברים דרך ידיהם של מספר אין־סופי של עובדים מגוונים. מחקר מ־2019 מאוניברסיטת וושינגטון מצא כי כ־80% מהזמן בפרויקטים של בינה מלאכותית או למידת מכונה מוקדשים להכנת הנתונים, כלל לא לעיבודם או פיתוח המודל על ידי מדעני הנתונים. כל זאת בלי להתייחס כלל לעובדה שהנתונים עצמם הם פרי יצירתם של אנשים נוספים שאינם צד לדבר, שההשקעה והזמן שלהם כלל לא מגולמים בחישובים אלו.
במקרה של DALL-E 2 מדובר על 650 מיליון תמונות שנקצרו באבחה מהאינטרנט, כך סתם, בלי רשות. לולא תמונות אלו ל־OpenAI לא היתה בכלל תוכנה שתייצר תוכן חדש שהיא כעת מוסרת אותו לשימוש מסחרי ובתשלום. 
בעולמות השימוש המסחרי בבינה מלאכותית רעיונות של בעלות או זכויות קניין על כל הנתונים הללו לא משנים בכלל, כאילו כשנלקחו לאמן מודל משל שמו אותם במכונת כביסה שממנה יוצאים נתונים נקיים מזכויות. אך האם העובדה שנתונים עברו עיבוד באמת מסיימים את זכותו של אדם על היצירה? אם ניסחתי מחדש מושג מוויקיפדיה והשתמשתי בו בעבודה אקדמית, האם ביצעתי פלגיאט?
התשובה לא נמצאת ברמה המשפטית, לפחות נכון להיום. לפי משרד זכויות היוצרים האמריקאי מ־2019, "יצירות המיוצרות על ידי מכונה או תהליך מכני בלבד שפועל באופן אקראי או אוטומטי ללא כל קלט או התערבות יצירתית של מחבר אנושי לא יירשמו". זאת אומרת אם תוכנה לא יכולה להיחשב ליוצרת של תוכן, אז מה שיוצא מצד השני של DALL-E 2 אינו הפרה של זכויות יוצרים. נפתרה הבעיה. על בסיס עיקרון זה מאמנים מודלים עם מאגרי נתונים ענקיים שנקצרים מהאינטרנט (Data Mining, או TDM) ללא כל רשות, ברוח מה שמכונה "שימוש הוגן" וללא חשש מעניינים של קניין רוחני.
ואכן באמת, כל מי שמתחיל לבנות מודלים של בינה מלאכותית ממהר לגשת למלאכת קצירת הנתונים. תכננת לבנות מודל לשפה? קצור את כל ויקיפדיה, מיליוני שעות העבודה של העורכים המסורים של הפרויקט. מעניין אתכם מודל לתמונות? קצרו את מאגרי התמונות והציורים שאי פעם עלו לאינטרנט, מיליוני שעות העבודה של ציירים, פסלים, מעצבים גרפיים וצלמים חובבים. רוצה לפתח מודל מטקסט לתמונה? קצור גם את זה וגם את זה. 
ב־OpenAI נמנעו עוד יותר מתסבוכת משפטית כשהתירו שימוש מסחרי לכל במחשבה שנטל העבודה היצירתית מבוצע אך ורק על ידי המשתמשים שכותבים את ההנחיות. אך מה על כל העבודה שנעשתה לפני כן?
הגישה של סודיות ארגונית סביב פיתוח מוצרי בינה מלאכותית מייצרת הפרדה מוחלטת בין פיתוח של טכנולוגיה לפריסתה, ומטשטשת לחלוטין את המאמץ שנדרש כדי לבנות את השירות. מה שאנחנו מתעסקים בו הוא רק בתפקיד הטכנולוגיה ולא שום דבר הקשור לתרומה האנושית הגדולה שנדרשת ליצירתה. 
עבודה בלתי נראית
מונח שטבעה הסוציולוגית ארלין קפלן דיוויס ב־1987 על סוגי עבודה ללא שכר של נשים שהופכים בלתי נראים באמצעות התעלמות, דחיקה לשוליים ותגמול חסר. היום המונח כולל מגוון עבודות אנושיות לא גלויות
גישה זו תורמת לביסוס נרטיבים טכנו־אוטופיים סביב המוצרים האלו, כאילו נוצרו יש מאין, רק באמצעות מדען שכתב קוד שבתורו הפך חכם וכעת יכול לעשות דברים מדהימים לבדו כמו לייעל לנו שירותים ולהפוך את החיים שלנו באופן לא מוסבר לפשוטים יותר או מתקדמים יותר. זו אשליה. בינה מלאכותית לא נוצרת מחלל האוויר, והיצירות של DALL-E אינן מקוריות, המודלים פשוט מסתירים עבודה אנושית רבה. 
אך כפי שמסבירה זאת ברהיטות ג'מה ניולנדס מאוניברסיטת אמסטרדם, כשמערכות אלו נפגשות כשירות ללקוחות קצה, חלק מאחורי הקלעים חייב להיחשף. ניולנדס אולי מדברת בעיקר על ההתערבות האנושית הבלתי פוסקת מצד החברות כדי להעמיד מוצר "בינה מלאכותית" גמיש ושמיש עבור הלקוחות שלהם (כמו אנשים שמפקחים על פעילותם של צ'אטבוטים), אך העבודה הבלתי נראית שנחשפת מגיעה במגוון רחב יותר של צורות. 
כך למשל במקרה של DALL-E 2, התמונה שנוצרת על ידי תוכנת הטקסט לתמונה כוללת באופן ויזואלי ובלתי נמנע יצירות של אין־ספור אנשים אחרים שאת סגנונם, שפתם העיצובית ויצירתם ממש התוכנה מגייסת כדי לייצר משהו על פי פקודה. 
“ברגע שמפסיקים לזהות מידע כבעל ערך, מתעלמים מהמקורות וההקשרים שלו, ומתייחסים רק לגודל המידע – פתאום הייחודיות שלו אובדת, והוא הופך רק לתשתית", אמרה ודייקה החוקרת קייט קרופורד בריאיון ל"כלכליסט" בשנה שעברה. 
התוכן ש־DALL-E 2 מייצר הופך את התרומה האנושית בלתי נראית, לעתים התמונות שהוא מפיק דומות באופן ברור ליצירות של אמנים גם חיים, מה שמעמיד בסיכון את פרנסתם של האמנים, לא משום, כפי שנוטים לטעון, שהתוכנה תיקח את עבודתם, אלא משום שהתוכנה מעתיקה את עבודתם ומציגה אותם כשלה. 
במובנים אלו ההתלהבות מתוצרי DALL-E 2 חושפת הרבה על האופן שבו אנו מעריכים סוג מסוים של עבודה – אנשי טכנולוגיה שבונים כלים שמעתיקים יצירתיות אנושית ומציגים אותה כחדשנית, ומוחקים סוגים אחרים של עבודה, הופכים אותה בלתי נראית או מכבסים אותה מבעלות.

תגיות: