סגור
באנר דסקטופ כלכליסט טק
אתר ויקיפדיה
ויקיפדיה (צילום: DIA TV/Shutterstock)

מפרפלקסיטי ועד מטא: חברות ה-AI שישלמו לוויקיפדיה על אימון מודלים

קרן ויקימדיה חתמה על הסכמים עם מיקרוסופט, אמזון, מטא ועוד, שיאפשרו להן גישה מהירה לתכני האנציקלופדיה תמורת תשלום. הרקע: מספר המבקרים האנושיים באתר יורד ב-8%, בעוד בוטים שואבים מידע באופן מסיבי ומייצרים עלויות תשתית גדלות. נעדרת מרשימת החותמות: OpenAI

ויקיפדיה חתמה על הסכמים עם מרבית חברות ה-AI הגדולות בעולם, ובראשן מיקרוסופט, אמזון ומטא, שיספקו להן גישה מהירה ובנפח רחב לתכני האנציקלופדיה החופשית לצורך אימון מודלי ה-AI שלהן – כך הודיעה קרן ויקימדיה, העמותה שמנהלת את ויקיפדיה, בשבוע שעבר. סכומי ההסכמים לא פורסמו. "אני אישית שמח שמודלי AI מתאמנים על מידע מוויקיפדיה, כי הוא נאצר על ידי בני אדם", אמר מייסד ויקיפדיה, ג'ימי וויילס, ל-AP. "אני לא רוצה להשתמש ב-AI שאומן רק על X, זה יהיה AI כועס מאוד. אנחנו רוצים לעבוד עם חברות AI, לא לחסום אותן. אבל הן צריכות לשלם את החלק ההוגן בעלויות שהן מייצרות לנו".
מהפכת ה-AI יצרה קשיים חדשים בעבור ויקיפדיה, שמתבססת באופן כמעט בלעדי על תרומות. מצד אחד, מספר המשתמשים האנושיים בה נמצא בירידה. לפי נתונים שפרסמה האנציקלופדיה באוקטובר, לאורך השנה ירד מספר המבקרים האנושיים בה ב-8%. זאת, בין השאר, לאור הפנייה לצ'אטבוטי AI למענה על שאלות שקודם לכן קיבלו תשובה בוויקיפדיה (הגם שלא פעם תשובות ה-AI מסתמכות על מידע מהאנציקלופדיה).
במקביל, נפח התעבורה לאתר דווקא גדל, לאור ביקורים מרובים של בוטים וכלי גרידה המוניים ששואבים את המידע של האנציקלופדיה לצורך אימון מודלים. לפי נתונים מאפריל שעבר, מאז ינואר 2024 נרשם גידול של 50% ברוחב הפס שמשמש להורדת מדיה. בוטים אחראים ל-65% מהבקשות התובעניות והיקרות ביותר לדאטה, אף שהם אחראים רק ל-35% מכלל העמודים הנצפים. התוצאה: הוצאות התשתית והתעבורה של ויקיפדיה מזנקות, בשעה שמקורות התרומה האפשריים – מבקרים אנושיים – מצטמצמים.
העסקה עם חברות ה-AI תאפשר לוויקיפדיה להתמודד עם מגמה זו, כאשר החברות שאחראיות לגידול בהוצאות ולירידה בהכנסות ישלמו מעתה בעבור המידע שהן שואבות. בין השאר נחתמו הסכמים עם ענקיות הטק מיקרוסופט, מטא ואמזון, סטארט-אפי ה-AI הבולטים מיסטרל ופרפלקסיטי, וחברות קטנות יותר דוגמת Ecosia ו-ProRata. הם מצטרפים להסכם דומה מ-2022 עם גוגל.
כל תכני ויקיפדיה זמינים באופן חופשי, וימשיכו להיות כך. ההסכמים יספקו לחברות גישה לממשק API פרימיום שיאפשר להן לגשת ל-65 מיליון ערכי ויקיפדיה, והתכנים החזותיים והקוליים שנלווים אליהם, במהירות גדולה יותר ובנפח גדול יותר ממה שמאפשר ממשק ה-API החינמי.
"ויקיפדיה היא רכיב קריטי של העבודה של חברות הטכנולוגיה האלו, והן היו צריכות להבין איך לתמוך בה פיננסית", אמר לרויטרס ליין בקר, נשיא Wikimedia Enterprise, חברה-בת מסחרית של קרן ויקימדיה. "לקח לנו זמן להבין אלו יכולות ופונקציונליות אנחנו צריכים להציע כדי להעביר את החברות האלו מהפלטפורמה החינמית לפלטפורמה המסחרית שלנו. אבל כל הענקיות הטק השותפות שלנו באמת מבינות את הצורך להתחייב לתמוך בעבודה של ויקיפדיה".
וויילס אמר לרויטרס: "ויקיפדיה נתמכת על ידי מתנדבים. האנשים האלו תורמים כסף לוויקיפדיה, ולא צריכים לסבסד את OpenAI שעולה לנו הרבה כסף. זה לא הוגן". OpenAI היא השם הבולט ביותר שנעדר מרשימת החברות שחתמו על הסכמים עם ויקיפדיה. אבל לעת עתה, לפחות, וויילס מסתייג מהגשת תביעה נגד חברות AI ששואבות מידע מהאנציקלופדיה ללא הסכם. "אני מרגיש שהיכולת שלנו להשתמש בכוח רך כדי לבייש אותן היא כנראה מאוד עוצמתית", הסביר.