ניתוח
המהפכה של דיפסיק הסינית עשויה להתברר כבלתי משמעותית
אחרי שזעזעה את עולם הבינה המלאכותית עם מודל R1, בבית הלבן וב־OpenAI טוענים שהחברה הסינית גנבה קניין רוחני מהענקית האמריקאית. צאר ה־AI של טראמפ: "ראיות משמעותיות לכך שדיפסיק זיקקה את הידע של המודלים של OpenAI"
האם ההצלחה המפתיעה של דיפסיק (DeepSeek) הסינית, שטוענת שהצליחה לאמן מודל בינה מלאכותית (AI) מתקדם בשבריר מהעלות והמשאבים שנדרשו לפתח מודלים של חברות מערביות, היא בכלל תוצאה של גניבת קניין רוחני באמצעות ניצול מידע שיצרו המודלים של OpenAI? אם יתבררו כנכונות הטענות שמשמיעים עתה ב־OpenAI ובבית הלבן, ימשוך הדבר את השטיח מתחת לפריצת הדרך, שלכאורה השיגה החברה הסינית.
השבוע זעזעה דיפסיק את עולם ה־AI והשבבים אחרי ששחררה את R1, מודל בינה מלאכותית גנרטיבית (GenAI) מתקדם, שדומה ביכולותיו למודל o1 של OpenAI, אך אומן בעלות מזערית ועם השקעה של 6 מיליון דולר בלבד בכוח מחשוב. זאת, לעומת עלויות שמגיעות לעשרות מיליוני ואף מיליארדי דולרים במודלים אחרים.
ואולם, עתה טוענים ב־OpenAI שההצלחה של דיפסיק נובעת במידה רבה מהסתמכות על ההשקעה העצומה שכבר ביצעה החברה במודלי ה־AI שלה. לדברי החברה, היא מצאה ראיות שדיפסיק השתמשה במודלים של OpenAI על מנת לאמן את R1, במה שיכולה להיחשב כפגיעה בזכויות קניין רוחני. בחברה אמרו ל"פייננשל טיימס" שמצאו ראיות שלפיהן דיפסיק עשתה שימוש בשיטת אימון שמכונה "זיקוק" (distillation). בשיטה זו מפתחי AI משפרים ביצועים של מודלים קטנים יותר באמצעות פלט ממודלים גדולים יותר ובעלי יכולות רבות יותר. מדובר בפרקטיקה מקובלת בתעשייה, כאשר חברה עושה שימוש במודלים שלה לצורך כך. ואולם, ב־OpenAI חושדים שדיפסיק "זיקקה" את המודלים שלה כדי לבנות את R1 היריב, תוך הפרת תנאי השימוש של OpenAI.
"הבעיה נוצרת כשאתה משתמש בפלטפורמה אחרת כדי ליצור מודל משלך למטרותיך", אמר ל"פייננשל טיימס" גורם המקורב ל־OpenAI. מהחברה עצמה נמסר: "אנחנו יודעים שחברות סיניות ואחרות מנסות תמיד לזקק את המודלים של חברות AI אמריקאיות מובילות. אנחנו מפעילים כלים כדי להגן על הקניין הרוחני שלנו, ומאמינים שכדי להתקדם יש חשיבות קריטית לעבודה קרובה עם ממשלת ארצות הברית כדי להגן בצורה הטובה ביותר על המודלים המתקדמים ביותר ממאמצי יריבים לקחת טכנולוגיה אמריקאית".
בלומברג דיווחה שמיקרוסופט ו־OpenAI חוקרות האם פלטי מידע מהמודלים של האחרונה הושגו באופן לא מאושר על ידי קבוצה שקשורה לדיפסיק. מקורות עם ידע בנושא אמרו לסוכנות הידיעות שכבר בסתיו זיהו חוקרים במיקרוסופט, שפרטים שלתפיסתם קשורים לדיפסיק שואבים כמויות מידע גדולות באמצעות כלי המפתחים של OpenAI. פעילות זו יכולה להוות הפרה של תנאי השימוש של OpenAI או להוות עדות לכך שהקבוצה פעלה כדי להסיר את המגבלות שהטילה החברה על היקף המידע שאפשר לקבל.
החשדות הללו זכו לחיזוק מצד הבית הלבן. "יש ראיות משמעותיות שמה שדיפסיק עשתה זה לזקק את הידע של המודלים של OpenAI, ואני לא חושב שהם מאוד שמחים לגבי זה", אמר צאר ה־AI דיוויד סאקס בריאיון לפוקס ניוז.
סאקס, OpenAI או מיקרוסופט טרם סיפקו ראיות לטענות. עם זאת, לפי גורמים בתעשייה, מעבדות AI בסין ואף בארצות הברית נוהגות לעשות שימוש בפלטי מודלים של חברות כמו OpenAI. חברות אלו השקיעו משאבים וכוח אדם משמעותיים באימון המודלים, וחברות קטנות יותר נוהגות לא פעם לתפוס טרמפ על ההשקעה כדי לשפר את שלהן. "מדובר בנוהג מקובל מאוד מצד סטארט־אפים וחוקרים באקדמיה לעשות שימוש בפלטים של מודלי שפה גדולים מסחריים, כמו ChatGPT, כדי לאמן מודל אחר", אמר ל"פייננשל טיימס" ריטוויק גופטה, דוקטורנט AI באוניברסיטת קליפורניה בברקלי. "כך אפשר לקבל בחינם את שלב המשוב האנושי. לא מפתיע אותי אם דיפסיק עושה את אותו הדבר. אם הם אכן עושים זאת, יהיה קשה למנוע את זה".
אם אכן הטענות נכונות, הדבר יעמיד בסימן שאלה גדול את ההישג של דיפסיק. קשה בשלב זה להעריך כמה הוצאות חסכה בכך שתפסה טרמפ על המודלים של OpenAI, אך לא מן הנמנע שהשיטה שבה השתמשה היתה חלק מהותי בכך. אם זה המצב, הרי שהמהפכה שבישרה עלולה להתברר כמשמעותית הרבה פחות, אולי אפילו זניחה. אם לא ניתן לאמן בזול מודלים מתקדמים חדשים ללא שימוש במודלים קיימים, הרי שעל מנת להשיג פריצת דרך עדיין יידרשו חברות כמו OpenAI להשקיע מיליארדים בכוח מחשוב.
במקרה כזה יצטרכו חברות ה־AI המובילות להתמודד עם בעיה אחרת: איך למנוע ממתחרות, ובפרט סיניות שאינן נוטות לציית לחוקי קניין רוחני של חברות מערביות, לגנוב את ההישגים היקרים שלהן כדי לפתח מודלים בשבריר מהעלות.