סגור
באנר דסקטופ כלכליסט טק
אלון ימין ממייסדי חברת קופיליקס Copyleaks
אלון ימין, ממייסדי חברת Copyleaks (צילום: רותם גולן, סטודיו גולן)

התשובה לזיופים ב-ChatGPT? החברה מקריית שמונה שמזהה טקסטים שנכתבו ב-AI

השקת ChatGPT העלתה חשש ממכת זיופים והעתקות. כעת Copyleaks הישראלית נכנסת לשוק של זיהוי טקסטים שנוצרו בידי בינה מלאכותית, וכבר הוכיחה את יכולותיה מול מוסדות אקדמיים בארה"ב שביקשו לבדוק עבודות סטודנטים. "לטקסט של AI ייחוד סטטסיטי. יש פירורי AI שמעידים שהתוכן שלא נכתב על ידי אדם", אומר המנכ"ל אלון ימין

ביום שגוגל הודיעה על פיטורי 12 אלף עובדים ביצעתי ניסוי קטן. נכנסתי ל־ChatGPT, הצ'טבוט המוצלח מדי של OpenAI, וביקשתי ממנו לכתוב מכתב ממנכ"ל גוגל לעובדי החברה שמודיע להם על פיטורים. את התוצאה שמתי לצד המכתב מהמנכ"ל האמיתי סונדאר פיצ'אי, וביקשתי מעמיתים לעבודה וסתם אנשים אקראיים לנחש איזה טקסט כתב בן אדם, ואיזה מכונה. במה שהוא אולי עדות לגנריות של טקסטים שיוצאים מאגפי דוברות של חברות, כולם ללא היסוס בחרו בטקסט של ChatGPT כזה שנוצר על ידי אדם. כולם, חוץ מאחד: כלי מקוון שפיתח Copyleaks, סטארט־אפ ישראלי עם משרדים בניו יורק ומרכז מו"פ בקריית שמונה. "נכתב על ידי AI (בינה מלאכותית) בסבירות גבוהה", הוא אמר.
מייסד ומנכ"ל החברה, אלון ימין, לא הופתע כמובן. מאז שהם שילבו את היכולת לזהות טקסטים שנוצרו על ידי בינה מלאכותית במערכת מניעת ההעתקות שלהם (שגם היא, אלא מה, מבוססת בינה מלאכותית), שהם משווקים בעיקר למוסדות אקדמיים בארה"ב, היא כבר הוכיחה את עצמה ככלי רב־עוצמה להתמודדות עם התפתחות טכנולוגית חדשה זו, וסייעה לחשוף את ממדי ההסתמכות על טקסטים של בינה מלאכותית. "יש לנו גישה להרבה תכנים של סטודנטים וחוקרים", אמר ימין ל"כלכליסט" בריאיון ממשרדי Copyleaks בניו יורק. "בשבועות האחרונים התחלנו להפעיל את זיהוי AI על התכנים האלו, כדי לדעת מה שיעור הסטודנטים שמשתמשים בבינה מלאכותית כדי לכתוב תכנים. בשלושת השבועות האחרונים למעלה מ־10% מהתכנים שמוגשים למערכת, וזה מאות אלפי מסמכים, כללו טקסט שנוצר על ידי AI, וזה כש־ChatGPT רק יצא. הנתונים ימשיכו לעלות. היינו מאוד מופתעים מהמספר הזה".
היכולת של ChatGPT לחולל טקסטים אינטליגנטיים ואינפורמטיביים למראה, ברמה גבוהה מספיק כדי לעמוד בהצלחה בבחינות הסמכה במקצועות כמו רפואה או ראיית חשבון או לצלוח בציון גבוה בחינות כניסה ללימודי MBA, העלתה חשש שימיה של העבודה האקדמית הכתובה – כלי מרכזי בהליך הלמידה כיום – חלפו ואינם עוד. ימין סבור שהפתרון שמציעה Copyleaks מתמודד עם המשבר הזה בצורה מוצלחת: "סטודנטים צריכים לדעת לכתוב תכנים, זו יכולת חשובה שלא תיעלם מהעולם, אבל יש תהליך של פענוח איך לעבוד עם הכלים האלו. הכל מאוד מאוד חדש".
החברה הוקמה לפני כשמונה שנים על ידי ימין ושותפו יונתן ביטון, סמנכ"ל הטכנולוגיות. "הכרתי את יונתן ב־8200", סיפר ימין. "היינו מתכנתים. אחרי השירות הצבאי יונתן למד מדעי המחשב ואני כלכלה וניהול. אחרי עבודה ראשונית התחלנו לעבוד על Copyleaks. אנחנו ממוקדים בטכנולוגיות AI לניתוח טקסט. מה המשמעות של הטקסט, מאיפה הוא נוצר, האם הוא מקורי או לא, באיזה טון נכתב, מי כתב את הטקסט.
"נקודת ההתחלה שלנו היתה עסק משפחתי של יונתן. הם מוכרים דגי נוי. הוא פיתח להם אתר אינטרנט עוד כשהיה בן 11, והעלה המון תכנים כדי להגיע לדירוג גבוה בגוגל. יום אחד הוא ראה שהם יורדים למטה בדירוג תוצאות החיפוש, זה השפיע על התעבורה לאתר ועל ההכנסות. הוא ראה שמתחרים שלהם מעתיקים תכנים, וגוגל מענישה אותם על זה כי מנוע החיפוש מדרג נמוך יותר אתרים עם תכנים משוכפלים, ואין לו יכולת לדעת מה המקור ומה ההעתקה. זו היתה נקודת ההתחלה. רצינו לפתח כלי שיידע לזהות את התפוצה של תכנים ברשת, ואם הם מקוריים או לא. הבחנו שהרבה תכנים לא מועתקים אחד לאחד, אז רצינו משהו יותר חכם שיודע לזהות גם אם מישהו משחק עם הטקסט, אבל המבנה, המשמעות והטון דומים מספיק כדי לעלות על זה.
"משם העברנו את המיקוד לעולם החינוך. מאוד חשוב שם לדעת אם תכנים מקוריים, ויש גם הרבה שימושים בעולמות הפרסום, המדיה והעסקים – האם מישהו מעתיק או גונב לך תכנים, האם יש דליפה של תכנים רגישים לרשת. הכל ברמה יותר מתוחכמת מקופי פייסט, אנחנו גם יכולים לזהות מקרים שבהם תוכן הועתק ותורגם, ממש לתת הגנה מכל הכיוונים".
ההופעה של ChatGPT, אומר ימין, לא תפסה אותם לא מוכנים: "אנחנו ראינו את ההתפתחות הזו כבר לפני חודשים, והיינו עסוקים בלפתח טכנולוגיה שתוכל להפחית את הסיכון. יש הרבה יתרונות בעבודה עם ChatGPT, אבל כמשתמשים אנחנו לא יודעים אם הטקסט נכתב על ידי בן אדם או AI. הטכנולוגיה שלנו יודעת לזהות. אולי לאנשים קשה לזהות את ההבדל, אבל בסופו של יום מערכת AI כותבת בצורה שונה שנראית אחרת מבחינה סטטסיטית. יש פירורי AI שטכנולוגיות כמו שלנו יודעות להגיד על בסיסן שזה תוכן שלא נכתב על ידי בני אדם. המעבר לא היה מאוד קל, זה משהו שאנחנו עובדים עליו הרבה מאוד זמן. בסוף מדובר בטקסט, גם אם הוא נוצר על ידי AI, ואנחנו עובדים כל הזמן בניתוח של תוכני טקסט. היו הרבה שינויים ופיתוחים שהיינו צריכים לעשות, אבל גם הרבה חלקים משותפים שאפשרו לנו להתבסס על התשתיות הקיימות שלנו".
איך זה עובד?
"דמיין שאתה שומע נקישות על הדלת. לנו זה נשמע כמו נקישה רגילה, אבל אם אתה מבין שפת מורס, יש לזה משמעות. הבינה המלאכותית שלנו יודעת לדבר את השפה של הבינה המלאכותית, לזהות אותה בטקסט לעומת טקסט שלא נוצר על ידי AI. המערכת שלנו מבינה איך נוצר טקסט של AI, זה טקסט שמבוסס על מודלים סטטיסטיים, על קובצי נתונים, הוא לא אנושי. בטקסט שנכתב על ידי AI יש דברים ייחודיים, ובגלל זה הוא נראה אחרת. אנחנו יודעים לזהות את הדברים האלו, לעשות הנדסה לאחור לאיך נוצר הטקסט".
איך נראה המשוב מהצד של המשתמש?
"כרגע אנחנו אומרים האם טקסט שנבחן נכתב על ידי AI בסבירות של יותר מ־99% על כל התוכן. זה רק אומר אם הטקסט כולל תוכן שנכתב על ידי AI, בלי פירוט אילו חלקים מהטקסט נוצרו על ידי AI. בשבועיים־שלושה הקרובים נשיק עדכון שיאפשר זיהוי על בסיס פסקאות ומשפטים. ניתן יהיה לדעת ברמת המשפט והפסקה מה נכתב על ידי AI ומה לא, ולכל משפט נצמיד אחוזי ביטחון. כרגע אנחנו מציגים רק דברים שאנחנו בטוחים בהם ב־99%".
מאז שיצא ChatGPT הופיעו לא מעט כלים שמתיימרים לזהות טקסטים שנוצרו על ידיו. גם המפתחת של הצ'טבוט, OpenAI, מתעתדת להשיק כלי זיהוי משלה. איפה היתרון שלכם במשחק הזה?
"אנחנו לא מוגבלים לפלטפורמה או למודל ספציפיים. הטכנולוגיה שלנו יכולה לזהות כל טקסט שנוצר על ידי AI, לא רק את ChatGPT. מעבר לכך היכולת לזהות ברמת הפסקה או המשפט היא משהו ייחודי לנו, וזה משפיע על האיכות ועל כמה אפשר להסתמך על התוצאות. בנוסף לכך הפיתוח שלנו הוא חלק מפלטפורמה מלאה. אנחנו יכולים להגיד גם אם הטקסט מקורי או לא. אנחנו הפלטפורמה היחידה שמכסה את כל מה שטקסט יכול לעבור – העתקה, פגיעה בזכויות יוצרים. אנחנו זמינים בחמש שפות (אנגלית, צרפתית, ספרדית, פורטוגזית וגרמנית) ועובדים על עוד שפות".
למרות ההאטה בענף ההייטק העולמי, אלון ימין מספר על תקופה מוצלחת מבחינת החברה: "אנחנו בעיצומם של תהליכי צמיחה וגיוסים, לא פיטורים. זו תקופה מעניינת".
מאוד נדיר למצוא סטארט־אפ בקריית שמונה.
"יונתן הוא מקיבוץ באזור, וזו הסיבה שהקמנו שם. רצינו להישאר באזור, לראות איך אפשר לעשות משהו עם סטארט־אפים שם. עכשיו JVP פתחו משרדים ויש התקדמות".
קשה לגייס שם עובדים?
"בשלב שבו אנחנו עכשיו פחות. בהתחלה לקח לנו זמן לפענח מה הדרך הטובה לעשות את זה. היינו צריכים להבין איך לעבוד עם מכללות ואוניברסיטאות באזור. הגענו לשלב של חבר מביא חבר. העובדים הראשונים שלנו היו דרוזים מהאזור שלמדו פיתוח, ועכשיו יש חמישה־שישה עובדים דרוזים. יש הרבה עובדים שמגיעים מהמכללות, והרבה עובדים שעבדו בתל אביב והם במקור צפון וזה אפשר להם לחזור לצפון".