$
אינטרנט

הרשת עושה היסטוריה: מוזיאונים משקיעים מיליונים במעבר לפורמט דיגיטלי

חוקרים מאוניברסיטת בר־אילן פיתחו טכנולוגיית סריקה המאחדת טקסטים גנוזים שנחשבו אבודים, הספרייה הלאומית מעבירה את הארכיון לפורמט דיגיטלי, ומוזיאון ישראל הקים גרסה וירטואלית בפרויקט האמנות של גוגל

הראל עילם 10:4403.05.12

בחודש הבא יוצג לראשונה בשלמותו אוסף שב־150 השנה האחרונות התפזר על פני עשרות ספריות ומאות אוספים פרטיים. גניזת קהיר, שהתגלתה בבית כנסת עתיק במצרים ומאז חלקיה פוזרו בכל העולם, תאוחד לראשונה — אך לא בצורה פיסית, אלא בארכיון דיגיטלי עצום בגודלו. האוסף יוצג במסגרת כנס Info של חברת טלדן.

 

האיש העומד מאחורי הפרויקט, שארך שש שנים ועלותו מוערכת במיליוני דולרים, הוא פרופסור יעקב שויקה מאוניברסיטת בר אילן. "אין אף אתר ברשת שמציע אוצר תרבותי עצום כזה במקום אחד", הוא אומר בראיון מיוחד ל"כלכליסט". "השנה אנחנו עומדים לסיים את קליטת כל תמונות הגניזה, חוץ ממספר מגילות שאנחנו מתכוונים להשיג בקרוב". אלה, כשיגיעו, יצטרפו ליותר מחצי מיליון תמונות סרוקות שכבר כלולות במאגר.

 

 

 

הפרויקט של שויקה לא רק יאחד את הכתבים, אלא יאפשר גם לחבר בין חלקים שונים של אותם הטקסטים, שחלקם נפוץ בכל העולם והקשר ביניהם אבד. מאז אותרו הכתבים בעליית הגג בקהיר מבקרים שונים אספו דפים מכל הבא ליד, ופיזרו את כתבי היד העדינים ברחבי העולם. מלבד מספר מקרים בודדים, כל נסיונות החוקרים לחבר בין חלקים שונים של הגניזות, שכוללות הגדות ופיוטים של יהדות המזרח ושנכתבו בחלקם לפני יותר מאלף שנה, עלו בתוהו.

 

שויקה לא רק אחראי על הפרויקט אלא גם על פיתוח טכנולוגיה שיכולה להביא לשינויים מרחקי לכת בפרשנות היהודית. הטכנולוגיה הישראלית חוללה מהפכה גם בתחום הזה, ובעזרת כלים מתקדמים של זיהוי טקסט וגרפולוגיה, שבין השאר גם בודקים את המרווח בין האותיות, השורות והפסקאות, הצליח הצוות של שויקה לחבר בחזרה קטעי טקסט שעד כה נשארו נטולי הקשר.

 

הצוות הצליח כבר לבנות מחדש למעלה ממאה צירופים שלא היו ידועים עד כה, ושמהווים תרומה אדירה לחקר יהדות המזרח בכלל והמגילות בפרט.

 

כצעד שני, מקווים שויקה וקבוצת החוקרים שלו להריץ את האלגוריתם המתוחכם על כל מאגר התמונות ולהשוות כל תמונה לתמונה אחרת. לדבריו, מדובר באתגר מחשובי אדיר, אך הוא מקווה שתוך מספר חודשים הוא יסתיים, ואז תשוב הגניזה לקדמותה, לראשונה מאז נקברה בעליית הגג בקהיר.

 

המאה ה-19 עולה לרשת

 

שויקה והצוות שלו אינם היחידים שעובדים על הצלת אוצרות תרבות היסטוריים מהכחדה. חברת גייל, חטיבת בת של קונגייט האמריקאית, היא הוצאה לאור המתמחה בדיגיטציה של ספרים עתיקים ונחשבת לגדולה מסוגה בעולם.

 

 

מרכז הדיגיטציה של הספרייה הלאומית. ארכיון של 120 אלף ספרים מרכז הדיגיטציה של הספרייה הלאומית. ארכיון של 120 אלף ספרים

 

החברה עובדת בימים אלו על הקמת מאגר ארכיוני עצום עבור המאה ה־19, העמוסה לעייפה במהפכות חברתיות וטכנולוגיות. יותר ספרים נכתבו במאה ה־19 מכל המאות שקדמו לה, בעיקר בזכות החדירה המהירה של מכונות דפוס חדשות. אבל מעטים מהספרים האלו שרדו עד היום, ומעטים אף יותר נסרקו ועלו לרשת.

 

ג'ים דרייפר, המוציא לאור של גייל, מקווה שעד סוף השנה החברה תסרוק למעלה ממיליון עמודים. "אין ספק שייקח לפחות עשור עד שנסיים את המאגר. אף אחד לא הצליח להתגבר על כמות החומר העצומה, אנחנו החברה היחידה שבאמת מעיזה להתמודד עם זה". גם דרייפר יופיע בכנס Info, שיערך במהלך החודש הקרוב.

 

דרייפר מסביר כי לא מדובר רק בספרים, אלא גם תסריטים, יומנים, מאמרים, מפות, תמונות, עלונים ופוסטרים — מאגר תרבותי שלם של המאה. לאחר מכן החברה תמכור את המאגר לספריות ואוניברסיטאות ובסופו של דבר הוא יכלול מאות מיליוני עמודים, כולל 300 אלף ספרים מלאים. החוקרים יוכלו לבצע כריית מידע אמיתית — כמו לחפש את השכיחות של מילים או קבוצות מילים מסוימות. בדרך זו אפשר למפות את התקופה, הסופרים ואת השינויים התרבותיים.

 

רוב הפרויקטים הדומים לשלכם מציעים את המאגרים בחינם. אתה לא חושב שאתם בבעיה?

 

"אני לא רואה את גוגל והאחרים כמתחרים. הפרויקט שלנו הוא פרויקט משלים. אנחנו מנסים לפתח כלי אקדמאי. תמיד יהיה צורך במוציאים לאור בתחום שלנו. אנחנו נפגשים עם החוקרים, הספרנים, האוצרים ולומדים את הצרכים שלהם".

 

מה מיוחד באוסף שלכם?

 

"יש סיפורים מרתקים מאחורי המידע שאנחנו מעלים. אנחנו עובדים למשל עם הספריה הבריטית, עם חומרים שאף פעם לא עברו דיגיטיציה, גם לא למיקרופילם. הם מתארים את החיים באותה תקופה. אנחנו מדברים על צווי משפט, יומנים, החיים של הפועלים והאנשים הרגילים, סיפורים שאף אחד לא סיפר עד היום".

 

איך שומרים על ספרים כל כך עתיקים?

 

"כל העבודה מתבצעת במקום, ביד ועל ידי אוצרים. העבודה יכולה לדרוש דקות לכל עמוד, לפעמים אפילו יותר במקרים של אוספים לא מאורגנים".

 

כמוציא לאור, אתה לא מודאג מעתידך?

 

"לא. הדרישה לחומר איכותי מעולם לא היתה גבוהה יותר. יש עלייה ברמת ההשכלה, בנגישות. זה נכון שהתעשייה משתנה, אבל כמות הספרים והמאמרים שיוצאים לאור רק עולה. זה נכון שהאינטרנט משנה את העולם, אבל אנחנו רואים רק עלייה בדרישה לתוכן".

 

120 שנה באתר אחד

 

דרייפר יגיע לישראל בשבוע הבא לכבוד כנס Info, וייפגש עם חלק מהחברות והארגונים שעובדים עימם, ביניהם הספריה הלאומית, האוניברסיטה העברית, אוניברסיטת תל אביב וחברת טלדן. בשנים הקרובות החברה גם תכלול במאגר של המאה ה־19 אוסף של כתבים מהמזרח התיכון ובתחום המזרחנות.

 

הוא יסייע לספריה הלאומית בטרנספורמציה הדיגיטלית שלה. לפי אורן ויינברג, מנכ"ל הספריה, מדובר בארכיון של למעלה מ־120 שנות תרבות ישראלית ויהודית, הכוללת "120 אלף ספרים, וגם אלפי דברי עיתונות, ארכיון מוזיקה ישראלית, כרוזים, מודעות, גלויות, כתבי יד, המייצגים כולם את התרבות של עם ישראל". הארכיון המלא יעלה לאוויר עוד השנה.

 

הספריה גם עובדת על מספר פרויקטים אחרים, ביניהם ארכיון ישראל, שירכז את כל אוספי התרבות של מסורת ישראל תחת פלטפורמה אחת ובסופו יכלול לא פחות מ־30 ארכיונים מקומיים ובינלאומיים. פרויקט נוסף יהיה רשת לאומית לאתרי מורשת.

 

גם מוזיאון ישראל בחזית

 

מוזיאון ישראל הצטרף לאחרונה לפרויקט האמנות הבינלאומי של גוגל, היוצר מוזיאונים וירטואליים באמצעות טכנולוגיית סטריט־ויו. גולשים יכולים פשוט להיכנס לאתר הפרויקט, לבחור באחד מ־151 מוזיאונים שצולמו במסגרת הפרויקט ולהתחיל לנוע במורד המסדרונות הווירטואליים ולצפות בסריקות באיכות גבוהה של פריטי אמנות, אשר מראות יותר פרטים ממה שניתן להבחין בעין האנושית.

 

 

האופניים של גוגל במהלך הצילומים במוזיאון ישראל האופניים של גוגל במהלך הצילומים במוזיאון ישראל

 

זה אינו שיתוף הפעולה הראשון בין מוזיאון ישראל וגוגל. לפני כחצי שנה פורסמו הסריקות של מגילות ים המלח המפורסמות, שבוצעו על ידי גוגל ומוזיאון ישראל, וכבר בימים הראשונים ביקרו באתר מיליוני מבקרים.

 

גוגל מעורבת בתחום שימור המידע הדיגיטלי מזה שנים רבות. היא מפעילה את אחד מהפרויקטים הגדולים בעולם לתיעוד ספרים, והיא סרקה למעלה מ־5 מיליון ספרים עתיקים מ־500 השנים האחרונות. היא גם יצרה ארכיונים דיגיטליים למוזיאון יד ושם ומוזיאונים על של נלסון מנדלה ודזמונד טוטו, פרויקטים שהתחילו בצורה מקומית על ידי עובדי גוגל ישראל. החברה גם עובדת עם רשות העתיקות.

 

התוצאה של כל הפרויקטים הנפרדים הללו היא שהחברה החליטה להקים לבסוף מרכז שימור תרבות, שנבנה בימים אלו בפריז ויעסיק עשרות מעובדי גוגל במשרה מלאה. לגוגל ישראל יש מעורבות משמעותית בפרויקט, ואייל מילר, מנהל הפיתוח העסקי בגוגל ישראל, מסייע בהקמתו. "היוזמה של המהנדסים הישראלים הפכה לחזון בינלאומי רחב יותר".

בטל שלח
    לכל התגובות
    x