$
שוק ההון

טריליון ג'יגה־בייט: זה לא האחסון, זה הארגון

כמות המידע שמייצרים ארגונים ברחבי העולם מכפילה את עצמה מדי שנה ועומדת כיום על מספר דמיוני של טריליון ג'יגה־בייט בשנה. כמה חברות נענו לאתגר האחסון הפיזי והניצול היעיל של המידע ומציעות פתרונות שונים. מי מהן תשלוט בשוק ה־Big Data? כתבה ראשונה בסדרה

רמי רוזן ויוני אבישר 07:35 13.03.12

 

תחום ה־Big Data - אחסון וניצול כמויות המידע הענקיות שמייצרים ארגונים - הוא אחד האתגרים הגדולים ביותר שעומדים בפני עולם הטכנולוגיה. במישור הארגוני מדובר בהסדרת ובניית התחום במהלך השנים הקרובות, תוך כדי אינטגרציה של מספר רב של טכנולוגיות כגון אמצעי אחסון נתונים, תוכנות לניתוח עסקי והאתגר של מסדי הנתונים. בסדרת כתבות זו נעסוק בנושאים המרכזיים המרכיבים את תחום ה־Big Data וננסה לאתר את החברות המובילות את התחומים ולבחון את כדאיות ההשקעה בהן.

 

 

התחום הראשון שבו נעסוק הוא התחום הפיזי של אמצעי אחסון הנתונים והמעבר המרתק בין טכנולוגיות אחסון נתונים מבוססות דיסקים קשיחים וקלטות, לכאלה שמבוססות על זיכרונות פלאש. בעוד שכצרכנים אנו עדים מדי יום לשינוי מהפכני זה במוצרי הצריכה השונים, שהולכים והופכים לזעירים יותר, בין היתר בזכות המעבר לזיכרונות פלאש במקום דיסקים קשיחים, הרי שבתחום הארגוני התהליך נמצא בראשית דרכו. זאת, הן משום ששיקולי העלות מול תועלת הם אקוטיים יותר והן בשל פיתוח טכנולוגיות שונות ובשל מורכבות המשימות הנדרשות ברמה הארגונית.

 

המאיץ העיקרי לעלייה הדרמטית בכמויות המידע הוא הממשק שנוצר בין מערכת המידע של ארגונים לבין האינטרנט, ביכולת לנתח את התעבורה באתר החברה, במוקדי השירות, וכמובן את כל המידע שמייצרים העובדים.

בכתבה זו נתמקד בחברות שמספקות פתרונות אחסון יעילים ומהירים לכמויות המידע העצומות שהצטברו בשרתי הארגונים, במטרה לנתח בזמן אמת את המידע ולקבל תובנות עסקיות.

 

עוברים לזיכרון פלאש

 

העלייה האקספוננציאלית בכמות המידע המועברת ברשת והנשמרת בשרתי האחסון יוצרת את הצורך בפתרונות אחסון נתונים בעלי יכולות משופרות. כדי להמחיש את הזינוק המטאורי בכמות המידע המיוצר בעולם, פרסמה לאחרונה IDC מחקר שלפיו כמות המידע שיוצרה בעולם ב־2010, עלתה לראשונה על המספר הדמיוני זתא בייט (שמשמעותו טריליון ג'יגה־בייט, כלומר 1,000,000,000,000 ג'יגה־בייט) של נתונים. כמות הנתונים המיוצרת בעולם בשנה מכפילה את עצמה בפרק זמן קצר יותר משנתיים. עובדה מעניינת היא שקצב צמיחת הקבצים שנוצרים וגם נשמרים גבוה משמעותית ועומד על 500 קוואדריליון (מספר דמיוני שמשמעותו 1,000 זתא בייט).

 

בתחום אמצעי אחסון הנתונים מתחולל בשנים האחרונות שינוי טכנולוגי שבמסגרתו אמצעי האחסון משתנים מדיסקים קשיחים, HDD (Hard Disk Drive) לאמצעי זיכרון מבוססי פלאש כאשר הפורמט הפשוט והנפוץ ביותר שלהם קרוי SSD(Solid State Drive). מהלך זה נמצא בעיצומו וצפוי לצבור תאוצה חזקה בשנים הקרובות בגלל הביקוש העצום.

 

מבלי להיכנס לעומק ההבדלים בין שני סוגי הזיכרונות, נסביר כי רכיבי זיכרון מבוססי פלאש תופסים שטח אחסון פיזי נמוך יותר מדיסקים קשיחים, זמן העלאת המערכת באמצעותם קצר יותר וכך גם זמני חיפוש הנתונים ותהליך הקריאה והכתיבה. זאת על ידי צריכת אנרגיה נמוכה יותר וחיי מוצר ארוכים יותר מהדיסקים קשיחים. עכשיו נותרה רק סוגיית העלות. מחירי הדיסקים הקשיחים נמוכים משמעותית ממחירי ה־SSD, כאשר בסוף 2011, ג'יגה־בייט אחד של SSD עלה בממוצע 2.42 דולרים, בעוד שג'יגה־בייט אחד של HDD עלה 7.5 סנט בלבד, אך הפער ממשיך להיסגר.

 

פתרונות אחסון המידע

 

קיימות כמה ארכיטקטורות שחברות האחסון מפתחות למטרת שימור המידע ובמטרה לנתח את הנתונים בצורה המהירה והיעילה ביותר.

 

ענקית האחסון EMC מקדמת את צורת האחסון בצורת "שכבות" או "רמות" ("TIERING"), כאשר ברמה הגבוהה ביותר נמצא המידע החשוב והזמין ביותר לניתוח, וכאשר יורדים ברמות האחסון, שמור המידע החשוב פחות, שלכן הוא גם פחות זמין.

 

השכבה הגבוהה ביותר מבוססת על זיכרון מסוג פלאש, וככל שיורדים בשכבות הזיכרון, עוברת לכוננים האופטיים הזולים יותר מסוג HDD, כאשר בשכבה האחרונה ניתן אפשר אפילו להשתמש בזיכרון הפשוט ביותר - קלטות. ארכיטקטורת "השכבות" מאפשרת לגשת לשכבה הגבוהה ביותר שמבוססת על פלאש במהירות ובכך לנתח מידע ולקטלג אותו בלי צורך לחכות זמן רב. החוכמה נמצאת לא רק בצד הפיזי של רכיב הזיכרון אלא גם בתוכנה שיודעת איזה מידע לאחסן באיזו "שכבה", על פי דרגת חשיבות וזמינות, ובכך לתת פתרון אחסון יעיל.

 

חברת Fusion-IO, שהונפקה ברעש גדול לפני פחות משנה, מפתחת שיטת אחסון המבוססת על רכיב הזיכרון מסוג פלאש שיושב צמוד למעבד של השרת ובכך מונע צווארי בקבוק שקיימים במערכות אחרות בקשר שבין השרת ליחידת האחסון שנמצאת במקום פיזי אחר. החברה טוענת שבעזרת הפתרון שלה ניתן להגדיל את תפוקת המערכת עד פי עשרה ולהוריד עלויות, זאת לעומת מערכות אחרות שבהן כ־90% מכוח המחשוב עשויים לעתים להיות לא מנוצלים. נכון להיום, החברה שולטת ביותר מ־80% מתחום הפעילות שאותו המציאה, אך קיימות כמה חברות נוספות מנסות לחקות את הפתרון של החברה ולהציע מוצר דומה.

 

היתרון המרכזי של החברה נמצא בתוכנת המערכת שמאפשרת גם יכולות וירטואליזציה, דבר שמאפשר להריץ מספר אפליקציות שונות במקביל, ושימוש בכלים לניהול שמירת המידע בצורה יעילה. הפתרון של שילוב יחידת האחסון על השבב הוא איכותי ומהיר, ולכן נראה שחברות האחסון האחרות ימשיכו לפתח עם השנים מוצרים שיתחרו ב־Fusion-IO. נכון להיום החברה מוכרת את המוצרים שלה בצורה ישירה או בעזרת הסכמים עם חברות המחשבים דל, IBM ו־HP. קצב המכירות השנתי של החברה עומד על 300 מיליון דולר והיא צומחת ב־50% בשנה, אבל מתומחרת יקר (מכפיל הרווח גבוה מ־100) ונראה שבעתיד היא צפויה להיתקל בתחרות גוברת למוצריה.

 

חברת האחסון NetApp מקדמת פיתרון אלטרנטיבי לאור מחירו היקר של הפלאש. היא מטמיעה את הפלאש כזיכרון זמני שיושב בתוך הבקר שמנהל את מערכת האחסון ובכך מאפשר לגשת למידע בדרך המהירה והקצרה ביותר. הפתרון הזה הוא יעיל כאשר מדובר במערכות שהשימוש העיקרי בהן הוא קריאה בלבד שבו לא מוחקים ומשנים את המידע שיושב בזיכרון. הפתרון זכה להצלחה, והחברה מתקשה כעת להדביק את הביקושים להזמנות למוצר, דבר שלא נעלם מעיני חברות אחרות שוקדות על פתרון מקביל.

 

חברת HP ומספר חברות פרטיות כמו Violin Memory ו־Texas Memory מקדמות ארכיטקטורה נוספת שפשוט מחליפה את כל מערך האחסון שמבוסס על כוננים אופטיים בכוננים מסוג פלאש ובכך שומרת על כל אותם כלי פיתוח ותוכנה שבאו מעולם האחסון הקונבנציונאלי. היתרונות במעבר לפלאש הן כמובן המהירות בשמירה וקריאה של מידע והפשטות בתחזוקת כונני הפלאש. החיסרון הוא בעלות היקרה של כונני הפלאש אבל ככל שהמחיר של הפלאש יורד יותר ארגונים מטמיעים מערכות אחסון שמבוססות פלאש.

 

ניתן לומר שהכניסה לנקודת האל חזור במעבר לכונני פלאש החלה במהלך בשנתיים האחרונות, עם הגידול במידע הלא מובנה מצד אחד והרצון של הארגונים לנתח את המידע בצורה מהירה ואמינה על מנת לקבל החלטות במהירות האופטימאלית. כל אחת מצורות האחסון מבוססות הפלאש תצמח בשנים הקרובות בהתאם ליתרונות ולחסרונות שלה. בנוסף, כל החברות הגדולות יפתחו פתרונות לכל אחד מצורות האחסון שהוזכרו כאן, על מנת שלא להיתפס בלי פתרון בזמן לשוק האדיר של ה־"BIG DATA".

 

השורה התחתונה: המעבר לפתרונות זיכרון מבוססי פלאש נמצא בעיצומו, כאשר עלות הייצור שלו נמצאת במגמת ירידה. על בסיס הפלאש, מפתחות השחקניות המרכזיות בשוק מספר פתרונות שזוכים להצלחה, ובעתיד הן יאלצו להתמודד עם כניסת מתחרות חדשות לתחומי פעילותן.

 

רמי רוזן הוא מנהל מחלקת המחקר Sell Side בהראל פיננסים. יוני אבישר הוא מנהל קרנות טכנולוגיה בהראל פיא

 

x