DATA VIZ – בעברית: הדמיית נתונים

המושג DATAVIZ, קיצור של DATA VISUALIZTION הפך שגור יותר ויותר בשנים האחרונות ועם זאת, מדובר בתחום חדש יחסית. הוא מרכז ידע משלושה תחומים שלכאורה, אין ביניהם קשר אינטואיטיבי: אנליטיקה, אסטטיקה ומדעי המוח.

 

עם ריבוי המידע וכלי ניתוח המידע שעומדים היום לרשות כל אחד ואחד מאיתנו – אנחנו מוצפים בנתונים, בסטטיסטיקות, בדוחות ובאופן כללי – בנתונים.

DATA VIZ או הדמייה חזותית – אמורה להקל על הבנת הנתונים.

כתבתי "אמורה" – כי אני נתקלת בכל כך הרבה הדמיות שמבקום לפשט את ההבנה או שמסבכות את הצופה, או שמטעות אותו או שמפשטות יותר מידי את המידע.

בכלל, חשוב להבין במה מדובר.

 

כמי שעוסקת כל הזמן בצורך לתמצת מידע, לתרגם אותו לשפה של מי שיצפה במידע – אני חושבת שהדמיה חזותית צריכה לעסוק בהצגת תובנות, הקניית חוכמה ודרך לתקשורת טובה בין מנתחי המידע למשתמש הסופי.

 

מהי בכלל הדמיית נתונים?

אם נחשוב על זה, כבר בימי קדם אנשים השתמשו בציור כדי להעביר מידע. בציורי מערות עתיקים ניתן למצוא רישומים של חיות שנמצו באזור, כמויות שלהן, גדלים וכו'.
בתקופה המודרנית יותר, ניתן למצוא הדמיות של מידע, החל ממפות מהמאה ה-17, המצאת הפאי בתחילת המאה ה-19 ועד להדמיות הדינמיות של ימינו.

הרעיון מאז ומעולם היה להעביר הרבה מאוד נתונים בצורה מאוגדת, מנותחת ומוצגת באופן שיובן על ידי כל מי שיתבונן בה.

מפה גיאורפית – כל מי שצופה במפה יכול לזהות בקלות מדינה מסויימת, להשוות בקלות את המיקום שלה על פני כדור הארץ, היחס בגודל ובמרחק בינה לבין כל האחרות.
דוגמה נוספת – מפת הפלנטות. גם בלי להבין את סדרי הגודל עצמם – אנחנו יכולים להבין איפה ממוקם כדור הארץ, מה גודלו ביחס לאחרים ומה המרחק ביחס לשמש.

לגבי הפאי – מאז התפתחו גרפים נוספים – חלקם, אפילו בשנים האחרונות.
ככל שישנם יותר נתונים, ככה נדרשות דרכים יצירתיות יותר ויותר להציג אותם באופן ברור.

 

מדוע הדמיית נתונים חשובה?

בשל האופן שבו המוח האנושי מעבד מידע, שימוש בתרשימים או גרפים מקל על ההבנה של כמויות גדולות של נתונים מורכבים – קל בהרבה מאשר הבנה של גליונות אלקטרוניים או דוחות.

הדמיית נתונים היא דרך מהירה וקלה להעביר מושגים באופן אוניברסלי – לעיתים ללא תלות בשפה ובתרבות.

לדוגמה: בחשבונות החשמל בארץ מציגים את נתוני השימוש בהשוואה בין החודשים השונים בשנה וביחס לצריכה הממוצעת באזור.
ניתוח זה, ניתן להבנה קלה גם על ידי מישהו שאינו דובר עברית רהוטה, וגם על ידי מישהו שלא ממש אוהב או יודע להתעמק במספרים.

בעולם העסקי, השימוש בהדמיות חזותיות מהוות מרכיב חשוב בניתוחים כגון: זיהוי אזורים הזקוקים לתשומת לב או לשיפור, המחשה של גורמים המשפיעים על התנהגות הלקוחות, חיזוי נפחי מכירות, השוואות בין שכר עובדים ועוד ועוד.

לא רק נתונים כמותיים, גם נתונים איכותיים ניתנים לתרגום: שביעות רצון לקוחות, פעולות אבטחת איכות, שביעות רצון עובדים וכו'.

הדמיית הנתונים – מציירת באופן ברור את הנתונים שנאספו. מקבלי ההחלטות יכולים לקבל החלטה מהירה, שהיתה לוקחת זמן רב אם היו צריכים להתעמק בנתונים, לנתח אותם ולהסיק את המסקנות.

 

איך זה עובד בפועל?

נאמר שיש לי נתונים של כלל המכירות של החברה בשנה האחרונה.

השלב הראשון יכול להתבצע באחת משתי הדרכים:

  • להחליט על תובנה אותה נרצה לקבל – למשל, איזה מהמוצרים (שירותים) הם הרווחיים ביותר.
  • לאסוף נתונים קיימים ולראות מה ניתן ללמוד מהם.

השלב השני – ניתוח הנתונים

  • במקרה וקבענו תובנה שנרצה לקבל – צריך לבדוק איזה נתונים נצטרך לאסוף. בדוגמה שלהלן נצטרך לאסוף נתונים לגבי עלויות ייצור, עלויות אכסון, עלויות שינוע ונתוני מכירות.
  • במקרה שיש לנו נתונים קיימים – נראה איזה תובנות ניתן להפיק מהם ואילו נתונים נוספים נצטרך לחבר אליהם כדי להגיע למסקנות.

השלב השלישי – הצגת נתונים

כאן צריך לבדוק כמה נושאים:

  • מה מטרת הצגת הנתונים
  • בפני מי מציגים את הנתונים
  • מהי הדרך הנכונה להציג את הנתונים כדי לענות על סעיף א.

צריך להביא בחשבון עוד מספר גורמים: האם ההצגה היא חד פעמית או שאנחנו רוצים שהם יתעדכנו באופן שוטף?
באיזה אמצעי נציג את הנתונים? כל אחד במחשב שלו? פרזנטציה פרונטלית? שליחת דו"ח במייל? העלאת מצגת באתר?

 

אז למה לפעמים זה לא עובד?

לטעמי, הסיבה העיקרית להדמייה לא מוצלחת היא הנסיון לרכז יותר מידי או פחות מידי מידע בהדמייה אחת.
סיבה חשובה נוספת אי חוסר הבנה באיך המוח האנושי תופס יחס, צבע וצורה.

אם נחזור לתחילת המאמר – הדמיית נתונים דורשת היכרות עם שלושה תחומים: אנליטיקה, אסטטיקה ומדעי המוח.

אנליטיקה –  לא מספיק לדעת לנתח נתונים. כשיוצרים הדמייה – היא צריכה להביא את התובנות, המסקנות – לא רק את ניתוח המידע.

לדוגמה:

טבלת נתונים מרכזת של נתוני מכירות שנתיים.

הדאטה במקור כללה כמות רבה שורות – שורה אחת בגין כל פריט שנמכר. סה"כ 2032 שורות שצומצמו ל-12 ולשורת כותרת.

טבלת נתונים מרכזת

 

גרף א' – מציג את הנתונים

גרף שמציג את הנתונים מהטבלה

 

 

 

 

 

 

 

 

 

 

גרף ב' – מציג תובנות

גם הדמייה, גם הבאת תובנות 

 

מבחינת ההאנליטיקה  – היא די דומה בשלושת ההדמיות: ריכוז נתוני מכירות שנתיים וחלוקתם לחודשים. במקום מאות שורות של מידע – ריכוז של הנתונים.

 

בשתי ההדמיות הבאות – נכנסת לתמונה גם תחום האסטטיקה – הויזואליה. יותר קל להבין גם את היחסים בין הנתוים.

בהדמייה השלישית – נכנס תחום מדעי המוח: איך להציג את המידע עם סיפור ברור מאחוריו. איך להפנות את תשומת הלב של הצופה למסר שהמציג רוצה להעביר.

 

שינוי קטן – אבל משמעותי. בטבלה, רצף של מספרים. צריך לקרוא ולהבין מה היחס ביניהם, מי גדול יותר, מי קטן ומה זה בעצם אומר.

בגרף א' – מוצגים הנתונים בצורה ויזואלית. קל לראות את היחס בין החודשים השונים. אפשר להתחיל להסיק מסקנות, מסקנות שונות.

בגרף ב' – יש סיפור. מה הנתונים אומרים בפועל, איזו תובנה רוצה מציג הנתונים שתבינו.  רובנו מבינים שאת הגרף השני הציג מישהו שיש לו עניין לצאת בקמפיין פרסום.

 

בכל המקרים, מדובר בסוג של הדמיית נתונים. אבל רק במקרה אחד – ההדמייה מביאה את התובנות. ההדמייה מספרת סיפור.

 

וזהו, בקצרה רבה, הסיפור של המושג "דאטה ויז" – Data Visualization

 

מזמינה אותך לקרוא פוסט נוסף שכתבתי בעבר בנושא.

חומר לקריאה נוספת (באנגלית)