בקצב בו העולם מתקדם, ביג דאטה (BIG DATA) הוא כמעט היסטוריה עתיקה, אך למרות זאת, המימוש שלו עדיין לא ברור עד הסוף. כאשר מדברים על נושא זה, אוהבים לזרוק מספרים עצומים לגבי כמות סרטוני הווידאו המועלים ליוטיוב בשעה או התמונות שמועלים לפייסבוק בדקה, אך יחד עם זאת, נשאלת השאלה: כיצד כל אלו משפרים את חיינו? במסגרת פרויקט NAEC, הציגו עובדי ה-OECD את הפרויקטים השונים, המסתמכים על BIG DATA וכיצד אלו יכולים להוביל לחיים טובים יותר.
להסתכל על העתיד ולא על העבר
ארגון ה-OECD משמש, בין היתר, כמרכז עצום של מידע סטטיסטי הנאסף מהמדינות וממקורות חיצוניים, באמצעותו ניתן לייצר ידע, מסקנות ואף מדיניות, אך לרוב, המידע שעליו מסתמך הארגון אינו עדכני אלא הולך אחורה, לפחות שנתיים. לעתים קרובות אף יותר, כמו במקרה של שיעור הילדים העניים במדינות ה-OECD, אינדיקטור שהסתמך על נתונים משנת 2013, כאשר אנחנו תכף ב-2016. בעיה זו חמורה אף יותר, כאשר מתרחשים משברים כלכליים, כמו משבר הפיננסים או משבר אזור היורו ולארגון ה-OECD יש קושי להישאר רלוונטי, כיוון שהניתוח המעודכן ביותר יגיע רק שנתיים אחרי. האם אפשר אחרת? לעיתים קרובות זה בלתי אפשרי, אך פעמים רבות המידע הרלוונטי נמצא אי-שם, במעמקי האינטרנט, בעולם ה-BIG DATA, המצריך יכולת לאסוף אותו. מדינות רבות כבר אוספות מידע בזמן אמת ומשתמשות בנתוני מיקרו המאפשרים ניתוח בזמן אמת.

שימוש נוסף ב-BIG DATA הוא האפשרות להיות לוקאלי, כי מדינות רבות אוספות נתונים מסוימים רק ברמה הלאומית. דוגמה לכך, היא מדד המחירים לצרכן, המורכב ממחירי דיור ומזון. מידע מקומי כבר קיים באתרי מכירות והחידוש הגדול הוא היכולת לאסוף אותו ולעבד אותו. האתגר המרכזי בנושא BIG DATA הוא איכות המידע ורעשי הרקע הקיימים מסביב, כיוון שהשאלה ששואל סוקר הרבה יותר מכוונת מטרה מאשר שאילתה בגוגל או פרסום בפייסבוק. אתגר נוסף ואולי חשוב יותר הוא האם המידע הזה מייצג את כלל האוכלוסייה, בעיקר כאשר מדברים על פייסבוק כברומטר חברתי? האם רשת חברתית זו מייצגת את כלל ישראל או חתך מסוים ספציפי? אתגר נוסף ובעייתי ביותר הוא, שרוב ה- BIG DATA אינו שייך למדינה אלא לסקטור הפרטי ולחברות מסחריות, שלא מחויבות או מעוניינות לחשוף אותו למחקרים.
המטרה העיקרית של ה-OECD וארגונים אחרים האוספים BIG DATA היא לעבור מניתוח בדיעבד לניתוח בזמן אמת ולמעשה לבטל את ניתוח המודלים, המסתמך על תיאוריות ולא על ממצאים קיימים. כאשר המדינה רוצה מידע על מצבם הכלכלי של אזרחיה, היא מבצעת סקר עם 500 או 1,500 משתתפים במדינות גדולות יותר, אך מדוע לא להשתמש בנתוני מיקרו על כלל האזרחים ולעבור מסקר לחיים האמתיים? פעמיים רבות זו בעיה טכנולוגית או משפטית, אבל בתחומים רבים המידע נאסף באופן קבוע, אך לא משתמשים בו לניתוחים מערכתיים. כאשר אתם הולכים לקופת החולים, הרופא מתעד הכול, אך המידע הזה לא הופך לידע כללי על המערכת ובריאות הציבור. האפשריות אין סופיות, הכול תלוי בטכנולוגיה ובחזון של המדינה.

העתיד ב-OECD: להפסיק להיות ממוצעים
כלל הפרויקטים, שמוצגים פה, מסתמכים על BIG DATA או נתוני מיקרו והמטרות העיקריות הן לקבל תוצאות בזמן אמת ולחשוב מעבר לממוצע ,כיוון שסקרים מכוונים לממוצע, אך כיוון ש- BIG DATA ונתוני מיקרו אמורים לכלול את כלל האזרחים, ניתן לייצר מדיניות ספציפית לכל חתך ולא מדיניות המותאמת לממוצע.
מדד החיים הטובים: פרויקט חדשני ב-OECD בודק את השאילתות בגוגל כסמן לאיכות החיים הסובייקטיבית בארה”ב. עד היום, רוב הנתונים שנאספו בוצעו על-ידי חברת הסקרים הגדולה בעולם גאלופ, אך הנתונים הם לרוב הולכים שנתיים אחורה. לגוגל יש יתרון נוסף על-פני סקרים, כיוון שהם חושפים רצונות האזרחים, שלא בהכרח היו מתוודים עליהם לסוקרים אנושיים. מלות חיפוש הנאספות אינן רנדומליות, אלא מחולקות לקטגוריות, כמו: חיפוש עבודה, בטחון פיננסי, משפחה והנאה.
כולנו מגינים על הסביבה: בתחום הסביבה, כל אדם יכול להיות תחנת ממסר לשם בדיקת איכות המים, אוויר, גיוון ביולוגי ועוד. בתחום זה השימוש ב- BIG DATA כבר קיים במדינות רבות דרך המידע, שנאסף באמצעות לוויינים ותחנות ממסר מקומיות, המאפשר לאסוף מידע ברזולוציה גבוהה על איכות המים, האוויר ועוד.
כלכלה פרטית: כולם יודעים, שרפורמות מבניות טובות לכלכלה, כלומר לצמיחה ולנתונים המאקרו-כלכליים, אך כיצד עניין זה משפיע על האדם הבודד? באמצעות נתוני מיקרו הקיימים כבר במדינות רבות ניתן לראות את ההשפעה של כל רפורמה בשוק התעסוקה על האפשרות להיות מבוטל. פרויקט זה הוא הדוגמה הקלאסית לחשיבה מעבר לממוצע ולהתאמת מדיניות לקהל ספציפי.

מחשבות ההמון: מרכז הפיתוח עובד עם מדינות לא OECD, מדינות מתפתחות, רבות מהן באפריקה. כאשר בודקים את התמ”ג במדינות אפריקה רואים שיש מגמה של צמיחה, שרק תתגבר בשנים הקרובות, אך כמו במדינות ה-OECD, התמ”ג לא מספר על איכות החיים ולכן יצרו אינדיקטורים נוספים להבין את רמת החיים כגון “מחאות חברתיות”, כלומר: היחס בין האזרחים לממשלה והמדד נבנה באמצעות מידע המגיע מסוכנויות ידיעות כמו AFP ורויטרס. התוצאות הראשונות מראות, שבתחילת שנות ה-90 הייתה ירידה במחאה חברתית, עד לאמצע שנות ה-2000 ואז רואים שהמדד חוזר לצמוח. מהי המסקנה? התמ”ג אמנם עולה אך אתו גם האינפלציה, שיצרה יוקר מחייה המקשה על אנשים רבים לשלם על מזון ותחבורה. המידע הזה גם מאפשר לראות את המוטיבציה מאחורי ההפגנות ומצאו שלרוב, הדרישות הן לשכר גבוה יותר. המטרה הבאה היא לבצע ניתוח שכזה למדינות ה-OECD, אך יש אתגרים כיוון שצריך לבטל ידיעות זהות, להבין את הקשר המלים וכדומה.
תחבורה – מדיניות מבוססת נתונים: תפקיד ה-ITF (שישראל הצטרפה אליו לא מכבר) הוא לספק עצות למדיניות טובה יותר בתחבורה. הארגון עובר מייעוץ המשולב מודלים לייעוץ המבוסס על נתוני אמת המגיעים מסנסורים רבים- מצלמות, רכבי אובר, GPS ברכבים ואף סמארטפונים והיחס בין הרכיבים השונים: רכבות, אוטובוסים, אופניים והולכי רגל. החשיבות היא להבין כיצד העיר עובדת כדי לתכנן את העתיד.
ערים פרודוקטיביות: ערים יותר פרודוקטיביות מאשר כפרים וערים גדולות פרודוקטיביות יותר מאשר ערים קטנות, מדוע? אחת מההשערות היא, שצפיפות מאפשרת ריכוז משאבים יעיל וכדי לבדוק זאת יש להבין את הצפיפות בערים, אך הנתונים לא תמיד מדויקים. לכן, בפרויקט זה לא משתמשים בנתונים לאומיים, אלא בנתוני לוויין, המאפשרים לראות את הצפיפות. מנהלי הפרויקט גילו, שהצפיפות הכללית אינה רלוונטית כלל לפרודוקטיביות, אלא רק הצפיפות במרכז העיר או בחלקים החשובים בה. שאלה שנייה, שפרויקט זה שואל, היא חשיבות התחבורה לפרודוקטיביות וכדי לדעת זאת הם לקחו נתונים מגוגל מפות, הנותן הערכה בכל חיפוש לזמן הגעה מא-לב’, יצרו מדד של איכות התחבורה והשוו אותו לפרודוקטיביות הערים.
