דורון גוראל
דורון גוראל
מילים מילים מילים מילים

אילו מוניות היו גחלילות

אילו מוניות היו גחלילות

כ-13,500 מוניות צהובות חורשות את רחובות התפוח הגדול, בהן נוהגים כ-30,000 נהגים, ונוסעים בהן מדי שנה כ-241 מיליון נוסעים. כל הטירוף הזה מוסדר על ידי ועד המוניות והלימוזינות של ניו-יורק (TLC). בזכות בקשת חופש מידע, כל הנסיעות שתועדו על ידי הארגון מ-2009 ועד יוני 2016 פורסמו וזמינות להורדה על ידי הציבור הרחב. לפני שאתם רצים להוריד את הנתונים, קחו בחשבון שמדובר בקובץ במשקל מכובד של 400GB בו מפורטים נקוות האיסוף, ההורדה והמחיר של 1,300,000,000 נסיעות שנערכו בעיר.

עם כמות כזו של נתונים עולה אתגר ממשי בניתוח ובהצגה של המידע. תרשים פיזור רגיל ייצור בעיקר בלגאן, ותרשימי קו או היסטוגרמות מפספסות את העושר שקיים בסט הנתונים. אחד הניסיונות המגניבים לחבר קהל לנתונים הללו בוצע על ידי מפתח מוכשר בשם כריס וונג, אשר יצר ממשק אינטראקטיבי המציג יום בחיי מונית אקראית. אך השיטה של וונג, מגניבה ככשל שתהיה לא מספקת תובנות על כלל הנתונים, אלא רק בוחנת מקרה פרטני. לאחרונה פרסם מדען הנתונים ד”ר ראבי שכאר כמה “מפות” מרשימות שיצר בעזרת ספריית Datashader בפייתון.

img1

איסוף נוסעים בעיר ניו-יורק

למעשה כלל לא מדובר במפות, אלא פשוט תרשים דו מימדי המציג את כלל נקודות הציון בסט הנתונים, כאשר עוצמת הבהירות של כל פיקסל מייצגת את כמות הפעמים שנקודה זו מופיעה בסט הנתונים. מה שנראה בבירור כרחובות נוצר פשוט מתוך הנתונים. אפשר לשים לב לטשטוש המופיע בעיקר במרכז ובדרום מנהטן. הטשטוש נגרם מחוסר הדיוק של נתוני ה-GPS, אשר נובע בעיקר מהדהוד שידורי לוויני ה-GPS על ידי בניינים גבוהים, דבר המקשה על המכשיר לחשב נקודת ציון מדוייקת.

img2

הורדת נוסעים בעיר ניו-יורק

במבט חטוף ובאופן לא מפתיע נראה שאזורי האיסוף זהים לחלוטין לאזורי ההורדה. אך כשלוקחים צעד אחורה ומסתכלים על כלל המטרופולין…

img3

איסוף נוסעים במטרופולין

img4

הורדת נוסעים במטרופולין

ניתן לראות שמחוץ לחצי האי מנהטן ישנן יותר הורדות נוסעים מאשר איסופים. וכן נקודות ההורדה יותר מגוונות מנקודות האיסוף. השערה אחת שיכולה להסביר את ההבדל היא שתושבי השכונות הפריפריאליות מגיעים לעיר בשעות בהן התחבורה הציבורית פעילה ויעילה, אך חוזרים מבילויים בשעות מאוחרות בהן הם נדרשים לחזור במונית. איסוף והורדת נוסעים בעיר ניו-יורק

img5

כאשר מציגים את שתי המפות אחת על גבי השניה ניתן לזהות דפוסים מעניינים. הנקודות הירקרקות מייצגות מקומות בהן התרחשו יותר איסופים מהורדות נוסעים, ולהפך באשר לנקודות הכתומות.

ניתן להבחין כי בעיר מנהטן נוסעים נוטים לעלות על מוניות ברחובות החוצים את העיר מצפון לדרום, אך מרבית ההורדות מתבצעות ברחובות המוליכים ממזרח למערב. בפריפריה גם ניתן להבחין בדפוס לפיו נוסעים עולים על מונית ברחובות הראשיים אך יורדים מהן ברחובות הפנימיים של שכונות המגורים.

כמו שאומרים, לפעמים וויזואליזציה אחת שווה אלף ניתוחים סטטיסטיים 😉

אז בפעם הבאה שאתם מנסים לתפוס מונית בניו-יורק, אולי כדאי שתלכו ל-avenue הקרוב לתפוס מונית שנוסעת על ציר צפון-דרום.

למאמר המלא, לחצו כאן

comments powered by Disqus