Priručnik za data novinarstvo 1.0
Loading

Subvencije za autobuski saobraćaj u Argentini

Od 2002., subvencije za javni autobuski saobraćaj u Argentini se povećavaju eksponencijalno, te svake godine pobijaju postojeći rekord. Ali 2011., nakon što je osvojila izbore, nova argentinska vlada je najavila smanjenje tih subvencija od decembra iste godine. Istovremeno, državna vlada je odlučila da administrativnu odgovornost za lokalne autobuske i metro linije prebaci vladi grada Buenos Aires. S obzirom na to da prenos nadležnosti za te subvencije nije preciziran i da nije bilo dovoljno lokalnih novčanih sredstava koja bi osigurala bezbjedan prenos sistema, grad Buenos Aires je tu odluku odbio.

Kada se to sve dešavalo, sastao sam se prvi put sa svojim kolegama u magazinu La Nación kako bismo raspravili kako da započnemo svoj prvi projekat data novinarstva. Naš urednik finansijskog sektora je naglasio kako bi bilo dobro početi od podataka koje je objavilo Ministarstvo saobraćaja (Secretaría de Transporte), jer ih je, zbog formata u kojem se nalaze i terminologije, veoma teško razumjeti.

Loši uslovi javnog prevoza utječu na svakodnevne živote preko 5.800.000 putnika. Kašnjenja, štrajkovi, kvarovi na vozilima, pa čak i nesreće su česta pojava. Zbog toga smo odlučili da istražimo gdje odlaze subvencije za javni prijevoz u Argentini, te da ove podatke učinimo lako dostupnima svim argentinskim građanima pomoću "Istraživača subvencija za saobraćaj", na kojem trenutno radimo.

Figure 21. Istraživač subvencija za javni saobraćaj (La Nación)

Prvo smo izračunali koliko autobuske kompanije mjesečno primaju od vlade. Koristili smo podatke objavljene na tranici Ministarstva za saobraćaj s na kojem je objavljeno preko 400 PDF dokumenata koji sadrže podatke o mjesečnim uplatama prema više od 1300 firmi, od 2006. do danas.

Figure 22. Rangiranje saobraćajnih firmi koje su dobile subvencije (La Nación)

Našem timu se pridružio viši programer kako bi razvio sistem koji će automatski skidati i pretvarati PDF dokumente u Excel i Database fajlove. Mi koristimo setove podataka koje na taj način dobijemo i koji sadrže preko 285.000 informacija za našu istragu i vizualizaciju za štampu i internet. Pored toga, ove podatke činimo dostupnima u formatima koji su mašinski čitljivi, tako da ih bilo koji Argentinac može koristiti i dijeliti.

Sljedeći korak je bio odrediti koliko mjesečno održavanje u prosjeku košta vladu. Kako bismo to saznali, otišli smo na drugi vladin web sajt, sajt Državne komisije za regulisanje saobraćaja (Comisión Nacional de Regulación del Transporte - CNRT), zadužene za regulisanje saobraćaja u Argentini. Ovdje smo pronašli spisak autobuskih firmi koje su ukupno posjedovale 9.000 vozila. Odredili smo standard kako bismo izjednačili imena autobuskih firmi i uporedili dva seta podataka.

Da bismo nastavili, trebao nam je registracijski broj svakog vozila. Na CNRT web sajtu smo našli spisak vozila po autobuskoj liniji po kompaniji, te njihove registracijske brojeve. Registracijski brojevi u Argentini se sastoje od slova i brojeva koji odgovaraju starosti vozila. Naprimjer, moje vozilo ima IDF234: ˝I˝ odgovara martu-aprilu 2011. Obrnutim procesom smo dešifrovali registracijske tablice autobusa koji pripadaju svim frimama, te smo tako mogli vidjeti koliko novca ide svakoj kompaniji i uporediti te iznose na osnovu prosječne starosti njihovih vozila.

Usred ovog procesa, sadržaj PDF-ova sa podacima koje je vlada objavila se misteriozno promijenio, iako su URL-ovi i imena fajlova ostali isti. Jedna od stvari koja se promijenila bilo je to što je u nekim PDF-ovima sada nedostajao vertikalni ˝total iznos˝, te je tako postalo nemoguće uporediti totale tokom cijelog perioda koji smo istraživali, 2002-2011.

Ovaj slučaj smo iznijeli na hakatonu koji je organizovao Hacks/Hackers u Bostonu, gdje nam je programer Matt Perry velikodušno kreirao nešto što zovemo ˝PDF špijun˝. Ova aplikacija je na navedenom događaju osvojila nagradu u kategoriji ˝Najintrigatnije˝. PDF špijun vodi do web stranice koja je puna PDF-ova, te provjerava da li se sadržaj unutar PDF-ova promijenio. ˝Neka vas nikada više ne zavara 'vladina transparentnost'˝, napisao je Matt Perry.

Figure 23. Poređenje starosti autobusa sa iznosom novca koje firme primaju od vlade (La Nación)

Ko je radio na projektu?

Tim od sedam novinara, programera i dizajner interaktivnih aplikacija su na ovom istraživanju radili 13 mjeseci.

Za ovaj projekat su nam bile potrebne sljedeće vještine:

  • Novinari koji su upoznati sa tim kako se dodjeljuju subvencije za javni saobraćaj i koji su rizici; poznavanje tržišta autobuskih kompanija.

  • Programer koji je vješt u izvlačenju, raščlanjivanju i normaliziranju podataka, te ekstraktovanju podataka iz PDF-ova u Excel.

  • Statističar koji analizira podatke i obavlja ostale proračune.

  • Dizajner za interaktivnu vizualizaciju podataka.

Koje alate smo koristili?

Za aplikacije smo koristili VBasic, Excel Macros, Tableau Public i Junar Open Data Platform, kao i Ruby on Rails, Google charts API i Mysql za Istraživač subvencija.

Projekat je imao veliki utjecaj. Imali smo na desetine hiljada pregleda i istraga je završila na prednjoj strani štampanog izdanja La Nación.

Uspjeh ovog prvog projekta iz data novinarstva nam je pomogao da interno objasnimo prednosti upostavljanja prakse data novinarstva koje će pomoći novinarima istraživačima i biti od koristi javnosti. Kao rezultat, nastala je Data.lanacion.com.ar, platforma na kojoj objavljujemo podatke o raznim temama od javnog interesa u formatu kojeg tražilice mogu čitati.

Angélica Peralta Ramos, La Nación (Argentina)