Priručnik za data novinarstvo 1.0
Loading

Kako je Datablog koristio crowdsourcing kako bi izvještavao o prodaji ulaznica za Olimpijske igre

Mislim da je naš najpopularniji crowdsourcing projekat bila priča o prodaji ulaznica za Olimpijadu. Na hiljade ljudi u UK-u je pokušalo doći do ulaznica za Olimpijske igre 2012. i mnogi su se razbjesnjeli jer nisu u tome uspjeli. Ljudi su naručili ulaznice vrijedne hiljade funti i onda su ih obavijestili da neće ništa dobiti. Ali niko nije znao da li se tu zapravo radi o nekolicini ljudi koji su se žalili na sva zvona, dok ih je većina zapravo bila zadovoljna uslugom. Tako da smo pokušali naći način da to saznamo.

Došli smo do zaključka da je najbolje da, u nedostatku podataka, direktno pitamo ljude. I mislili smo da ćemo ovaj projekat morati tretirati kao zabavni sadržaj jer se ne radi o izbalansiranom uzorku.

Kreirali smo Google formular i postavili veoma precizna pitanja. Formular je bio dug: pitao je koliko su vrijedne ulaznice koje su naručili, koliki iznos im je odbijen sa kartice, na koje događaje su željeli ići i tako dalje.

Figure 13. Koliko ste ulaznica za Olimpijske igre nabavili?: odgovori čitalaca (the Guardian)

Postavili smo ga u obliku male slike na početnu stranicu sajta i veoma brzo su ga korisnici počeli međusobno dijeliti. Mislim da je ovo jedna od ključnih stvari; ne možete samo misliti "Šta nama treba za priču?", već i "Šta nam ljudi žele ispričati?". I tek kada dobijete uvid u to o čemu ljudi žele razgoavarati, crowdsourcing može biti uspješan. Ovaj projekat, koji predstavlja jedan od naših prvih pokušaja crowdsourcinga, je imao ogroman odaziv. Dobili smo hiljadu odgovora za manje od sat vremena i sedam hiljada do kraja tog dana.

Nakon toga smo se ozbiljnije posvetili prezentovanju tih kvantitativnih podataka. U početku nismo imali pojma koliko će projekat biti uspješan. Tako da smo dodali neke napomene: moguće je da su čitaoci Guardiana imućniji od drugih, ljudi koju su dobili manje će možda biti spremniji da razgovaraju sa nama, i tako dalje.

Nismo znali koju će vrijednost imati rezultati. Na kraju smo dobili sedam hiljada podataka na kojima možemo bazirati našu priču i saznali smo da oko polovine ljudi koji su tražili ulaznice nisu ništa dobili. Sve smo to uvrstili i, pošto je toliko ljudi poslalo odgovore, vladao je ogroman interes za rezultate.

Nekoliko sedmica kasnije, izašla je zvanična verzija kratkog izvještaja i pokazalo se da su naše cifre bile nevjerovatno blizu. Bile su skoro identične. Mislim da smo djelimično imali sreće, ali je djelimično utjecalo i to što smo dobili toliko odgovora od ljudi.

Ukoliko ovakva pitanja čitaocima postavite u rubrikama za komentare, nećete moći puno toga uraditi sa rezultatima. Tako da prije svega morate razmisliti o tome koji je najbolji alat koji možete upotrijebiti kako biste saznali ono što vas interesuje. Da li da koristite rubriku za komentare? Da li da izgradite aplikaciju? Ukoliko se uspostavi da je aplikacija najbolje rješenje, trebate se zapitati da li se isplati toliko čekati. I da li je vrijedno resursa koji se morati uložiti.

U ovom slučaju, mi smo se odlučili za Google Forms. Ukoliko neko ispuni formular, vi rezultate vidite kao red u tabeli. To znači da sam mogao, iako su odgovori još uvijek pristizali i tabela se još uvijek ažurirala, odmah otvoriti tabelu i vidjeti rezultate.

Možda sam mogao pokušati ovo odraditi u Googleu, ali sam ga downloadovao u Microsoft Excel i onda sve sortirao od niskih do visokih iznosa, našao polja u koja su ljudi unijeli iznose slovima umjesto brojevima i popravio ih. Odlučio sam da što manje stvari izostavim. Tako da se nisam skoncentrisao samo na validne odgovore, već sam pokušao i da popravim ostale. Neki čitaoci su koristili strane valute, tako da sam ih konvertovao u funte, što je sve bilo pomalo naporno.

Ali cijela analiza je bila gotova za nekoliko sati i izbacio sam unose koji su bili očigledno neozbiljni. Mnogo ljudi je odlučilo da ispuni formular i da naglasi da nisu nimalo novca potrošili na ulaznice. To je malo neozbiljno, ali nema veze. Ovakvih je bilo stotinjak od preko sedam hiljada odgovora.

Bilo je i nekoliko desetina koji su namjerno naveli nevjerovatno visoke iznose kako bi pokušali narušiti rezultate. Navodili su iznose od 10 miliona funti. Tako da sam na kraju dobio set koji sam mogao iskoristiti za standardnu obradu podataka. Napravio sam takozvanu "pivot tabelu", našao neke srednje vrijednosti i slično.

Nismo imali pojma koliki će odaziv projekat izazvati, tako da sam samo ja sarađivao sa urednikom bloga Sports. Udružili smo snage i smatrali da će ovo biti jedan zabavan projekat. I sve smo završili za 24 sata. Imali smo ideju, na pauzi za ručak smo sastavili nešto za početak, to smo postavili na početnu stranu sajta. Projekat se odmah pokazao popularnim, pa smo ga zadržali na početnoj strani i ostatak dana i onda sljedećeg jutra rezultate predstavili online.

Odlučili smo da koristimo Google Docs jer omogućava potpunu kontrolu nad rezultatima. Nisam morao koristiti tuđe alate za analizu. Jednostavno sam sve stavio u softver za baze podataka ili u tabele. Kada počnete koristiti softvere specijalizirane za ankete, često možete koristiti samo njihove alate. Da su informacije koje smo tražili bile posebno osjetljive, dvoumili bismo se da li da koristimo Google i pokušali smisliti kako da iskoristimo nešto naše. Ali, generalno je lako ubaciti Google formular na Guardianov sajt i korisnicima je skoro nevidljivo da ga koristimo. Tako da je jako zgodan.

Data novinarima koji žele koristiti crowdsourcing poručujem sljedeće: morate tačno znati šta želite saznati. Koliko god je moguće, pitanja formulišite tako da nude višestruke odgovore. Pokušajte naći osnovne demografske podatke o ciljanoj publici kako biste znali da li vam je uzorak objektivan. Ukoliko tražite da se navode iznosi, uključite objašnjenje da se koriste cifre, da se iznos treba izraziti u određenoj valuti i slično. Mnogi to neće uraditi, ali što im dajete više uputstava, to je bolje. I uvijek, uvijek ostavite okvir za komentare, jer će mnogi ljudi ispuniti ono što se od njih traži, ali će zapravo najviše željeti da vam pruže svoje mišljenje o priči. Naročito kada je u pitanju priča koja se tiče potrošača i nečega što je izazvalo bijes javnosti.

Marianne Bouchart, Data Journalism Blog, intervjuira James Balla, the Guardian