Priručnik za data novinarstvo 1.0
Loading

Korištenje crowdsourcinga za Guardianov Datablog

Wikipedia definira crowdsourcing kao ˝distribuirani proces rješavanja problema i proizvodnje koji podrazumijeva dodjeljivanje zadataka mreži ljudi, poznatijoj kao gomila˝. Citat koji slijedi je dio iz intervjua sa Simonom Rogersom o tome kako je Datablog iskoristio crowdsourcing za izvještavanje o skandalu sa troškovima članova parlamenta, zkorištenju droga, te dokumentima o Sarah Palin:

Ponekada ćete dobiti gomile fajlova, statistika, ili izvještaja koje jedna osoba jednostavno ne može sama pregledati. Isto tako, možda ćete dobiti i materijal koji je nepristupačan ili lošeg formata i nećete moći puno toga sa njim uraditi. Upravo tu vam crowdsourcing može pomoći.

Guardian ima mnogo čitalaca, dakle mnogo parova očiju. Ukoliko naiđemo na interesantan projekat za koji nam je potreban input, možemo ih zamoliti za pomoć. Upravo to smo i uradili sa projektom MPs' Expenses (troškovi članova parlamenta). Imali smo 450.000 dokumenata i veoma malo vremena da sa njima bilo šta uradimo. Ima li boljeg načina nego da zadatak podijelimo sa našim čitaocima?

Figure 12. Uređena kopija troškova Stephena Pounda (the Guardian)

Projekat MPs Expenses je generirao mnogo odgovora. Dobili smo više priča nego podataka. Što se tiče posjećenosti sajta, ovaj projekat je bio nevjerovatno uspješan. Ljudima se zaista svidio.

Trenutno sa MixMag-om radimo na jednomprojektu o konzumiranju droge koji je također fenomenalan. Izgleda da će broj ljudi koji se na njega vraća prevazići broj ljudi koji su dolazili na anketu o kriminalu u Britaniji, što je odlično.

Za ova dva projekta je zajedničko to što se bave temama do kojih je ljudima zaista stalo, tako da su spremni da za njih odvoje vrijeme. Dosta našeg crowdsourcinga zavisi od ljudi koji se zaista opsesivno posvete zadatku. Na projektu MPs Expenses smo imali ogromnu posjećenost na samom početku, ali je ona kasnije značajno opala. Ostali su oni ljudi koji opsesivno pregledaju svaku stranicu i traže anomalije i priče. Jedna osoba je pregledala 30.000 stranica. Oni znaju dosta stvari.

Crowdsourcing smo koristili i za dokumente Sarah Palin. Ti saradnici su nam nevjerovatno pomogli u traženju priča u sirovim podacima.

Kada je u pitanju pronalaženje priča, crowdsourcing nam je mnogo pomogao. Ljudima se zaista svidjelo, a Guardian je stekao dobru reputaciju. Ali tu metodu nismo mnogo koristili za samo prikupljanje podataka.

Neki od uspješnih projekata za koje smo koristili crowdsourcing su podsjećali na staromodne ankete. One su veoma uspješne, jer kada ljudima postavljate pitanja o njihovom iskustvu, životima, o tome šta su uradili, manje je vjerovatno da će izmišljati odgovore. Reći će tačno ono što osjećaju. Kada ljude zamolimo da na neki način odrade dio posla za nas, onda moramo postaviti neki okvir unutar kojeg će dostavljati podatke kojima se može vjerovati.

Što se tiče vjerodostojnosti samih podataka, mislim da je pristup Old Weathera veoma dobar. Njima svaki upis obavlja 10 osoba, te tako osiguraju tačnost. Mi smo sa projektom MPS Expense pokušali minimizirati rizik da se članovi parlamenta loguju i urede podatke o sebi tako da izgledaju bolje. Međutim, ovo ne možete uvijek spriječiti. Zapravo, samo možete potražiti određene URL-ove ili provjeriti da li dolaze iz SW1 područja u Londonu. Tako da je to malo komplikovanije. Nismo uvijek mogli biti sigurni da su podaci koje smo izbacivali tačni. Iako su priče bile odlične, ipak nisu pružale sirove podatke koje smo mogli sa sigurnošću koristiti.

Moj savjet budućim data novinarima koji žele koristiti crowdsourcing kako bi prikupili podatke je da ovu metodu koriste kada je u pitanju tema do koje je ljudima zaista stalo i koja će im biti značajna i kada se više ne bude nalazila na naslovnim stranama. Isto tako, ljude ćete lakše uključiti ukoliko sve organizujete kao neki vid igre. Kada smo drugi put radili priču o troškovima, projekat je podsjećao na igru u sklopu koje su ljudi dobili pojedinačne zadatke. To je značajno pokrenulo stvari jer ako ljudima ponudite gomilu informacija i kažete im da ih pregledaju, to im se može učiniti kao težak posao koji ne nudi nikakvu nagradu. Tako da smatram da je veoma važno da zadatke učinite zabavnima.

Marianne Bouchart, Data Journalism Blog, intervjuira Simona Rogersa, the Guardian