Priručnik za data novinarstvo 1.0
Loading

Postanite pismeni za kvantitativne podatke u tri jednostavna koraka

Kao što pismenost znači ˝sposobnost čitanja s ciljem sticanja znanja, pisanja i kritičkog razmišljanja o štampanom materijalu˝, tako i pismenost za kvantitativne podatke predstavlja sposobnost čitanja podataka s cilje sticanja znanja, njihovo smisleno kreiranje te kritičko razmišljanje o podacima. Pismenost za kvantitativne podatke uključuje i poznavanje statistike, kao i razumijevanje procesa rada sa velikim setovima podataka, kako su proizvedeni, kako povezati različite setove podataka i kako ih interpretirati.

Figure 1. Kopanje po podacima (photo by JDHancock)

Poynterova Škola novinarstvo nudi predavanja pod nazivom Matematika za novinare, na kojima novinari uče o konceptima poput promjena procenata i prosjeka. Interesantno je da istu stvar istovremeno uče učenici petog razreda (10-11 godina starosti) u blizini Poynterovih kancelarija, u školama na Floridi, i to u sklopu redovnog nastavnog plana i programa.

Činjenica da je novinarima potrebna pomoć sa matematičkim operacijama koje se uče prije srednje škole ukazuje na to koliko su redakcije zapravo nepismene za kvantitativne podatke. Ovo je problem. Kako jedan data novinar može razumjeti brojke o klimatskim promjenama ako ne zna šta znači interval pouzdanosti? Kako data novinar može napisati priču o distribuciji plata ukoliko ne zna razliku između sredine i medijana?

Novinaru nije potrebna diploma iz statistike kako bi bio efikasniji u radu sa kvantitativnim podacima. Kada se suočite sa brojevima, nekoliko jednostavnih trikova može pomoći da se napiše mnogo bolja priča. Kao što kaže Gerd Gigerenzer, profesor sa instituta Max Planck, bolji alati ne vode do boljeg novinarstva ukoliko se ne koriste sa razumijevanjem.

Čak i ako ne posjedujete bilo kakvo znanje iz matematike ili statistike, možete lako postati iskusni data novinar postavljanjem 3 veoma jednostavna pitanja.

1. Kako su podaci prikupljeni?

Nevjerovatan porast BDP-a

Najlakši način da se pohvalite spektakularnim podacima je da ih izmislite. Zvuči očigledno, ali podaci o nečemu o čemu se tako često govori, kao što je BDP, mogu isto tako biti lažni. Bivši britanski ambasador Craig Murray u svojoj knjizi Ubistvo u Samarkandu navodi da lokalna vlada i međunarodna tijela u Uzbekistanu žustro raspravljaju o stepenu porasta BDP-a. Drugim riječima, to nema nikakve veze sa lokalnom ekonomijom.

BDP se koristi kao glavni indikator jer vlade na osnovu njega prate glavni izvor primanja – PDV. Vlade koje se ne finansiraju na osnovu PDV-a ili svoj budžet ne objavljuju javno nemaju razloga da prikupljaju podatke o BDP-u i bolje prođu ukoliko ga lažiraju.

Kriminal je uvijek u porastu

˝Kriminal u Španiji porastao za 3%˝, piše El Pais. Brisel je mamac za sve veću stopu kriminalnih radnji nelegalnih useljenika i ovisnika o drogama, javlja RTL. Ovakva vrsta izvještavanja koja se bazira na statistikama prikupljenim od policije je česta, ali nam ne govori mnogo o nasilju.

Možemo biti sigurni da se unutar Evropske unije podaci ne diraju. Ali, policijsko osoblje reaguje na stimulaciju. Ukoliko se njihov učinak mjeri prema slučajevima za koje je već izrečena optužnica, naprimjer, onda su policajci motivisani da što više izvještavaju o slučajevima koji ne zahtijevaju dalju istragu. Jedan takav prekršaj je pušenje marihuane. To objašnjava zašto su se kriminalna djela vezana za drogu u Francuskoj učetverostručili u proteklih 15 godina, dok je nivo konzumacije ostao isti.

Šta vi možete uraditi

Kada sumnjate u kredibilitet brojki, uvijek ponovo provjerite, baš kao što biste postupili i da je u pitanju citat od nekog policajca. U slučaju iz Uzbekistana, dovoljno je nazvati nekoga ko duži period živi tamo (˝Da li se čini da je zemlja tri puta bogatija nego 1995., kao što kažu zvanične cifre?˝)

Za policijske podatke, sociolozi često sprovode studije viktimizacije u kojima ljude pitaju da li su žrtve kriminala. Ove studije su značajno stabilnije od policijskih podataka. Možda baš zbog toga i ne postanu udarne vijesti.

Drugi testovi, kao što je Benfordov zakon, vam omogućavaju da precizno procijenite kredibilitet kvantitativnih podataka, ali nijedan ne može zamijeniti vaše vlastito kritičko razmišljanje.

2. Šta se može naučiti iz toga?

Rizik od multiple skleroze se udvostručava ukoliko radite noću

Logično je da bi svaki normalni Nijemac prestao raditi noćnu smjenu nakon što pročita ovakav naslov. Međutim, članak na kraju uopšte ne objašnjava o kakvom se riziku radi.

Uzmimo naprimjer 1.000 Nijemaca. Jedan on njih će u toku svog života oboliti od MS-a. E sad, ukoliko je svih 1.000 radilo noćnu smjenu, broj oboljelih od MS-a se povećava na 2. Tako da je dodatni rizik za obolijevanje od MS-a ukoliko radite u smjenama 1 naprema 1.000, a ne 100%. Ova informacija je svakako mnogo korisnija ukoliko trebate odlučiti da li da prihvatite posao.

U prosjeku, 1 od 15 Evropljana je u potpunosti nepismen

Ovaj naslov izgleda zastrašujuće. Ali je i apsolutno tačan. Među 500 miliona Evropljana, 36 miliona njih vjerovatno ne zna čitati. Usput govoreći, 36 miliona ih ima manje od 7 godina (podatak iz Eurostata).

Kada pišete o prosječnim vrijednostima, uvijek se zapitajte u odnosu na šta se taj prosjek mjeri. Da li je populacija koja se spominje homogena? Naprimjer, obrazac nejednake distribucije objašnjava zašto većina ljudi vozi bolje od prosjeka. Mnogi u toku života dožive nijednu ili samo jednu saobraćajnu nesreću. Nekoliko nemarnih vozača skrivi mnogo nesreća i time prosječan broj povećava na značajno više nego što većina ljudi doživi. Isto se odnosi i na raspodjelu plata: većina ljudi zarađuje ispod prosjeka.

Šta vi možete uraditi

Uvijek uzmite u obzir raspodjelu i baznu stopu. Imat ćete bolji uvid u podatke ukoliko provjerite sredinu i medijan, kao i mod (najčešću vrijednost unutar raspodjele). Ukoliko poznajete kako se magnituda kreće, lakše možete kontekstualizirati stvari, kao što je bio slučaj sa primjerom u kojem se spominje MS. Na kraju, izvještaji u kojem koristite prirodne frekvencije (1 od 100) čitaoci mogu mnogo lakše razumjeti od onog koji koristi procente (1%).

3. Koliko je informacija pouzdana?

Problem veličine uzorka

˝80% nezadovoljno pravosudnim sistemom˝, stoji u anketi koja je objavljena u Diaro de Navarra iz Zaragoze. Kako je moguće na osnovu 800 ispitanika izvući zaključak o 46 miliona Španjolaca? Ovaj procenat je sigurno prenapuhan.

Kada istražujete veliku populaciju (preko nekoliko hiljada), rijetko vam je potrebno više od hiljadu ispitanika kako biste dobili rezultate sa greškom ispod 3%. To znači da, ukoliko istu anketu sprovedete nad potpuno drugačijim uzorkom, u 19 od 20 slučajeva će se rezultati koje dobijete razlikovati za 3% od rezultata koje biste dobili da ste ispitali svaku pojedinu osobu.

Konzumiranje čaja smanjuje rizik od srčanog udara

Česti su članci o blagodatima konzumiranja čaja. Ni ovaj kratki članak u Die Welt, koji navodi da konzumiranje čaja smanjuje rizik od srčanog udara nije izuzetak. Iako neki ozbiljno proučavaju djelotvornost čaja, mnoga istraživanja u obzir ne uzimaju faktore životnog stila poput prehrane, zanimanja i bavljenja sportom.

U mnogim zemljama čaj je topli napitak kojeg konzimura viša klasa koja brine za svoje zdravlje. Ukoliko istraživači u svoje studije o prednostima konzumiranja čaja ne uvrste životni stil, onda nam zapravo otkrivaju samo to da su bogati ljudi zdraviji i da piju mnogo čaja.

Šta vi možete uraditi

Matematika koja stoji iza odnosa i margine greške u studijama o čaju je tačna, barem u većini slučajeva. Ali, ako istraživači ne traže korelacije (npr. konzumiranje čaja je povezano sa bavljenjem sportom), onda njihovi rezultati nemaju veliku vrijednost.

Kao novinar, nema smisla da u pitanje dovodite numeričke rezultate neke studije, kao što je veličina uzorka, osim ako ne budi baš velike sumnje. Međutim, lako je vidjeti da li su istraživači zaboravili da u obzir uzmu neke ključne informacije.

Nicolas Kayser-Bril, Journalism++