Priručnik za data novinarstvo 1.0
Loading

Korištenje i razmjena podataka: crna slova, sitna štampa i stvarnost

U ovom odlomku ćemo napraviti kratki pregled zakona vezanih za podatke i baze podataka, te šta možete uraditi da biste javnosti otvorili svoje kvantitativne podatke koristeći dostupne javne licence i pravne alate. Ne dozvolite da vam bilo šta od navedenog umanji entuzijazam za data novinarstvom. Pravne restrikcije vezane za podatke vam obično neće zasmetati i možete se pobrinuti za to da ne ometaju druge koji koriste podatke koje vi objavite.

Kao što je svima očigledno, prikupljanje kvantitativnih podataka nikada nije bilo lakše. Prije nego su se podaci počeli masovno objavljivati na internetu, čak i ako ste identifikovali set kvantitativnih podataka koji vam je potreban, te podatke ste morali tražiti od strane koja ih je posjedovala, i to po mogućnosti da vam ih u štampanoj formi pošalju poštom ili lično dostave. Danas vaš kompjuter može tražiti od njihovog kompjutera da vam pošalje kopiju. Koncept je sličan, ali danas postoje autorska prava, te oni (autori ili osobe koje su podatke objavile) ne trebaju raditi ništa i vjerovatno i nemaju ideju da ste downloadovali kopiju podataka.

A šta je sa skidanjem podataka uz pomoć nekog programa (poznato i kako "scraping") i uslovima korištenja? Pogledajte prethodni paragraf - vaš browser je upravo jedan takav program. Da li uslovi korištenja sprečavaju pristup samo određenom tipu programa? Ukoliko imate neograničenu količinu vremena i novca koje možete potrošiti na takve dokumente ili na pravne savjete, samo naprijed. Ali, zapravo, dovoljno je da se ne pravite naivni – ukoliko vaš program napadne neki sajt, moguće je da će vašoj mreži biti blokiran pristup - možda ste to i zaslužili. Danas je razvijena praksa koja se tiče pristupa i ekstrakcije podataka sa weba. Ukoliko planirate da to uradite, dobar početak je da pročitate o primjerima koji su navedeni na sajtovima poput ScraperWiki.

Kada dobijete određene kvantitativne podatke koji vas interesuju, možete poslati upit, pregledati, vizualizirati, uvezivati i provoditi bilo kakvu analizu nad vašom kopijom tih podataka. Svoju analizu možete objaviti i citirati bilo koji podatak. Ima dosta istine u izrazu ˝činjenice su slobodne˝ (kao u slobodnom govoru). Međutim, ovo možda predstavlja samo frazu onima koji previše razmišljaju o pravnom osnovu baza podataka ili, još šire (i nepreciznije), upravljanja podacima.

Šta ako vi, kao dobar data novinar ili novinar koji to želi postati, namjeravate objaviti i analize, činjenice i podatke, ali i setove/baze podataka koje ste koristili? Ili ste možda samo prikupili kvantitativne podatke i niste obavili nikakvu analizu (odlično: treba nam ljudi koji pronalaze podatke). Ukoliko koristite podatke koje je neko drugi sakupio, tu bi mogla biti neka kvaka. (Ukoliko ste vi sami u potpunosti sastavili svoju bazu podataka, ipak pročitajte sljedeći odlomak kako bi vas motivisao da primjenjujete praksu razmjene podataka.)

Ukoliko ste upoznati sa načinom na koji autorska prava ograničavaju kreativan rad – ukoliko nosilac prava ne dozvoli da se njegov rad koristi (ili rad pripada javnom domenu ili potpada pod izuzetke ili ograničenja kao što su fer korištenje), ali ga vi ipak iskoristite (distribuirate i slično), nosilac autorskih prava vas može natjerati da prestanete. Iako su činjenice besplatne, određeni skupovi činjenica se mogu na sličan način ograničiti, mada odgovarajući zakoni variraju više od zakona o autorskim pravima koji se primjenjuju na kreativni rad. Ukratko, baza podataka može potpadati pod autorska prava kao kreativni rad. U mnogim pravosudnim sistemima, sam trud oko prikupljanja baze podataka, čak i na potpuno nekreativan način, čini bazu podataka materijalom koji potpada pod autorska prava. SAD recimo imaju viši prag kreativnog rada koji je potrebno ispuniti da bi se mogao primijeniti zakon o autorskim pravima (najpoznatiji primjer je Feist v. Rural, slučaj o telefonskom imeniku, potražite ga ako vas zanima). Ali u nekim pravosudnim sistemima postoje posebna prava za baze podataka koja ograničavaju korištenje baza podataka odvojeno od autorskih prava (iako se podudaraju u mnogo stvari koje pokrivaju, naročito kada je u pitanju prag kreativnosti, koji u zakonu o autorskim pravima skoro da ne postoji). Najpoznatiji primjer u EU su sui generis prava vezana za baze podataka. I ponovo, naročito ako ste u Evropi, poželjno je da se prvo uvjerite da imate dozvolu prije nego objavite bazu podataka koju ste od nekoga preuzeli.

Ovakve restrikcije očigledno nisu najbolje okruženje za razvoj ekosistema data novinarstva (niti su dobri za društvo u cjelini - tako su društveni znanstvenici i ostali tvrdili EU prije nego je izašao sui generis i studije koje su od tada provedene su pokazale da su bili u pravu). Srećom, kao osoba koja objavljuje neku bazu podataka, možete ukloniti takve restrikcije sa baze podataka (osim ako ne sadrži elemente za koje nemate dozvolu da dodjeljujete dozvole drugima), tako što ćete unaprijed odobriti dozvolu. Ovo možete izvesti tako što ćete svoju bazu podataka objaviti pod javnom licencom ili na javnom domenu – baš kao što i mnogi programeri svoje kodove objavljuju pod licencom za slobodno korištenje, kako bi ih drugi mogli upotrijebiti (pošto data novinarstvo često uključuje i kodove, a ne samo kvantitativne podatke, logično je da i vi trebate objaviti svoje kodove, tako da se vaši podaci i analize mogu reprodukovati). Postoji mnogo razloga zašto biste trebali otvoriti svoje podatke. Naprimjer, vaša publika će možda na osnovu njih kreirati nove vizualizacije ili aplikacije i vi onda na njih možete postaviti link – kao što je Guardian uradio sa svojim Flickr albumom za vizualizacije. Vaši setovi kvantitativnih podataka se mogu kombinovati sa drugim setovima kvantitativnih podataka kako bi vama i vašim čitaocima pružili bolji uvid u temu. Ono što drugi urade sa vašim podacima vam može dati ideje za nove priče ili neke druge data projekte. A sigurno će vam donijeti dodatne bodove.

Figure 14. Open Data naljepnice (Open Knowledge Foundation)

Kada shvatite da je neophodno objavljivati radove pod javnim licencama, otvori se pitanje: pod kojom licencom? Na to pitanje će često odgovoriti projekat ili zajednica na čijem proizvodu vi gradite svoj projekat, ili kojoj želite posvetiti svoj rad – koristite istu licencu koju i oni koriste. Ukoliko trebate kopati dublje, počnite sa licencama koje su besplatne i dostupne – što znači da svako ima dozvolu za bilo kakvo korištenje (možda je neophodno navesti izvor i dalje dijeliti te podatke). Ono što su Free Software Definition i Open Source Definition uradili za softver, Open Knowledge Definition čini za svo znanje, uključujući i baze podataka: definiše šta neki proizvod čini otvorenim i šta licence dozvoljavaju korisnicima da urade.

Možete posjetiti web sajt organizacije Open Knowledge Foundation da vidite koje su licence trenutno važeće. Ukratko, postoje tri vrste licenci za slobodan rad sa podacima:

Licence za javni domen

Licence koje dozvoljavaju apsolutno sve; nikakvi uslovi se ne postavljaju za korištenje određenog proizvoda.

Licence koje zahtijevaju da pripišete zasluge

Jedini uslov je da navedete odakle ste preuzeli podatke.

Copyleft, recipročne licence i licence koje zahtijevaju da i vi određeni proizvod prosljeđujete pod istim uslovima

Ove licence zahtijevaju da, ukoliko objavite modifikovani proizvod koji ste negdje preuzeli, to uradite pod istom licenocm.

Ukoliko koristite set podataka koji je objavljen pod licencom za slobodan rad sa podacima, onda neka vam gornji paragraf služi kao vodič kako da ispunite uslove te licence. Najčešće licence, od Creative Commons, Open Data Commons i različitih vlada, obično sadrže kratki pregled osnovnih uslova. Obično se podatak o tome koja licenca je korištena nalazi na web stranici sa koje želite downloadovati (ili ˝sastrugati˝, jer web stranice mogu sadržavati setove podataka) neki set podataka, ili čak unutar samog seta podataka, što zavisi od formata. I vi trebate navesti isto kada otvorite svoje setove podataka.

Da se vratimo na početak. Šta ukoliko set podataka koji želite još uvijek nije dostupan online ili se nalazi iza neke kontrole pristupa? Razmislite o tome da, pored toga što tražite da vama dozvole pristup, i da se podaci učine javno dostupnima kako bi ih cijeli svijet mogao koristiti. Možete navesti neke pozitivne stvari koje će uslijediti ako se podaci otvore za javnost.

Kada se podaci dijele sa cijelim svijetom, otvaraju se pitanja poput privatnosti i regulacija koji bi mogli važiti za određene setove podataka. Iako otvoreni podaci snižavaju tehničke barijere, kao i one koje se tiču autorskih prava, to ne znači da možete ignorisati odgovarajuće zakone. Ali situacija je uvijek bila takva i novinarima su dostupni različiti resursi, pa čak i zaštita, ukoliko procijenite da ih je potrebno istražiti.

Sretno! Mada je vjerovatnije da će vam mnogo više sreće biti potrebno za druge aspekte projekta, nego za suočavanje sa (malim) pravnim rizicima.

Mike Linksvayer, Creative Commons