Verktygsback för datajournalister

25 Apr

Det drar ihop sig till hackathon! Och dags att packa verktygsbacken. Jag ska här lista några av de många program och tjänster som kan vara bra att koll på om man ska analysera och presentera data. Merparten av verktygen är open source och gratis att använda.

För att bearbeta data

Excel/Google Docs

Excel är för datajournalisten vad den schweiziska armékniven är för MacGyver. I Google Docs kan du i stort sett göra allt det du kan göra i Excel. Nackdelen är att Google Docs brukar få svårt att hänga med när datamaterialen blir riktigt stora.
Samtidigtär Google Docs på flera områden faktiskt bättre än åtminstone Mac-versionen av Excel. Till exempel när det gäller import av data från webben och pivottabeller.

Google Fusion Tables

Google Fusion Tables använder du bland annat för att slå ihop data från olika databaser. Du kommer åt Fusion Tables i Google Docs (välj Create > Table).

Google Refine

Google Refine använder du för att städa upp stora mängder “smutsig” data. Programmet är till exempel användbart om du vill kategorisera data eller göra gruppsammanslagningar.
Till skillnad från de andra Google-verktygen måste Google Refine laddas ner.

Data Wrangler

Vill man av en orsak eller annan inte köra på Google-spåret finns Data Wrangler från Stanford-universitetet som en alternativ plattform. Jag har dock inte använt det här programmet själv.

R

Om du ska göra mera avancerade statistiska analyser behöver du tyngre verktyg än de som listats hittills. R är ett open source-alternativ till vetenskaplig (och dyra!) program som SPSS. Nackdelen är att programmet inte är alldeles användarvänligt. Alla kommandon skrivs till exempel in för hand.

För att visualisera data

Enkla grafer

I Google Docs kan du enkelt göra basic-grafer, men det finns också andra alternativ. Many Eyes erbjuder en del spännande tillägg som treemaps, ordmoln och bubbeldiagram.

Kartor

Google Fusion Tables är också här ett bra alternativ för att märka ut punkter på en karta. Geocommons är en annan gratistjänst för geografisk visualisering.
Programmet QGIS är ett open source-alternativ för att bland annat göra egna kartlager och transformera kartor mellan olika format. I QGIS kan du till exempel shape-filer och göra om dem till GeoJSON stöds av Geocommons och många andra karttjänster.
Om man kan lite Javascript-programmering finns det betydligt fler verktyg att jobba med. Tile Mill är ett verktyg för att stajla till kartbottnar, Polymaps ett Javascript-bibliotek för att göra kartlager på Open street map-kartor och Leaftlet en annan Javascript-lösning för att göra interaktiva kartor.

Nätverksgrafer

En spänannde visualiseringsform är nätverksgrafer. Det finns i dag flera förhållandevis lätta programvaror för att rita sociala nätverksgrafer.
Open source-programmet Gephi kan ta lite tid att komma in i, men är när man väl kommit i gång väldigt lättanvänt. NodeXL är ett tillägg till Excel för samma ändamål. Fungerar dock endast på PC.

Javascript-bibliotek

För att verkligen kunna skräddarsy sina datapresentationerna så behöver man kunna programmera lite. Flash håller på att stryka på foten för Javascript-lösningar, så det är främst i den riktningen du ska snegla.
Det finns en rad Javascript-bibliotek som det enkelt att presentera data. Rapheal, D3, JIT och Highcharts är några av de vanligaste.

Flera länkar och verktyg

Vill du gräva djupare i verktygsbacken? Här är några listor att beta av:

Annonser

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

%d bloggare gillar detta: