Til forsiden

Datajournalistikk på OsloMet: Statistikk, dataanalyse og Python

I et samfunn med stadig økende datamengder, algoritmer som gjør valg for oss og ikke minst sett i lys av fremveksten av generativ AI, er det avgjørende å bygge kompetanse på statistikk og dataanalyse i redaksjoner og på redaktørnivå.

Skrevet avAndreas Fosse, leder for brukerdata og KI i E24

Sist oppdatert

Først publisert

Dette var bakteppet for at jeg søkte Norsk Redaktørforenings vederlagsfond om studiestipend for å gjennomføre et emne i datajournalistikk på masternivå på OsloMet, nærmere bestemt Innføring i statistikk og dataanalyse, våren 2024. I utgangspunktet var det en studieavgift på 18.900,- for å delta, men det ble senere besluttet av OsloMet å fjerne studieavgiften, og dermed sto man igjen kun med en semesteravgift på i underkant av 1000 kroner. Da førsteamanuensis Fabrizio Palumbo på det sterkeste også anbefalte studentene å kombinere emnet med Innføring i Python-programmering, meldte jeg meg også - etter litt betenkningstid - opp til det.

Ankepunktet var naturlig nok tid. Det er omfattende nok å gjennomføre 10 studiepoeng ved siden av arbeid, om man ikke i tillegg skal doble dette. På den andre siden så var jo studieavgiften fjernet, og Python-programmering er et meget effektivt og fleksibelt verktøy for dataanalyse. Så jeg var overbevist om at jeg totalt sett ville få mye mer ut av å gjennomføre begge emnene. Det fikk jeg rett i.

Statistikk og dataanalyse

Programmet var lagt opp med felles, fysiske samlinger på OsloMet der vi ble introdusert for dataanalyseprosessen, fra hypotesen/spørsmålstillingen gjennom innhenting av data, utforsking, vasking, transformering, analyse, verifisering og til presentasjon og kommunikasjon av resultatene.

I tillegg gikk vi gjennom fallgruver, viktigheten av domenekunnskap om dataene man analyserer. Vi lærte også om ulike datatyper, statistiske beskrivelser og distribusjoner - for eksempel at gjennomsnitt ikke gir en særlig god beskrivelse av dataen i en veldig skjev distribusjon.

Kanskje viktigste av alt var den kritiske forståelsen hvordan statistikk og dataanalyse kan misbrukes - både med og uten intensjon - blant annet ved at man har skjevheter i utvalget sitt, ikke ser dataen i riktig kontekst eller at man trekker feil konklusjoner. Ja, det er korrelasjon mellom haiangrep og isspising, men det betyr ikke at det ene forårsaker det andre - kanskje har det mer med å gjøre at flere spiser is og bader når det er varmt.

Python-programmering

Om man ikke har noen særlig erfaring med å skrive kode, er det å skulle lære seg Python litt som å stange hodet i veggen gjentatte ganger. Det gjør vondt, men til slutt kommer man gjennom.

Også i Python-kurset var det felles samlinger, og vi startet veldig basic med å installere Python på maskinen for så å gå gjennom grunnleggende konsepter i programmering. Deretter gikk vi gjennom ulike funksjoner, syntaks og arbeidsflyt i Python. Med det mest vesentlige på plass begynte vi å jobbe med et dataprosjekt, og jeg dro særlig nytte av pandas-rammetverket i Python, som egne seg godt for analyse av store datatabeller.

Læring

I begge emnene jobbet jeg med et og samme dataprosjekt, hvor jeg så på korrelasjon mellom akkumulasjon av farlig avfall og bruk av reseptbelagte medisiner (allergi, astma, diabetes) på kommunenivå. Her måtte jeg koble sammen fem ulike datasett, rense og normalisere data og utføre ulike analyser (hovedsakelig korrelasjon og regresjon) og visualiseringer.

Statistikk- og dataanalysebiten var avgjørende for at jeg skulle angripe prosjektet riktig og unngå fallgruver, mens Python-programmeringen gjorde selve databehandlingen og -analysen langt enklere (når man først kan litt Python, er det veldig mye bedre og mer fleksibelt enn å bruke enn Excel). Å kombinere disse emnene ga meg langt mer utbytte i hvert fag enn om jeg hadde tatt et av dem isolert.

Jeg leverte en eksamensoppgave om dataanalysetilnæringen til prosjektet - og en om programmeringstilnæringen.

Det var et par meget intensive måneder i forbindelse med utdanningen. Jeg var heldig og fikk satt av en del arbeidstid for å være med på samlinger og til å jobbe med oppgavene, men det gikk også veldig mye tid på kvelder og i helger.

Viktig kompetanse

Men det var verdt innsatsen. Jeg har tilegnet meg helt ny kompetanse som gjør det mulig for meg å angripe dataprosjekter selv. I rollen som leder for brukerdata og AI i E24 har utdanningen gitt meg en dypere forståelse av hvordan algoritmer og AI-modeller fungerer, og med en grunnleggende forståelse i programmering er jeg bedre egnet til å lede - og ikke minst samarbeide med - utviklere i redaksjonen.

At OsloMet har et eget mastergradprogram i datajournalistikk er virkelig gull verdt, og jeg vil anbefale kursene. Gå selv eller send ansatte med interesse for å utvikle seg i denne retning. Dette er kompetanse alle nyhetsredaksjoner trenger.

For interesserte: Les mer om datajournalistikkutdanningen ved OsloMet her

Trenger du rådgivning?

Kontakt oss på telefon eller e-post

Kontakt oss
Reidun Kjelling NybøReidun Kjelling Nybø

Vi er tilgjengelige via hotline 24/7 for alle medlemmer

Utforsk ressursene

Let i NRs veiledere, domsarkiv, rapporter, kursopptak og spørsmål & svar

Trykk Enter for å søke..

Se alle ressurser

Til forsiden

Til forsiden

Designet og utviklet av Kult Byrå