– Analysere tall 1

For å kunne stole på resultatene må vi være rimelig sikre på at det verken er systematiske eller tilfeldige feil i studien. En kritisk vurdering av hvordan forskerne gikk fram gir oss svar på om det kan foreligge systematiske feil, mens faget statistikk hjelper oss å vurdere om resultatene kan skyldes tilfeldige feil. Det kan vi bedømme ved å utnytte hjelpemidler som konfidensintervall eller statistiske tester. Statistikken hjelper oss å reflektere om hva som ville ha skjedd dersom den aktuelle studien var blitt gjentatt mange ganger. Dermed kan vi få en formening om det er rimelig å anta at resultatene ikke bare gjelder for dem som ble undersøkt i akkurat denne studien, men også for alle andre liknende personer.

Analyse av forskjeller i frekvenser

Når utfallene er todelte (dikotome), f.eks. frisk eller syk, kan en beregne sammenheng mellom tiltaket og utfallet. Det er ulike måter å presentere resultatet, men utgangspunktet for analysene er alltid en 2 x 2 tabell. Tabell 1 er en 2 x 2 tabell som oppsummerer resultater fra en studie som undersøkte effekten av massasje for pasienter med kroniske nakkesmerter og viser at 18 av 31 (58 %) pasienter som fikk massasje ble bedre, mens 2 av 29 (7 %) pasienter i kontrollgruppen rapporterte bedring.

Figur 1: Antall pasienter som rapporterte bedring ved 4 uker

 
Global Health Rating
 
  Bedring (Ja) Ikke bedring (Nei) Totalt
Massasje (Tiltak) 18 13 31
Informasjon (Kontroll) 2 27 29
Totalt 20 40 60

 

I de første kolonnene i tabell 2 er tallene fra tabell 1 presentert som prosent. En vanlig måte å analysere tallene er å se på forskjell i ”risikoen” for å bli bedre hvis du får massasje, sammenlignet med om du får en informasjonsbrosjyre. Risikoforskjellen mellom de to gruppene kan tallfestes, og er et punktestimat. Rundt effektestimat beregner vi et konfidensintervall som viser i hvilket intervall vi med sikkerhet kan si at effektestimatet ligger hvis vi skal anvende den i utgangspopulasjonen. Det er vanlig å oppgi CI med 95 % sikkerhet (95 % CI).

P-verdien viser sannsynligheten for at resultatet skyldes tilfeldige feil. Vi sier som regel at en p-verdi under 0,05 er statistisk signifikant, som betyr at sannsynligheten for at det skyldes tilfeldige feil er lav nok. Statistisk signifikans betyr ikke at resultatet er klinisk signifikant, dvs. om forskjellen betyr noe for pasienten.

Figur  2: Analysere tall relativ risiko (RR) og 95%CI (analyse av forskjell i frekvenser)

Generell bedring Massasje Informasjon Relativ risiko 95% CI p-verdi
4 uker 58 7 8,5 2,0 til 35,4 0,003
26 uker 43 25 1,8 0,8 til 3,8 0,14

 

I tabell 2 er risikoforskjellen mellom massasjegruppen og informasjonsgruppen presentert som relativ risiko (RR). For å finne RR må en regne ut risikoen i hver gruppe først. Risikoen i hver gruppe regnes ut ved å ta antallet som ble bedre, delt på alle i gruppen. I tiltaksgruppen ble 18 av 31 bedre, dvs. risikoen er 18/31 (58 %). I kontrollgruppen ble 2 av 29 bedre, dvs. risikoen er 2/29 (7 %). Tallene ble hentet fra Tabell 1. Den relativ risikoen (RR) finner en ved å ta risikoen i tiltaksgruppen og dele på risikoen i kontrollgruppen, dvs. 58 delt på 7 som er 8,5. Det betyr at sjansen for å bli bedre var 8,5 ganger større for de som fikk massasje. I tabell 2 er RR presentert for alle måletidspunktene. Det er stor variasjon i 95 % CI for 4 uker (2,0 til 35,4), og p-verdien er 0,003. Ved 26 uker krysser konfidensintervallet 1 og p-verdien over 0,05, og den varige effekten er derfor usikker.

Resultatene kan også presenteres som absolutt risikoreduksjon (ARR) som angir andelen pasienter som ikke får et ugunstig utfall. Hvis vi tar utgangspunkt i 2×2 tabellen igjen (tabell 1) finner du ARR ved å ta risikoen for de som ikke fikk behandling (2/29) minus risikoen for de som fikk behandlingen (18/31). ARR blir da 7 % – 58 % = -51 % som betyr at sjansen (”risikoen”) for å bli bedre er 51 % større i tiltaksgruppen enn i kontrollgruppen etter fire uker.

En mer konkret måte å presentere resultatene på, er å si hvor mange som må få behandling for at én pasient skal bli bedre, evt. forhindre et ugunstig utfall. Denne måten kalles number-needed-to-treat (NNT). Dette regnes ut ved å ta 100 delt på absolutt risikoreduksjon (ARR) i prosent. I vårt eksempel er ARR 51 % slik at det blir 100/51. Det betyr, kort sagt, at hvis to pasienter får massasje vil én oppgi bedring etter fire uker.

LÆRINGSMÅL

Etter denne delen skal du kunne:

  • Forstå hva statistikkfaget kan hjelpe oss med
  • Lære hvordan en kan sammenligne resultater fra to grupper
  • Forstå hva konfidensintervall og statistisk signifikans er
  • Kjenne til noen tester som brukes i statistisk analyse