To typer effektstørrelsesstatistikk: Standardisert og ikke-standardisert

Effektstørrelsesstatistikk er raseri i disse dager.

Journalredaktører krever dem. Komiteer vil ikke bestå avhandlinger uten dem.

Men grunnen til å beregne dem er ikke bare at noen vil ha dem – de kan virkelig hjelpe deg med å forstå dataanalysen din.

Hva er en Effektstørrelsesstatistikk?

Når mange av oss hører «Effektstørrelsesstatistikk», tror vi umiddelbart at vi trenger en av noen få statistikker: Eta-kvadrat, Cohens d, R-kvadrat.
Og ja, disse kvalifiserer absolutt. Men konseptet med en effektstørrelsesstatistikk er faktisk mye bredere. Her er en beskrivelse fra en fin artikkel om effektstørrelsesstatistikk:

«… informasjon om størrelsen og retningen på forskjellen mellom to grupper eller forholdet mellom to variabler.»

– Joseph A Durlak, «Hvordan velge, beregne og tolke effektstørrelser»

Hvis du tenker på det, passer mange kjente statistikker til denne beskrivelsen. Regresjonskoeffisienter gir informasjon om størrelsen og retningen til forholdet mellom to variabler. Det samme gjør korrelasjonskoeffisienter.

På samme måte passer en enkel forskjell mellom to gruppemedier direkte til denne definisjonen.

Så hvorfor trenger vi å rapportere spesifikk effektstørrelsesstatistikk?

Enkel og standardisert effektstørrelsesstatistikk

Det er to typer statistikk som beskriver størrelsen på en effekt.

Den første typen er standardisert. Når folk flest snakker om effektstørrelsesstatistikk, er det dette de snakker om.

Standardisert effektstørrelsesstatistikk fjerner enhetene til variablene i effekten.

Den andre typen er enkel. Denne statistikken beskriver størrelsen på effekten, men forblir i de opprinnelige enhetene til variablene.

Så si for eksempel at du sammenligner gjennomsnittstemperaturen til jorda under to forskjellige forhold.

Den enkle effektstørrelsen vil være forskjellen i gjennomsnittstemperaturen:

Gjennomsnitt 1 – Gjennomsnitt 2.

Du vil tolke den statistikken i Grader celsius. For eksempel: Gjennomsnittstemperaturen i tilstand 1 var 2,3 grader høyere enn i tilstand 2.

Statistikk for standardisert effektstørrelse vil dele den gjennomsnittlige forskjellen med standardavviket:

(Gjennomsnitt 1 – Gjennomsnitt 2) / Standardavvik.

Du vil tolke den statistikken i form av standardavvik: Gjennomsnittstemperaturen i tilstand 1 var 1,4 standardavvik høyere enn i tilstand 2 .

Fordeler og ulemper

Selv om mange journalredaktører ønsker standardiserte effektstørrelser, er de ikke alltid bedre enn enkle effektstørrelser. De har imidlertid reelle fordeler i visse situasjoner.

1. Standardiserte effektstørrelser hjelper deg med å evaluere hvor stor eller liten effekt er når måleenhetene ikke er intuitive.

De fleste jordforskere vil ha en god forståelse av om 2,3 grader Celsius er en meningsfull forskjell. 2,3 grader Celsius betyr noe fordi en grad er intuitiv. Men det er ikke alltid tilfelle.

Se for deg en 2,3-punktsforskjell på en angstskala som går fra 7 til 49. Er det en meningsfull forskjell? Vel, det er vanskelig å fortelle fordi disse punktene ikke er veldig intuitive. Vi må ha en sterk forståelse av fordelingen av poeng for å se om 2,3 poeng var et stort trekk, og vi må forstå hva 2,3 poeng egentlig forteller oss om angst.

Noen ganger standardiserer vi statistikk – å sette det i form av standardavvik – hjelper til med å fjerne de meningsløse enhetene og lar forskere evaluere effektene i forhold til den fulle fordelingen av poeng.

2. Standardiserte effektstørrelser kan hjelpe deg med å sammenligne resultater på tvers av studier.

Mange variabler måles på forskjellige skalaer i forskjellige studier. Igjen, dette vil sannsynligvis ikke skje med en variabel som temperatur, men det er flere angstskalaer å velge mellom, som hver er i en annen skala. Inkludert standardisert effektstørrelsesstatistikk kan hjelpe leserne til å forstå trender eller forskjeller på tvers av studier.

De er grunnlaget for metaanalyse, som analyserer resultater fra et utvalg av studier, så rapportering av denne statistikken vil være til fordel for kollegene dine.

3. Standardiserte effektstørrelser bør brukes i utvalgsstørrelsesberegninger med forsiktighet.

Både den minste meningsfulle enkle effekten og et standardavvik er nødvendig for å estimere utvalgsstørrelsesstatistikk (gitt en viss alfa og ønsket effekt, blant andre nødvendige estimater ). Noe programvare krever at du først kombinerer disse to delene av informasjonen til en standardisert effektstørrelsesstatistikk for å beregne den nødvendige prøvestørrelsen for å oppnå ønsket effekt.

Selv om det ikke er noe galt med å bruke standardiserte effektstørrelser i disse beregningene, hvis du vil ha gode estimater, må du gå gjennom prosessen med å oppnå et rimelig standardavvik på variablene dine og tenke på hva en meningsfull effekt ville være.

Ja, dette er veldig vanskelig, og det er ikke ett riktig svar. Men du er eksperten på ditt felt, og det er opp til deg å bestemme fra litteraturen hva en meningsfull effektstørrelse er.

Hvis du bruker generisk effektstørrelsesstatistikk på grunnlag av kraftberegningen uten å tenke om hva det betyr i studien din, får du bare et generisk estimat av størrelsen på prøven. Det er ikke veldig nyttig.

Effektstørrelsesstatistikk
Statistisk programvare gir oss ikke alltid de effektstørrelsene vi trenger. Lær noen av vanlige effektstørrelsesstatistikker og måtene å beregne dem selv.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *