Forståelse av intern og ekstern gyldighet

Intern og ekstern gyldighet er begreper som reflekterer om resultatene av en studie er troverdige og meningsfylte. Mens intern validitet er relatert til hvor godt en studie utføres (dens struktur), gjelder ekstern validitet for hvor gjeldende funnene er for den virkelige verden.

Intern Gyldighet

Intern validitet er i hvilken utstrekning en studie etablerer et pålitelig årsakssammenheng mellom behandling og utfall. Det gjenspeiler også at en gitt studie gjør det mulig å eliminere alternative forklaringer for et funn. For eksempel, hvis du implementerer et røykesluttprogram med en gruppe individer, hvor sikker kan du være at enhver forbedring sett i behandlingsgruppen skyldes den behandlingen du administrerte?

Intern validitet avhenger i stor grad av prosedyrene i en studie og hvor streng det utføres.

Intern validitet er ikke en "ja eller nei" type konsept. I stedet vurderer vi hvor trygg vi kan være med funnene av en studie, basert på om det unngår feller som kan gjøre funnene tvilsomme.

Jo mindre sjanse det er for "forvirrende" i en studie, desto høyere er den interne gyldigheten og det mer selvsikker vi kan være i funnene. Forvirrende refererer til en situasjon der andre faktorer kommer inn i spill som forvirrer utfallet av en studie. For eksempel kan en studie gjøre oss usikre på om vi kan stole på at vi har identifisert det ovennevnte "årsak og effekt" -scenariet.

Kort sagt, du kan bare være sikker på at studien din er internt gyldig dersom du kan utelukke alternative forklaringer for funnene dine. Som en kort oppsummering kan du bare anta årsak og virkning når du oppfyller de følgende tre kriteriene i studien din:

Årsaken førte til effekten når det gjaldt tid.
Årsaken og virkningen varierer sammen.
Det er ingen andre sannsynlige forklaringer for dette forholdet du har observert.

Faktorer som forbedrer intern gyldighet

Hvis du ønsker å forbedre den interne validiteten til en studie, vil du vurdere aspekter av ditt forskningsprosjekt som vil gjøre det mer sannsynlig at du kan avvise alternative hypoteser. Det er mange faktorer som kan forbedre intern validitet.

randomisering refererer til tilfeldig tildeling av deltakere til behandlings- og kontrollgrupper, og sikrer at det ikke er noen systematisk forspenning mellom grupper.
Tilfeldig utvalg av deltakerne refererer til å velge deltakerne dine tilfeldig eller på en måte som de er representative for befolkningen som du ønsker å studere.
blinding i en studie refererer til deltakere - og noen ganger forskere - er uvitende om hvilken intervensjon de mottar (for eksempel ved å bruke en placebo i en medisinstudie) for å unngå denne kunnskapen som forvirrer deres oppfatninger og atferd og dermed resultatet av studien.
Eksperimentell manipulasjon refererer til å manipulere en uavhengig variabel i en studie (for eksempel å gi røykere et opphøringsprogram) i stedet for å bare observere en forening uten å gjennomføre noen intervensjon (undersøke sammenhengen mellom trening og røykegang).
Studieprotokoll refererer til følgende spesifikke prosedyrer for administrering av en behandling for ikke å introdusere noen effekter av for eksempel å gjøre ting annerledes med en gruppe mennesker mot en annen gruppe mennesker.

Hvordan virker tilfeldig utvalg?

Faktorer som truer intern gyldighet

Akkurat som det er mange måter å sikre at en studie er internt gyldig, er det også en liste over potensielle trusler mot intern validitet som bør vurderes når man planlegger en studie.

Forvirrenderefererer til en situasjon der endringer i en utfallsvariabel kan antas å ha resultert fra en tredje variabel som er relatert til behandlingen du administrerte.
Historiske hendelser kan påvirke utfallet av studier som forekommer over en tidsperiode. Eksempler på disse hendelsene kan innebære en endring i politisk leder eller naturkatastrofe som påvirker hvordan studere deltakere føler og handler.
modningrefererer til virkningen av tid som en variabel i en studie. Hvis en undersøkelse foregår over en periode der det er mulig at deltakerne naturlig endret seg på en eller annen måte (ble eldre, ble sliten), kan det være umulig å utelukke hvorvidt effektene i studien ganske enkelt skyldtes effekten av tiden.
testingrefererer til effekten av gjentatte testdeltakere ved å bruke de samme tiltakene. Hvis du gir noen samme test tre ganger, er det ikke sannsynlig at de vil gjøre det bedre når de lærer testen eller blir vant til testprosessen slik at de svarer annerledes?

instrumentering refererer til virkningen av de faktiske testinstrumentene som brukes i en studie om hvordan deltakerne svarer. Selv om det kan høres uvanlig, er det mulig å "prime" deltakere i en studie på bestemte måter med de tiltakene du bruker, noe som får dem til å reagere på en måte som er annerledes enn de ville ha ellers.
Statistisk regresjonrefererer til den naturlige effekten av deltakerne i ekstreme ender av et mål som faller i en bestemt retning bare på grunn av tidens gang i stedet for effekten av en intervensjon.
Slitasje refererer til deltakere som slipper ut eller forlater en studie, noe som betyr at resultatene er basert på en partisk prøve av bare de som ikke valgte å forlate (og muligens alle som har noe til felles, for eksempel høyere motivasjon).
Spredningrefererer til behandlingen i en studie som sprer seg fra behandlingsgruppen til kontrollgruppen gjennom gruppene som samhandler og snakker med eller observerer hverandre. Dette kan også føre til et annet problem som heter resentful demoralization, hvor en kontrollgruppe prøver mindre hardt fordi de føler seg irriterende over gruppen de er i.

Eksperimenter biasrefererer til en eksperiment som oppfører seg på en annen måte med ulike grupper i en studie, noe som fører til innvirkning på resultatene av denne studien (og elimineres gjennom blinding).

Ekstern gyldighet

Ekstern gyldighet refererer til hvor godt utfallet av en studie kan forventes å gjelde for andre innstillinger. Med andre ord, denne type gyldighet refererer til hvordan generaliserbare funnene er. For eksempel gjelder funnene for andre mennesker, innstillinger, situasjoner og tidsperioder?

Økologisk validitet, et aspekt av ekstern validitet, refererer til om en undersøkelses funn kan generaliseres til den virkelige verden.

Selv om strenge forskningsmetoder kan sikre intern validitet, kan ekstern validitet imidlertid begrenses av disse metodene.

Et annet begrep som kalles overførbarhet, gjelder ekstern validitet og refererer til det kvalitative forskningsmetoden. Overførbarhet refererer til om resultatene overføres til situasjoner med lignende egenskaper.

Faktorer som forbedrer ekstern gyldighet

Hva kan du gjøre for å forbedre den eksterne gyldigheten av studien din?

Inkluderings- og ekskluderingskriterier bør brukes til å sikre at du har klart definert befolkningen du studerer i din forskning.
Psykologisk realisme refererer til at deltakerne opplever hendelsene i en studie som en ekte begivenhet og kan oppnås ved å fortelle dem en "cover story" om formålet med studien. Ellers kan deltakerne i noen tilfeller oppføre seg annerledes enn de ville i virkeligheten hvis de vet hva de skal forvente eller vet hva formålet med studien er.
Replication refererer til å gjennomføre studien igjen med forskjellige prøver eller i forskjellige innstillinger for å se om du får de samme resultatene. Når mange studier har blitt gjennomført, meta-analyse kan også brukes til å avgjøre om effekten av en uavhengig variabel er pålitelig (basert på å undersøke funnene av et stort antall studier på ett emne).
Felteksperimenterkan også brukes der du utfører en undersøkelse utenfor laboratoriet i en naturlig setting.
Reprosessering eller kalibrering refererer til bruk av statistiske metoder for å justere for problemer relatert til ekstern validitet. For eksempel, hvis en studie hadde ujevne grupper for noen karakteristiske (som alder), kan det bli brukt omvekting.

Faktorer som truer ekstern gyldighet

Ekstern gyldighet er truet når en studie ikke tar hensyn til vekselvirkningene i den virkelige verden.

Situasjonsfaktorer slik som tidspunkt på dagen, sted, støy, forskeregenskaper og hvor mange tiltak som brukes kan påvirke funnets generaliserbarhet.
Pre- og post-test effekter referer til situasjonen hvor pre- eller post-testen på en eller annen måte er relatert til effekten sett i studien, slik at forholdet mellom årsak og virkning forsvinner uten disse tilføyde testene.
Eksempelfunksjoner referere til situasjonen der noen trekk ved det aktuelle prøven var ansvarlig for effekten (eller delvis ansvarlig), noe som førte til begrenset generaliserbarhet av funnene.
Utvalgsperspektiv refererer til problemet med forskjeller mellom grupper i en studie som kan forholde seg til den uavhengige variabelen (enda en gang, noe som motivasjon eller vilje til å delta i studien, spesifikk demografi av individer som er mer sannsynlig å delta i en online-undersøkelse). Dette kan også betraktes som en trussel mot intern validitet.

Likheter og ulikheter

Intern og ekstern gyldighet er som to sider av samme mynt. Du kan ha en studie med god intern validitet, men samlet sett kan det være irrelevant for den virkelige verden. På den annen side kan du utføre en feltstudie som er svært relevant for den virkelige verden, men det har ikke troverdige resultater når det gjelder å vite hvilke variabler som forårsaket resultatene du ser.

likheter

Hva er likhetene mellom intern og ekstern gyldighet? De er begge faktorer som bør vurderes ved utformingen av en studie, og begge har implikasjoner når det gjelder om resultatene av en studie har betydning. Begge er ikke "enten" eller "konsepter", og derfor vil du alltid avgjøre i hvilken grad studien din utfører når det gjelder begge typer gyldighet.

Hvert av disse konseptene er vanligvis rapportert i en forskningsartikkel som publiseres i en vitenskapelig tidsskrift. Dette er slik at andre forskere kan vurdere studien og ta beslutninger om resultatene er nyttige og gyldige.

forskjeller

Den vesentlige forskjellen mellom intern og ekstern validitet er at intern validitet refererer til strukturen av en studie og dens variabler, mens ekstern validitet er relatert til hvor universelle resultatene er. Det er videre forskjeller mellom de to også.

Intern Gyldighet

Fokus på nøyaktighet og sterke forskningsmetoder
Kontrollerer utenlandske variabler
Konklusjoner er berettiget
Eliminerer alternative forklaringer

Ekstern gyldighet

Resultatene oversettes til hele verden
Resultater er generaliserbare
Utfallene gjelder for praktiske situasjoner
Resultatene kan oversettes til en annen kontekst

Intern validitet fokuserer på å vise en forskjell som skyldes den uavhengige variabelen alene, mens eksterne validitetsresultater kan oversettes til hele verden.

eksempler

Et eksempel på en studie med god intern validitet ville være hvis en forsker hypoteser om at bruk av en bestemt mindfulness app vil redusere negativt humør. For å teste denne hypotesen tilordner forskeren tilfeldigvis et utvalg av deltakere til en av to grupper: de som vil bruke appen over en bestemt periode, og de som utfører en kontrolloppgave.

Forskeren sørger for at det ikke er systematisk forstyrrelser i hvordan deltakerne blir tildelt gruppene, og blinder også forskerassistentene til gruppene studentene er i under eksperimentering.

En streng studieprotokoll brukes som skisserer prosedyrene i studien. Potensielle confounding-variabler måles sammen med humør, for eksempel deltakerne sosioøkonomisk status, kjønn, alder, blant andre faktorer. Hvis deltakerne faller ut av studien, undersøkes deres karakteristika for å sikre at det ikke er systematisk forstyrrelser når det gjelder hvem som bor i studien.

Et eksempel på en studie med god ekstern validitet vil være i eksemplet ovenfor, og forskeren sørget også for at studien hadde ekstern gyldighet ved at deltakerne bruker appen hjemme i stedet for i laboratoriet. Forskeren definerer klart befolkningen av interesse og velger et representativt utvalg, og han / hun kopierer studien for ulike teknologiske enheter.

Et ord fra Verywell

Sette opp et eksperiment slik at det har lyd intern og ekstern gyldighet innebærer å være oppmerksom på begynnelsen om faktorer som kan påvirke hvert aspekt av forskningen. Det er best å bruke ekstra tid på å designe en strukturelt lydstudie som har vidtgående implikasjoner, i stedet for å raskt rush gjennom designfasen bare for å oppdage problemer senere. Først når både intern og ekstern gyldighet er høy, kan sterke konklusjoner gjøres om resultatene dine.

En oversikt over den vitenskapelige metoden