Pålitelighet og konsistens i psykometri

Når vi kaller noen eller noe pålitelig, mener vi at de er konsistente og pålitelige. Pålitelighet er også en viktig del av en god psykologisk test. Tross alt ville en test ikke være veldig verdifull hvis den var inkonsekvent og produserte ulike resultater hver gang. Hvordan definerer psykologer pålitelighet? Hvilken påvirkning har den på psykologisk testing?

Pålitelighet refererer til konsistensen av et mål. En test anses pålitelig hvis vi får det samme resultatet flere ganger. For eksempel, hvis en test er utformet for å måle et trekk (for eksempel introversjon), må resultatet hver gang testen administreres til et emne, være omtrent det samme. Dessverre er det umulig å beregne påliteligheten nøyaktig, men det kan estimeres på en rekke forskjellige måter.

Test-Retest Pålitelighet

Test-retest pålitelighet er et mål for konsistensen av en psykologisk test eller vurdering. Denne typen pålitelighet brukes til å bestemme konsistensen av en test over tid. Test-retest pålitelighet er best brukt til ting som er stabile over tid, for eksempel intelligens.

Test-retest pålitelighet måles ved å administrere en test to ganger på to forskjellige punkter i tide. Denne typen pålitelighet forutsetter at det ikke vil bli endret i kvaliteten eller konstruksjonen som måles.

I de fleste tilfeller vil påliteligheten bli høyere når det er lite tid mellom tester.

Test-retest-metoden er bare en av måtene som kan brukes til å bestemme påliteligheten til en måling. Andre teknikker som kan brukes inkluderer inter-rater pålitelighet, intern konsistens og parallellformer pålitelighet.

Det er viktig å merke seg at test-retest-pålitelighet bare refererer til konsistensen av en test, ikke nødvendigvis gyldigheten av resultatene.

Inter-Rater Pålitelighet

Denne type pålitelighet vurderes ved å ha to eller flere uavhengige dommere scorer testen. Resultatene sammenlignes deretter for å bestemme konsistensen av estimatene fra raters.

En måte å teste inter-rater pålitelighet på er å ha hver rater tildele hvert testelement en score. For eksempel kan hver rytter score på en skala fra 1 til 10. Deretter beregner du sammenhengen mellom de to karakterene for å bestemme nivået på inter-rater-pålitelighet.

Et annet middel for å teste inter-rater pålitelighet er å ha ratere avgjøre hvilken kategori hver observasjon faller inn i og deretter beregne prosentandelen av avtale mellom ratene. Så, hvis raterne er enige om 8 av 10 ganger, har testen en pålitelighetshastighet på 80%.

Parallell-Forms Pålitelighet

Parallelle former for pålitelighet måles ved å sammenligne to forskjellige tester som ble opprettet ved hjelp av det samme innholdet. Dette oppnås ved å skape et stort utvalg av testelementer som måler samme kvalitet og deretter tilfeldig deles elementene i to separate tester. De to testene skal da administreres til de samme fagene samtidig.

Intern konsistens Pålitelighet

Denne form for pålitelighet brukes til å bedømme konsistensen av resultatene på tvers av elementer på samme test. I hovedsak sammenligner du testelementer som måler samme konstruksjon for å bestemme testens interne konsistens. Når du ser et spørsmål som ser veldig ut som et annet testspørsmål, kan det tyde på at de to spørsmålene brukes til å måle påliteligheten. Fordi de to spørsmålene er like og utformet for å måle det samme, må testtakeren svare på begge spørsmålene, noe som vil indikere at testen har intern konsistens.

Faktorer som kan påvirke pålitelighet

Det er en rekke forskjellige faktorer som kan påvirke påliteligheten av et tiltak. Først og kanskje tydeligvis er det viktig at tingen som blir målt, er ganske stabil og konsistent. Hvis den målte variabelen er noe som endres regelmessig, vil resultatene av testen ikke være konsistente.

Aspekter av testsituasjonen kan også påvirke påliteligheten. For eksempel, hvis testen blir administrert i et rom som er ekstremt varmt, kan respondentene bli distrahert og ikke klarer å fullføre testen til det beste av deres evne. Dette kan påvirke tiltakets pålitelighet. Andre ting som tretthet, stress, sykdom, motivasjon, dårlige instruksjoner og miljøforstyrrelser kan også skade påliteligheten.

Pålitelighet vs. Gyldighet

Det er viktig å merke seg at bare fordi en test har pålitelighet betyr det ikke at den har gyldighet. Gyldighet refererer til om en test virkelig måler hva det hevder å måle. Tenk på pålitelighet som et mål for presisjon og validitet som et mål for nøyaktighet. I noen tilfeller kan en test være pålitelig, men ikke gyldig. For eksempel tenk at jobbsøkere tar en test for å avgjøre om de har en bestemt personlighetstrekk. Mens testen kan gi konsistente resultater, kan det egentlig ikke være å måle egenskapen som den påstår å måle.