English version of this page

Anonymisering/avidentifisering i transkriberingsprosessen

Det kan være utfordrende å vite hva som er for mye og for lite informasjon for å identifisere noen. Med inntoget av tilgjengelige kunstig intelligens-verktøy blir det enda viktigere å avidentifisere tilstrekkelig.

Informasjon du bør vurdere å fjerne fra datamaterialet er personnavn (på deltagere, tredjepersoner, kjæledyr osv.), alder, irrelevante identifiserende historier, stedsnavn, navn på arbeidsplass, klubber eller andre typer fellesskap og interesser personen er tilknyttet. I tillegg bør du vurdere å fjerne sosiolekt, dialekt, gjentakende bruk av enkelte ord og uttrykk, som kan være identifiserende i ditt tilfelle. Historier og erfaringer kan være viktig for datamaterialet, og dette kan løses gjennom å gjøre historiene eller erfaringene mer generelle, slik at det ikke er så detaljert (f.eks: Sande i Vestfold kan bli til et lite sted på Østlandet). Denne prosessen er ekstra viktig hvis du vurdererå å dele intervjudataene om du får samtykke til det (som en del av open science-praksis). Det finnes altså ikke noe fasit eller tydelig svar på hva som er for lite eller for mye informasjon. Du må tenke på alle faktorer som kan være med på å identifisere en person.

Eksempel: Deltageren din nevner at de arbeidere frivillig på en fritidsklubb i kommunen du skriver oppgave om. Du gjør et google søk og finner ut at det kun er 1 fritidsklubb i kommunen, og her jobber det 20 frivillige. Sjansen for at personen kan identifiseres når annen informasjon legges til blir dermed stor.

For mer informasjon: Generelt om personvern - Hva er avidentifisert og anonym data?

Publisert 3. juni 2024 10:58 - Sist endret 13. juni 2024 13:15