3.1 Multippel korrespondanseanalyse


3.1 Multippel korrespondanseanalyse

Ei fullstendig innføring i korrespondanseanalysen høyrer ikkje hit (sjå td. Greenacre 1993, Hjellbrekke 1999), men logikken som ligg til grunn for analyseteknikken er i korte trekk den følgjande: Informasjonen vert først sett opp i ein krysstabell eller ei binær indikatormatrise. For å maksimere forskjellar mellom rekke- eller kolonneprofilar i tabellen/matrisa, vert kjikvadrat-avstandane mellom desse profilane rekna ut. Deretter søkjer ein å avdekkje dei underliggande dimensjonane som best er i stand til å skildre dei mest sentrale opposisjonane i det analyserte datamaterialet. Akse 1 er eit uttrykk for den mest framtredande opposisjonen, akse 2 den nest mest framtredande, etc. Målet er å sitje att med så få aksar som mogleg i den vidare tolkinga.

For å tolke aksane må ein granske verdiane for aksen sin prosentdel forklarte varians (eller inertia), dei absolutte bidraga frå variablane og for variabelkategoriane til aksane (eit uttrykk for kor sentrale variablane/kategoriane er for konstruksjonen av aksane), og også dei relative bidraga (eit uttrykk for kor godt ein akse er i stand til å skildre eit punkt sin posisjon i det same rommet). Kategoriar og variablar med høge absolutte bidrag (bidrag større enn gjennomsnittet) vert tillagde størst vekt i analysen. For ei meir detaljert tolking av opposisjonane i rommet, kan ein med fordel også rekne ut kor mykje opposisjonen mellom to eller fleire variabelkategoriar frå same variabel yter til den gjevne variabelen sitt absolutte bidrag (også kalla intrabidrag, sjå Le Roux og Rouanet 1998, Chiche, Le Roux, Perrineau, & Rouanet 2000)[10].

Aksane vert så nytta for å kunne framstille dei same opposisjonane geometrisk som distansar i eit fleirdimensjonalt rom. Rekkekategoriar vert lokaliserte i eitt rom, kolonnekategoriar i eitt rom, og av matematiske årsaker let desse to seg presentere i ein og same romkonstruksjon. Kategoriar frå same variabel som er lokaliserte nær einannan i rommet, vil tendere til å ha like profilar på tvers av alle dei andre aktive variablane i analysen. Ein kategori frå ein variabel, vil likeeins orientere seg i retning av den/dei kategoriane i dei andre variablane der den, relativt sett (dvs. samanlikna med dei andre kategoriane i same variabel), ”gjer det best” (dvs. har relativt høgare skåre på kategorien i den andre variabelen). Ein variabelkategori sin posisjon må derfor tolkast i relasjon til posisjonane til kategoriane i alle dei andre analyserte variablane. Som ein generell regel vil kategoriar med høge absolutte bidrag også ha stor orienteringskraft i høve til kva retning aksane tek i det fleirdimensjonale rommet.

I den multiple korrespondanseanalysen vil den analyserte tabellen som oftast ta form av ei binær indikatormatrise. Vi får då vi ei sky for (som oftast) respondentane, og ei sky for variabelkategoriane (denne siste skya er presentert nedanfor i Figur 1). Ein variabelkategori sin posisjon, td. “Undervisning/forsking” i Figur 1, er her å forstå som den gjennomsnittlege posisjonen for alle individ som har verdien “Undervisning/forsking” på variabelen “Bransje”. Individpunkta vil følgjeleg ligge spreidde rundt gjennomsnittspunktet, og denne spreiinga kan variere (kor stor spreiinga er kan vi ikkje utan vidare slutte oss til utifrå Figur 1, men som vi skal sjå seinare i rapporten er det utvikla eit analyseverktøy som gjer det mogeleg både å seie noko om kor stor speiinga er og kva som karakteriserer denne). Respondentgrupper med sterk konsentrasjon er homogene i sine profilar, medan grupper med sterk spreiing er heterogene i sine profilar.


[10]Denne framgangsmåten, som vil bli nytta vidare i rapporten, krev ein spesialvariant kalla spesifikk multippel korrespondanseanalyse. Framgangsmåten, utvikla av Brigitte Le Roux og Henry Rouanet, krev at ein skil mellom aktive, passive og supplementære kategoriar i analysen (sjå Le Roux og Rouanet op. cit. for ytterlegare informasjon)


Publisert 25. nov. 2010 13:52