SAMPLING

Et samfundsvidenskabeligt projekt kan rumme et meget stort antal potentielle respondenter, dvs. respondenter som kunne være relevante for projektet. En politisk opinionsmåling i Danmark vil eksempelvis omfatte over 4,2 millioner relevante respondenter. Her er en totalundersøgelse praktisk uoverkommelig. Desuden vil det være bedre at bruge ressourcerne til at komme i dybden med de enkelte svar frem for at kontakte alle relevante respondenter. Derfor kan det komme på tale at udvælge de respondenter som skal deltage i projektet. I fagterminologien taler man om at sample (dvs. udvælge) respondenter ud af populationen (dvs. "universet" eller "alle potentielle og relevante respondenter").

Populationen er samtlige respondenter der er relevante for det konkrete projekt. Før du starter udvælgelsen, skal du definere og afgrænse denne population. Det gør du ved at udarbejde en komplet up-to-date liste over alle potentielle respondenter, for eksempel alle kvinder mellem 15 og 45 år i Ringkøbing amt. Ud fra denne populationsliste kan du sample et antal respondenter der skal afspejle populationen i alle væsentlige henseender. Den udvalgte gruppe skal være et minibillede af populationen, og derfor er det naturligvis ikke ligegyldigt hvilke respondenter du udvælger. Hvis den udvalgte gruppe er skæv i forhold til populationen, vil resultatet give et tilsvarende skævt billede af populationen. Du skal altså være opmærksom på hvordan du sampler, og du skal løbende kontrollere hvorvidt samplingen har haft en uheldig indflydelse på resultaterne af dine undersøgelser.

1. Tilfældig udvælgelse

Du kan - bevidst eller ubevidst - have personlige præferencer, der styrer din udvælgelse. Måske gider du ikke gå op ad alle trapperne, og derfor interviewer du kun dem der bor i stueetagen. Eller måske har du kun tid til dine observationer om formiddagen, og derfor får du kun fat i folk der er hjemme på dette tidspunkt. Det kan give en systematisk skæv fordeling i udvælgelsen og for at modvirke det, kan du anvende tilfældige udvælgelsesmetoder. Du kan her vælge mellem tre forskellige former:

a. Helt tilfældig udvælgelse

Fremgangsmåden i en helt tilfældig udvælgelse foregår på samme måde som ved lodtrækning: En liste med navne nummereres, og respondenterne udvælges efter nummer. Er der tale om et stort antal respondenter, kan du bruge edb til udvælgelsen. En mere systematisk tilfældig sampling er at udvælge hver 10. person på en liste med hele populationen. Denne form for udvælgelse kræver dog at der ikke er et mønster i populationslisten. Hvis du for eksempel anvender postvæsnets adresselister som populationsliste, risikerer du at hver 10. respondent alle bor i stueetagerne (der er antageligt en overvægt af ældre beboere i stueetagerne).

b. Stratificeret tilfældig udvælgelse

Hvis du på forhånd kender nogle karakteristiske egenskaber ved en population, kan du med fordel opdele denne i grupper eller planer [strata]. For eksempel kan kønsfordelingen i en population være skævt fordelt. Du risikerer i den helt tilfældige sampling at udvalget ikke afspejler den skæve kønsfordeling. Hvis du derimod starter med at opdele populationen i køn, kan du efterfølgende tilfældigt udvælge et bestemt antal fra hver gruppe og herved sikre at samplingen er repræsentativ med henblik på kønsfordelingen.

c. Klyngeudvalg

Efter samme princip som i den stratificerede sampling kan du opdele populationen i klynger. Blandt disse udvælger du tilfældigt eller ikke-tilfældigt et antal klynger. Hvis der er tale om klynger som indeholder mange respondenter, kan du fortsætte med tilfældigt at udvælge et antal respondenter ud af hver klynge. For eksempel kan du opdele Danmark i områder (kommuner, amter, bydele) og tilfældigt eller ikke-tilfældigt udvælge et antal områder. Inden for de udvalgte områder gentager du samplingen med tilfældigt at udvælge et antal respondenter. Det er fordelagtigt at du ikke behøver at rejse hele landet rundt for at interviewe dine respondenter, men kan nøjes med at koncentrere dig om de udvalgte områder. I andre eksempler er klyngerne mindre (for eksempel familier, fodboldklubber), og klyngeudvælgelsen vil her begrænse sig alene til valget af klynge og altså ikke efterfølges af en udvælgelse inden for klyngen.

2. Ikke-tilfældig udvælgelse

Der kan indsnige sig tilfældighedsfejl i udvælgelsen selvom de tilfældige udvælgelsesmetoder minimerer indflydelsen af bevidste eller ubevidste præferencer. Måske er der bias (skævhed) i udvælgelsen, for eksempel på grund af forældede eller ufuldstændige populationslister. Du bør derfor altid kontrollere hvorvidt den udvalgte gruppe faktisk afspejler populationen i alle væsentlige områder. Du kan også fra starten vælge ikke-tilfældige udvælgelsesmetoder hvis du mener at have tilstrækkeligt overblik over populationen og kontrol over samplingen. Ikke-tilfældige udvælgelser er mere almindelige end måske umiddelbart antaget, især inden for kvalitative metoder.

a. Skønsmæssig udvælgelse

Her udvælger du respondenterne ud fra et kvalificeret skøn. Hvis du tør stole på dine evner til at kontrollere og udelukke forhold som ikke er relevante for projektet, er der en stor chance for at den skønsmæssige udvælgelse er repræsentativ. Kvalitative interview af nøglepersoner bygger ofte på skønsmæssige udvælgelser.

b. Selvselektion

Du kan også vælge at bygge din udvælgelse udelukkende på frivillig tilmelding. For eksempel kan et ugeblad opfordre læserne til at indsende et spørgeskema, eller et radioprogram kan opfordre lytterne til at ringe og sige deres mening. En ulempe i denne form for udvælgelse
er muligheden for en systematisk skævhed i undersøgelsen da det måske kun er de aktive eller særligt kritiske respondenter der reagerer på opfordringen.

c. Slumpmæssig udvælgelse

Slump er en kombination af skønsmæssig udvælgelse og selvselektion. Her har du på forhånd udvalgt bestemte kategorier af respondenter (for eksempel kvinder, unge, hver 10. forbipasserende og lignende). Men i selve situationen lader du det være op til den enkelte respondent hvorvidt han eller hun vil deltage. Typisk finder du denne form for udvælgelse på gågader, i butikker og lignende steder. En markedsresearcher kan for eksempel udforme et spørgeskema om hygiejnebind som skal fordeles til potentielle kunder, dvs. kvinder mellem 15 og 45 år. Mændene er på forhånd fravalgt i denne undersøgelse. Men det er (naturligvis) stadig op til hver enkelt kvindelig respondent om hun ønsker eller har tid til at udfylde spørgeskemaet.

3. Udvalgets størrelse

Hvor mange respondenter skal du udvælge til dine projekter? Hensynet til ressourcerne taler for at begrænse udvalget. Modsat vil ønsket om at kunne generalisere resultaterne tale for at udvalget bliver så stort som muligt. Udvalget skal altså afspejle en balance mellem praktiske hensyn og generaliserbarhed.

Den præcise størrelse af udvalget bestemmes især af respondentgruppens homogenitet, eller sagt med en matematisk terminologi: statistiske signifikans. Hvis respondenterne i en population antages at ligne hinanden i alle væsentlige henseender, kan du nøjes med et mindre udvalg af respondenter. Modsat skal udvalget være forholdsvist stort i tilfælde af at respondentgruppen antages at være uhomogent sammensat. Antagelsen om at kunne finde en grad af homogenitet i en respondentgruppe er i øvrigt selve forudsætningen for at kunne udvælge.

Den udvalgte gruppe skal som nævnt være et minibillede af populationen, men det er heller ikke et umuligt krav. For eksempel er det rimeligt at antage en vis grad af enighed blandt medarbejderne i en virksomhed. Det er på denne baggrund at selv et lille antal respondenter kan give et repræsentativt billede af populationen, og det vil i så fald være bedre at gå i dybden med et par udvalgte nøglepersoner end at udspørge alle medarbejderne i virksomheden.

Nu er det ikke altid let at bestemme graden af homogenitet blandt respondenterne. Hvad vil det sige at respondenterne skal "ligne hinanden på de væsentligste områder"? Svaret afhænger af hvor dybt du ønsker at gå i undersøgelsen. Hvis du søger præcis og nuanceret viden fra respondenterne, skal udvalget være stort. Udvalgets størrelse afhænger derfor af hvilke konklusioner du ønsker at drage. Hvis hensigten med projektet er at tilvejebringe sikker viden som andre forskere kan bygge videre på, bør kravet til præcisionen være høj, og udvalget derfor tilsvarende stort. I andre projekter kan vi derimod tillade os at slække på kravene til præcisionen, og udvalget kan blive tilsvarende mindre.

Samlet kan vi sige at fire faktorer har betydning for størrelsen af udvalget. Ideelt vil hensynet til generaliserbarhed tale for det størst mulige udvalg. Et stort antal udvalgte respondenter minimerer risikoen for et skævt billede af populationen. Imidlertid varierer kravet til generaliserbarhed afhængig af den grad af præcision vi ønsker i undersøgelsens resultater. Desuden vil stort anlagte undersøgelser ofte være en bekostelig affære, og en mere hensigtsmæssig udvalgsstørrelse vil derfor også være nødt til at tage praktiske/økonomiske hensyn. Sidst, men ikke mindst, er respondenternes indbyrdes homogenitet som nævnt en afgørende faktor for størrelsen af udvalget.

4. Bortfald

Det er sjældent at man får tilbagemeldinger fra hele udvalget. Den del som mangler at svare, kaldes bortfaldet, og du bør allerede fra starten af projektet overveje hvad du vil stille op med et eventuelt bortfald.

I bortfaldsanalysen sammenligner du gruppen af personer der har meldt tilbage med gruppen uden tilbagemeldinger. Hvis de to grupper ligner hinanden i alle væsentlige henseender, kan du tillade et relativt stort bortfald. Hvis der derimod er væsentlige forskelle mellem de to grupper, bør du forsøge at kortlægge gruppen med de manglende tilbagemeldinger. I en undersøgelse af potentielle kunder til et dagligvareprodukt kan vi for eksempel risikere at det kun er positivt indstillede respondenter der returnerer spørgeskemaet. Hvis vi ikke tager højde for det, vil resultatet af undersøgelsen blive uforholdsmæssigt positivt, og konsekvensen kan blive en række fejlinvesteringer.

Start bortfaldsanalysen med at finde ud af hvilke respondent-kategorier som ikke har besvaret spørgeskemaet. Ofte kan du allerede her frasortere et antal respondenter som alligevel ikke kan bidrage med væsentlige nye data til projektet. Send et rykkerbrev til resten, eventuelt sammen med et nyt spørgeskema, og vent en uge eller to. Hvis der stadig mangler enkelte respondenter, gentager du analysen af bortfaldet. Vurderer du at enkelte blandt de resterende respondenter kan bidrage med væsentlige data, kan du overveje at kontakte dem per telefon. Det kan i det mindste være interessant at vide hvorfor de ikke ønsker at deltage i din undersøgelse.

I alt: 1610 ord

© Harboe, Thomas: Indføring i samfundsvidenskabelig metode. Forlaget Samfundslitteratur.

Tilbage til instruktionen
Tilbage til Filmvejledninger