Wat is factoranalyse?
Factoranalyse is de praktijk van het condenseren van vele variabelen tot slechts een paar, zodat je onderzoeksgegevens gemakkelijker zijn om mee te werken.
De theorie is dat er diepere factoren zijn die de onderliggende concepten in je gegevens aansturen, en dat je deze kunt blootleggen en ermee kunt werken in plaats van je bezig te houden met de variabelen op een lager niveau die daaruit voortvloeien. Factoranalyse wordt soms ook “dimensiereductie” genoemd. U kunt de “dimensies” van uw gegevens reduceren tot een of meer “supervariabelen”, ook wel niet-waargenomen variabelen of latente variabelen genoemd.
Deze diepere concepten liggen niet onmiddellijk voor de hand. Ze kunnen eigenschappen of tendensen vertegenwoordigen die moeilijk te meten zijn, zoals extraversie of IQ.
Zoals bij elk proces dat complexiteit vereenvoudigt, is er een wisselwerking tussen de nauwkeurigheid van de gegevens en hoe gemakkelijk ze zijn om mee te werken. Bij factoranalyse is de beste oplossing die vereenvoudiging die de ware aard van de gegevens weergeeft, met zo min mogelijk verlies van precisie.
Factoranalyse is niet één techniek, maar een familie van statistische methoden die kunnen worden gebruikt om de latente factoren te identificeren die waarneembare variabelen aandrijven. Factoranalyse wordt veel gebruikt in marktonderzoek, maar ook in andere disciplines zoals technologie, geneeskunde, sociologie, veldbiologie, onderwijs, psychologie en nog veel meer.
eBook: 8 innovaties om marktonderzoek te moderniseren
Key concepts in factoranalyse
Een van de belangrijkste ideeën in factoranalyse is variantie – hoeveel uw numerieke waarden verschillen van het gemiddelde. Wanneer u factoranalyse uitvoert, probeert u te begrijpen hoe de verschillende onderliggende factoren de variantie tussen uw variabelen beïnvloeden. Elke factor heeft invloed, maar sommige factoren verklaren meer variantie dan andere, wat betekent dat de factor de variabelen waaruit hij is opgebouwd beter weergeeft.
De hoeveelheid variantie die een factor verklaart, wordt uitgedrukt in een eigenwaarde. Als een factoroplossing een eigenwaarde van 1 of hoger heeft, verklaart deze meer variantie dan een enkele geobserveerde variabele – wat betekent dat deze voor u nuttig kan zijn bij het beperken van uw aantal variabelen. Factoroplossingen met eigenwaarden kleiner dan 1 verklaren minder variabiliteit dan een enkele variabele en worden niet in de analyse opgenomen. In die zin zou een oplossing minder factoren bevatten dan het oorspronkelijke aantal variabelen.
Een andere belangrijke metriek is de factorscore. Dit is een numerieke maat die beschrijft hoe sterk een variabele uit de oorspronkelijke onderzoeksgegevens samenhangt met een bepaalde factor. Een andere term voor deze associatie of weging naar een bepaalde factor is factorlading.
Typen factoranalyse
Er zijn twee basisvormen van factoranalyse, exploratieve en confirmatieve. Hier leest u hoe ze worden gebruikt om waarde toe te voegen aan uw onderzoeksproces.
Bevestigende factoranalyse
Bij deze vorm van analyse begint de onderzoeker met een hypothese over zijn gegevens die hij wil bewijzen of ontkrachten. Factoranalyse zal bevestigen – of niet – waar de latente variabelen zich bevinden en hoeveel variantie zij voor hun rekening nemen.
Principal component analysis is een populaire vorm van confirmatieve factoranalyse. Met deze methode voert de onderzoeker de analyse uit om meerdere mogelijke oplossingen te verkrijgen die de gegevens over een aantal factoren verdelen. Items die op een enkele factor laden zijn sterker aan elkaar gerelateerd en kunnen door de onderzoeker met behulp van zijn conceptuele kennis worden gegroepeerd.
Het gebruik van PCA zal een reeks oplossingen met verschillende aantallen factoren opleveren, van vereenvoudigde 1-factor oplossingen tot hogere niveaus van complexiteit. Hoe minder factoren echter worden gebruikt, hoe minder variantie in de oplossing wordt verwerkt.
Verkennende factoranalyse
Zoals de naam al aangeeft, wordt verkennende factoranalyse uitgevoerd zonder een hypothese voor ogen. Het is een onderzoeksproces dat onderzoekers helpt te begrijpen of er verbanden bestaan tussen de oorspronkelijke variabelen, en zo ja, waar deze liggen en hoe ze zijn gegroepeerd.
Hoe voer je factoranalyse uit
De meeste grote statistische softwarepakketten, zoals SPSS en Stata, bevatten een factoranalysefunctie die u kunt gebruiken om uw gegevens te analyseren. Om te beginnen hebt u de variabelen nodig waarin u geïnteresseerd bent en, indien van toepassing, details van uw eerste hypothese over hun relaties en onderliggende variabelen.
Hoe factoranalyse u kan helpen
Naast het feit dat u minder variabelen hoeft te doorzoeken, kan factoranalyse u helpen groepering en clustering in uw invoervariabelen te begrijpen, omdat ze worden gegroepeerd volgens de latente variabelen.
Stel dat u verschillende vragen stelt die allemaal bedoeld zijn om verschillende, maar nauw verwante aspecten van klanttevredenheid te onderzoeken:
- Hoe tevreden bent u met ons product?
- Zou u ons product aan een vriend of familielid aanbevelen?
- Hoe waarschijnlijk is het dat u ons product in de toekomst zult kopen?
Maar u wilt slechts één variabele die een score voor klanttevredenheid weergeeft. Een optie zou zijn om het gemiddelde te nemen van de drie antwoorden op de vragen. Een andere optie is het creëren van een factorafhankelijke variabele. Dit kan worden gedaan door PCA uit te voeren en de eerste Principal Component (ook bekend als een factor) te behouden. Het voordeel van PCA boven een gemiddelde is dat elk van de variabelen automatisch wordt gewogen in de berekening.
Stel dat u een lijst met vragen hebt en u weet niet precies welke antwoorden samen zullen bewegen en welke verschillend; bijvoorbeeld aankoopbelemmeringen van potentiële klanten. De volgende zijn mogelijke aankoopbelemmeringen:
- Prijs is onbetaalbaar
- Overale implementatiekosten
- We kunnen geen consensus bereiken in onze organisatie
- Product sluit niet aan bij onze bedrijfsstrategie
- Ik moet een ROI ontwikkelen, maar kan of heb dat niet gedaan
- We zitten vast aan een contract met een ander product
- De voordelen van het product wegen niet op tegen de kosten
- We hebben geen reden om over te stappen
- Onze IT-afdeling kan uw product niet ondersteunen
- We hebben niet voldoende technische middelen
- Uw product heeft geen functie die we nodig hebben
- Anders (specificeer)
Factoranalyse kan de trends blootleggen van hoe deze vragen in elkaar zullen bewegen. Hieronder volgen de wegingen voor 3 factoren voor elk van de variabelen.
Zie hoe elk van de hoofdcomponenten hoge wegingen heeft voor een deelverzameling van de variabelen. De eerste component weegt zwaar op variabelen met betrekking tot kosten, de tweede op variabelen met betrekking tot IT, en de derde op variabelen met betrekking tot organisatorische factoren. We kunnen onze nieuwe supervariabelen slimme namen geven.
Als we de klanten zouden clusteren op basis van deze drie componenten, kunnen we enkele trends zien.
Voorbeelden van factoranalyses
Factoranalyses, waaronder PCA, worden vaak gebruikt in combinatie met segmentatiestudies. Het kan een tussenstap zijn om variabelen te reduceren voordat KMeans wordt gebruikt om de segmenten te maken.
Factoranalyse biedt eenvoud na het reduceren van variabelen. Voor lange studies met grote blokken Matrix Likert-schaalvragen kan het aantal variabelen onhandelbaar worden. Vereenvoudiging van de gegevens met behulp van factoranalyse helpt analisten om zich te concentreren en de resultaten te verduidelijken, terwijl ook het aantal dimensies waarop ze clusteren wordt verminderd.
Voorstelvragen
Het is zowel een kunst als een wetenschap om precies te kiezen op welke vragen een factoranalyse moet worden uitgevoerd. De keuze van de variabelen die moeten worden gereduceerd, vergt experimenteren, geduld en creativiteit. Factoranalyse werkt goed op Likert-schaalvragen en Som tot 100-vraagtypen.
Factoranalyse werkt goed op matrixblokken van de volgende vraagtypen:
Psychografische vragen (Mee eens/Onmee oneens):
- Ik hecht waarde aan familie
- Ik geloof dat een merk waarde vertegenwoordigt
Gedrag (mee eens/niet mee eens):
- Ik koop de goedkoopste optie
- Ik ben een koopjes shopper
Attitudinaal (mee eens/niet mee eens):
- De economie gaat niet vooruit
- Ik ben tevreden over het product
Activiteitsgebaseerd (mee eens/niet mee eens):
- Ik hou van sport
- Ik shop soms online tijdens werktijd
Gedragsgebaseerde en psychografische vragen zijn bijzonder geschikt voor factoranalyse.