Menu
in

Wat is valse correlatie

In de statistiek verwijst een onechte correlatie, of onechtheid, naar een verband tussen twee variabelen dat causaal lijkt, maar dat niet is. Schijnrelaties hebben vaak het uiterlijk dat de ene variabele de andere beïnvloedt. Deze valse correlatie wordt vaak veroorzaakt door een derde factor die niet duidelijk is op het moment van onderzoek, soms een verstorende factor genoemd.

KEY POINTS

  • Onechte, of onechte, correlatie is wanneer twee factoren willekeurig gerelateerd lijken, maar dat niet zijn.
  • Het verschijnen van een oorzakelijk verband is vaak te wijten aan een vergelijkbare beweging op een grafiek die willekeurig blijkt te zijn of veroorzaakt door een derde “verwarrende” factor.
  • Valse correlatie kan vaak worden veroorzaakt door kleine steekproeven of willekeurige eindpunten.

Hoe onechte correlatie werkt

Wanneer twee willekeurige variabelen elkaar nauw opvolgen in een grafiek, is het gemakkelijk om een correlatie te vermoeden, of een relatie tussen de twee factoren, waarbij de ene verandering de andere beïnvloedt. Afgezien van “causaliteit”, een ander argument, kan deze observatie de lezer van de grafiek doen geloven dat de beweging van variabele A gerelateerd is aan de beweging van variabele B of vice versa.  maar soms, Bij nader statistisch onderzoek vallen uitgelijnde bewegingen samen met of worden ze veroorzaakt door een derde factor die de eerste twee beïnvloedt. Dit is een valse correlatie. Onderzoek uitgevoerd met kleine steekproeven of willekeurige eindpunten is bijzonder gevoelig voor onwaarheid.  

Zuivere correlaties voorbeeld

Het is niet zo moeilijk om interessante correlaties te ontdekken. Velen zullen echter vals blijken te zijn. Voor de mannelijke soort Wall Street hebben twee populaire valse correlaties betrekking op vrouwen en sport. Geboren in de jaren 20 is de theorie van roklengte, die stelt dat roklengtes en beursrichting gecorreleerd zijn. Als de lengtes van de rok lang zijn, betekent dit dat de aandelenmarkt daalt; Als ze short zijn, gaat de markt omhoog. Tegen het einde van januari is er sprake van de zogenaamde Super Bowl-indicator, die suggereert dat een overwinning van het AFC-team waarschijnlijk betekent dat de aandelenmarkt het komende jaar zal dalen, terwijl een overwinning van het NFC-team een stijging van de markt voorspelt. Sinds 1966 heeft de indicator een nauwkeurigheid van 80%. Het is een leuk gespreksstuk, maar waarschijnlijk niet iets dat een serieuze financieel adviseur zou aanbevelen als beleggingsstrategie voor klanten. Hier zijn enkele andere voorbeelden van veel voorkomende valse correlaties:
  • Drownings nemen toe wanneer de ijsverkoop toeneemt. Het lijkt erop dat de toegenomen verkoop van ijs meer verdrinking veroorzaakt, maar in werkelijkheid kan verhoogde hitte ervoor zorgen dat meer mensen zwemmen en meer ijs kopen. 
  • Het moordcijfer in de Verenigde Staten van 2006 tot 2011 daalde in hetzelfde tempo als het gebruik van Microsoft Internet Explorer.
  • Leidinggevenden die alsjeblieft en bedankt zeggen, genieten vaker van betere prestaties.
  • Mensen die Oakland Raiders-teamkleding dragen, hebben meer kans om misdaden te plegen.

Hoe onechte correlaties te detecteren

Statistici en andere wetenschappers die gegevens analyseren, moeten altijd op zoek zijn naar valse relaties. Er zijn een aantal methoden die ze gebruiken, waaronder:
  • Verzeker een adequate representatieve steekproef.
  • Zorg voor een adequate steekproefomvang.
  • Wees op uw hoede voor willekeurige eindpunten.
  • Controle voor zoveel mogelijk externe variabelen.
  • Gebruik een nulhypothese en test een sterke p-waarde.

Leave a Reply