E non è inquietante il fatto che il numero degli annegamenti dovuti a una caduta in una piscina è correlato al numero di film all'anno nei quali ha recitato Nicolas Cage? Anche qui, il grafico è eloquente:
I dati sono reali: li ha raccolti e rappresentati graficamente Tyler Vigen, presso Tylervigen.com. Ma questi grafici non hanno lo scopo di sminuire la statistica o di insinuare che si può mentire facilmente e in modo molto convincente usando un grafico e scegliendo i dati opportuni: servono a ricordare che una correlazione non vuol dire nulla se non c'è anche un meccanismo di causa ed effetto che leghi le serie di dati.
Per esempio, all'inizio del secolo scorso i tumori ai polmoni, che prima erano rarissimi, stavano aumentando enormemente e non si sapeva perché. Ma nel 1929 il medico tedesco Fritz Lickint pubblicò il primo studio che indicava una forte correlazione fra fumo e tumore ai polmoni e suggerì che era sensato condurre studi ulteriori per verificare che ci fosse davvero un legame di causa ed effetto e non si trattasse di una correlazione spuria.
Le statistiche grafiche, insomma, sono uno strumento potente per far emergere fenomeni che altrimenti resterebbero sepolti nei numeri, e l'informatica è un alleato molto efficiente in questo campo; ma ci vuole l'intelligenza umana, abbinata alla conoscenza del mondo reale, per decidere se la correlazione fra due variabili è semplice coincidenza o se c'è davvero un legame di causa.
Altrimenti dovremmo concludere che il consumo di formaggio causa la morte per intrappolamento fra le lenzuola, come si evince da questo grafico:
Scritto da Paolo Attivissimo per il blog Il Disinformatico. Ripubblicabile liberamente se viene inclusa questa dicitura (dettagli). Sono ben accette le donazioni Paypal.
0sem comentários ainda
Por favor digite as duas palavras abaixo