Novembre 2007 Estadístiques curioses 1
Estadístiques curioses
Olga JuliàProfessora TitularDpt. de Probabilitat, Lògica i EstadísticaFacultat de Matemàtiques
Novembre 2007 Estadístiques curioses 2
Estadístiques curioses
Mètodes enginyosos
Conclusions estranyes
Mala utilització de l’estadística
Novembre 2007 Estadístiques curioses 3
VERITATS
MITGES VERITATS
MITGES MENTIDES
MENTIDES
ESTADÍSTIQUES
DITA
Novembre 2007 Estadístiques curioses 4
L’Estadística i el sentit comú
En el desenvolupament de la nostra vida quotidiana sovint som bombardejats per estadístiques.
No calen grans coneixements d’Estadística per entendre els números que ens presenta la premsa, però sí que cal sentit comú.
“El sentit comú és el menys comú dels sentits” (Voltaire)
Novembre 2007 Estadístiques curioses 5
Tothom sap calcular un tant per cent?
De la premsa:Un diputat danès va explicar “ que el
68% de la població no utilitzava les biblioteques”
D’on va treure aquesta dada? Doncs tenia una enquesta que deia que el 31% de les dones i el 37% dels homes no utilitza les biblioteques.
Novembre 2007 Estadístiques curioses 6
Els tants per cent no es poden sumar
En aquest cas si p és la proporció de dones i q la proporció d’homes, tenim que el tant per cent de la població que no utilitza les biblioteques és p.31% + q.37%
En el cas més simple de que la població tingui la mateixa proporció de dones i d’homes, p=q= ½ :
½ 31% + ½ 37%=34%
Novembre 2007 Estadístiques curioses 7
Anècdota verídica Carrega un 100% sobre el preu del
producte. No ven res i per tant no té benefici. Rebaixa el preu un 50%. Ara ven
molt, però tampoc té beneficis. On és el 50% que falta?
Novembre 2007 Estadístiques curioses 8
Diferents interpretacions de les mateixes dades La taula següent mostra els resultats
de la selectivitat d’un institut en dos anys consecutius
2006 2007Matriculats Aprovats Matriculats Aprovats
No repetidors
44 24 30 16
Repetidors 6 6 20 18Total 50 30 50 34
Novembre 2007 Estadístiques curioses 9
Diferents interpretacions de les mateixes dades Un professor: "la taxa
d’aprovats ha crescut un 8% “
Percentatge d’aprovats el 2006: 30·100/50=60%
Percentatge d’aprovats el 2007: 34·100/50=68%
2006
2007
M A M A
NR 44 24 30 16
R 6 6 20 18
T 50 30 50 34
Novembre 2007 Estadístiques curioses 10
Diferents interpretacions de les mateixes dades
El director: l’any 2007 marca un augment del 13% en el nombre d’aprovats. És una demostració de la bona feina que fem.
Aprovats el 2006: 30 Increment en el 2007: 4 4·100/30=13%
2006
2007
M A M A
NR 44 24 30 16
R 6 6 20 18
T 50 30 50 34
Novembre 2007 Estadístiques curioses 11
Diferents interpretacions de les mateixes dades Un alumne: “tant si
ets repetidor com si no, aquest any ha estat pitjor”
Percentatge d’aprovats entre els no repetidors
2006: 24·100/44=54.5% 2007: 16·100/30=53.3% Percentatge
d’aprovats entre els repetidors:
2006: 6·100/6=100% 2007: 18·100/20=90%
2006
2007
M A M A
NR 44 24 30 16
R 6 6 20 18
T 50 30 50 34
Novembre 2007 Estadístiques curioses 12
Diferents interpretacions de les mateixes dades
Un alumne repetidor: “Els que repetien en el 2007 tenien un 35.5% més de possibilitats d’aprovar”
Aquest alumne era repetidor el 2007 però no al 2006
2006: 24·100/44=54.5% 2007: 18·100/20=90%
2006
2007
M A M A
NR 44 24 30 16
R 6 6 20 18
T 50 30 50 34
Novembre 2007 Estadístiques curioses 13
Diferents interpretacions de les mateixes dades Un alumne repetidor:
“repetint en el 2007 tenies un 10% menys de possibilitats d’aprovar “
Percentatge d’aprovats entre els repetidors:
2006: 6·100/6=100% 2007: 18·100/20=90%
2006
2007
M A M A
NR 44 24 30 16
R 6 6 20 18
T 50 30 50 34
Novembre 2007 Estadístiques curioses 14
Un de cada ...
En lloc de tants per cents, als medis de comunicació els agrada presentar els resultats estadístics com un de cada cinc ..., tres de cada 10 ...
Novembre 2007 Estadístiques curioses 15
Un de cada ...
El 34% dels morts per accident de trànsit durant l’estiu del 2005 no portaven el cinturó posat.
De la premsa:Una de cada tres víctimes mortals
d'accident de cotxe no portava cordat el cinturó.
Novembre 2007 Estadístiques curioses 16
Dades inútils Si només ens diuen que una de cada tres
víctimes mortals no portava el cinturó, no en podem treure cap conclusió.
És millor no posar-se’l? (2 de cada tres el duien). Sabem que és millor dur-lo posat, però no gràcies a aquestes dades.
Quan tothom porti el cinturó el 100% de les víctimes mortals el portaran posat.
Novembre 2007 Estadístiques curioses 17
Mitjana, Mediana i Moda
Per resumir les dades, el més comú és utilitzar els paràmetres de posició:
Mitjana (x1+ x2+...+ xn)/n Mediana: el valor del mig (meitat
per sobre, meitat per sota). Moda: el valor més freqüent.
Novembre 2007 Estadístiques curioses 18
La mitjana, la gran simplificació En moltes ocasions tenim tendència
a perdre de vista la població i fixar-nos només en la mitjana.
Treballar amb la mitjana i no amb la població és una gran simplificació.
Novembre 2007 Estadístiques curioses 19
La mitjana, la gran simplificació
El ingrés mitja de les llars americanes és de 55.000$ l’any
Novembre 2007 Estadístiques curioses 20
Desfilada Curiosa
Imaginem que als EEUU s’organitza una desfilada d’una hora que inclourà un representant de cada llar.
Els representants s’alinearan de manera que primer passaran els més pobres, seguits dels qui són cada vegada més rics. Tots aniran a la mateixa velocitat.
* Tret d’un document de Justícia i Pau anomenat desfilada de la Victòria
Novembre 2007 Estadístiques curioses 21
Suposem que podem fer que l’alçada de cada persona que desfila sigui proporcional als ingressos de la llar que representa.
La xifra d’ingrés mitjà en aquella societat (55.000$) estarà representada per “l’estatura mitjana” d’un americà, que és de 1,80m.
Desfilada Curiosa
Novembre 2007 Estadístiques curioses 22
30 cm=9.200$ 5 minuts
Novembre 2007 Estadístiques curioses 23
12 minuts50 cm=15.000$
Novembre 2007 Estadístiques curioses 24
1 metre=27.500$ 20 minuts
Novembre 2007 Estadístiques curioses 25
1,40m=43.000$ 30 minuts
Novembre 2007 Estadístiques curioses 26
1,80m=55.000$ 40 minuts
Novembre 2007 Estadístiques curioses 27
2,50m=80.000$ 48 minuts
Novembre 2007 Estadístiques curioses 28
54-57 minuts3,70m=110.000$
4,80m =142.000$
Novembre 2007 Estadístiques curioses 29
400.000$12.000.000$ 10.000.000$
300mÚltim mig minut
Novembre 2007 Estadístiques curioses 30
Aneto
100M=3000m
Últims segons
Novembre 2007 Estadístiques curioses 31
Everest=8.800
4.900MBill Gates
Novembre 2007 Estadístiques curioses 32
Com es fa un histograma? Dividim les dades en classes d’igual
amplitud. Calculem la freqüència de cada classe, i la representem en un gràfic de la forma:
Notes
0
1
2
3
4
5
6
7
8
0 -- 1 1 -- 2 2 -- 3 3 -- 4 4 -- 5 5 -- 6 6 -- 7 7 -- 8 8 -- 9 9 --10
Novembre 2007 Estadístiques curioses 33
És el mateix un histograma que un diagrama de barres? El diagrama de barres s’aplica quan
les dades estan dividides per classes per raons qualitatives
Persones amb més de 100 anys a la ciutat de Barcelona
0
100
200
300
400
500
600
Dones Homes
Novembre 2007 Estadístiques curioses 34
L’Íbex-35 del 1990 al 2002Ibex-35
0
2000
4000
6000
8000
10000
12000
14000
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
Novembre 2007 Estadístiques curioses 35
Novembre 2007 Estadístiques curioses 36
Captura i Recaptura Com podríem saber quants peixos hi ha en un
llac?
Novembre 2007 Estadístiques curioses 37
Captura i Recaptura Captura i Marcat Capturem N peixos vius i sense danyar-
los se’ls marca. Desprès se’ls retorna al llac
Recaptura Al cap d’un temps (dies, setmanes..) en
que se suposa que els peixos marcats s’han barrejat amb els altres, es fa una altra captura de M peixos i es compta quants peixos estan marcats.
Novembre 2007 Estadístiques curioses 38
Quants peixos tenim? Peixos totals al llac: T Captura: N peixos marcats Proporció de marcats p=N/T Recaptura: M peixos. k marcats, M-k no marcats. Proporció de marcats a la recaptura q=k/MÉs d’esperar que p≈q i per tant N/T≈k/M T≈N·M/kL’error d’aquest procediment es pot calcular
matemàticament i això permet establir un interval de confiança.
Novembre 2007 Estadístiques curioses 39
La prova d'independència de la χ2
Aquest tipus de prova s’utilitza freqüentment per determinar la relació entre dos factors.
Suposem que volem veure la relació entre alts nivells de colesterol i ser fumador.
Tenim una mostra de 595 persones i les classifiquem segons si són fumadores o no, i si tenen nivells de colesterol alts o no.
Novembre 2007 Estadístiques curioses 40
Fumadors No fumadors TotalsColesterol alt 140 90 230Colesterol normal 140 225 365Totals 280 315 595
Prob. de tenir el colesterol alt =230/595=0,39 Prob. de ser fumador =280/595=0,47
En cas d’independència la probabilitat de la intersecció és producte de probabilitats.
Prob. de tenir el colesterol alt i ser fumador =0,39·0,47=0,183Caldria esperar 0,18·595=108 fumadors amb colesterol alt.
Novembre 2007 Estadístiques curioses 41
Prova de la χ2
Aquesta prova valora la diferència entre l’observat i l’esperat.Si aquesta diferència és gran ens fa pensar que els factors nosón independents.
∑ −=
ij ij
ijij
np
npf 22 )(
χ
valors esperats Fumadors No fumadorsColesterol alt 108.2 121.8 230Colesterol normal 171.8 193.2 365
280 315 595
Fumadors No fumadorsColesterol alt 140 90 230Colesterol normal 140 225 365
280 315 595
=28.7
0)7.28( 2 ≈≥χP
Novembre 2007 Estadístiques curioses 42
Els calbs són propensos als atacs de cor?
Un estudi mèdic amb 1437 homes va obtenir les dades següents:
CalbSi No total
Atac de Si 214 451 665cor No 175 597 772
total 389 1048 1437
CalbSi No total
Atac de Si 180.02 484.98 665cor No 208.98 563.02 772
total 389 1048 1437
∑ −=
ij ij
ijij
np
npf 22 )(
χ = 16.37
0001.0)37.16( 2 =≥χP
Valors esperats
Novembre 2007 Estadístiques curioses 43
Amagar informació Moltes vegades les variables ocultes
porten a alguns investigadors a conclusions equivocades.
No tenir en compte aquestes variables pot ser degut a la mala fe, però en general és per ignorància i/o falta de sentit comú.
Novembre 2007 Estadístiques curioses 44
Discriminació i Pena de Mort Les dades següents, provinents d’un
estat dels EEUU, corresponen a 3260 casos d'assassinat on el jurat va considerar culpable a l’acusat i havia de decidir si aplicar la pena de mort. Les dades estan classificades segons si l’acusat era de raça blanca o no.
Novembre 2007 Estadístiques curioses 45
Discriminació i Pena de Mort
Pena de MortSi No
Blanc 190 1410 1600No Blanc 170 1490 1660Total 360 2900
Pena de MortSi No
Blanc 176,7 1423,3No Blanc 183,3 1476,7
Valors esperats∑ =−
=ij ij
ijij
np
npf21.2
)( 22χ
74.0)21.2( 2 =≥χP
Novembre 2007 Estadístiques curioses 46
Discriminació i Pena de Mort Mirem les
mateixes dades tenint en compte la raça de la víctima
Pena de MortAcusat Víctima Si No totalsBlanc Blanc 190 1320 1510Blanc No Blanc 0 90 90No Blanc Blanc 110 520 630No Blanc No Blanc 60 970 1030
totals 360 2900 3260
valors esperats Pena de Mort Pena de MortAcusat Víctima Si No Blanc Blanc 166,7 1343,3Blanc No Blanc 9,9 80,1No Blanc Blanc 69,6 560,4No Blanc No Blanc 113,7 916,3
8.142 =χ
005.0)8.14( 2 ≈≥χP
Novembre 2007 Estadístiques curioses 47
Acudit Qualsevol cosa té probabilitat ½,
perquè només es poden donar dos cassos:
passa no passa
Novembre 2007 Estadístiques curioses 48
Thomas Vasek i la prob. que Déu existeixi
De la premsa: La probabilitat que Déu
existeixi és del 62% segons el càlcul fet pel periodista T. Vasek a partir d’una fórmula de fa 250 anys del matemàtic T. Bayes
Novembre 2007 Estadístiques curioses 49
Thomas Bayes Matemàtic (1702-1761), va donar una
fórmula per invertir els condicionants:P(pluja)P(retard/pluja)P(retard/no pluja)
P(plou/retard)
Novembre 2007 Estadístiques curioses 50
Raonament d’en Vasek P(Déu)=1/2 Existència del univers 67% Ordre del cosmos 80% Evolució no altera Existència del mal 45% Experiències místiques 62%
Novembre 2007 Estadístiques curioses 51
Blaise Pascal (1623-1662) Matemàtic físic i filòsof, que va fer
aportacions importantíssimes a la Teoria de la probabilitat .
Al final de la seva vida es va dedicar a la filosofia i la teologia. En el seu llibre Pensées reflexiona sobre la conveniència de creure en Déu.
Novembre 2007 Estadístiques curioses 52
L’aposta de Pascal Analitza el guany d’apostar per creure
en Déu.
Deu existeix
Deu no existeix
Creure en Deu
+∞ 0
No Creure en Deu
-∞ 0
Novembre 2007 Estadístiques curioses 53
Moltes gràcies per la vostra
atenció
Top Related