Problemes d’estadística descriPtiva · 2014-09-17 · 17 t E ma 3. M ESURES D E a S ÍNTESI P ER...

10
TEXTOS DOCENTS 389 PROBLEMES D’ESTADíSTICA DESCRIPTIVA Manuela Alcañiz Montserrat Guillén Ernest Pons Héctor Rufino (eds.) Departament d’Econometria, Estadística i Economia Espanyola

Transcript of Problemes d’estadística descriPtiva · 2014-09-17 · 17 t E ma 3. M ESURES D E a S ÍNTESI P ER...

textos docents389textos docents389

La societat en què vivim es caracteritza per la gran quantitat de dades que s’hi generen. Cada vegada que fem servir Internet, anem a com-prar, visitem el metge o viatgem en transport públic, deixem un rastre de dades de gran interès des de diversos punts de vista, però manquen professionals que sàpiguen convertir-les en informació útil. L’Estadística Descriptiva és el primer pas per fer-ho, ja que ens permet entendre com són les dades, resumir-les i representar-les gràficament, i aquest llibre ofereix una eina útil per posar en pràctica els coneixements en la ma-tèria. La major part dels exercicis que conté recullen aplicacions, però també n’hi ha alguns de teòrics per tal de facilitar una comprensió més profunda de les tècniques, així com un formulari adaptat a cada tema. Els exercicis s’han dissenyat per a l’assignatura d’Estadística Descriptiva del grau en Estadística UB-UPC, però es poden utilitzar igualment en qualsevol altra matèria que requereixi posar uns fonaments ferms abans de començar amb la Inferència Estadística.

Problemes d’estadística descriPtiva

Manuela AlcañizMontserrat GuillénErnest PonsHéctor Rufino(eds.)

Departament d’Econometria, Estadística i Economia Espanyola

9 7 8 8 4 4 7 5 3 8 1 6 4

15301_problemes_estadistica_descriptiva_coberta_TD_389.indd 1 21/07/14 11:50

Índex

Introducció ................................................................................................................................... 7

Exercicis Tema 1. Introducció: conceptes bàsics ........................................................................................... 11Tema 2. Representació gràfica i tabulació de dades ...................................................................... 13 Tema 3. Mesures de síntesi per a dades quantitatives univariants (I) ......................................... 17 Tema 4. Mesures de síntesi per a dades quantitatives univariants (II) ....................................... 23 Tema 5. Dades multidimensionals .................................................................................................. 27 Tema 6. Regressió............................................................................................................................. 35 Tema 7. Nombres índexs ................................................................................................................. 41

Solucions Solucions als exercicis del tema 1 ................................................................................................... 47 Solucions als exercicis del tema 2 ................................................................................................... 49 Solucions als exercicis del tema 3 ................................................................................................... 51 Solucions als exercicis del tema 4 ................................................................................................... 53 Solucions als exercicis del tema 5 ................................................................................................... 55 Solucions als exercicis del tema 6 ................................................................................................... 59 Solucions als exercicis del tema 7 ................................................................................................... 63

Formularis Formulari del tema 2 ........................................................................................................................ 67 Formulari del tema 3 ........................................................................................................................ 68 Formulari del tema 4 ........................................................................................................................ 69 Formulari del tema 5 ........................................................................................................................ 70 Formulari del tema 6 ........................................................................................................................ 72 Formulari del tema 7 ........................................................................................................................ 73

15301_problemes_estad_descrip_td389.indd 5 21/07/14 12:13

Introducció

A continuació es presenten un seguit de materials d’estadística descriptiva. El seu objectiu fo-namental és servir de suport per a les classes de problemes de l’assignatura del mateix nom que es desenvolupa al grau en Estadística impartit per la Universitat de Barcelona i la Universitat Politècnica de Catalunya. Tanmateix també poden ser utilitzats en altres assignatures que tin-guin una part dedicada a aquesta matèria.

Amb més o menys intensitat, es tracten tots els temes que es desenvolupen a les sessions teòriques de l’assignatura d’Estadística Descriptiva, i es proposen nombrosos exercicis per po-der treballar amb els conceptes i els procediments explicats.

Per la seva situació en el Pla d’estudis vigent, els problemes no suposen cap coneixement de probabilitat, ja que aquesta s’estudia en l’assignatura d’Introducció a la Probabilitat. Malgrat això, per les característiques dels estudiants que cursen l’assignatura, es considera natural que els problemes continguin raonaments sobre mesures d’estadística descriptiva formulats de manera general, i no només particularment per a un conjunt de dades, com sol ser habitual en la major part dels llibres d’estadística descriptiva.

Amb vista a la utilització del material per a la docència, es recomana seguir la numeració dels problemes proposats. En els casos en què es proporcionin dades, serà interessant dur a terme la resolució mitjançant els programes informàtics que s’estudien en l’assignatura d’Intro-ducció a la Informàtica del mateix ensenyament.

Per tal de facilitar a l’alumne la resolució dels problemes, s’inclouen les solucions de molts dels exercicis, principalment d’aquells de caràcter numèric. També s’inclou un formulari com a compendi d’alguns dels principals conceptes i fórmules que es fan servir a l’assignatura.

Barcelona, febrer de 2014

7

INTR

OD

UC

CIó

15301_problemes_estad_descrip_td389.indd 7 21/07/14 12:13

17

tEm

a 3

. M

ESU

RES

DE

SÍN

TESI

PER

A D

AD

ES Q

UA

NTI

TATI

vES

UN

IvA

RIA

NTS

I

Tema 3

MESURES DE SÍNTESI PER A DADES QUANTITATIvES UNIvARIANTS (I)

16. Donades les dades següents: –4, –1, 2, 4, és la mitjana geomètrica una mesura representa-tiva de la seva tendència central? Per què?

17. Quina mesura de síntesi faríeu servir per calcular la vida mínima que ha de tenir una de les bombetes d’un cert lot, de manera que pugui ser classificada entre la meitat que més duren?

18. A continuació teniu les dades sobre la superfície de certs habitatges d’una mateixa ciutat, en metres quadrats. Calculeu la mitjana aritmètica, la mediana, la moda i el rang mitjà de les dades i raoneu si totes aquestes mesures han de ser semblants, i, en tot cas, per què ha de ser així:

89, 73, 91, 112, 117, 108, 53, 95, 72, 88,109, 132, 120, 110, 112, 98, 95, 132, 114, 87.

19. Seleccioneu quin tipus de mitjana calcularíeu en cadascuna de les situacions següents:

a) Un inversor té els seus estalvis repartits en tres dipòsits amb 2.000, 5.000 i 10.000 euros, res-

pectivament. Si el primer li rendeix un 5% anual, el segon un 4% anual i el tercer un 2%

anual, quin és el tipus d’interès mitjà que rep?

b) Per avaluar la velocitat mitjana que s’assoleix amb una nova línia ferroviària s’han fet un

total de 5 proves en tot el trajecte (55 km) en què s’han registrat velocitats uniformes de 86

km/h, 87,5 km/h, 89 km/h, 84 km/h i 86 km/h. Calculeu la velocitat mitjana.

c) El rendiment d’una màquina depèn del nombre d’operaris que hi treballen. Un dia ha fabri-

cat 3 peces per hora, un altre dia 4 peces per hora, un tercer dia 5 peces per hora i un quart

dia 6 peces per hora. Quin és el seu rendiment mitjà?

d) L’Ajuntament de Barcelona vol mesurar el que es triga a creuar un determinat semàfor a

partir de les dades referides a 4 persones: 15 segons, 13 segons, 12 segons i 8 segons. Calcu-

leu la mitjana del temps necessari per creuar el semàfor.

e) Un taronger dóna 100 taronges el primer any, 180 el segon, 234 el tercer i 262 el quart. Quin

ha estat l’increment mitjà anual en el nombre de taronges que ha donat?

20. Un inversor en Borsa ha comprat accions d’una mateixa empresa en cinc moments del temps pagant preus de 18, 20, 15, 24 i 25 euros per acció, respectivament. Calculeu la mitjana del preu de les accions que ha comprat en cadascun dels supòsits següents:

a) Els cinc cops va comprar el mateix nombre d’accions.

b) Els cinc cops va invertir el mateix capital.

21. Una persona que tenia 60.000 € estalviats, els va repartir a finals de l’any 2001 en tres fons d’inversió. Després d’un any, el primer fons (on va posar 10.000 €) li ha donat un rendiment del 10%, el segon fons (on va posar 20.000 €) li ha donat un rendiment del 4% i el tercer fons li ha donat un rendiment de l’1%. Quin és el rendiment mitjà (en tant per cent) que ha rebut aquesta persona pels seus estalvis?

15301_problemes_estad_descrip_td389.indd 17 21/07/14 12:13

18

22. Suposa que has tingut la sort de guanyar un premi de loteria i t’ha tocat la quantitat d’un milió d’euros. Per això, reps trucades de quatre grans bancs que t’ofereixen que posis els diners en un dels seus dipòsits a 5 anys. Quina de les quatre ofertes triaries?

Tipus d’interès dipòsits bancaris

Banc 1 Banc 2 Banc 3

Any 1 10% 2% 18%

Any 2 10% 6% 14%

Any 3 10% 10% 10%

Any 4 10% 14% 6%

Any 5 10% 18% 2%

23. Es calcula que en un país l’any 2006 hi havia aproximadament 15 milions de telèfons mò-bils. Si s’espera que l’any 2013 n’hi hagi 25 milions, quin és el creixement anual mitjà que s’es-pera?

24. Una empresa està fent un procés de selecció entre dos candidats per a un lloc de treball. Les valoracions que han obtingut a les entrevistes i proves que se’ls han fet són les següents:

Aspecte candidat A candidat B

Experiència 8 7coneixements 6 7Psicotècnic 4 5

Si l’empresa dóna una importància del 60% a l’experiència, del 25% als coneixements i del 15% a l’habilitat psicotècnica, quin dels dos candidats escollirà?

25. S’ha fet un estudi sobre l’edat dels vianants atropellats en un cert municipi durant el bien-ni 2010-2011. La taula següent mostra alguns dels resultats obtinguts, en funció del sexe de la persona:

Edat Home Dona

Mitjana 40,55 46,96

Mediana 37,50 53,00

1r quartil 13,62 19,50

3r quartil 67,07 70,82

Mínim 1 2

Màxim 95 87

Nombre de casos 194 167

a) Seleccioneu la informació rellevant i construïu un diagrama de caixa múltiple (un per a cada sexe). Esbrineu si existeixen outliers o observacions extremes.

b) Comenteu les diferències que s’observen entre els sexes.c) Pel que fa als infants, quin dels dos sexes presenta més perillositat?d) En vista dels diagrames de caixa, podríeu deduir aproximadament la forma dels histo-

grames de freqüències? Són campaniformes?e) Calculeu, si és possible, la mitjana, la mediana, el primer quartil, el tercer quartil, el mí-

nim i el màxim de l’edat del total de vianants atropellats.

15301_problemes_estad_descrip_td389.indd 18 21/07/14 12:13

19

tEm

a 3

. M

ESU

RES

DE

SÍN

TESI

PER

A D

AD

ES Q

UA

NTI

TATI

vES

UN

IvA

RIA

NTS

I

26. Suposem que tenim n observacions x1, x2,..., xn d’una variable quantitativa amb mitjana aritmètica

–X. Suposem que afegim una observació xn+1 = k ·

–X , on k és un escalar més gran

que 1. És possible saber com variarà la mitjana aritmètica quan afegim aquesta dada a les an-teriors? Busqueu com serà aquesta variació i després trobeu un contraexemple per mostrar que la mediana es comporta diferent.

27. Tenint en compte la informació següent sobre la distribució d’una certa variable, creieu possible que la mitjana aritmètica d’aquesta variable sigui igual a 19? I que la desviació típica sigui igual a 15? Raoneu les vostres respostes.

Min = 5 Q1 = 10 Me = 20 Q3 = 30 Max = 35

28. Calculeu la mitjana i la variància de cadascun dels conjunts de dades següents. Què en podeu concloure?

a) 10, 20, 30, 40, 50, 60b) 10, 10, 10, 60, 60, 60c) –130, 20, 30, 40, 50, 200

29. Poseu exemples de dades que compleixin les característiques següents:

a) Sis observacions de manera que la mitjana aritmètica sigui igual a 10.b) Cinc observacions de manera que la variància sigui igual a 0.c) Quatre observacions de manera que la variància sigui igual a 5.d) Tres observacions de manera que la mitjana aritmètica sigui 10 i la variància sigui 5.

30. Donades les n dades que es presenten a continuació:

0, 1, 0, 1, 0, 1, …

Calculeu quant valen en general

X , Me i S2, distingint si n és parell o senar. Què passa quan el nombre de dades n tendeix a infinit?

31. Una regió es divideix en tres zones, cadascuna amb el mateix nombre d’habitants. A la pri-mera zona hi ha un habitant per telèfon; a la segona, dos habitants per telèfon, i a la tercera, tres habitants per telèfon. Quina és la mitjana d’habitants per telèfon de la regió sencera? Quina mesura de tendència central heu calculat?

32. Les dades següents corresponen als països africans amb costa al Mediterrani:

PaísPoblació

(milions hab.)Esperança

de vidaMorts per cada mil habitants

Marroc 32,3 72 6Algèria 36,0 73 5Tunísia 10,7 75 6Líbia 6,4 75 4Egipte 82,6 73 5Total

Font: 2011 Population Reference Bureau

Completeu la darrera filera de la taula, tot indicant quin tipus de mesura feu servir.

15301_problemes_estad_descrip_td389.indd 19 21/07/14 12:13

20

33. Demostreu les afirmacions següents:

a) La mitjana aritmètica és igual a la mitjana d’ordre 1.b) La mitjana harmònica és igual a la mitjana d’ordre –1.

Nota: La mitjana geomètrica és igual a la mitjana d’ordre 0, però no en farem la demostració.

34. Suposem que tenim n dades de dues variables X i Y quantitatives que s’obtenen de la ma-nera següent:

Xi = {0, si i és senar

1, si i és parell

Yi = {0, si i és senar

1, si i és parell

Considerem ara unes altres dades zi i ti, per i = 1,..., n, que s’obtenen com zi = xi + yi i ti = xi · yi. Calculeu quant valen la mitjana i la variància de les variables Z i T.

35. Considerem els n números següents: k + 1, k + 2,..., k + n. Calculeu-ne la mitjana aritmètica i la variància, en funció de k i n.

36. Donades les empreses multinacionals següents, es coneixen dades sobre les quantitats de vendes efectuades el 2011 en milions de dòlars. Feu un comentari descriptiu d’aquestes xifres, tot indicant quines mesures quantitatives podríeu utilitzar. A més, feu servir una mesura de lo-calització per a indicar el posicionament de Chevron respecte a les altres.

Empresa Vendes

Wal-Mart 421.849

Exxon 354.674

Chevron 196.337

Conoco Phillips 184.966

Fannie Mae 153.825

General Electric 151.628

Berkshire Hathaway 136.185

General Motors 135.592

Bank of America Corp 134.194

Ford Motor 128.954

37. La mitjana aritmètica d’una distribució campaniforme és 30 i la seva variància és 16. Cons-truïu un interval que contingui almenys el 95% de les observacions.

38. Sigui una distribució (xi,ni) i = 1,...,k amb les característiques següents:

X– = k0 , Mo = k1 , S2 = k2 , n = N

Determineu aquestes mateixes mesures per a la distribució (c1 · Xi + c2 , c3 · ni) i = 1, ...,k on k2 és una constant positiva, c3 és un enter estrictament positiu i c1, c2, k0 i k1 són constants arbitràries. Raoneu la resposta.

15301_problemes_estad_descrip_td389.indd 20 21/07/14 12:13

21

tEm

a 3

. M

ESU

RES

DE

SÍN

TESI

PER

A D

AD

ES Q

UA

NTI

TATI

vES

UN

IvA

RIA

NTS

I

39. La despesa de dos grups de persones en el seu dinar ha estat la següent:

Grup A Grup B

Despesa Nombre de persones Despesa Nombre de persones400 24 400 6600 17 600 13700 30 800 401.000 17 1.000 21.200 4 1.400 1

Determineu quin dels dos grups és més homogeni respecte a la seva despesa. Raoneu la resposta.

40. La mitjana del pes de 10 persones és de 65,7 quilos, amb una desviació estàndard de 8,58 quilos. Es coneixen 8 dels pesos: 52, 59, 61, 62, 67, 69, 74 i 80. Podeu dir quins són els dos pesos que s’han perdut?

41. Un estudiant s’examina d’Estadística i obté una qualificació de 7,5 punts, essent la nota mitjana de la classe de 5,5, amb una desviació estàndard de 2. D’altra banda, també s’examina d’Informàtica i aconsegueix una qualificació de 8,2 punts, essent la mitjana de la classe de 6 i la desviació estàndard de 1,8.

a) En quina de les dues assignatures l’estudiant sobresurt més respecte del conjunt de la classe?

b) Es pot considerar que l’estudiant destaca de forma notable en alguna de les dues assig-natures?

c) Quina de les dues mitjanes és més representativa del conjunt de qualificacions de la classe per a l’assignatura en qüestió?

42. El salari mensual mitjà dels empleats d’un centre comercial és de 800 euros. De cara al proper any, la direcció de l’empresa ha fet tres propostes al comitè d’empresa:

1) Augmentar el salari en 40 euros mensuals a tots els treballadors.2) Aplicar un augment del 5% a tots els treballadors.3) Aplicar un augment lineal de 20 euros a tots els treballadors a més d’un augment del

2,5%.

Tenint en compte el que s’ha dit anteriorment:

a) Calculeu quina de les tres propostes suposa una menor despesa per a l’empresa.b) Calculeu quin serà el salari mitjà el proper any si s’aplica cadascuna de les tres propos-

tes.c) Amb quina de les tres propostes augmenten més les diferències salarials dins l’empresa?

15301_problemes_estad_descrip_td389.indd 21 21/07/14 12:13

23

tEm

a 4

. M

ESU

RES

DE

SÍN

TESI

PER

A D

AD

ES Q

UA

NTI

TATI

vES

UN

IvA

RIA

NTS

II

Tema 4

MESURES DE SÍNTESI PER A DADES QUANTITATIvES UNIvARIANTS (II)

43. Les dades següents corresponen a la concentració de monòxid de carboni a l’atmosfera (en unitats de monòxid de carboni dividit per unitats de volum). S’han fet observacions setmanals, agafant un dia i una hora a l’atzar. Les observacions són:

9,3 10,7 8,5 9,6 12,215,6 9,2 10,5 9,0 13,212,0 8,8 13,7 12,1 9,8

a) Calculeu mesures d’asimetria i d’apuntament de les dades. Comenteu els resultats.b) Construïu una taula de freqüències amb tres intervals. Calculeu la mitjana aritmètica i

la mediana utilitzant la informació d’aquesta taula i compareu el resultat amb l’obtin-gut amb les observacions originals. Observeu quina és la influència sobre els resultats del fet de treballar amb dades agrupades.

44. Suposem que s’estudia la durada en minuts de 100 avaries elèctriques en un sector urbà. Es recullen observacions i els resultats es mostren a la taula següent:

Durada Freqüència

[0, 5) 42

[5, 10) 35

[10, 15) 18

[15, 20) 5

Total 100

a) Digueu si la variable durada de l’avaria elèctrica és qualitativa o quantitativa, discreta o contínua.

b) Calculeu les freqüències absolutes acumulades i les freqüències relatives. Doneu els resultats en una taula com l’anterior.

c) Quin percentatge d’avaries duren menys de 15 minuts? I entre 5 i 20 minuts?d) Doneu la mitjana de durada de les avaries elèctriques i la seva variància.e) Calculeu la mediana de la variable i interpreteu el resultat.

45. L’alçada (en cm) de 82 estudiants d’Estadística Descriptiva es pot sintetitzar a través de les mesures següents:

X = 169,46; Me = 169,50; Mo = 175,00; S2 = 59,81;CV = 4,56; g1 = 0,0774 i g2 = −0,5194

Suposem que ara es considera l’alçada en metres. Com variaran les mesures?

15301_problemes_estad_descrip_td389.indd 23 21/07/14 12:13

24

46. A continuació es presenten dades sobre la durada en hores de bombetes de 100 watts. A la taula següent tenim les freqüències absolutes:

Durada Freqüència

[0, 40) 231[40, 50) 168[50, 60) 244[60, 70) 300[70, 80) 11[80, 90) 48[90, 100) 98Total 1.100

a) Calculeu la mitjana de durada de les bombetes, la mediana, la moda i el rang mitjà i raoneu la diferència entre aquestes mesures.

b) Calculeu mesures de dispersió de les dades.c) Calculeu un coeficient d’asimetria i comenteu si té el valor que esperàveu.

47. La desviació típica d’una distribució de freqüències pren el valor 2. Suposant que la distri-bució és campaniforme, comenteu quines condicions han de complir els seus moments per-què sigui:

a) Simètrica, asimètrica a la dreta o asimètrica a l’esquerra.b) Platicúrtica, mesocúrtica o leptocúrtica.

48. Dues empreses, A i B, tenen 50 treballadors cadascuna. Les dietes de desplaçament són:

Empresa A: 10 reben 80 euros 5 reben 60 euros 5 reben 20 euros 5 reben 15 euros 25 reben 10 euros

Empresa B: 5 reben 80 euros 15 reben 60 euros 15 reben 20 euros 10 reben 15 euros 5 reben 10 euros

Obteniu la corba de Lorenz i l’Índex de Gini en cada cas. Què es pot concloure?

15301_problemes_estad_descrip_td389.indd 24 21/07/14 12:13