Aplicatii Rezolvate Statistica
1. Pentru 30 de convorbiri telefonice de lung-distan s-au nregistrat duratele (n minute):
11,8;3,6;16,6;13,5;4,8;8,3;8,9;9,1;7,7;2,3;12,1;6,1;
10,2;8,0;11,4;6,8;9,6;19,5;15,3;12,3;8,5;15,9;18,7;11,7;
6,2;11,2;10,4;7,2;5,5;14,5.
Se cere:
a) S se determine durata medie a unei convorbiri telefonice i s se studieze dac valoarea obinut este reprezentativ;
b) S se analizeze asimetria distribuiei;
c) S se grupeze datele pe 6 intervale de mrime egal i s se reprezinte grafic rezultatul gruprii;
Rezolvare:
a) Notm cu X variabila durata unei convorbiri telefonice, iar xi reprezint valorile variabilei X pentru cele n=30 observaii.
Pentru calculul mediei se va utiliza formula mediei aritmetice simple:
minute.
Verificarea reprezentativitii mediei se face cu ajutorul coeficientului de variaie:
Calculm abaterea medie ptratic:
minute.
Coeficientul de variaie este:
>35%, ceea ce nseamn c seria de date are un grad redus de omogenitate i deci media are o reprezentativitate sczut.
b) Analizm asimetria seriei cu ajutorul coeficientului de asimetrie Pearson:
, unde Mo este valoarea modal i reprezint valoarea cel mai des ntlnit ntr-o serie statistic.
Dac analizm seria de date observm c fiecare valoare apare o singur dat i deci putem afirma nu exist mod. n acest caz vom analiza asimetria seriei folosind o formul alternativ a coeficientului de asimetrie, formul bazat pe ipoteza c ntr-o repartiie moderat asimetric ntre indicatorii tendinei centrale exist relaia .
, unde Me reprezint mediana seriei.
Pentru determinarea valorii medianei procedm astfel:
Ordonm cresctor seria de date:
2,33,64,85,56,16,26,87,27,788,38,5
8,99,19,610,210,411,211,411,711,812,112,313,5
14,515,315,916,618,719,5
Determinm locul medianei n serie:
. Aceast valoare arat c mediana se gsete ntre termenul al 15-lea, respective al 16-lea ai seriei ordodate cresctor/descresctor, adic mediana este o valoare cuprins ntre 9,6 i 10,2.
Determinm mediana ca fiind media aritmetic simpl a celor dou valori:
minute.
Aceasta nseamn c 50% dintre convorbirile telefonice au o durat mai mic de 9,9 minute, respective 50% au o durat mai mare.
Observaie: .
Valoarea coeficientului arat o uoar asimetrie pozitiv, n serie predominnd valorile mici.
c) Ax = xmax - xmin = 19,1 - 2,3 = 16,8 minute
r = 6
minute
Rezultatele gruprii sunt prezentate n tabelul:Intervale de variaie a duratei convorbirilor telefonice (minute)Numr de convorbiri telefonice
2-53
5-86
8-118
11-147
14-174
17-202
Total30
Not: limita inferioar inclus n interval.
Reprezentarea grafic:
Distribuia convorbirilor telefonice dup durat
Se observ c distribuia este normal, uor asimetric la dreapta (vezi coeficientul de asimetrie-punctul b).
2. Distribuia celor 54 de ageni comerciali ai unei firme ce comercializeaz produse cosmetice de dup numrul de zile lucrate n luna iulie este urmtoarea:
Zile lucrateNumr vnztori
216
227
2314
2411
259
264
273
Total54
Se cere:
a) S se reprezinte grafic distribuia vnztorilor dup numrul de zile lucrate;
b) S se determine numrul mediu de zile lucrate i s se studieze dac valoarea obinut este reprezentativ;c) Care este numrul de zile lucrate peste care se situeaz 50% din vnztori?
d) S se analizeze asimetria distribuiei.
e) Daca cei 54 de vanzatori reprezinta un esantion reprezentativ, selectat aleator repetat, determinati intervalul de incredere pentru nr. mediu de zile lucrate de un vanzator din colectivitatea generala (probabilitate de garantare a rezultatelor este de 95% (z0,025=1.96)). Rezolvare:
a) n tabel avem o serie de distribuie de frecvene pe variante, variabila analizat X fiind numr zile lucrate. Pentru reprezentarea grafic se folosete diagrama cu coloane nelipite centrate pe variant.
Distribuia vnztorilor dup numrul de zile lucrate
b) Se calculeaz numrul mediu de zile lucrate cu ajutorul mediei aritmetice ponderate:
zile.
Tabelul 3.4
Zile lucrate
(xi)Numr vnztori
(ni)
Fci
01234
21612640,566
22715417,9213
23143225,0427
24112641,7638
25922517,6447
26410423,0451
2738134,6854
Total541276140,64-
Aadar, un vnztor din cei 54 luai n studiu a lucrat, n medie, aproximativ 23 de zile i jumtate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza abaterii medii ptratice:
Dispersia variabilei este:
.
Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloana 3 a tabelului 3.4.
Abaterea medie ptratic va fi:
zile.
iar coeficientul de variaie:
< 35%, ceea ce nseamn c media calculat este reprezentativ, colectivitatea fiind omogen.
c) Se cere determinarea medianei
Mediana (Me)
Me = 24 zile.
Deci, 50% din vnztori au lucrat mai mult de 24 de zile, iar 50% mai puin.
d) Analizm asimetria distribuiei cu ajutorul coeficientului de asimetrie al lui Pearson.
Mo = 23 zile (nivelul variabilei cu frecvena cea mai mare).
Valoarea coeficientului de asimetrie indic fapul c seria este moderat asimetric la dreapta (predomin valorile mici ale variabilei).
e) Intervalul de incredere pentru media din colectivitatea generala este:
Eroarea limita este:
3. Procentul din profit cheltuit de 70 de firme pentru reclam i publicitate n anul 2005 a avut urmtoarea distribuie:
Tabelul 3.5
% pentru reclam i publicitateNr. firme cu % pentru reclama mai mic dect limita superioar a intervalului
0,6-1,014
1,0-1,432
1,4-1,856
1,8-2,264
2,2-2,668
2,6-3,070
Total-
Not: limita inferioar inclus n interval.
Se cere:
a) S se reprezinte grafic distribuia de frecvene absolute;
b) S se determine procentul mediu cheltuit pentru reclam i publicitate i s se studieze dac valoarea obinut este reprezentativ;c) Care este procentul din profit cheltuit pentru reclam i publicitate peste care se situeaz:c1) trei sferturi dintre firme?
c2) 50% din firme?
c3) o ptrime din firme?
d) S se analizeze asimetria i excesul distribuiei.
e) S se calculeze media i dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclam i publicitate.
Rezolvare:
a) Se observ c n tabelul 3.5 sunt date frecvenele absolute cumulate cresctor. Pentru a determina frecvenele absolute, trebuie s decumulm frecvenele date n tabelul iniial (coloana 2). Rezultatele prelucrrilor intermediare necesare pentru calcularea indicatorilor solicitai vor fi redate n tabelul 3.6.
Tabelul 3.6
% cheltuit pentru reclam i publicitateFrecvenele absolute cumulate cresctorFrecvene absolute
(nr. firme)
(ni)Centre de interval (xi)
01234567
0,6-1,014140,811,2-0,666,0982,656
1,0-1,432181,221,6-0,261,2170,082
1,4-1,856241,638,40,140,4700,009
1,8-2,26482,0160,542,3330,680
2,2-2,66842,49,60,943,5343,123
2,6-3,07022,85,61,343,5916,448
Total-70-102,417,24413,000
Distribuia de frecvene absolute este reprezentat grafic n figura 3.3, prin histogram.
Figura 3.3 Distribuia firmelor dup procentul cheltuit pentru reclam i publicitate
b) Se calculeaz media aritmetic ponderat a procentului cheltuit pentru reclam i publicitate, pe baza frecvenelor absolute (coloana 4):
%
Aadar, o firm din cele 70 luate n studiu a cheltuit, n medie, 1,46% din profit pentru reclam i publicitate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza abaterii medii ptratice:
Dispersia variabilei n eantion este:
Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloanele 5 i 6.
Abaterea medie ptratic va fi:
%.
iar coeficientul de variaie:
< 35%, ceea ce nseamn c media calculat este reprezentativ, colectivitatea fiind omogen.
c) Se cer calculai urmtorii indicatori medii de poziie:
c1) prima cuartil (Q1):
Pentru calculul ei se procedeaz astfel:
se determin locul primei cuartile:
se gsete intervalul n care se afl prima cuartil (primul interval a crui frecven cumulat cresctor depete locul primei cuartile), acesta este 1,0-1,4;
se calculeaz prima cuartil, cu formula:
%.
unde:
x0 = limita inferioar a intervalului primei cuartile;
k = mrimea intervalului cuartilic;
FcQ1-1 = frecvena cumulat a intervalului anterior celui cuartilic;
nQ1 = frecvena absolut a intervalului primei cuartile.
Aadar, 75% dintre firme au cheltuit pentru reclam i publicitate mai mult de 1,08 % din profit.
c2) Mediana (Me)
Mediana se gsete n intervalul 1,4-1,8.
%.
Deci, 50% din firme au cheltuit pentru reclam i publicitate mai mult de 1,458 % din profit, iar 50% mai puin.
c3) Cuartila a treia (Q3)
A treia cuartil se gsete tot n intervalul 1,4-1,8.
%.
Aadar, 25% din firme au cheltuit pentru reclam i publicitate mai mult de 1,754 % din profit, iar 75% mai puin.
d) Analizm asimetria distribuiei cu ajutorul coeficientului de asimetrie al lui Pearson.
unde:
x0 = limita inferioar a intervalului modal;
k = mrimea intervalului modal;
Intervalul modal este intervalul cu frecvena maxim: [1,4-1,8)(1 = nMo nMo-1 = frecvena intervalului modal minus frecvena intervalului anterior celui modal;
(2 = nMo - nMo+1 = frecvena intervalului modal minus frecvena intervalului urmtor celui modal;
Se obine
Cele mai multe firme au cheltuit pentru reclam i publicitate 1,52% din profit.
3, iar (2 > 0.
d) Se creeaz o caracteristic alternativ cu o stare favorabil (firmele care au cheltuit peste 2,2%) i o stare nefavorabil (firmele care au cheltuit mai puin de 2,2%).
Media caracteristicii alternative este:
(n medie, 9% din firme au cheltuit peste 2,2%)
iar dispersia:
.
4. Se cunosc urmtoarele date referitoare la distribuia celor 3569 structuri de primire turistic cu funciuni de cazare turistic, pe categorii de confort n anul 2003:
Tabelul 3.7
Categorii de confort Numr de uniti (ni)
01
Neclasificate448
1 stea1080
2 stele1479
3 stele427
4 stele125
5 stele10
TOTAL3569
Sursa: www.insse.roS se determine indicatorii tendinei centrale pentru aceast serie.
Rezolvare:
Datele prezentate n tabelul 3.7 reprezint o serie de distribuie de frecvene pe variante, iar variabila analizat (categoria de confort) este calitativ, msurat pe o scal ordinal. Din categoria indicatorilor ce caracterizeaz tendina central, pentru aceast serie pot fi determinate valoarea modal (modul) i mediana.
Modul (Mo) este valoarea variabilei cu frecvena cea mai mare, deci nivelul Mo este 2 stele (nimax =1467).
Pentru determinarea medianei (Me) procedm astfel:
Calculm frecvenele absolute cumulate cresctor (Fci)- coloana 2, tabelul 3.8.
Tabelul 3.8
Categorii de confort Numr de uniti (ni)Frecvene absolute cumulate cresctor (Fci)
012
Neclasificate448448
1 stea10801528
2 stele14793007
3 stele4273434
4 stele1253559
5 stele103569
TOTAL3569-
Determinm locul medianei:
Determinm mediana:
Mediana reprezint acel nivel al variabilei analizate corespunztor primei frecvene cumulate cresctor mai mare dect locMe. Deci i nivelul Me este 2 stele (Fc3=3007>locMe=1785).
5. Dou grupe de studeni, cu efective de 25 i, respectiv, 32 de persoane, au susinut un test de cultur general. Prima grup a obinut media 7,8, iar a doua 8,4. Cercettorul este interesat n a determina nota medie pe ansamblul celor dou grupe.
Rspuns:Nota medie pe ansamblul celor dou grupe se poate determina ca o medie de medii pariale. S notm:
n1 = 25
i
n2 = 32
i
Atunci: , puncte.
6. Considerai urmtoarele valori: 5, 7, 4, 5, 20, 6, 4.
a) Calculai media aritmetic i mediana acestui set de date; ce valoare vi se pare mai potrivit pentru a caracteriza tendina central: media sau mediana?
b) nlocuii valoarea 20 cu valoarea 8 i recalculai cei doi indicatori ai tendinei centrale. Explicai modificrile survenite.
c) Adugai 50 fiecrei valori iniiale. Cum se va modifica media?
Rspuns:
Pentru determinarea medianei, datele se ordoneaz: 4, 4, 5, 5, 6, 7, 20. Se determin locul medianei n serie:
Seria avnd un numr impar de termeni, mediana este egal cu valoarea termenului central (al patrulea), deci Me = 5.
Mediana este un indicator potrivit pentru a studia tendina central n acest set de date, deoarece valoarea 20 este o valoare extrem, ce afecteaz, prin magnitudine, nivelul total al variabilei i deci valoarea mediei. ase dintre cele apte valori se situeaz sub valoarea mediei aritmetice, ceea ce face ca indicatorul median s exprime mai corect tendina central.
b) Noile valori sunt: 4, 4, 5, 5, 6, 7, 8.
, Me = 5.
Valoarea medianei rmne neschimbat, ea innd cont numai de numrul valorilor mari, nu i de valoarea lor efectiv.
c) Valorile sunt: 55, 57, 54, 55, 70, 56, 54.
.
Se verific proprietatea mediei aritmetice de a se modifica (() cu a uniti, dac fiecare valoare se modific (() cu cte a uniti.
9. Directorul unei bnci dorete s cunoasc situaia numrul de zile de ntrziere a rambursrii creditelor. Analiznd distribuia debitorilor dup numrul zilelor de ntrziere, constat urmtoarele: 30% din debitori ntrzie ntre 10 i 20 de zile, 40% ntre 20 i 30 de zile, 18% ntre 30 i 40 de zile, iar restul mai mult de 40 de zile. Care este numrul mediu de zile de ntrziere a plii pe un debitor?Rspuns:
Datele pot fi sistematizate ca n tabelul 3.11:
Tabelul 3.11
Intervale de variaie a numrului de zile de ntrziere a pliiNumr de debitori (%)xi
10-204015600
20-303025750
30-401835630
40 i peste1245540
Total100-2520
Se va utiliza media aritmetic ponderat, calculat pe baza frecvenelor relative:
Aadar, n medie, un debitor al bncii ntrzie 25 zile la rambursarea unui credit.
15. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele nregistrate sunt:
Tabelul 3.20
Mrimea firmelorNumr de sptmni de la angajare pn la prima promovare
Mici30; 26; 30; 38; 32; 24; 32; 30;
Medii30; 34; 32; 25; 36;
Mari49; 42; 43; 48; 40; 49; 40.
Se cere:
a) s se determine numrul mediu de sptmni pn la prima promovare, pe fiecare grup de firme, precum i pe total;
b) s se arate dac numrul mediu de sptmni pn la prima promovare, calculat pe total, la punctul anterior, este o valoare reprezentativ;
c) n ce msur variaia timpului scurs pn la prima promovare este influenat de mrimea firmei?
Rezolvare
a) Notm cu X caracteristica mrimea firmelor factorul de grupare i cu Y caracteristica numr de sptmni de la angajare pn la prima promovare.
Tabelul 3.21
Mrimea firmelorni
Mici830,2515,44
Medii531,414,24
Mari744,4314,53
Total20--
, i reprezint grupa (mrimea firmei)
Calculm mediile pentru fiecare grup i ():
sptmni;
sptmni;
sptmni.
Numrul mediu de sptmni pentru ntreaga colectivitate de 20 de firme poate fi calculat ca medie a mediilor pariale:
sptmni.
b) Pentru a verifica dac numrul mediu de sptmni pn la prima promovare, calculat pe total, la punctul anterior, este o valoare reprezentativ trebuie s calculm, mai nti, dispersia pe total cu ajutorul regulii de adunare a dispersiilor. Determinm, mai nti, dispersia fiecrei grupe i ():
Media dispersiilor grupelor va fi:
Dispersia dintre grupe care sintetizeaz influena factorului de grupare X asupra variaiei variabilei Y este:
Din regula de adunare a dispersiilor rezult:
Reprezentativitatea mediei este influenat de omogenitatea seriei de date i se msoar cu ajutorul coeficientului de variaie:
Cum v < 35%, rezult c numrul mediu de sptmni pn la prima promovare este o valoare reprezentativ pentru colectivitate.
c) Pentru a calcula n ce msur variaia timpului scurs pn la prima promovare este influenat de mrimea firmei utilizm coeficientul de determinaie:
Aadar, 74% din variaia caracteristicii Y este influenat de mrimea firmei, iar influena altor factori (considerai aleatori) este:
_1218638438.unknown
_1219320772.unknown
_1219326145.unknown
_1219339498.xlsChart1
6
7
14
11
9
4
3
zile lucrate
nr.lucratori
Sheet1
0,6-1,014140.811.2-0.666.0982.656
1,0-1,432181.221.6-0.261.2170.082
1,4-1,856241.638.40.140.4700.009
1,8-2,26482160.542.3330.680
2,2-2,66842.49.60.943.5343.123
2,6-3,07022.85.61.343.5916.448
70102.417.24413.000
1.46
0.2463428571
0.4963293837
0.3424657534
ianuarie101.31.0131.05835049351998192.11.92110.7216990726
februarie100.81.0081.00949673681999184.01.841.4849457998
martie101.11.011100.94967368392000153.91.539
aprilie101.11.0112001135.41.354
mai100.51.0052002126.81.268
iunie100.91.0092003114.81.148
Oct-2020-3030-4040-5050-6060-70
Numr de debitori354821952
3529
484029
211840
97184015600
5473025750
2241835630
12099.521245540
1002520
Sheet2
niyimediuvisyi
1009206.52603,598359,80892,0003,787,962
120104010.5811012,1071,452,845124,800668,300
180116012.0714019,6033,528,605208,800370,570
140118010.1712014,4012,016,202165,200598,3113030490.06251.9620.8849
13012007.5908,1001,053,000156,000947,51426344218.06256.765.9049
670--8,410,459746,8006,372,6573032430.06250.362.0449
3025480.062540.9612.7449
3236403.062521.1619.6249
1255332157493.062571.220.8849
11152431.44039.062514.2419.6249
95113831160.0625101.7
24244.43123.514.5285714286
30.2515.4375
22064
43.1076687425296
14.80
nyj
10660-1.5624.336-6
88640.441.549158120-1.6239.366
510502.4429.76820102000.382.888
120712842.3839.6508
231741.3255.653423040481.9048
30.2515.44577.2146.882
7.56521739139.61904761931.414.248113.92145.8632
7.569.6244.4314.537101.71537.1632
292.83829.9084
2.419686956514.6441.49542
710
35.5
44844835706
1080152817857
1479300714
427343411
12535599
1035694
3
54
Sheet3
216
227
2314
2411
259
264
273
Total54
Sheet3
0
0
0
0
0
0
0
zile lucrate
nr.lucratori
MBD00087A90.xls
Chart2
14
18
24
8
4
2
procentul pt. reclama si publicitate
Numr de firme
Sheet1
10-140.1
14-180.25
18-220.5
22-260.1
26-300.05
0-414
4-840
8-1264
12-1652
16-2020
20-2410
Sheet1
0
0
0
0
0
0
Minute
Frecvente relative
Sheet2
Vanzari (buc.)
Numar de magazine
Distributia magazinelor dupa vanzarile de combine frigorifice
Sheet3
_1219340118.unknown
_1219340346.unknown
_1219341239.unknown
_1266598497.unknown
_1266664522.unknown
_1219404934.unknown
_1219340780.unknown
_1219340221.unknown
_1219339628.unknown
_1219339970.unknown
_1219339574.unknown
_1219326754.unknown
_1219327299.unknown
_1219336486.unknown
_1219326576.unknown
_1219323948.unknown
_1219325152.unknown
_1219325229.unknown
_1219323995.unknown
_1219321880.unknown
_1219322068.unknown
_1218640963.unknown
_1218721642.unknown
_1218810552.unknown
_1218813219.unknown
_1218813961.unknown
_1218814083.unknown
_1218814128.unknown
_1218813917.unknown
_1218812970.unknown
_1218812981.unknown
_1218811225.unknown
_1218811379.unknown
_1218810738.unknown
_1218808945.unknown
_1218809872.unknown
_1218810188.unknown
_1218809096.unknown
_1218808867.unknown
_1218647661.unknown
_1218647811.unknown
_1218641223.unknown
_1218647574.unknown
_1218639895.unknown
_1218640433.unknown
_1218640572.unknown
_1218639980.unknown
_1218639174.unknown
_1218639472.unknown
_1218638643.unknown
_1218635753.xlsChart2
14
18
24
8
4
2
procentul pt. reclama si publicitate
Numr de firme
Sheet1
10-140.1
14-180.25
18-220.5
22-260.1
26-300.05
0-414
4-840
8-1264
12-1652
16-2020
20-2410
Sheet1
0
0
0
0
0
0
Minute
Frecvente relative
Sheet2
Vanzari (buc.)
Numar de magazine
Distributia magazinelor dupa vanzarile de combine frigorifice
Sheet3
_1218637594.unknown
_1218638055.unknown
_1218638151.unknown
_1218637787.unknown
_1218636729.unknown
_1218637280.unknown
_1218636169.unknown
_1108745356.unknown
_1218632271.xlsChart3
0-2
3
6
8
7
4
2
Durata
Convorbiri
Sheet1
10-140.1
14-180.25
18-220.5
22-260.1
26-300.05
0-414
4-840
8-1264
12-1652
16-2020
20-2410
0-2
2-53
5-86
8-118
11-147
14-174
17-202
Sheet1
0
0
0
0
0
0
Minute
Frecvente relative
Sheet2
0
0
0
0
0
0
Vanzari (buc.)
Numar de magazine
Distributia magazinelor dupa vanzarile de combine frigorifice
Sheet3
0
0
0
0
0
0
0
Durata
Convorbiri
Distributia convorbirilor telefonice dupa durata
_1218635044.unknown
_1218635057.unknown
_1218634916.unknown
_1201252509.unknown
_1201252517.unknown
_1201252588.unknown
_1201252513.unknown
_1201252505.unknown
_1108743167.unknown
_1108743275.unknown
_1108743244.unknown
_1091855422.unknown
_1108743061.unknown
_1108743159.unknown
_973623932.unknown
_1077981081.unknown
_973259709.unknown
Top Related