2012 Janne Petersen - kustaff.pubhealth.ku.dk/~jufo/courses/logistic/SAS... · 2012. 5. 15. · SAS...

18
SAS 2012 Janne Petersen February 7, 2012 SAS systemet Styrken i SAS er dets evne til at håndtere store datasæt. Det er hurtigt og har mange statistiske og ikke-statistiske muligheder. Kan "alt", så det er ikke nødvendigt at skifte program undervejs. Alle phd-studerende kan få SAS gratis. En af ulemperne ved SAS er, at det tager noget tid at sætte sig ind i det. Der eksisterer dog forskellige brugervenlige inter-faces, f.eks. Interpriseguide. Alternative store programmer: SPSS, R og Stata. SAS vinduer Enhanced Editor: Program editor, hvor ens program kode skrives. Dvs. det er her man fortæller SAS hvad det er den skal gøre. Program Editor: Programeditor, gammel, ingen farver. Lad være med at bruge den. Log: Her skrives løbende hvad SAS laver, noter om fejl m.m. Output: Output fra ens kørsler, fortløbende. Dvs. resultaterne af ens kode. Results: Overblik over output Explorer: Libraries (SAS-software-biblioteker) og File Shortcuts. Kommando linien: Kan give korte kommandoer til SAS, f.eks. help freq (virker hjemme men ikke her). Menu linien: (Den øverste linie) Indeholder forskellige peg og klik muligheder (som alle andre Windows programmer) Værktøjs linien: Forskellige nyttige ikoner.

Transcript of 2012 Janne Petersen - kustaff.pubhealth.ku.dk/~jufo/courses/logistic/SAS... · 2012. 5. 15. · SAS...

  • SAS2012

    Janne Petersen

    February 7, 2012

    SAS systemet

    Styrken i SAS er dets evne til at håndtere store datasæt. Det erhurtigt og har mange statistiske og ikke-statistiske muligheder.

    Kan "alt", så det er ikke nødvendigt at skifte program undervejs.Alle phd-studerende kan få SAS gratis.

    En af ulemperne ved SAS er, at det tager noget tid at sætte sigind i det. Der eksisterer dog forskellige brugervenligeinter-faces, f.eks. Interpriseguide.

    Alternative store programmer: SPSS, R og Stata.

    SAS vinduer

    Enhanced Editor: Program editor, hvor ens program kodeskrives. Dvs. det er her man fortæller SAS hvaddet er den skal gøre.

    Program Editor: Programeditor, gammel, ingen farver. Ladvære med at bruge den.

    Log: Her skrives løbende hvad SAS laver, noter om fejlm.m.

    Output: Output fra ens kørsler, fortløbende. Dvs.resultaterne af ens kode.

    Results: Overblik over outputExplorer: Libraries (SAS-software-biblioteker) og File

    Shortcuts.

    Kommando linien: Kan give korte kommandoer til SAS, f.eks.help freq (virker hjemme men ikke her).

    Menu linien: (Den øverste linie) Indeholder forskellige peg ogklik muligheder (som alle andre Windowsprogrammer)

    Værktøjs linien: Forskellige nyttige ikoner.

  • Filer

    Disse er de vigtigste af de filer SAS laver når man kører SAS.

    - *.SAS filer (SAS program)- *.LOG filer (Log)- *.LST filer (Output)- *.sas7bdat filer (Datasæt)

    Fejl i loggen

    Vigtigt: kig altid log filen igennem efter, at du har kørt etprogram.

    Note (blå): information, der ikke indikerer en fejl, menen oplysning, som man bør læse, fordi den kanvære informativ og god til af finde metodefejl.Eksemper: Antal observationer i et data sæt kanvære lavere end forventet.

    Warning (grøn): viser fejl som SAS selv har kunnet rette.Programmet er gennemført med disse fejl, mentjek om dette er gjort ordentligt. Eksempel:stavefejl.

    Error (rød): Alvorlige fejl, som SAS ikke kunne rette,programmet er stoppet, og man må selv findefejlen og rette den. Eksempel: glemt semikolon.

    Vær opmærksom på at røde fejl i et datastep betyder, at derikke bliver lavet noget nyt datasæt.

    Kør programmet

    Funktionstaster F8Menulinie Run, SubmitKommando SubmitVærktøjslinie Mand løber

    Hvis man kun ønske at køre en del af sit program, kan manmarkere delen og køre den.

  • Hjælpe funktioner

    ♣ Menulinien "Help"♣ SAS manualen:

    http://support.sas.com/91doc/docmainpage.jsp♣ Kommando feltet: skriv f.eks. help freq.

    Alle SAS datasæt er gemt i et SAS Library.

    Der findes to permanente Library i SAS ved standardopsætning. WORK og SASUSER

    I WORK gemmes alle de midlertidige SAS datasæt. Alt iWORK slettes ved lukning af SAS.

    I SASUSER gemmes alle datasæt permanent, dvs. de er derigen når SAS genstartes

    Importer data- I menulinien vælg filer- Vælg Importer data- Vælg "Delimited File (*.txt)- Klik Next- Browse frem til jeres datasæt- Klik ok- Vælg om I vil gemme i SASUSER eller WORK - Skriv et navnpå jeres datasæt under "Member"- Klik next- Browse frem til der hvor I vil gemme indlæsningsprogrammet- Skriv et navn på den lille programstump, som I gerne vilgemme.- Tryk gem- Tryk Finish

    Nu er datasættet indlæst og der er genereret et lille program,der kan gøre det igen.

    Opgave

    a Importer xxx..txt fra t-drevet til WORK biblioteketb Tjek at der ikke er nogen fejl i log filenc Prøv at åbne jeres datasæt igennem explorer

    vinduet, og luk det igen.(Hjælp: Klik på explorer, vælg libraries, vælg work,klik på datasættet)

    HUSK AT LUKKE DATASÆTTET IGEN!!

  • SAS Programmering

    SAS programmering foregår i 2 forskellige trin: DATA trin ogprocedure (PROC) trin.

    DATA trin:1. indlæser data fra fil2. laver transformationer og tilføjer nye variable3. laver nyt SAS data sæt, med de nye rettelser.

    Procedure trin:1. Bruger SAS data sæt2. Producerer den information vi vil have, f.eks. tabeller,

    statistik, grafer m.v.

    Data trin

    DATA (work.)test; /*Det nye data sæt hedder test*/SET test1; /*Indlæser data sættet test1*/

    RUN; /*Slutter data trinnet*/

    Læser datasæt "test1" ind fra work og gemmer det over i detmidlertidige datasæt "test" også i work.

    - Husk ; efter hver linie.- Det jeg skriver med store bogstaver er ord SAS kender.- Ikke nødvendigt at skrive WORK.- /* starter en kommentar, mens */ slutter en kommentar.

    Oprettelse af et permanent datasæt.

    libname us1 "P:\janne\SASkursus";

    Tænk på us1 som en forkortelse for stien"P:\janne\SASkursus"

    DATA us1.test; /*Laver et permanent datasæt.*/SET test1; /*Indlæser det midlertidige data sæt test1.*/

    RUN; /*Slutter data trinnet.*/

    Denne lille program stump gemmer altså vores midlertidigedatasæt test1 i et permanent datasæt "test", der kan findes ifolderen "P:\janne\SASkursus".

  • Indlæsning af et permanent datasæt.

    libname us1 "P:\ janne\ SASkursus";

    Indlæsning af et permanent datasæt.

    DATA test; /*Laver et midlertidigt datasæt.*/SET us1.test1; /*Indlæser det permanente data sæt

    test1.*/RUN; /*Slutter data trinnet.*/

    PAS PÅ MED AT OVERSKRIVE JERES DATASÆT!!

    Indtastning af datasæt

    DATA test1;INPUT id alder sex$; /*liste over variable, $ efter tekst

    variable*/DATALINES;1 45 m2 35 m3 40 m4 43 k5 56 k6 45 k;

    RUN;

    Variable

    Der er to typer af variable i SAS, numeriske og tekst variable.

    En typisk tekst variabel er bogstaver, men det kan også væretal.Eksempel: Måned med værdier ’jan’, ’feb’, . . ., ’Dec’.

    En numerisk variabel er altid tal.Eksempel: alder med værdier 45, 13, . . . , 30. Man kan kunberegne f.eks. middelværdier på numeriske variable. Manbenytter decimalpunktum

    I kan se hvilke variable der er tekst variable og hvilke variableder er nummeriske ved i explorer vinduet at højre klikke på jeresdatasæt og vælge view columns. Men husk at lukke det igen!

    Opgaver 2

    a Indlæs SAS datasættet sundby.sas7bat fraBasalstatistik-folderen på T drevet.

    b V.h.a. Explorer vinduet undersøges hvilke variable,der er tekst variable og hvilke der er numeriske.

  • Udvælgelse af observationer

    DATA test;SET test1;IF var1>8; /*Vælger alle dem med var1 større end 8*/

    RUN;

    Indlæser igen test1 og laver et nyt data sæt test, kun med deobservationer/personer, der har mere end 8 i var1.

    DATA test;SET test1;IF var1>8 THEN DELETE; /*sletter dem med var1 > 8*/

    RUN;

    Her gør vi altså det modsatte, vi sletter dem, der har var1 størreend 8 i test data sættet.

    Hvis det er en tekst variabel vi laver filter/betingelse på, så skalværdien i plinger;

    DATA test;SET test1;IF var2 = ’mat’; /*udvælger dem der har var2 = mat*/

    RUN;

    Oversigt over forskellige operatorer

    Forklaring Eksempel= EQ lig med karakter = 8

    ˆ = forskellig fra NE karakter NE 8< LT mindre end karakter < 8> GT større end karakter > 8

    = GE større end eller lig karakter GE 8

    IN tilhører karakter IN (6, 7, 8)& AND og karakter=8 AND fag=’mat’| OR eller karakter=8 OR fag=’mat’ˆ NOT negation NOT(karakter IN (6,7,8))

  • Oprettelse afvariable ved beregning

    DATA test;SET us1.test1;k = 10 + var1; /*Ny variabel k, der er var1+10 */m = 10 * var1; /*Ny variabel m, der er var1*10 */expvar1=exp(var1); /*Ny variabel expvar1, der er evar1*/

    RUN;

    Regneudtryk og funktioner

    Regneudtrykog funktioner** Potensopløftning* Multiplikation/ Division+ Addition- SubtraktionEXP(argument) EksponentialfunktionenLOG(argument) Naturlig logaritmeLOG10(argument) 10-tals logaritmeSQRT(argument) KvadratrodenABS(argument) Numerisk værdiINT(argument) Den hele del afROUND(argument, afrundingsenhed) Afrundet værdi

    Oprettelse af nye variable ved gruppering

    DATA test;SET test1;IF sp5vgt >= 160 THEN tung = ’ja’;IF sp5vgt < 160 THEN tung= ’nej’;

    RUN;

    Tung har værdien ’ja’ hvis personen har en vægt på 160 ellerderover, og ’nej’ hvis vægt er under 160 eller manglende.

    Manglende værdi regner SAS som en værdi på minus uendelig.

    Manglende værdier

    Manglende værdier af en tekst variabel er angivet ved et blanktfelt, mens manglende for en nummerisk er angivet ved et . elle.x

    Manglende . tæller som −∞ så pas på med f.eks. IF alder

  • SAS programstruktur

    DATA trin:1. indlæser data fra fil2. laver transformationer og tilføjer nye variable3. laver nyt SAS data sæt eller overskriver det gamle.

    Procedure trin:1. Bruger SAS data sæt2. Producerer den information vi vil have, f.eks. tabeller,

    statistik og grafer.

    Procedure trin

    SAS indeholder en lang række procedurer, der er inddelt imoduler efter deres anvendelse

    Ligesom et data trin altid starter med et DATA, starterprocedure trinnet altid med et PROC.

    PROC procnavn DATA= datanavn;(ordre vedr. udførelsen)

    RUN;

    Her gælder følgende: Datanavnet angiver hvilket datasætproceduren skal arbejde på. Undlades DATA=datanavnbenytter proceduren det sidst oprettede SAS-datasæt.

    Der findes rigtig mange forskellig ordrer til hver procedure.

    Resulaterne af en procedure kommer i output vinduet,medmindre man har bedt SAS om noget andet.

    PROC CONTENTS

    Skal man have oplysninger om antallet af observationer ognavnene på de variable, der er i datasættet, kan man brugePROC CONTENTS.

    PROC CONTENTS DATA= test;RUN;

  • PROC SORT

    Denne procedure kan sortere datasættet efter en eller flerevariable.

    PROC SORT DATA= datanavn;BY variabel;

    RUN;

    Datasættet datanavn bliver her sorteret efter voksende værdieraf variabel, dvs. fra mindst til størst.

    Visse procedurer og data trin kræver en sortering af data før dekan gennemføres.

    PROC PRINT

    PROC PRINT udskriver datasættet, eller måske kun dele af det.

    PROC PRINT DATA= test;RUN;

    Udskriver samtlige observationer og samtlige variable tilskærmen.

    PROC PRINT DATA= test;VAR var1 var2;

    RUN;

    Udskriver variablene var1 og var2 for samtlige observationer.

    PROC PRINT DATA= test;WHERE var1 = 8;VAR var1 var2;

    RUN;

    Udskriver variablene var1 og var2 for dem, der har 8 i var1.Rækkefølgen på VAR og WHERE er underordnet.

    Eksempel: PROC PRINT

    /*sorter datasættet efter det diastolisk blodtryk*/PROC SORT DATA= test;

    BY dias;RUN;/*printer det systoliske og det diastoliske blodtryk til outputvinduet*/PROC PRINT DATA= test;

    VAR dias syst;RUN;

  • PROC MEANS

    Proc means bruges når man skal have beregnet summer,gennemsnit, standardafvigelser osv.

    PROC MEANS DATA= test;VAR hoejde;

    RUN;

    The SAS System 14:31 Saturday, March 17, 2007 1

    The MEANS Procedure

    Analysis Variable : hoejd Højde

    N Mean Std Dev Minimum Maximum__________________________________________________________________18 174.8888889 6.2955529 163.0000000 189.0000000__________________________________________________________________

    PROC MEANS

    Man kan specificere præcis hvad det er, der skal udregnes påfølgende måde:

    PROC MEANS DATA= test1 N MEAN p25 p50 p75 SUM;VAR var1;

    RUN;

    Her angiver SAS, hvor mange, der har var1 oplyst,middelværdien 25, 50 og 75 percentilerne af var1 samtsummen af variablen var1.

    N Antal observationer med ikke manglende værdierNMISS Antal observationer med manglende værdierMEAN x = 1N

    ∑Ni=1 xi Gennemsnit

    STD s =√

    1N−1

    ∑Ni=1(xi − x)2 Spredning

    MIN x(1) MinimumMAX x(N) MaximumRANGE x(1) − x(N) VariationsbreddeSUM

    ∑Ni=1 xi Summen af observationen

    VAR s2 = 1N−1∑N

    i=1(xi − x)2 Empirisk variansCSS

    ∑Ni=1(xi − x)2 Kvadratafvigelsessummen

    CV 100 sx Variations koefficientenSTDERR s√

    NEmpirisk spredning for gennemsnit

  • Eksempel 2: PROC MEANS

    Man kan også beregne forskellige værdier for undergrupper afdata:

    PROC SORT DATA= test1;BY ryger;

    RUN;

    PROC MEANS DATA= test1 N MEAN p50;VAR gendia gensys;BY ryger;

    RUN;

    The SAS System 14:31 Saturday, March 17, 2007 33

    Ryger De?=Ja, dagligtThe MEANS ProcedureVariable N Mean 50th Pctl______________________________________________gensys 3 125.6666667 126.6666667gendia 3 83.1111111 80.0000000______________________________________________

    Ryger De?=Ja men der er dage hvor jeg ikke rygerVariable N Mean 50th Pctl______________________________________________gensys 2 127.6666667 127.6666667gendia 2 79.6666667 79.6666667______________________________________________

    Ryger De?=NejVariable N Mean 50th Pctl______________________________________________gensys 13 124.8461538 125.0000000gendia 13 77.5641026 80.3333333______________________________________________

    PROC FREQ

    PROC FREQ bruges til at lave tabeller med. Den kan lave en-eller flersidede tabeller.

    Ensidet tabel.

    PROC FREQ DATA= test;TABLE sp13;

    RUN;

    SAS indlæser test, og tabellerer variablen sp13.

    The SAS System 09:42 Monday, March 19, 2007 1

    The FREQ Procedure

    I hvilken grad har De haft tillid til, at De har faet den rettesygeplejefaglige behandling?

    Cumulative Cumulativesp13 Frequency Percent Frequency Percent

    _____________________________________________________________________________I høj grad 3 16.67 3 16.67I nogen grad 11 61.11 14 77.78I mindre grad 3 16.67 17 94.44Har ikke faet sygeplejefaglig 1 5.56 18 100.00behandling

  • PROC FREQ

    Man kan også liste en hel række af variable man gerne vil havelavet tabeller over.

    PROC FREQ DATA= test;TABLE var1 var2 var3;

    RUN;

    Hvis man vil have lavet flervejs tabeller (krydstabeller), sætterman en stjerne imellem de variable der skal tabelleres modhinanden.

    PROC FREQ DATA= test;TABLE sp14t*sp13/nocol;

    RUN;

    sp14t(Oplevede De, at der var 1-2 sygeplejerser i afdelingen, der havde særligt ansvar for deres pleje?)sp13(I hvilken grad har De haft tillid til, at De har fået den rette sygeplejefaglige behandling?)

    FrequencyPercentRow Pct I høj gr I nogen I mindre Har ikke Total

    ad grad grad fået behJa 2 3 0 1 6

    11.11 16.67 0.00 5.56 33.3333.33 50.00 0.00 16.67

    Nej 1 7 3 0 115.56 38.89 16.67 0.00 61.119.09 63.64 27.27 0.00

    Ved ikke 0 1 0 0 10.00 5.56 0.00 0.00 5.560.00 100.00 0.00 0.00

    Total 3 11 3 1 1816.67 61.11 16.67 5.56 100.00

    Eksempel: PROC FREQ

    Der bliver her fast angivet i hver enkelt celle, antalobservationer, celle procenter, række procenter samt søjleprocenter. Men kan ved enkelte options fjerne nogle af alledisse værdier.

    PROC FREQ DATA= test;TABLE sp14t*sp13/NOROW NOCOL NOPERCENT;

    RUN;

    sp14t(Oplevede De, at der var 1-2 sygeplejerser i afdelingen, derhavde særligt ansvar for deres pleje?)

    sp13(I hvilken grad har De haft tillid til, at De harfået den rette sygeplejefaglige behandling?)

    Frequency|I høj gr|I nogen |I mindre|Har ikke| Total|ad |grad | grad | fået sy|| | | |geplejef|| | | |aglig be|| | | |handling|

    ______________________________________________Ja | 2 | 3 | 0 | 1 | 6______________________________________________Nej | 1 | 7 | 3 | 0 | 11______________________________________________Ved ikke | 0 | 1 | 0 | 0 | 1______________________________________________Total 3 11 3 1 18

  • Grafik

    De to mest brugte procedurer til at lave grafik med i SAS erPROC GCHART og PROC GPLOT. Proceduren GCHART kanbruges til at lave histogrammer og lagkager og GPLOT brugesmest til at lave scatter plot, men kan utrolig meget, deriblandtogså histogrammer.

    PROC GCHART

    Proceduren GCHART kaldes på følgende møde.

    PROC GCHART DATA=algimin;VBAR sex/DISCRETE;

    RUN;QUIT;

    Den variabel vi gerne vil have afsat på af Y-aksen skrives efterVBAR. Options DISCRETE fortæller SAS, at det er en diskretvariabel vi vil lave et histogram af.

    Efter grafik skal der altid skrives QUIT, ellers bliver SAS vedmed at køre.

    Hvis histogrammet i stedet skulle have været liggende, varstatement HBAR brugt i stedet.

    Hvis vi skal sammenligne to forskellige grupper, f.eks. køn.

    PROC GCHART DATA=algimin;VBAR alder / TYPE=percent G100 GROUP=sex

    RUN;QUIT;

    Denne program stump giver os to histogrammer i et. Et formændene og et for kvinderne. GROUP=sex gør, at der blivertegnet seperate søjler for hvert køn. TYPE=percent, gør at vifår procenter i stedet for frekvenser. Option G100 bevirker, atsummen af søjlerne vil være 100% for hver værdi afGROUP-variablen. Undlades G100 vil summen af alle søjlernevære 100%.

  • PROC GPLOT

    PROC GPLOT bruges f.eks. til at lave scatter plot med. Dvs.hvis man gerne vil plotte to variable mod hinanden.

    PROC GPLOT DATA=algimin;PLOT BMI*alder;

    RUN;QUIT;

    I PLOT-ordren fortælles hvilke variable, der skal tegnes op modhinanden. Y-variablen skal stå først.

    Hvis man gerne vil have delt plottet op på f.eks. sex kan manlave forskelligt symbol alt efter om det er en mand eller kvindeman plotter.

    PROC GPLOT DATA=algimin;PLOT BMI*alder=sex;

    RUN;QUIT;

  • Man kan få mere avancerede plot ved brug af SYMBOL-ordrer,der fortæller hvad der skal ske med punkterne og evt. imellempunkterne (I= står for Interpolation=). Disse ordreindeholder blandt andet beskrivelser af farve C, plotsymboler V,signature L og interpolationsmåder I, som angiver ompunkterne skal forbindes og i så fald hvordan.

    Værdier for n: Tallene for 1 til 255Værdier for C: Almindelige farvenavne på engelsk. Hvilke der

    kan bruges afhænger af konfigurationen.Maskinen ændrer selv, hvis man bruger nogleulovlige

    Værdier for V: PLUS, STAR, DIAMOND, DOT, NONE etc.Bruger man NONE bliver selve punkterne ikketegnet. Brug symmetriske tegn

    Værdier for L: Tallene fra 1 til 46

    Værdier for I NONE punkterne forbindes ikke,JOIN punkterne forbindes med rette linier,SPLINE tegner ’glat’ kurve gennem punkterne,NEEDLE tegner lodret linie ned til x-aksenRL tilpasser bedste rette linieRQ tilpasser bedste andengradspolynomiumSTEPL tegner trappe funktion, punkterne er tilvenstre for stregenSTEPR tegner trappe funktion, punkterne er tilhøjre for stregenSTEPC tegner trappe funktion, punkterne er påmidten af stregen

    Eksempel

    SYMBOL1 C=black V=plus L=1 I=RL;

    PROC GPLOT DATA=algimin;PLOT BMI*alder=1 / FRAME HAXIS=10 TO 70 BY 10

    VAXIS=10 TO 60 BY 10;RUN;QUIT;

    Vi har her lavet et plot af BMI mod alder og sat et + for hverobservation og samtidige tegnet den bedste rette linie igennempunkterne. I loggen kommer der til at stå en forskrift forregressions linien. Ordren = 1 i PLOT statement gør, at det ersymbolerne fra SYMBOL1 der bliver brugt.

  • SYMBOL1 C=blue V=plus L=1 I=RL;SYMBOL2 C=red I=RQ;

    PROC GPLOT DATA=algimin;PLOT BMI*alder=1

    BMI*alder=2 / FRAME OVERLAY;RUN; QUIT;OVERLAY gør at de to plots bliver tegnet oven i hinanden.

    Resultater i word

    ODS RTF FILE= "C:\Janne\projekter\proj1\descp anal.rtf";SYMBOL2 C=red I=rq;

    PROC GPLOT DATA=algimin;PLOT BMI*alder=1

    BMI*alder=2 /FRAME OVERLAY;RUN; QUIT;ODS RTF CLOSE;

    Alt hvad der står mellem ODS RTF FILE= og ODS RTFCLOSE; bliver kommer over i word dokumentet.

  • Resultater i word - lidt pænere

    ODS RTF FILE= "C:\Janne\descp anal.rtf" BODYTITLESTARTPAGE=NO STYLE=journal;ODS NOPROCTITLE;SYMBOL2 C =red I=RQ;

    PROC GPLOT DATA=algimin;PLOT BMI*alder=1

    BMI*alder=2 /FRAME OVERLAY;RUN; QUIT;ODS RTF CLOSE;

    Histogram med normalfordeling

    PROC UNIVARIATE DATA=a;VAR alder;HISTOGRAM alder/NORMAL;

    RUN;

    Boxplot

    PROC BOXPLOT DATA=a;PLOT alder*sex/ BOXSTYLE=SCHEMATIC;

    RUN;

    Hvis hver datalinie tæller for flere personer

    PROC UNIVARIATE DATA=a;VAR alder;FREQ antal;HISTOGRAM alder/NORMAL;

    RUN;

    Her tæller hver datalinie for "antal" observertioner/personer

  • Hvis hver datalinie tæller for flere personerPROC

    FREQ DATA= test;TABLE var1 var2 var3;WEIGHT antal;

    RUN;

    Her tæller hver datalinie for "antal" observertioner/personer