7/21/2019 Manual Amostragem Introduo SPSS
1/79
Manual de Amostragem e deIntroduo ao SPSS
7/21/2019 Manual Amostragem Introduo SPSS
2/79
2
Manual Amostragem e de Introduo ao SPSS
Ficha Tcnica
Autor:
------------
Resumo biogrfico:
------------
Ttulo do manual:
Manual de Amostragem e de Introduo ao SPSS
Ms e Ano de elaborao:Novembro de 2008
7/21/2019 Manual Amostragem Introduo SPSS
3/79
3
ndicePg.
Estruturao dos captulos 5Introduo 6
Captulo 1 Amostragem 7
Objectivos 7
Palavras-chave 7
Contedo temtico
1.1. Noes de amostragem 8
1.2. Mtodos de amostragem 10
1.3. Seleco das unidades amostrais 11
1.4. Margens de erro e intervalos de confiana 12
Avaliao 15
Bibliografia 15
Captulo 2 Introduo ao SPSS 16
Objectivos 16
Palavras-chave 16
Contedo temtico
2.1. Editor de dados do SPSS 17
2.2. Output do SPSS 18
2.3. Menus SPSS 19
2.4. Criao de bases de dados 22
2.5. Tratamento Preliminar de dados 22
2.5.1. Transformao algbrica de variveis 23
2.5.2. Transformao lgica de variveis 28
2.5.3. Inverso da escala de uma varivel 29
2.5.4. Variveis de contagem de ocorrncias 30
2.6. Seleco de casos 31
Avaliao 35
Referncias 36
7/21/2019 Manual Amostragem Introduo SPSS
4/79
4
Pg.Captulo 3 Estatstica aplicada com SPSS 37
Objectivos 37
Palavras-chave 37
Contedo temtico3.1. Anlise de dados univariada 38
3.1.1. Frequncias 38
3.1.2. Estatsticas descritivas e grficos de perfil 41
3.1.3. Testes de aderncia (para 1 amostra) 44
3.1.3.1. 2(Qui-quadrado) 44
3.1.3.2. Kolmogorov-Smirnov 45
3.1.3.3 Teste tde Student 46
3.2. Anlise de dados bivariada 47
3.2.1. Cruzamentos e teste de independncia 2(Qui-quadrado) 47
3.2.2. Testes no paramtricos procedimento Non Parametric Tests 50
3.2.2.1. Duas amostras independentes (Mann-Whitney e Kolmogorov-Smirnov) 50
3.2.2.2. K amostras independentes (Kruskal-Wallis) 52
3.2.3. Testes no paramtricos procedimento Compare Means 54
3.2.3.1. Duas amostras emparelhadas (t de Studentamostras emparelhadas) 54
3.2.3.2. Duas amostras independentes (t de Studentde independncia) 55
3.2.3.3. k amostras independentes (Anlise de Varincia Simples Paramtrica -ANOVA) 56
3.2.4. Correlao linear simples 59
3.3. Modelos de previso 61
3.3.1. Anlise de Regresso Simples 61
3.3.2. Anlise de Regresso Mltipla 63
3.4. Anlise de dados multivariada 66
3.4.1. Anlise das Componentes Principais 66
3.4.2. Anlise de Clusters 71
3.4.2.1. Anlise hierrquica de Clusters 72
3.4.2.2. Anlise no hierrquica de Clusters mtodo de optimizao (K-Means) 76
3.4.3. Articulao entre a Anlise das Componentes Principais r a Anlise deClusters 76
Avaliao 79
Bibliografia 79
Anexo 1: Testes de inferncia estatstica mais utilizados em Anlise bivariada 80
Anexo 2: European Social Survey (round 1 - 2002) - Questionrio adaptado 83
7/21/2019 Manual Amostragem Introduo SPSS
5/79
5
Estruturao dos captulos
Em cada captulo ou contedo temtico, o(a) aluno(a) visualizar uma estrutura que apresentar
as seguintes subdivises, a saber:
Objectivos
Objectivo(s) especfico(s), no qual cada participante conhecer a propostade aprendizagem a ser alcanada no final dessa mesma (sub)temtica e queservir de referncia para a auto-avaliao;
Palavras
Palavras-chave, que pela sua relevncia para a temtica e como realce daateno do(a) aluno(a) para determinada designao ou conceito, que ter asua definio e explicitao, no final do captulo, no espao reservado emGlossrio.
Contedo
Contedo programtico, onde se procurar desenvolver, de modo claro,objectivo e com rigor tcnico, a (sub)temtica em apreo, referenciando-seos elementos de substncia, julgados mais significativos e de interesse paraa aprendizagem do(a) aluno(a).
Avaliao
Avaliao. Neste espao ser indicada a forma de avaliao do captulo eincluda a respectiva ficha de exerccio.
Referncias
Referncias. Nesta subdiviso poder-se- encontrar uma lista de elementosbibliogrficos referentes: s citaes efectuadas ao longo do texto; s obrasconsultadas pelo autor, i. , livros, artigos, monografias, trabalhosacadmicos, endereos electrnicos, etc., que podero ajudar no trabalhode pesquisa ou de aprofundamento de saberes de cada aluno(a).
7/21/2019 Manual Amostragem Introduo SPSS
6/79
6
Introduo
O Manual de Amostragem e Introduo ao SPSS tem como objectivo principal orientar os alunosna utilizao do SPSS, constituindo-se simultaneamente como um guio da matria leccionada ede uma ficha tcnica para realizao dos exerccios propostos no mbito do da cadeira deInformtica Aplicada.
Pretende-se, deste modo, disponibilizar aos alunos um guio que lhes permita acompanhar asequncia dos pontos do programa e as respectivas aulas. Nesse sentido, este manual nodispensa a necessidade de se tirar apontamentos nas aulas, nem a leitura e consulta de outra
bibliografia, que permitir o aprofundamento dos temas, na medida em que aqui se situamapenas os principais tpicos e as balizas das matrias abordadas.
Procurou-se por isso apresentar o contedo dos vrios pontos de uma forma clara, simples esinttica, de maneira a que o essencial seja captado neste manual, podendo ser aprofundado apartir das referncias indicadas.
De acordo com o programa, este manual divide-se em trs captulos, que esto obviamenterelacionados intimamente:
- O primeiro pretende fornecer aos alunos elementos que lhes permitam construir umaamostra representativa e proceder seleco aleatria das unidades amostrais.
- O segundo tem como objectivo familiarizar os formandos com o SPSS, permitindo-lhes
criar, importar e manipular bases de dados, bem como proceder ao tratamento preliminardos dados, recodificar variveis e construir novas variveis a partir das variveisoriginais.
- O terceiro tem como objectivo dotar os formandos de competncias tcnicas e estatsticasque lhes permitam proceder anlise de dados univariada, bivariada e multrivariada,com SPSS.
7/21/2019 Manual Amostragem Introduo SPSS
7/79
Captulo 1 Amostragem
No final deste captulo os alunos devero ser capazes de:
1. seleccionar os tipos de amostra mais adequados a cada contexto;2. calcular a dimenso da amostra e a margem de erro;3. seleccionar as unidades amostrais.
- Amostra- Erro amostral- Unidades amostrais
Captulo
1Objectivos
Palavras
7/21/2019 Manual Amostragem Introduo SPSS
8/79
8
1.1. Noes de amostragem
Em Estatstica1, amostra o conjunto de elementos extrados de um conjuntomaior, chamado Populao. um conjunto constitudo de indivduos (famlias ou outrasorganizaes), acontecimentos ou outros objectos de estudo que o investigador pretende descreverou para os quais pretende generalizar as suas concluses ou resultados.
Principais razes para se trabalhar com uma amostra:
- A populao infinita, ou considerada como tal, no podendo portanto ser analisadana ntegra;
- Custo excessivo do processo de recolha e tratamento dos dados, como resultado dagrande dimenso da populao ou da complexidade do processo de caracterizao detodos os elementos da populao;
- Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo obteno de informao desactualizada;
- As populaes so dinmicas, de onde resulta que os elementos ou objectos dapopulao esto em constante renovao, de onde resulta a impossibilidade de
analisar todos os elementos desta populao;
Se a constituio da amostra obedecer a determinadas condies, a anlise das caractersticas daamostra pode servir para se fazerem inferncias sobre a populao.
Nota:A dimenso da amostra significativamente inferior dimenso da populao, de forma ajustificar a constituio da amostra. A amostragem , por sua vez, um conjunto deprocedimentos atravs dos quais se selecciona uma amostra de uma populao. Pode-sedividir as tcnicas de amostragem em vrio tipos:
- Amostragem probabilstica - procedimento em que todos os elementos da populaotm uma probabilidade conhecida e superior a zero de integrar a amostra;
- Amostragem no probabilstica:- Amostragem intencional - amostragem no probabilstica subordinada a objectivos
especficos do investigador;- Amostragem no intencional - amostragem no probabilstica regida por critrios de
convenincia e/ou de disponibilidade dos inquiridos.
1Amostra (estatstica) . In Infopdia [Em linha]. Porto: Porto Editora, 2003-2008. [Consult. 2008-01-15]. Disponvel na www:.
Contedo
7/21/2019 Manual Amostragem Introduo SPSS
9/79
9
Questes prQuestes prvias ao processo de amostragemvias ao processo de amostragemde natureza quantitativade natureza quantitativa
1. Definio clara dosobjectivos do estudo
O que se pretende saber/conhecer
melhor/compreender
2. Quem dever serentrevistado
Populao alvo* e populao a
inquirir
3. Quantos devero serentrevistados
Dimenso da amostra
4. Como seroseleccionados
Mtodo de seleco da amostra
(escolha das unidades amostrais)
*Designa-se por populao alvo a totalidade dos elementos sobre os quais se deseja obter determinado tipode informao
7
Amostra, n(unidades de observao)
Universo ou Populao, N(finito)
Unidades que poderiam serobservadas
Conjunto de unidades existentes squais se aplica a teoria
Universo Hipottico(praticamente infinito)
* in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989
RepresentaRepresentao de uma Amostra*o de uma Amostra*
8
7/21/2019 Manual Amostragem Introduo SPSS
10/79
10
Desenvolvimento de um planoDesenvolvimento de um plano amostral*amostral*
* in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999
Populao alvo
Populao a inquirir
Processo amostral
Dimenso da amostra
Mtodo de recolha
de dados
Amostra final
9
1.2. Mtodos amostrais
MMtodos de selectodos de seleco da amostra*o da amostra*
* in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999
Mtodos probabilsticos(amostragem casual)
Amostragem aleatria simples
Amostragem sistemtica
Amostragem estratificada
Amostragem por clusters
Amostragem multi-etapas
Amostragem multifsica
Mtodos no
probabilsticos(amostragem dirigida)
Amostragem por convenincia
Amostragem intencional
Amostragem snowballAmostragem sequencial
Amostragem por quotas
10
7/21/2019 Manual Amostragem Introduo SPSS
11/79
11
1.3. Seleco das unidades amostrais
MMtodos de selectodos de seleco da amostrao da amostra ((contcont))**
* in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999
Mtodos probabilsticos - amostragem aleatria
Cada elemento da populao tem a mesma probabilidade de serseleccionado
Aleatria simples
Clculo do rcio K=N/n; seleco aleatria do primeiro elementoda populao e sequencial dos restantes
Casualsistemtica
Separao dos elementos da populao em estratos e selecoaleatria dos elementos dentro de cada estrato
Estratificada
A populao encontra-se dividida em clusters que soseleccionados aleatoriamente, constituindo as unidades amostraisClusters
Idntico ao anterior mas em que as unidades amostrais soseleccionadas aleatoriamente dentro de cada cluster
Multi-etapas
Numa 1 fase recolhem-se dados sobre determinadascaractersticas dos respondentes (comportamentos e frequncia deconsumos, variveis demogrficas, etc.) e da sua disponibilidadepara responder novamente a um inqurito. ento retirada destafase uma sub-amostra que ser inquirida na 2 fase.
Multi-fsica
11
12
rea
6500610184013902 660Total24501706006101070Produto D27001907005501260Produto C5005023070150Produto B850200310160
180Produto A
TotalOutros(Restantesdistritos)
Sul(Lisboa,Setbal eSantarm)
Centro(Coimbra,Aveiro eLeiria)
Norte(Braga ePorto)Sector
Amostra estratificada*Amostra estratificada*
* Adaptado de: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999
Uni v
er
so
rea
65061184139266Total245176061107Produto D270197055126Produto C50523715Produto B8520311618Produto A
TotalOutros(Restantesdistritos)
Sul(Lisboa,Setbal eSantarm)
Centro(Coimbra,Aveiro eLeiria)
Norte(Braga ePorto)Sector
Am
ostr
a(10
%
da
populao
)
7/21/2019 Manual Amostragem Introduo SPSS
12/79
12
MMtodos de selectodos de seleco da amostrao da amostra ((contcont))**
* in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999
A amostra seleccionada em funo da disponibilidade eacessibilidade dos elementos que constituem a populao alvo
Amostragem porconvenincia
A escolha dos elementos a incluir na amostra baseia-se na opiniode uma ou mais pessoas que conhecem muito bem ascaractersticas especficas da populao em estudo, que sepretende analisar
Amostragemintencional
Numa 1 fase os inquiridos so escolhidos aleatoriamente, sendo,numa segunda fase, os inquiridos adicionais escolhidos com basena informao dos primeiros
Amostragemsnowball
Semelhante ao mtodo multi-fsico. A realizao da fase seguintes decidida depois de analisados os resultados da fase anterior.
Amostragemsequencial
Equivalente amostragem aleatria estratificada. As proporesdos vrios sub-grupos reflectem a sua distribuio dentro dapopulao. Cada entrevistador dispe das caractersticas que os
entrevistados devero satisfazer, terminando as entrevistasquando as quotas estiverem preenchidas.
Amostragem por
quotas
Mtodos no probabilsticos - amostragem dirigida
13
1.4. Erro amostral
DeterminaDeterminao da margem de erro em funo da margem de erro em funo do no do n de elementos*de elementos*
in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 198914
7/21/2019 Manual Amostragem Introduo SPSS
13/79
13
DeterminaDeterminao no n de elementos em funde elementos em funo da margem de erro *o da margem de erro *
in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989 15
DeterminaDeterminao no n de elementos em funde elementos em funo da margem de erro e dao da margem de erro e dadimenso da populadimenso da populao *o *
in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989 16
7/21/2019 Manual Amostragem Introduo SPSS
14/79
14
A avaliao deste captulo consiste num exerccio escrito, de resposta sseguintes questes
Exerccio de avaliao:
1) Depois de se identificar os dados que devero ser recolhidos e o instrumento (questionrioestruturado, por exemplo) a utilizar para essa recolha, o passo seguinte consiste em definir um
processo de amostragem adequado ao tipo de dados e ao instrumento de anlise2
Diga, sucintamente em que consistem os seguintes mtodos de mostragem:- Amostra aleatria simples;
- Amostra Estratificada;- Amostra por quotas.
2)O problema da Inferncia Indutiva , do ponto de vista da Estatstica, encarado da seguinteforma: a finalidade da investigao descobrir algo sobre determinada populao ou universo.3
Comente a frase e diga quais os procedimentos para seleccionar as unidades amostrais (sujeitos)numa amostra estratificada.
- Bravo, R. S. (1988), Tcnicas de investigacin social, 5 ed.corregida e ampliada, Madrid, Paraninfo (Seco 1).
- Reis, E., P. Melo; R. Andrade e T. Calapez (1999) EstatsticaAplicada volume 2, Lisboa, Slabo, 3 edio revista.
- Vicente, P.; E. Reis; F. Ferro (2002), Sondagens-A amostragemcomo factor decisivo de qualidade, Lisboa, Edies Slabo.
2Reis, E., P. Melo; R. Andrade e T. Calapez (1999)Estatstica Aplicada volume 2, Lisboa, Slabo, 3 edio revista.3Idem.
Avaliao
Referncias
7/21/2019 Manual Amostragem Introduo SPSS
15/79
15
Captulo 2 Introduo ao SPSS
O objectivo geral deste captulo o de familiarizar os alunos com o SPSS,nomeadamente no que se refere:
- Janelas e menus;
- Criao e manipulao de bases de dados;- Tratamento preliminar dos dados.
- Varivel- Nvel de medida
Captulo
2Objectivos
Palavras
7/21/2019 Manual Amostragem Introduo SPSS
16/79
16
2.1. Editor de dados do SPSS
O package estatstico SPSS para Windows um poderoso sistema de anlises
estatsticas e manuseamento de dados, em que a utilizao mais frequente, para amaioria das anlises a efectuar, se resume seleco das respectivas opes emmenus e caixas de dilogo
O editor de dados do SPSS (Data Editor) composto por duas janelassobrepostas:Data Viewe Variable View. A funo da primeira Data View a de introduzir osdados e da segunda - Variable View criar a estrutura da base de dados.
Muda-se de uma para outra clicando no respectivo separador.
OData Editordo SPSS um programa do tipo de folha de clculo que permite facilmente criar ou
editar ficheiros de dados. Abre automaticamente quando se entra no SPSS.O seu aspecto o seguinte:
JanelaData View:
Contedo
7/21/2019 Manual Amostragem Introduo SPSS
17/79
17
Janela Variable View:
2.2. Outputdo SPSS (Output Viewer)
nesta janela que so apresentados todos os resultados estatsticos. Abre automaticamente sempreque um determinado procedimento gera resultados. possvel editar as tabelas e grficos
produzidos, clicando duas vezes com a tecla esquerda do rato e modificar a sua aparncia.
Janela Output Viewer:
7/21/2019 Manual Amostragem Introduo SPSS
18/79
18
2.3. Menus do SPSS
Os menus das janelas principais Data Editor e Outpur Viewer - so idnticos e tm o seguinteaspecto visual:
Principais funcionalidades dos menus
FileCriar, abrir, ler, exportar, gravar e imprimirficheiros.
EditConfigurao/parametrizao do SPSS
(Options), inserir novas variveis e novos casos.
7/21/2019 Manual Amostragem Introduo SPSS
19/79
19
ViewActivar/desactivar barras de comandos, fontes,grelha, barra de status e mostrar etiquetas(labels) definidas.
Data
Alterao global dos dados;Ordenar a base;Juntar ficheiros (Merge Files);
Dividir a anlise por grupos (Split File);Criar subconjuntos de casos para anlise (SelectCases);Activar ponderadores (Weight Cases).
TransformCriar novas variveis com base nas variveisoriginais;Recodificar variveis.
7/21/2019 Manual Amostragem Introduo SPSS
20/79
20
Analyse Procedimentos de anlise estatstica.
Graphs Criar grficos.
Utilities Informao sobre as variveis.
WindowComuta entre janelas;Minimizar janelas
HelpAjuda em linha;Tutorial.
7/21/2019 Manual Amostragem Introduo SPSS
21/79
21
2.4. Criao de bases de dados
As bases de dados so criadas na janela Variable View,devendo a estrutura das variveis obedecers seguintes regras:
Name
- Mximo 64 caracteres (verses anteriores 13, apenas 8);- Deve comear por uma letra; os restantes caracteres podem ser letras(maisculas ou minsculas so iguais), algarismos, ou os smbolos @, #, _, $.
- No se podem usar espaos em branco, nem os seguintes caracteres: !, ?, , , *,+, -, %, vrgula, ponto e vrgula, \, /, >, 65 anos.a) Criao da varivel idade:
4A base de dados original est disponvel em http://www.europeansocialsurvey.org/.
7/21/2019 Manual Amostragem Introduo SPSS
22/79
22
A varivel idade acrescentou-se base de dados. Vamos agora proceder sua recodificao,criando uma nova varivel idade2 com 4 escales5:
A varivel idade2 acrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.
O resultado ser o seguinte:
Idade
341 22.6 22.6 22.6
505 33.4 33.4 56.0
315 20.8 20.8 76.8
350 23.2 23.2 100.0
1511 100.0 100.0
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
ValidFrequency Percent Valid Percent
CumulativePercent
5 Nota: na recodificao de variveis recomendvel manter as variveis originais e criar novas variveis recodificadas,escolhendo para o efeito a opoInto diferent variable.
7/21/2019 Manual Amostragem Introduo SPSS
23/79
23
b) Recodificao da varivel escolaridade:
Pretende-se recodificar a varivel escolaridade (f7) criando uma nova varivel (escol) com 3escales: at 9 anos; 10 12 anos e > 12 anos.
A varivel escolacrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.
O resultado ser o seguinte:
Escolaridade
1046 69.2 69.2 69.2
251 16.6 16.6 85.8
212 14.0 14.0 99.9
2 .1 .1 100.0
1511 100.0 100.0
At 9 anos
10 - 12 anos
> 12 anos
NR
Total
ValidFrequency Percent Valid Percent
CumulativePercent
7/21/2019 Manual Amostragem Introduo SPSS
24/79
24
c) Recodificao da varivel autoposicionamento poltico:
Pretende-se recodificar a varivel autoposicionamento poltico (b28) criando uma nova varivel(b28r) com 3 escales: esquerda; centro e direita.
A varivelb28racrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.
O resultado ser o seguinte:
Autoposic ionamento pol tico
296 19.6 24.5 24.5
620 41.0 51.2 75.7
294 19.4 24.3 100.0
1211 79.9 100.0
304 20.1
1515 100.0
Esquerda
Centro
Direita
Total
Valid
SystemMissing
Total
Frequency Percent Valid Percent
Cumulative
Percent
7/21/2019 Manual Amostragem Introduo SPSS
25/79
25
Exemplo 2: criao de ndices sintticos
Pretende-se criar dois ndices sintticos: Confiana social(variveis a8, a9e a10) e Confianainstitucional(variveisb7,b8,b9eb10).
As 2 variveis acrescentaram-se base6:
Os resultados so os seguintes:
Descriptive Statistics
1480 .0 10.0 4.316 1.7469
1338 .0 9.3 4.097 1.7603
1319
ndice sinttico de Confiana social
ndice sinttico de Confiana institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
6Nota: tratando-se de variveis rcio, devero ter casas decimais (1 ou 2).
7/21/2019 Manual Amostragem Introduo SPSS
26/79
26
2.5.2. Transformao lgica de variveis
Exemplo: pretende-se criar uma varivel -sexid- atravs da transformao lgica das variveisf2e idade2, com 4 categorias: homens at 30 anos, homens com mais de 30 anos,mulheres at 30 anos e mulheres com mais de 30 anos.
Nota: repetir o comando para as restantes categorias, cujas expresses numricas so as seguintes:Categoria 2:f2= 1 & idade2> 2
Categoria 3:f2= 2 & idade2= 3Categoria 4:f2= 2 & idade2> 4
A varivel sexid acrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos label e value labels.
O resultado o seguinte:
Sexo e Idade
158 10.5 10.5 10.5
472 31.2 31.2 41.7
183 12.1 12.1 53.8
698 46.2 46.2 100.0
1511 100.0 100.0
Homens at 30 anos
Homens com mais de 30 anos
Mulheres at 30 anos
Mulheres com mais de 30 anos
Total
ValidFrequency Percent Valid Percent
Cumulative
Percent
7/21/2019 Manual Amostragem Introduo SPSS
27/79
27
2.5.3. Inverso da escala de uma varivel
Exemplo: pretende-se criar uma nova varivel (ib1) com a inverso da escala da varivel interessepela poltica (b1) de modo a que 1 corresponda a nenhum interesse e 4 a muitointeresse:
O resultado o seguinte:
b1
Qual o seu interesse pela poltica
117 7.7 7.8 7.8
456 30.2 30.3 38.1
441 29.2 29.3 67.5
489 32.4 32.5 100.0
1503 99.5 100.0
6 .4
2 .1
8 .5
1511 100.0
Muito interesse
Algum interesse
Pouco interesse
Nenhum interesse
Total
Valid
Recusa
No sabe
Total
Missing
Total
Frequency Percent Valid PercentCumulative
Percent
ib1
Qual o seu i nteresse pela poltica
489 32.4 32.5 32.5
441 29.2 29.3 61.9
456 30.2 30.3 92.2
117 7.7 7.8 100.0
1503 99.5 100.0
2 .1
6 .4
8 .5
1511 100.0
Nenhum interesse
Pouco interesse
Algum interesse
Muito interesse
Total
Valid
No sabe
Recusa
Total
Missing
Total
Frequency Percent Valid PercentCumulative
Percent
7/21/2019 Manual Amostragem Introduo SPSS
28/79
28
2.5.4. Variveis de contagem de ocorrncias
Exemplo: pretende-se criar uma varivel partciv que traduza o ndice de participao cvica,que integre (conte) apenas os inquiridos que responderam sim (1) s questes b15a
b24.
A varivelpartcivacrescentar-se- base.
O resultado o seguinte:
ndice sinttico de Participao cvica
1174 77.7 77.7 77.7
145 9.6 9.6 87.3
85 5.6 5.6 92.9
39 2.6 2.6 95.5
30 2.0 2.0 97.5
16 1.1 1.1 98.5
9 .6 .6 99.1
11 .7 .7 99.9
1 .1 .1 99.91 .1 .1 100.0
1511 100.0 100.0
0
1
2
3
4
5
6
7
910
Total
ValidFrequency Percent Valid Percent
CumulativePercent
A interpretao a seguinte: 77,7% (1174) inquiridos no assinalaram nenhum indicador, 9,6%(145) assinalaram apenas 1, 5,6% (85) assinalaram 2, etc.
7/21/2019 Manual Amostragem Introduo SPSS
29/79
29
2.6. Seleco de casos
Exemplo 1: seleco de uma sub-amostraPretende-se seleccionar (filtrar) apenas os inquiridos da regio de Lisboa e Vale do Tejo(regiao=3).
Na base de dados (Data View) os registos no seleccionados (filtrados) aparecem tracejados,mantendo-se assim at que se anule a seleco (filtro). A barra de status informa que a base estfiltrada:
Nota muito importante:no esquecer de desactivar o filtro quando no for necessrio:
7/21/2019 Manual Amostragem Introduo SPSS
30/79
30
Exemplo 2: Seleco de uma amostra aleatria simplesPretende-se seleccionar uma amostra de 5% dos casos, aproximadamente:
Na base de dados (Data View) os registos no seleccionados (filtrados) aparecem tracejados,
mantendo-se assim at que se anule a seleco (filtro). A barra de status informa que a base estfiltrada:
Nota muito importante:no esquecer de desactivar o filtro quando no for necessrio:
Exemplo 3: Separar a anlise por grupos
Pretende-se separar a anlise pelas 4 categorias (sub-amostras) da varivel sexid(sexo e idade). possvel obter os resultados na mesma tabela, seleccionando a opo Compare groupsou emtabelas diferentes, com a opo Output by groups:
No primeiro caso, os resultados so os seguintes:Descriptive Statistics
156 1.0 9.0 4.859 1.4670
147 .0 8.5 4.248 1.7428
145
456 .0 10.0 4.259 1.8100
440 .0 9.3 4.066 1.8441
430
182 .0 9.3 4.604 1.6277
168 .0 8.0 4.116 1.6234
167
686 .0 10.0 4.153 1.7629
583 .0 9.3 4.075 1.7401577
ndice sinttico de Confiana social
ndice sinttico de Confiana institucional
Valid N (listwise)
ndice sinttico de Confiana social
ndice sinttico de Confiana institucional
Valid N (listwise)
ndice sinttico de Confiana social
ndice sinttico de Confiana institucional
Valid N (listwise)
ndice sinttico de Confiana social
ndice sinttico de Confiana institucionalValid N (listwise)
Sexo e Idade
Homens at 30 anos
Homens com maisde 30 anos
Mulheres at 30anos
Mulheres com maisde 30 anos
N Minimum Maximum Mean Std. Deviation
7/21/2019 Manual Amostragem Introduo SPSS
31/79
31
No segundo caso seriam produzidas 4 tabelas, uma por cada categoria da varivel colocada emsplit:
Descriptive Statisticsa
156 1.0 9.0 4.859 1.4670
147 .0 8.5 4.248 1.7428
145
ndice sinttico deConfiana social
ndice sinttico deConfiana institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Homens at 30 anosa.
Descriptive Statisticsa
456 .0 10.0 4.259 1.8100
440 .0 9.3 4.066 1.8441
430
ndice sinttico deConfiana social
ndice sinttico deConfiana institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Homens com mais de 30 anosa.
Descript ive Statisti csa
182 .0 9.3 4.604 1.6277
168 .0 8.0 4.116 1.6234
167
ndice sinttico deConfiana social
ndice sinttico deConfiana institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Mulheres at 30 anosa.
Descript ive Statisti csa
686 .0 10.0 4.153 1.7629
583 .0 9.3 4.075 1.7401
577
ndice sinttico deConfiana social
ndice sinttico deConfiana institucional
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
Sexo e Idade = Mulheres com mais de 30 anosa.
7/21/2019 Manual Amostragem Introduo SPSS
32/79
32
Avaliao deste mdulo consiste em criar uma base de dados para o excerto doseguinte questionrio:
- Pereira, A. (1999), SPSS-Guia Prtico de Utilizao, Anlise deDados para Cincias Sociais e Psicologia, Lisboa, Edies Slabo, 6edio revista e corrigida.
- Vinacua, B. V. (2002), Anlisis Estadstico con SPSS para Windows. Volumen I.Estadstica bsica, Madrid, McGraw-Hill, 2 edicin.
Avaliao
Referncias
7/21/2019 Manual Amostragem Introduo SPSS
33/79
33
Captulo 3 Estatstica aplicada com SPSSO objectivo geral deste captulo o de proceder anlise estatstica de dados, nomeadamente:
o Anlise univariada frequncias e distribuies;o Anlise bivariada Cruzamentos, testes de hipteses e inferncia
estatstica;o Anlise multivariada:
Previso - Regresso linear simples e mltipla; Detectar dimenses latentes - Anlise das componentes
principais;
Segmentao: Anlise de Clusters
Frequncias Cruzamentos Testes de hipteses Inferncia estatstica Margem de erro Intervalo de confiana Significncia estatstica
3.1. Anlise de dados univariada3.1. 1. Frequncias
a) Utilizando o comandoFrequencies7
Variveis de caracterizao social:
7 Nota: as tabelas geradas pelo procedimento Frequencies so em formato rascunho destinando-se apenas aocontrolo e validao da base de dados, com o objectivo de eliminar erros de introduo de dados.
Captulo
Objectivos
Palavras
Contedo
7/21/2019 Manual Amostragem Introduo SPSS
34/79
34
Os resultados so os seguintes:
Sexo
630 41.7 41.7 41.7
881 58.3 58.3 100.01511 100.0 100.0
Masculino
FemininoTotal
ValidFrequency Percent Valid Percent
CumulativePercent
Idade
341 22.6 22.6 22.6
505 33.4 33.4 56.0
315 20.8 20.8 76.8
350 23.2 23.2 100.0
1511 100.0 100.0
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Anos de esc olar idade concl udos
1046 69.2 69.3 69.3
251 16.6 16.6 86.0
212 14.0 14.0 100.0
1509 99.9 100.0
2 .1
1511 100.0
At 9 anos
10 - 12 anos> 12 anos
Total
Valid
NRMissing
Total
Frequency Percent Valid PercentCumulative
Percent
b) Utilizando o comando Tables
7/21/2019 Manual Amostragem Introduo SPSS
35/79
35
Os resultados so os seguintes8:
630 41.7
881 58.3
1511 100.0
341 22.6
505 33.4
315 20.8
350 23.2
1511 100.0
1046 69.2
251 16.6
212 14.0
2 .1
1511 100.0
Masculino
Feminino
TotalSexo
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Idade
At 9 anos
10 - 12 anos
> 12 anos
NR
Total
Anos deescolaridadeconcludos
N %
c) Quadro de frequncias (%) dos indicadores das questes d18 a d24
8Nota: o quadro foi modificado no respectivo editor, a que se acede clicando duas vezes sobre o mesmo.
7/21/2019 Manual Amostragem Introduo SPSS
36/79
36
O resultado o seguinte:
11.7 41.3 15.1 25.4 6.5 100.0
14.1 46.1 19.4 16.2 4.3 100.0
13.7 53.7 16.7 12.3 3.6 100.0
14.3 42.3 22.1 16.2 5.2 100.0
25.9 54.0 12.5 6.0 1.6 100.0
43.3 40.1 9.3 6.2 1.0 100.0
26.6 38.5 19.0 13.2 2.7 100.0
As pessoas que vm viver e trabalhar para c fazemcom que os salrios baixem
As pessoas que vm viver e trabalhar para c, em
regra, prejudicam mais as expectativas econmicasdos pobres do que dos ricos
As pessoas que vm viver e trabalhar para cajudam a preencher lugares em que h falta detrabalhadores
Se as pessoas que vieram viver e trabalhar para cestiverem desempregadas por muito tempo deviamser obrigadas a ir embora
As pessoas que vieram viver para c devem ter osmesmos direitos do que todas as outras pessoas
As pessoas que vieram viver para c cometerem umcrime grave, devem ser obrigadas a ir embora
As pessoas que vieram viver para c cometeremqualquer crime, devem ser obrigadas a ir embora
Concordatotalmente Concorda
Nemconcorda Discorda
Discordatotalmente Total
7/21/2019 Manual Amostragem Introduo SPSS
37/79
37
3.1. 2. Estatsticas descritivas e grfico de perfil
Nota muito importante: A anlise estatstica, excepto nos quadros de frequncias,deve incidir apenas nas respostas vlidas. Assim, antes de efectuar qualquer anliseestatstica, torna-se necessrio definir e activar os respectivos missing values (no
responde/no sabe/no se aplica) na colunamissingda base de dados.a) Utilizando o comandoDescriptives9
Indicadores das questesd10ad17:
Os resultados so os seguintes:
Descriptive Statistics
1448 0 10 7.46 2.241
1449 0 10 7.11 2.442
1447 0 10 6.81 2.807
1454 0 10 6.48 2.425
1416 0 10 6.06 2.536
1466 0 10 6.05 2.633
1440 0 10 3.79 2.971
1451 0 10 2.85 2.874
1330
Ter qualificaes profissionais de que o pas precisa
Querer adaptar-se ao mesmo modo de vida do pas
Ser rico
Ter familiares prximos a viver c
Ter boas qualificaes acadmicas
Saber falar a lngua oficial do pas
Ter formao crist
Ser branco
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
9 Nota: as tabelas geradas pelo procedimento Descriptives so em formato rascunho destinando-se apenas aocontrolo e validao da base de dados, com o objectivo de eliminar erros de introduo de dados.
7/21/2019 Manual Amostragem Introduo SPSS
38/79
38
b) Utilizando o comando Tables
Os resultados so os seguintes:
6.1 2.5
6.5 2.4
6.1 2.63.8 3.0
2.8 2.9
6.8 2.8
7.5 2.2
7.1 2.4
Ter boas qualificaes acadmicas
Ter familiares prximos a viver c
Saber falar a lngua oficial do pasTer formao crist
Ser branco
Ser rico
Ter qualificaes profissionais de que o pas precisa
Querer adaptar-se ao mesmo modo de vida do pas
Mdia Desvio-padro
7/21/2019 Manual Amostragem Introduo SPSS
39/79
39
c) Grfico de perfil10:
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
Ter boas qualificaes acadmicas
Ter familiares prximo s a viver c
Saber falar a lngua ofic ial do p as
Ter formao crist
Ser branco
Ser rico
Ter qualificaes profissionais d e que o pas precisa
Querer adaptar-se ao mesmo modo de v ida do pas
6.1
6.5
6.1
3.8
2.8
6.8
7.5
7.1
Nenhuma importncia Muita importncia
10Para obter um grfico interactivo de linhas, o procedimento o seguinte: Graph/Interactive/Line, seleccionam-se
todas as variveis em simultneopressionando a tecla Ctrl e arrastam-se para horizontal.O grfico do exemplo foi editado e transformado, tendo-se alterado a escala para o formato real e a cor da linha eacrescentado as etiquetas (valores e mnimo e mximo), a grelha e a linha de referncia.
7/21/2019 Manual Amostragem Introduo SPSS
40/79
40
3.1.3. Testes de aderncia (para 1 amostra)
3.1.3.1. 2 (Qui-quadrado)
Exemplo 1: Pretende-se testar se a classe social (classe2) tem uma distribuio uniforme11no
universo.
Como a varivel nominal, o procedimento consiste em realizar o teste de adernciado 2(All categories equal):
O resultado o seguinte:
Classes so ciais (ACM) prprio
175 256.6 -81.6
191 256.6 -65.6
81 256.6 -175.6
413 256.6 156.4
423 256.6 166.4
1283
Empresrios, dirigentese profissionais liberais
Profissionais tcnicos ede enquadramento
Trabalhadoresindependentes
Empregados executantes
Operrios
Total
Observed N Expected N ResidualTest Statisti cs
366.123
4
.000
Chi-Squarea
df
Asymp. Sig.
Classessociais (ACM)
prprio
0 cells (.0%) have expected frequencies less than5. The minimum expected cell frequency is 256.6.
a.
Interpretao: A varivel classe social no segue uma distribuio uniforme no universo
(2
(4)=366,123;p=0,000).
11Testando se as frequncias observadas so iguais s frequncias esperadas.
7/21/2019 Manual Amostragem Introduo SPSS
41/79
41
3.1.3.2. Kolmogorov-Smirnov
Exemplo:Pretende-se testar se o interesse pela poltica (ib1) segue uma distribuio normal ouuniforme no universo.
Como a varivel ordinal, o procedimento consiste em realizar o teste de adernciade Kolmogorov-Smirnov para as duas distribuies:
O resultado o seguinte:
One-Sample Kolmogo rov-Smirnov Test
1503
2.13
.961
.206
.206
-.198
8.001
.000
N
Mean
Std. Deviation
Normal Parametersa,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Qual o seuinteresse
pela poltica
Test distribution is Normal.a.
Calculated from data.b.
One-Sample Kol mogorov-Smirnov Test 2
1503
1
4
.325
.325
-.078
12.613
.000
N
Minimum
Maximum
Uniform Parametersa,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Qual o seuinteresse
pela poltica
Test distribution is Uniform.a.
Calculated from data.b.
Interpretao: A varivel interesse pela poltica no segue uma distribuio normal(K-S=8,001;p=0,000) nem uniforme (K-S=12,613;p=0,000) no universo.
7/21/2019 Manual Amostragem Introduo SPSS
42/79
42
3.1.3.3 Teste t de Student
Exemplo:Pretende-se testar se a confiana social adere mdia que corresponde ao centro daescala (5)12dos indicadores que compem a varivel (confsoc).
Como a varivel quantitativa, o procedimento consiste em realizar o teste t deaderncia (One-Sample T-Test), comparando se a mdia observada diferesignificativamente de 5:
O resultado o seguinte:
One-Sample Statistics
1480 4.316 1.7469 .0454ndice sinttico deConfiana social
N Mean Std. Deviation Std. ErrorMean
One-Sample Test
-15.073 1479 .000 -.684 -.774 -.595ndice sinttico deConfiana social
t df Sig. (2-tailed)Mean
Difference Lower Upper
95% ConfidenceInterval of the Difference
Test Value = 5
Interpretao: A mdia observada 4,3, diferindo significativamente da mdia de referncia(t(1479)= -15,073;p=0,000).
12A escala de medida dos indicadores de confiana social varia entre 0=nenhuma e 10=toda.
7/21/2019 Manual Amostragem Introduo SPSS
43/79
43
3.2. Anlise de dados bivariada3.2.1. Cruzamentos e teste de independncia 2(Qui-quadrado)
Exemplo 1:Pretende-se saber se h relao entre o sexo e o facto de ter comprado produtos por
razes de ordem poltica, tica ou ambiental.
O procedimento consiste em cruzar as variveis sexo (f2) e (b22) e solicitar o testede independncia do 2*.
a) Utilizando o comando Crosstabs
O resultado o seguinte:
Sexo * Comprou produtos por razes de ordem poltica,tica ou ambiental Crosstabulation
% within Sexo
7.2% 92.8% 100.0%
7.7% 92.3% 100.0%
7.5% 92.5% 100.0%
Masculino
Feminino
Sexo
Total
Sim No
Comprou produtos porrazes de ordempoltica, tica ou
ambiental
Total
Chi-Square Tests
.121b 1 .728
.062 1 .804
.122 1 .727
.766 .404
.121 1 .728
1495
Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-LinearAssociation
N of Valid Cases
Value df Asymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expected count is46.75.
b.
Interpretao: As mulheres compram ligeiramente mais que os homens mas as diferenas noso estatisticamente significativas (2(1)=0,121;p>0,05).
*Para a seleco dos testes estatsticos, ver o Anexo 1.
7/21/2019 Manual Amostragem Introduo SPSS
44/79
44
b) Utilizando o comando Tables
O resultado o seguinte:
7.2 92.8 100.0
7.7 92.3 100.0
7.5 92.5 100.0
Masculino
Feminino
Total
SexoSim No Total
Comprou produtos por razes deordem poltica, tica ou ambiental
Pearson Chi-Square Tests
.121
1
.728
Chi-square
df
Sig.
Sexo
Comprouprodutos por
razes de
ordempoltica, ticaou ambiental
Results are based on nonempty rows andcolumns in each innermost subtable.
7/21/2019 Manual Amostragem Introduo SPSS
45/79
45
3.2.2. Testes no paramtricos (procedimento Non Parametric Tests)
3.2.2.1. Duas amostras independentes
(Mann-Whitney eKolmogorov-Smirnov)
Exemplo 1: Pretende-se testar se h relao entre o sexo (f2) e o interesse pela poltica (ib1).
O procedimento consiste na realizao do teste no paramtrico para 2 amostrasindependentes (Mann-Whitney)13.
O resultado o seguinte:
Ranks
628 815.82 512336.00
875 706.19 617920.00
1503
SexoMasculino
Feminino
Total
Qual o seu interessepela poltica
N Mean Rank Sum of Ranks
Test Statisticsa
234670.000
617920.000
-5.058
.000
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Qual o seuinteresse
pela poltica
Grouping Variable: Sexoa.
Interpretao: a mdia das ordenaes (Mean Rank) superior nos homens. Ou seja, os homensreferem que tm mais interesse pela poltica do que as mulheres. As diferenas soestatisticamente significativas (M-W=234670;p=0,000).
13Consultar o Anexo 1.
7/21/2019 Manual Amostragem Introduo SPSS
46/79
46
Exemplo 2: Pretende-se testar se h relao entre o sexo (f2) e o grau de escolaridade (escol).
O procedimento consiste na em fazer o cruzamento entre as 2 variveis e realizar doteste no paramtrico para duas amostras independentes (Kolmogorov-Smirnov)14.
14Consultar o Anexo 1.
7/21/2019 Manual Amostragem Introduo SPSS
47/79
47
O resultado o seguinte:
67.9 18.9 13.2 100.0
70.3 15.0 14.7 100.069.3 16.6 14.0 100.0
Masculino
FemininoTotal
SexoAt 9 anos 10 - 12 > 12 anos Total
Anos de escolaridade concludos
Test Statisticsa
.025
.025
-.014
.476
.977
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Escolaridade
Grouping Variable: Sexoa.
Interpretao: Tanto no grau de escolaridade intermdio como no superior, verifica-se que hmais homens do que mulheres, observando-se o inverso no grau de escolaridade mais baixo. Noentanto, as diferenas no so estatisticamente significativas (K-S=0,476;p>0,05).
3.2.2.2. K amostras independentes (Kruskal-Wallis)
Exemplo: Pretende-se testar se h relao entre a idade (idade2) e o interesse pela poltica (ib1).
O procedimento consiste na realizao do teste no paramtrico para k amostrasindependentes (Kruskal-Wallis)15.
O resultado o seguinte:
15Consultar o Anexo 1.
7/21/2019 Manual Amostragem Introduo SPSS
48/79
48
27.4 33.6 31.9 7.1 100.0
28.0 28.8 32.9 10.3 100.0
30.7 30.4 29.7 9.3 100.0
45.8 25.1 25.6 3.5 100.0
32.5 29.3 30.3 7.8 100.0
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Idade
Nenhuminteresse
Poucointeresse
Alguminteresse
Muitointeresse Total
Qual o seu interesse pela poltica
Ranks
339 777.35
504 803.46
313 768.74
347 637.38
1503
IdadeAt 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Qual o seu interessepela poltica
N Mean Rank
Test Statisticsa,b
36.088
3
.000
Chi-Square
df
Asymp. Sig.
Qual o seuinteresse
pela poltica
Kruskal Wallis Testa.
Grouping Variable: Idadeb.
Interpretao: A mdia das ordenaes (Mean Rank) mais elevada nos que tm entre 31 e 50 anos,sendo este escalo, por conseguinte, que refere ter mais interesse pela poltica, enquanto os maisvelhos so os que revelam menos interesse. As diferenas so estatisticamente significativas (K-W(3)=36,088;p=0,000).
7/21/2019 Manual Amostragem Introduo SPSS
49/79
49
3.2.3. Testes paramtricos (procedimento Compare Means)
3.2.3.1. Duas amostras emparelhadas (t de Student para amostras
emparelhadas)
Exemplo: Pretende-se testar se a mdia da confiana social (confsoc) idntica, ou no, mdia
da confiana institucional (confinst).
O procedimento consiste na realizao do teste paramtrico para duas amostrasemparelhadas (Paired-Samples T-Test)16.
O resultado o seguinte:
Paired Samples Statistics
4.313 1319 1.7165 .0473
4.087 1319 1.7606 .0485
ndice sinttico deConfiana social
ndice sinttico deConfiana institucional
Pair 1Mean N Std. Deviation
Std. ErrorMean
Paired Samples Correlations
1319 .310 .000
ndice sinttico deConfiana social &ndice sinttico deConfiana institucional
Pair 1N Correlation Sig.
Paired Samples Test
.225 2.0428 .0562 .115 .336 4.009 1318 .000ndice sinttico deConfiana social -ndice sinttico deConfiana institucional
Pair 1
Mean Std. DeviationStd. Error
Mean Lower Upper
95%Confidence
Interval of theDifference
Paired Differences
t df Sig. (2-tailed)
Interpretao: A mdia da confiana social (4,313) ligeiramente superior mdia da confianainstitucional (4,087). A correlao entre as duas variveis mdia fraca (0,310) e estatisticamentesignificativa (p=0,000), sendo igualmente estatisticamente significativa a diferena entre as duasmdias (t (1318)=4,009;p=0,000).
16Consultar o Anexo 1.
7/21/2019 Manual Amostragem Introduo SPSS
50/79
50
3.2.3.2. Duas amostras independentes
(t de Student de independncia)
Exemplo: Pretende-se testar se h relao entre o sexo (f2) e a confiana social (confsoc).
O procedimento consiste na realizao do teste paramtrico para duas amostrasindependentes (Independent-Samples T-Test)17.
O resultado o seguinte:
Group Statistics
612 4.412 1.7476 .0706
868 4.248 1.7442 .0592
SexoMasculino
Feminino
ndice sinttico deConfiana social
N Mean Std. Deviation
Std. Error
Mean
Independent Samples Test
.182 .669 1.781 1478 .075 .164 .0921 -.0167 .3448
1.780 1313.926 .075 .164 .0922 -.0167 .3449
Equal variances assumed
Equal variances notassumed
ndice sinttico deConfiana social
F Sig.
Levene's Testfor Equality of
Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95%Confidence
Interval of theDifference
t-test for Equality of Means
Interpretao: Os homens (4,412) revelam mais confiana social que as mulheres (4,248)18,embora a diferena no seja estatisticamente significativa, (t (1480)=1,808;p> 0,05).
17Consultar o Anexo 1.18O ndice de confiana social varia entre 0=nenhuma confiana e 10=toda a confiana.
7/21/2019 Manual Amostragem Introduo SPSS
51/79
51
3.2.3.3. k amostras independentes (Anlise de Varincia Simples Paramtrica -ANOVA)
Exemplo: Pretende-se testar se h relao entre a idade (idade2) e a confiana social (confsoc).
O procedimento consiste na realizao da Anlise de Varincia Simples Paramtrica(One-way Anova)19.
O resultado o seguinte:
Descriptives
ndice sinttico de Confiana social
338 4.722 1.5585 .0848 4.555 4.889 .0 9.3
497 4.058 1.6747 .0751 3.911 4.206 .0 9.3
312 4.068 1.8340 .1038 3.864 4.273 .0 10.0
333 4.519 1.8500 .1014 4.319 4.718 .0 10.0
1480 4.316 1.7469 .0454 4.226 4.405 .0 10.0
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
N Mean Std. Deviation Std. Error Lower Bound Upper Bound
95% Confidence Interval forMean
Minimum Maximum
Test of Homogeneity of Variances
ndice sinttico de Confiana social
4.050 3 1476 .007
LeveneStatistic df1 df2 Sig.
ANOVA
ndice sinttico de Confiana social
121.466 3 40.489 13.607 .000
4391.954 1476 2.976
4513.420 1479
Between Groups
Within Groups
Total
Sum ofSquares df Mean Square F Sig.
19Consultar o Anexo 1.
7/21/2019 Manual Amostragem Introduo SPSS
52/79
52
Interpretao: So os mais novos (4,722), seguidos dos mais velhos (4,519) que mais confiam.Os escales intermdios 31-50 anos (4,058) e 51-65 anos ( (4,068) confiam um pouco menos. Asdiferenas so estatisticamente significativas (F (3)=13,787;p=0,000).
Nota: sendo as diferenas estatisticamente significativas, importa saber quais os grupos quediferem uns dos outros. Para o efeito realiza-se um teste posteriori (Post Hoc). O SPSSdisponibiliza vrios testes para este fim, sendo os mais utilizados, o teste de Scheffe20, no caso deas varincias serem iguais, e o teste Games-Howellno caso de serem diferentes.
Neste caso, uma vez que se rejeita a hiptese de as varincias serem iguais (p=0,007), vamossolicitar o teste Games-Howell:
O resultado o seguinte:
Multiple Comparisons
Dependent Variable: ndice sinttico de Confiana social
Games-Howell
.664* .1133 .000 .372 .955
.654* .1340 .000 .308 .999
.203 .1321 .415 -.137 .544
-.664* .1133 .000 -.955 -.372
-.010 .1282 1.000 -.340 .320
-.460* .1262 .002 -.785 -.135-.654* .1340 .000 -.999 -.308
.010 .1282 1.000 -.320 .340
-.450* .1451 .011 -.824 -.076
-.203 .1321 .415 -.544 .137
.460* .1262 .002 .135 .785
.450* .1451 .011 .076 .824
(J) IdadeAt 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anosAt 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
(I) IdadeAt 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
MeanDifference (I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
20Que tambm o mais conservador,
7/21/2019 Manual Amostragem Introduo SPSS
53/79
53
Interpretao: os grupos que diferem estatisticamente entre si esto assinalados com um *. Oquadro seguinte sintetiza as diferenas significativas entre os quatro escales etrios
At 30 anos 31-50 anos 51-65 anos > 65 anosAt 30 anos X X31-50 anos X X51-65 anos X X> 65 anos X X
3.2.4. Correlao linear simples
A correlao linear simples permite obter uma medida (coeficiente de correlao r de Pearson)atravs da qual se determina a fora ou intensidade de uma associao linear entre duas ou maisvariveis quantitativas ou tratadas como tal (escalas tipoLikert).
O coeficiente de correlao varia entre 1 e 121e deve ser interpretado da seguinte forma:0: ausncia de correlao;+/- ]0 0,25]: correlao muito fraca;+/- ]0,25 0,40] correlao fraca;+/- ]0,40 0,60] correlao mdia;+/- ]0,60 0,75] correlao mdia forte;+/- ]0,75 0,90] correlao forte;+/- ]0,90 1[ correlao muito forte;+/- 1 correlao perfeita
Exemplo: Correlao entre as variveis satisfao com a vida (b29), com a economia (b30), com oGoverno (b31), com a democracia (b32), com a educao (b33) e com os servios desade (b34):
21O sinal significa uma correlao negativa e a ausncia de sinal uma correlao positiva.
7/21/2019 Manual Amostragem Introduo SPSS
54/79
54
O resultado o seguinte:
Correlations
.339**
.000
1441
.280** .578**
.000 .000
1413 1392
.348** .403** .507**
.000 .000 .000
1371 1353 1339
.205** .361** .289** .300**
.000 .000 .000 .000
1429 1389 1367 1338
.195** .396** .340** .294** .537**
.000 .000 .000 .000 .000
1489 1440 1412 1370 1433
Pearson Correlation
Sig. (2-tailed)N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Satisfao com a
vida em geral
Economia
Governo
Democracia
Educao
Servios de Sade
Satisfaocom a vidaem geral Economia Governo Democracia Educao
Serviosde Sade
Correlation is significant at the 0.01 level (2-tailed).**.
Interpretao: as correlaes so positivas e significativas entre todas as variveis ; (p=0,000),sendo a menor entre a satisfao com a vida e com a educao (0,209e a maior entre a satisfaocom o Governo e com a economia (0,577
7/21/2019 Manual Amostragem Introduo SPSS
55/79
55
3.3. Modelos de previso3.3.1. Anlise de Regresso Simples
A regresso linear, como referem Bryman e Cramer, um poderoso instrumento para resumir anatureza da associao entre variveis e para fazer previses acerca dos valores da varivel
dependente.22
Na regresso linear simples, o objectivo sintetizar a associao entre duas variveis(independente e dependente), produzindo uma linha (recta de regresso) que se aproxime dosdados recolhidos. Ou seja, prever Y (varivel dependente) a partir de X (varivel independente).
Exemplo: pretende-se saber em que medida que a confiana social (confsoc) varivelindependente explica a confiana institucional (confinst) varivel dependente.
O procedimento consiste na realizao da Anlise de regresso linear simples entre asduas variveis:
22Alan Bryman e Duncan Cramer, op.cit.: 212
7/21/2019 Manual Amostragem Introduo SPSS
56/79
56
O resultado o seguinte:
Model Summary
.310a .096 .095 1.6746
Model
1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), ndice sinttico de Confianasocial
a.
ANOVAb
392.354 1 392.354 139.912 .000a
3693.263 1317 2.804
4085.617 1318
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), ndice sinttico de Confiana sociala.
Dependent Variable: ndice sinttico de Confiana institucionalb.
Coefficients a
2.716 .125 21.778 .000
.318 .027 .310 11.828 .000
(Constant)
ndice sinttico deConfiana social
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: ndice sinttico de Confiana institucionala.
Interpretao: A correlao entre as variveis fraca (R=0,310) e o coeficiente de determinao
muito fraco (R2=0,096)23. Ou seja, apenas 9,6% da variao da confiana institucional variveldependente explicada pela variao da confiana social varivel independente.
O teste F (quadro Anova) d-nos informao sobre a adequabilidade do modelo, testando ahiptese do coeficiente de determinao R2 ser 0 na populao. Neste caso (F (1)=141,178;
p=0,000), rejeita-se a hiptese de isso acontecer.
Os testes t (no quadro dos Coefficients), testam a nulidade dos coeficientes. No primeiro caso(t=115,605;p=0,000) testa a probabilidade de a constante (recta de regresso na origem) ser 0, eno segundo caso testa a probabilidade do coeficiente de regresso ser 0.A recta da regresso24, neste caso, a seguinte: Confiana institucional = 2,716 + 0,318 confianasocial.
23O coeficiente de determinao quantifica a percentagem de variao da varivel dependentes que explicada pela
variao da varivel independente.24A equao simplificada da recta da regresso a seguinte: Yi= 0+ 1Xi, em que Yi a varivel dependente, 0 aordenada na origem, 1 o coeficiente de regresso e Xi a varivel independente.
7/21/2019 Manual Amostragem Introduo SPSS
57/79
57
3.3.2. Anlise de Regresso Mltipla
A regresso, como referem Bryman e Cramer, um poderoso instrumento para resumir anatureza da associao entre variveis e para fazer previses acerca dos valores da varivel
dependente.
25
No nosso exemplo vamos usar a anlise de regresso mltipla em concreto a linear paramodelar a relao entre as variveis independentes e a varivel dependente26.
Exemplo: com base nos dados do ESS, pretende-se saber se os nveis de satisfao com o estadoda Economiaportuguesa(b30), com a forma como o Governotem governado(b31),com a qualidade da Democracia (b32), com o estado da Educao (b33) e com osServios de Sade (b33) so, ou no, predictores da satisfao com a vida em geral(b29):
Varivel dependente
Variveis independentes(b30, b31, b32, b33 e b34)
Mtodo: Stepwise(Neste mtodo entram no modeloapenas as variveis independentescom significncia estatstica, porordem de importncia.)Nota: habitual usar-se o mtodoENTER quando se pretende
testar um modelo e o mtodoStepwise em contextosexploratrios, como o caso.
Procedimentos seleccionados:
Informao sobre a significnciaestatstica da mudana deR2;
Informao sobremulticolinearidade;
Intervalo de confiana para cadaum dos coeficientes de regresso
Resultado:
25Bryman, A. e D. Cramer,Anlise de Dados em Ciencias Sociais, Oeiras, Celta, 2003.26
Quando se associa s variveis o estatuto de independentes e dependente pretende-se analisar mais do que aassociao entre elas (entenda-se variao conjunta), descrever e explicar uma relao de dependencia que deverser tericamente fundamentada.
7/21/2019 Manual Amostragem Introduo SPSS
58/79
58
Variables Entered/Removed a
Democracia .Stepwise (Criteria: Probability-of-F-to-enter= .100).
Economia .
Stepwise (Criteria: Probability-of-F-to-enter
= .100).
Model1
2
VariablesEntered
VariablesRemoved Method
Dependent Variable: Satisfao com a vida em gerala.
Variveis queentraram nosmodelos
ANOVAc
760.940 1 760.940 174.812 .000a
5610.899 1289 4.353
6371.839 1290
1051.123 2 525.562 127.224 .000b
5320.716 1288 4.131
6371.839 1290
Regression
Residual
Total
Regression
Residual
Total
Model1
2
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Democraciaa.
Predictors: (Constant), Democracia, Economiab.Dependent Variable: Satisfao com a vida em geralc.
O objectivo do teste F verificar se a varivelindependente influencia avarivel dependente nouniverso. O que equivale adetectar se o modeloajustado ou nosignificativo.Permite inferir sobre aadequabilidade do modelo
linear para explicar a relaoentre as duas variveis.
Model Summary
.346a .119 .119 2.086 .119 174.812 1 1289 .000
.406b .165 .164 2.032 .046 70.245 1 1288 .000
Model1
2
R R SquareAdjustedR Square
Std. Error ofthe Estimate
R SquareChange F Change df1 df2 Sig. F Change
Change Statistics
Predictors: (Constant), Democraciaa.
Predictors: (Constant), Democracia, Economiab.
Coeficiente de correlaomltipla em mdulo % de variao da satisfaocom a vida em geral explicadapelas variveis independentesque entraram no modeloNota: Em modelos com mas do que 1varivel independente deve interprtar-se o R2ajustado
Contributo das variveisindependentes para amudana verificada noR2;
Teste F erespectivasignificnciaestatstica
Coefficientsa
4.221 .133 31.764 .000 3.960 4.481
.350 .026 .346 13.222 .000 .298 .402 1.000 1.000
3.841 .137 28.013 .000 3.572 4.110.254 .028 .251 9.002 .000 .199 .309 .835 1.197
.276 .033 .234 8.381 .000 .212 .341 .835 1.197
(Constant)
Democracia
Economia
(Constant)Democracia
Economia
Model1
2
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval forB
Tolerance VIF
CollinearityStatistics
Dependent Variable: Satisfao com a vida em gerala.
Coeficientes de regresso standardizados e nostandardizados que permitem escrever a equao darecta:Satisfao com a vida = 3,841 + 0,254 satisfao com ademocracia + 0,276 satisfao com a economia.
Quando a tolerncia baixa, a correlaomltipla elevada e existe a possibilidade demulticolinearidade. Com estes valores, aprobabilidade de isso acontecer baixa.Varia entre [0, 1] e quanto mais perto de 0 maiorser a multicolinearidade entre certa varivelindependente e as outras variveis independentes.
7/21/2019 Manual Amostragem Introduo SPSS
59/79
59
3.4. Anlise de dados multivariada3.4.1. Anlise das Componentes Principais
A Anlise das Componentes Principais um dos mtodos de reduo de dados mais comum no
marketing e em pesquisas de mercado. uma tcnica de anlise exploratria multivariada quetransforma um conjunto de variveis correlacionadas entre si num conjunto menor de variveisindependentes, combinaes lineares das variveis originais, designadas por componentes
principais27. No essencial, o seu objectivo identificar novas variveis, em nmero menor que oconjunto inicial, mas sem perda significativa da informao contida neste conjunto28.
No nosso exemplo, pretendemos identificar as componentes principais latentes nos 8indicadores relativos s atitudes face imigrao (d10 + d11 + d12 +d13 + d14 +d15 + d16 +
d17).
Vamos comear por solicitar uma ACP com a extraco das componentes por defeito (critrio de
Kaiser: valor prprio das componentes a 1).
Seleco dasvariveis;
Kaiser-Meyer-Olkin: quantificao nvel de intercorrelaes entre
as variveis; Testa a hiptese de a matriz decorrelaes na populao ser amatriz identidade.
27
Moroco, J.Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo, 2003: 231.28Reis, E., Anlise factorial das componentes principais: um mtodo de reduzir sem perder informao, LisboaGiesta/Iscte, 1990.
7/21/2019 Manual Amostragem Introduo SPSS
60/79
60
Critrio de Kaiser deextraco das componentesque o SPSS usa por defeito.So extradas ascomponentes com valores
prprias superiores a 1.Cada componente devecontribuir para a varincia,como se de uma varivel deinput se tratasse.
Rotao das componentes erespectiva matriz.
Nota: tem o objectivo de ajudar ainterpretar as componentes
Ordena a matriz rodada por ordemdecrescente da contribuio de
cada varivel para a componente;
Adequabilidade da ACP:
KMO and Bartl ett's Test
.812
3474.721
28
.000
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Approx. Chi-Square
df
Sig.
Bartlett's Test ofSphericity
KMO Qualidade da ACP1 0,9 Muito boa
0,8 0,9 Boa
0,7 0,8 Mdia
0,6 0,7 Razovel
0,5 0,6 M
>0,5 Inaceitvel
De acordo com os resultados da estatstica KMO (0,812) e do teste de esfericidade de Bartlett(p=0,000), a adequabilidade da ACP boa.
7/21/2019 Manual Amostragem Introduo SPSS
61/79
61
Total Variance Explained
3.518 43.975 43.975 3.518 43.975 43.975 3.007 37.587 37.587
1.283 16.043 60.018 1.283 16.043 60.018 1.795 22.432 60.018
.978 12.230 72.248
.539 6.739 78.987
.493 6.165 85.153
.419 5.244 90.396
.391 4.885 95.282
.377 4.718 100.000
Component1
2
3
4
56
7
8
Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
Initial Eigenvalues Extract ion Sums of Squared Loadings Rotation Sums of Squared Loadings
Extraction Method: Principal Component Analysis.
Como podemos observar, por defeito foram extradas duas componentes, que explicam cerca de60% da varincia total.
Verificando-se que a terceira componente tem uma valor prprio prximo de 1 (0,984) e queaumenta a varincia explicada em 12,3%, vamos forar a sua extraco e gravar as trs
componentes extradas como novas variveis:
Cria novas variveis compostas pelosscores factoriais das componentesextradas.
Os resultados so os seguintes:
Descriptive Statistics
6.11 2.527 1330
6.44 2.407 1330
6.01 2.615 1330
3.77 2.906 1330
2.82 2.825 1330
6.77 2.812 1330
7.45 2.247 13307.07 2.448 1330
Ter boas qualificaes acadmicas
Ter familiares prximos a viver c
Saber falar a lngua oficial do pas
Ter formao crist
Ser branco
Ser rico
Ter qualificaes profissionais de que o pas precisaQuerer adaptar-se ao mesmo modo de vida do pas
MeanStd.
DeviationAnalysis
N KMO and Bartlett's Test
.812
3474.721
28
.000
Kaiser-Meyer-Olkin Measure of SamplingAdequacy.
Approx. Chi-Square
df
Sig.
Bartlett's Test ofSphericity
7/21/2019 Manual Amostragem Introduo SPSS
62/79
62
Communalities
1.000 .590
1.000 .788
1.000 .719
1.000 .756
1.000 .786
1.000 .7221.000 .749
1.000 .669
Ter boas qualificaes acadmicas
Ter familiares prximos a viver c
Saber falar a lngua oficial do pas
Ter formao crist
Ser branco
Ser ricoTer qualificaes profissionais de que o pas precisa
Querer adaptar-se ao mesmo modo de vida do pas
Initial Extraction
Extraction Method: Principal Component Analysis.
As Comunalidadesrepresentam aproporo de varincia da varivelexplicada pelas componentes.Variveis com comunalidadesreduzidas (0,3 ou inferior) so
pouco explicadas pelascomponentes e contribuem pouco
para a sua definio.
Total Variance Explained
3.518 43.975 43.975 3.518 43.975 43.975 2.152 26.898 26.898
1.283 16.043 60.018 1.283 16.043 60.018 1.951 24.389 51.287
.978 12.230 72.248 .978 12.230 72.248 1.677 20.961 72.248
.539 6.739 78.987
.493 6.165 85.153
.419 5.244 90.396
.391 4.885 95.282
.377 4.718 100.000
Component1
2
3
4
5
6
78
Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
Initial Eigenvalues Extract ion Sums of Squared Loadings Rotat ion Sums of Squared Loadings
Extraction Method: Principal Component Analysis.
Rotated Component Matrixa
.785 .361 -.053
.775 .244 .089
.771 -.014 .358
.110 .880 .047
.260 .741 .319
.487 .587 .090
.124 .011 .878
.094 .305 .809
Ter qualificaes profissionais de que o pas precisa
Querer adaptar-se ao mesmo modo de vida do pas
Ser rico
Ter familiares prximos a viver c
Saber falar a lngua oficial do pas
Ter boas qualificaes acadmicas
Ser branco
Ter formao crist
1 2 3
Component
Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.
Rotation converged in 4 iterations.a.
Foram extradas 3 componentes (factores), que explicam 72,25% da varincia total.
A matriz rodada29
ajuda-nos a identificar e a designar as componentes: Componente 1: recursos profissionais e econmicos; Componente 2: facilidades de integrao; Componente 3: caractersticas raciais e religiosas. Caracterizao social das trs Componentes Principais
29O SPSS utiliza vrias formas de rotao, sendo a mais usada a rotao Varimax, de modo a permitir uma mais fcilinterpretao dos factores, pois torna os loadings elevados ainda mais elevados e os loadings baixos ainda maisbaixos. Para a interpretao das componentes consideram-se os loadings mais correlacionados com as mesmas.
Em geral, consideram-se bons os loadings maiores ou iguais a 0,5, por serem pelo menos responsveis por 25% davarincia. (cfr. Pestana e Gageiro, Anlise de Dados para as Cincias Sociais A complementaridade do SPSS,Lisboa, Slabo, 3 edio, 2003: 504.
7/21/2019 Manual Amostragem Introduo SPSS
63/79
63
Masculino
Feminino
Sexo
Recursos profissionais e econmicosFacilidades de integrao
Caractersticas raciais e religiosas
-0,05
0,00
0,05
m
dia
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Idade
Recursos profissionais e econmicosFacilidades de integrao
Caractersticas raciais e religiosas
-0,20
0,00
0,20
mdia
At 9 anos
10 - 12 anos> 12 anos
Escolaridade
Recursos profissionais e econmicosFacilidades de integrao
Caractersticas raciais e religiosas
-0,40
-0,30
-0,20
-0,10
0,00
0,10
mdia
Esquerda
CentroDireita
Au top os ic ion ament o po lt ico
Recursos profissionais e econmicosFacilidades de integrao
Caractersticas raciais e religiosas
-0,10
0,00
0,10
mdia
Anlise de Clusters
De acordo com Moroco,30 a anlise de Clusters uma tcnica multivariada que no possuislidos fundamentos tericos e que procura agrupar objectos mais ou menos homogneos segundocritrios mais ou menos heursticos.
A classificao dos sujeitos em cada um dos clusters , regra geral, mais rigorosa nos mtodosno-hierrquicos do que nos hierrquicos, podendo a validade das solues obtidas com osmtodos hierrquicos segundo Elizabeth Reis tornar-se bastante limitada. Alguns autores
propem, por isso, a utilizao de mtodos no-hierrquicos de optimizao que permitam apartio dos indivduos num nmero pr definido de grupos.
A questo de determinao do nmero de grupos pr definido , no entanto, um dos principaisproblemas a resolver numa anlise de clusters. Uma forma simples a anlise do Dendrograma
30Cfr. Reis, Elizabeth,A Anlise de Clusters e as Aplicaes s Cncias Empresariais: Uma Viso Crtica da Teoria
dos Grupos Estratgicos, in Elizabeth Reis e Manuel Alberto M. Ferreira (eds.) Temas em Mtodos Quantitativos1, Lisboa, Slabo, 2000: 206-238 e Moroco, Joo, Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo,2003
7/21/2019 Manual Amostragem Introduo SPSS
64/79
64
que, no entanto, s est disponvel no mtodo hierrquico, resumindo-se a sua utilidade apenas emamostras de pequena dimenso. Quando no esse o caso, ou se se pretende usar um mtodo no-hierrquico, poder-se- utilizar primeiro um mtodo hierrquico aglomerativo para determinaodo nmero de grupos e depois utilizar um mtodo no-hierrquico para optimizar a soluoencontrada.
Uma forma de obviar limitao do dendrograma na determinao do nmero de grupos, proceder representao grfica dos coeficientes de aglomerao mais elevados31, que denotam,por conseguinte, maiores distncias, onde a escolha ptima do nmero de grupos coincidir comuma marcada horizontalidade da curva32.
3.4.2.1. Anlise hierrquica de Clusters (Hierarquical Cluster)
Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos s atitudesface imigrao (d10 +d11 +d12 +d13 +d14 +d15 +d16 +d17)
Seleco das variveis; Para obter os coeficientes de
aglomerao Desactivar Plots, pois o
Dendrogramaseria demasiadoextenso para poder serinterpretado.
Escolha do MtodoBetwen-groups linkage(Distncia mdia entre grupos): adistncia do 1 cluster aos restantes objectos a mdia dasdistncias de cada um dos elementos que constituem ocluster a cada um dos restantes objectos. Melhor performance com dados com grande disperso; Influenciado por outliers; Tendncia para produzir clusters com varincias
homogneas.Within-groups linkage: Este mtodo semelhante Distncia mdia entre grupos mas os clusters so unidosde modo a que a variabilidade dentro dos grupos sejamnima.
Nearest Neighbor(Vizinho mais prximo): a distncia do1 cluster aos restantes objectos, a menor das distnciasde cada um dos elementos que constituem o cluster a cadaum dos restantes objectos. Tendncia para formar clusters alongados; Menos influenciado por outliers;Furthest Neighbor(Vizinho mais distante): a distncia do1 cluster aos restantes objectos, a maior das distnciasde cada um dos elementos que constituem o cluster a cadaum dos restantes objectos. Menos influenciado por outliers;
31
Estes coeficientes so o valor numrico para o qual vrios indivduos ou grupos se unem para formarem um novogrupo e so disponibilizados pelo SPSS no mtodo hierrquico (Aglomeration Schedule).32Reis, op.cit.
7/21/2019 Manual Amostragem Introduo SPSS
65/79
65
Escolhemos o Wards method, pois, sendo umdos mtodos mais usado, tem tendncia paraconstituir grupos com dimenses idnticas.
Centroid clustering: a distncia entre dois grupos adiferena entre as suas mdias para todas as variveis. Pior performance com dados com grande disperso Menos influenciado por outliers;Median clustering(Distncia mediana): A distncia entredois objectos a mediana das distncias de cada um doselementos que constituem o cluster a cada um dos restantesobjectos.
Wards method: optimiza a varincia mnima dentro dosgrupos, agrupando os objectos que provoquem umaumento mnimo da soma dos quadrados dos erros. Boa performance com dados com grande disperso; Influenciado por outliers Tendncia para produzir clusters com dimenso
semelhante.
Para a identificao do n de clusters, vamos representar graficamente (em Excel) as diferenasentre os 30 coeficientes de aglomerao com valor mais elevado, produzidos pelo SPSS(Agglomeration schedule).
7/21/2019 Manual Amostragem Introduo SPSS
66/79
66
Optamos por uma soluo de 4 clusters.33
Deveremos agora repetir os procedimentos anteriores no SPSS, desactivar Statistics34e solicitar aopo Save, assinalando o n de clusters que pretendemos:
A varivel CLU4-1 (primeira soluo com 4 clusters) acrescentou-se base de dados, tendo sidocompletada com os respectivos label.
O n de elementos em cada cluster o seguinte:
CLU4_1 Clusters d10 a d17 (Ward Method)
498 33.0 37.4 37.4
299 19.8 22.5 59.9
423 28.0 31.8 91.7
110 7.3 8.3 100.0
1330 88.0 100.0
181 12.0
1511 100.0
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Total
Valid
SystemMissing
Total
Frequency Percent Valid PercentCumulative
Percent
33Pois so os que apresentam maior distncia entre si. No entanto, seria sempre possvel ensaiar solues com mais
clusters. No essencial, mais clusters significam mais homogeneidade entre os seus elementos e menos clustersmenos homogeneidade.34Uma vez que j no necessitamos dos coeficientes de aglomerao.
7/21/2019 Manual Amostragem Introduo SPSS
67/79
67
3.4.2.2. Anlise no-hierrquica de Clusters - Mtodo de optimizao
(K-Means Cluster)
Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos s atitudes
face imigrao (d10 +d11 +d12 +d13 +d14 +d15 +d16 +d17)
1.Seleco dasvariveis;
2.Indicao do n deClusters
pretendidos (vamosindicar 4, de acordocom o processoanterior)
3.Criao de umanova varivel queregista a pertenade cada observaoao clusterrespectivo
A varivel QCL_1 (primeira soluo com 4 clusters) acrescentou-se base de dados, tendo sido
completada com os respectivos label.
O resultado o seguinte:
QCL_1 Clusters d10 a d17 (K-Means)
334 22.1 25.1 25.1459 30.4 34.5 59.6
324 21.4 24.4 84.0
213 14.1 16.0 100.0
1330 88.0 100.0
181 12.0
1511 100.0
Cluster 1Cluster 2
Cluster 3
Cluster 4
Total
Valid
SystemMissing
Total
Frequency Percent Valid PercentCumulative
Percent
7/21/2019 Manual Amostragem Introduo SPSS
68/79
68
3.4.3. Articulao entre a Anlise das Componentes Principais e a
Anlise de Clusters
Para este exemplo interessa saber, no entanto, que a anlise de clusters uma tcnica
multivariada que no possui slidos fundamentos tericos e que procura agrupar objectos mais oumenos homogneos segundo critrios mais ou menos heursticos35.
Exemplo: Pretende-se criar trs clusters (grupos homogneos) com base nas trs componentesprincipais obtidas no exerccio anterior.
Trata-se de um mtodo de classificao (classifica indivduos), cujo procedimento, que vai serdescrito detalhadamente no captulo 5, o seguinte:
a) Criao dos clusters
Acrescentou-se base de dados uma nova varivel com 3 categorias, que designmos de Cluster 1,Cluster 2 e Cluster 3, que agrupa os indivduos com valores semelhantes nas trs Componentes36
35
Moroco, J.Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo, 2003.36Nota: como se torna evidente, os valores so mais ou menos semelhantes quantos mais ou menos clusters criarmos.Ou seja, mais clusters significa mais homogeneidade entre os clusters.
7/21/2019 Manual Amostragem Introduo SPSS
69/79
69
O n de elementos em cada cluster o seguinte:
Clusters Fac1_1+Fac1_2+Fac1_3 (Ward Method)
480 31.8 36.1 36.1
624 41.3 46.9 83.0
226 15.0 17.0 100.0
1330 88.0 100.0
181 12.0
1511 100.0
Cluster 1
Cluster 2
Cluster 3
Total
Valid
SystemMissing
Total
Frequency Percent Valid PercentCumulative
Percent
b) Caracterizao dos clusters segundo as variveis de input
Cluster 1
Cluster 2
Cluster 3
Recursos profissionais e econmicosFacilidades de integrao
Caractersticas raciais e religiosas
-1.50
-1.00
-0.50
0.00
0.50
1.00
(Mdias)
Interpretao:
Cluster 1: d importncia abaixo da mdia aos recursos profissionais e econmicos e scaractersticas raciais e religiosas e acima da mdia s facilidades de integrao;
Cluster 2: d importncia acima da mdia aos recursos profissionais e econmicos e scaractersticas raciais e religiosas e mdia s facilidades de integrao;
Cluster 3: d importncia mdia aos recursos profissionais e econmicos e abaixo damdia s facilidades de integrao e s caractersticas raciais e religiosas.
7/21/2019 Manual Amostragem Introduo SPSS
70/79
70
c) Caracterizao social dos clusters
211 44.0 252 40.4 106 46.9 569 42.8
269 56.0 372 59.6 120 53.1 761 57.2
480 100.0 624 100.0 226 100.0 1330 100.0148 30.8 117 18.8 51 22.6 316 23.8
179 37.3 197 31.6 93 41.2 469 35.3
88 18.3 147 23.6 44 19.5 279 21.0
65 13.5 163 26.1 38 16.8 266 20.0
480 100.0 624 100.0 226 100.0 1330 100.0
272 56.7 470 75.4 150 66.4 892 67.1
100 20.8 102 16.4 39 17.3 241 18.1
108 22.5 51 8.2 37 16.4 196 14.7
480 100.0 623 100.0 226 100.0 1329 100.0
111 27.3 117 22.5 47 27.6 275 25.1
211 52.0 265 50.9 89 52.4 565 51.5
84 20.7 139 26.7 34 20.0 257 23.4406 100.0 521 100.0 170 100.0 1097 100.0
Masculino
Feminino
Total
Sexo
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Idade
At 9 anos
10 - 12 anos
> 12 anos
Total
Anos deescolaridadeconcludos
Esquerda
Centro
DireitaTotal
Autoposic ionamento
poltico
N %
Cluster 1
N %
Cluster 2
N %
Cluster 3
N %
Total
d) Distribuio dos indivduos pelos clusters, segundo caractersticas scio-demogrficas
211 37.1 252 44.3 106 18.6 569 100.0
269 35.3 372 48.9 120 15.8 761 100.0
480 36.1 624 46.9 226 17.0 1330 100.0
148 46.8 117 37.0 51 16.1 316 100.0
179 38.2 197 42.0 93 19.8 469 100.0
88 31.5 147 52.7 44 15.8 279 100.0
65 24.4 163 61.3 38 14.3 266 100.0
480 36.1 624 46.9 226 17.0 1330 100.0
272 30.5 470 52.7 150 16.8 892 100.0
100 41.5 102 42.3 39 16.2 241 100.0
108 55.1 51 26.0 37 18.9 196 100.0
480 36.1 623 46.9 226 17.0 1329 100.0
111 40.4 117 42.5 47 17.1 275 100.0
211 37.3 265 46.9 89 15.8 565 100.0
84 32.7 139 54.1 34 13.2 257 100.0
406 37.0 521 47.5 170 15.5 1097 100.0
Masculino
Feminino
TotalSexo
At 30 anos
31 - 50 anos
51 - 65 anos
> 65 anos
Total
Idade
At 9 anos
10 - 12 anos
> 12 anos
Total
Anos deescolaridadeconcludos
Esquerda
Centro
Direita
Total
Autoposic ionamentopoltico
N %
Cluster 1
N %
Cluster 2
N %
Cluster 3
N %
Total
7/21/2019 Manual Amostragem Introduo SPSS
71/79
71
A avaliao deste captulo consiste na avaliao da participaonas aulas e da realizao dos exerccios que compem o seucontedo.
Aranaz, M. F. (2001), SPSS para Windows. Anlise Estadstico,Madrid, McGraw-Hill.
Bryman, A. e D. Cramer (2003), Anlise de Dados em Cincias
Sociais Introduo s Tcnicas Utilizando o SPSS paraWindows, Lisboa, Celta (3 edio). Moroco, J. (2003) Anlise Estatstica com utilizao do SPSS,
Lisboa, Edies Slabo, 3 edio. Pereira, A. (1999), SPSS-Guia Prtico de Utilizao, Anlise de Dados para Cincias
Sociais e Psicologia, Lisboa, Edies Slabo, 6 edio revista e corrigida. Pestana, M. H. e J. N. Gageiro (2000), Anlise de Dados para as Cincias Sociais A
Complementaridade do SPSS, Lisboa, Slabo, 2 edio revista e aumentada. Rada, Vidal Daz (2002), Tcnicas de Anlise Multivariante para Investigacin Social
e Comercial, Madrid, RA-MA. Reis, E., Anlise factorial das componentes principais: um mtodo de reduzir sem
perder informao, Lisboa Giesta/Iscte, 1990. Vaus, D (2004),Analysing Social Science Data, London, Sage Publications. Vinacua, B. V. (2002), Anlisis Estadstico con SPSS para Windows. Volumen I.
Estadstica bsica, Madrid, McGraw-Hill, 2 edicin. Vinacua, B. V. e J. C. M Canas (2002),Anlisis Estadstico con SPSS para Windows.
Volumen II. Estadstica multivariante, Madrid, McGraw-Hill, 2 edicin.
Avaliao
Referncias
7/21/2019 Manual Amostragem Introduo SPSS
72/79
72
ANEXO 1
Testes de inferncia estatstica mais uti lizados
em
Anlise de dados bivariada
7/21/2019 Manual Amostragem Introduo SPSS
73/79
7/21/2019 Manual Amostragem Introduo SPSS
74/79
7/21/2019 Manual Amostragem Introduo SPSS
75/79
ANEXO 2
European Social Survey(round 1 - 2002)
Questionrio adaptado
http://www.europeansocialsurvey.org/
7/21/2019 Manual Amostragem Introduo SPSS
76/79
76
7/21/2019 Manual Amostragem Introduo SPSS
77/79
77
7/21/2019 Manual Amostragem Introduo SPSS
78/79
78
7/21/2019 Manual Amostragem Introduo SPSS
79/79
Top Related