Post on 07-Jun-2015
description
81,9(56,'$'(�&$7Ï/,&$�'(�%5$6Ë/,$�352*5$0$�'(�3Ï6�*5$'8$d2�675,&72�6(168�(0�*(672�'2�
&21+(&,0(172�(�'$�7(&12/2*,$�'$�,1)250$d2��
6XSRUWH�j�'HFLVmR�SDUD�9LJLOkQFLD�(SLGHPLROyJLFD�EDVHDGR�HP�0RGHOR�3UHGLWLYR�GH�6XUWRV�GH�'HQJXH�XWLOL]DQGR�5HGHV�1HXUDLV�
$UWLILFLDLV��
Giovanni Gondim de Castro �
BRASÍLIA
2005
Giovanni Gondim de Castro
6XSRUWH�j�'HFLVmR�SDUD�9LJLOkQFLD�(SLGHPLROyJLFD�EDVHDGR�HP�0RGHOR�3UHGLWLYR�GH�6XUWRV�GH�'HQJXH�XWLOL]DQGR�5HGHV�1HXUDLV�
$UWLILFLDLV�
Dissertação apresentada ao Programa de Pós-Graduação 6WULFWR�6HQVX� em Gestão do Conhecimento e da Tecnologia da Informação da Universidade Católica de Brasília, como requisito parcial para obtenção do grau de Mestre em gestão do conhecimento e da tecnologia da informação.
Orientador: PROF. DR. ROGÉRIO ALVARENGA Co-orientador: PROF. DR. HÉRCULES ANTÔNIO DO PRADO
BRASÍLIA
2005
'(',&$7Ï5,$
Aos dois Anjos (,Q�PHPRULDP) que, passando pela minha vida, iluminaram-na com a sua
presença e deixaram saudades profundas.
Adilson Roberto Moreira – 19/08/1963 a 11/10/2001 Larissa Carelli de Araújo – 01/02/1986 a 19/10/2001
$*5$'(&,0(1726
Ao Senhor Deus pela saúde, força, iluminação e imensa proteção, sem o qual nada é possível. Por me ter colocado em contato com pessoas fantásticas e por me agraciar com a
oportunidade de participar de algo tão belo, e que por vezes esquecemos tão facilmente o quão maravilhoso é encontrar amigos em um ambiente de conhecimento.
À minha família pela paciência e compreensão, nas horas em que tive que me afastar em
função dos trabalhos desta dissertação. E, em especial, aos meus pais, que sempre apoiaram, incentivaram e souberam passar aos filhos, valores de honestidade, paciência, perseverança e
fé. Ao meu irmão Rogério e à minha namorada Lenita Meireles, agradeço profundamente pelo carinho.
Aos orientadores Rogério Alvarenga e Hércules Antônio do Prado, o meu agradecimento pelo incentivo e apoio, sem os quais a realização desta dissertação não teria sido possível.
À Gleycione Gundim Dutra, o meu muito obrigado pelo carinho e amizade gastos com um
hóspede que esteve presente, diversas vezes, em sua residência.
À ‘Família Politec’ que, através de seus funcionários Hiraclis Nicolaidis Júnior, Nelson de Sousa e Silva Neto, Román Dario Cuattrin e Ricardo Ajax Dias Kosloski, me cativou, na
cidade de Brasília.
Às amigas e funcionárias da Universidade Católica de Brasília, Janina Silva e Georgiane Pessoa Alcoforado Jordão, por todo apoio e incentivo.
A todos os colegas da COMDATA e da Secretaria Municipal de Saúde, que me
auxiliaram, após a digitação de todas as tabelas, na conferência e validação dos dados.
Meus agradecimentos especiais ao Sr. Dr. Alaor Moacyr Dall'Antonia Júnior, pela autorização de doação dos parâmetros climáticos necessários, e aos meteorologistas do 10º
DISME, pelo auxílio na adaptação da escala anemométrica de %HDXIRUW� para esta dissertação.
Agradeço, também, ao Prof. Gercino Monteiro Filho, do Centro Integrado de Ensino, pela consultoria e revisão dos cálculos nesta dissertação.
'867�,1�7+(�:,1'3RHLUD�DR�YHQWR
I CLOSE MY EYES
Eu fecho os meus olhos
ONLY FOR A MOMENT AND THE MOMENT’S GONE
Somente por um momento e esse momento se vai
ALL MY DREAMS
Todos meus sonhos
PASS BEFORE MY EYES IN CURIOSITY
Passam diante dos meus olhos por curiosidade
DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND
Poeira ao vento, tudo o que somos é poeira ao vento
SAME OLD SONG
A mesma velha canção
JUST A DROP OF WATER IN A ENDLESS SEA
Apenas uma gota d’água em um mar sem fim
ALL WE DO
Todos nós
CRUMBLES TO THE GROUND AND WE REFUSE TO SEE
Esfarelamos no chão embora recusemos a ver
DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND
Poeira ao vento, tudo o que somos é poeira ao vento
DON´T HANG ON
Não se perca
NOTHING LAST FOREVER BUT THE EARTH AND SKY
Nada dura para sempre exceto o céu e a terra
IT SLIPS AWAY
Ela se vai
AND ALL YOUR MONEY WON´T ANOTHER MINUTE BY
E todo seu dinheiro não comprará outro minuto
DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND
Poeira ao vento, tudo o que somos é poeira ao vento
DUST IN THE WIND
Poeira ao vento
EVERYTHING IS DUST IN THE WIND
Tudo é poeira ao vento
GRUPO: KANSAS
I
5(6802�A Gestão da Vigilância Epidemiológica, para Dengue, pode ser realizada, através da inclusão de modelos preditivos que auxiliem ao gestor da área de saúde, na tomada de decisão, para o combate a epidemias (surtos). Com esse suporte, o tomador de decisões pode ter o apoio técnico necessário para designar seus limitados recursos humanos e financeiros, ao tratamento dos pacientes e ao combate ao vetor urbano brasileiro ($HGHV� DHJ\SWL) dessas doenças. Existem modelos relatados que alcançaram algum sucesso na predição, em áreas como a financeira e a epidemiológica. Nesta dissertação, utilizou-se Descoberta de Conhecimentos em Base de Dados com Mineração de Dados, para realizar um estudo de caso, na construção de um modelo de predição, baseado em séries temporais, para a cidade de Goiânia-Go, e para comparar os resultados obtidos nesse modelo, com os do Diagrama de Controle, que é a técnica atual utilizada no Brasil.
Foram utilizados os dados do Sistema de Informações de Agravos de Notificação (casos confirmados) e a média dos parâmetros climáticos (definida D SULRUL�de duas semanas), coletados pelo 10º Distrito de Meteorologia daquela cidade, no período de 01/01/2001 a 30/04/2004, por semana epidemiológica.
O uso das séries temporais se deve à possibilidade de previsões de novos estados, a partir da análise dos valores passados. Consistem em medidas ou observações, obtidas a partir de um fenômeno, e que são realizadas seqüencialmente, sob um intervalo de tempo.
As séries produzidas foram representadas na forma de redes neurais artificiais, tipo MLP – 0XOWL/D\HU� 3HUFHSWURQ, com algoritmo de aprendizado de retropropagação (EDFNSURSDJDWLRQ) e, nele, aplicada a técnica de janelamento. O modelo obtido possibilita a detecção prévia do início do surto, com margem de confiança satisfatória. Evidenciou-se a sazonalidade da série histórica de Dengue para o período, com valores, também, satisfatórios, que possibilitam e credenciam a aplicabilidade do modelo, na predição de surtos de Dengue, para a cidade de Goiânia-Go.
�3DODYUDV�&KDYH: Mineração de Dados; Predição; Séries Temporais; Janelamento; Dengue; Redes Neurais Artificiais.
II
�
$%675$&7�The management of epidemiological surveillance for Dengue or Yellow Fever can be performed by incorporating predictive models to help the health policy makers to take decisions concerning the control of epidemics (outbreaks). With this tool he may have the necessary technical support to allocate his limited human and financial resources to the patients care and/or the control of the Brazilian urban vector ($HGHV� DHJ\SWL) for these diseases. Models have been reported reaching some success in predicting financial and epidemiological fields. In our thesis we have used Knowledge Database Discovery, with datamining, using temporal series, in order to build up a predictive model for the city of Goiania - Goias in central Brazil to compare results obtained by the Control Diagram that is the standard technique applied in epidemiological studies in Brazil.
We used data from Sistema de Informações de Agravos de Notificação (confirmed cases) and the mean of climatic parameters (defined a priori in two weeks) colleted by 10º Distrito de Meteorologia of this city, from the period of 01/01/2001 to 30/04/2004, by epidemiological week. All confirmed cases refer to Dengue since there was no report of Yellow Fever during the study period.
The use of temporal series aims to predict new values taking into account the analyses of previous values. The temporal series are measures or observations obtained from phenomena and which are sequentially produced in a time interval.
The temporal series were represented in artificial neural networks format such as MLP – MultiLayer Perceptron as a EDFNSURSDJDWLRQ learning algorithmic using the windowing technique. The model obtained made possible an early warning of outbreak with reliable confidence limit. There was evidence of the seasonality of the Dengue temporal series, for the period, with satisfactory values that made possible to recommend this predictive model for Dengue outbreaks in municipality of Goiania-Goias.
.H\�:RUGV� Datamining; prediction; forecasting; series; windowing; dengue; artificial neural network
�
III
680È5,2�5(6802 �������������������������������������������������������������������������������������������������������������������������������������� , $%675$&7��������������������������������������������������������������������������������������������������������������������������������� ,, /,67$�'(�),*85$6���������������������������������������������������������������������������������������������������������������������9 /,67$�'(�48$'526 ����������������������������������������������������������������������������������������������������������������9,, /,67$�'(�48$'526 ����������������������������������������������������������������������������������������������������������������9,, /,67$�'(�7$%(/$6 ���������������������������������������������������������������������������������������������������������������9,,, /,67$�'(�*5È),&26 ���������������������������������������������������������������������������������������������������������������� ,; /,67$�'(�6,*/$6 �����������������������������������������������������������������������������������������������������������������������; /,67$�'(�$%5(9,$d®(6���������������������������������������������������������������������������������������������������������;,, � ,1752'8d2 �����������������������������������������������������������������������������������������������������������������������
1.1 EXPOSIÇÃO DO ASSUNTO.............................................................................................5 1.2 INTRODUÇÃO AO PROBLEMA........................................................................................5 1.3 DEFINIÇÃO DA PESQUISA.............................................................................................7 1.4 DELIMITAÇÃO DA PESQUISA........................................................................................7 1.5 JUSTIFICATIVA DA PESQUISA........................................................................................8 1.6 REFERENCIAL TEÓRICO................................................................................................8 1.7 OBJETIVOS...................................................................................................................9 ����� *HUDO �������������������������������������������������������������������������������������������������������������������� ����� (VSHFtILFRV ���������������������������������������������������������������������������������������������������������� 1.8 HIPÓTESE...................................................................................................................10 ����� +LSyWHVH�SULQFLSDO����������������������������������������������������������������������������������������������� ����� +LSyWHVHV�VHFXQGiULDV ���������������������������������������������������������������������������������������� 1.9 ORGANIZAÇÃO DO DOCUMENTO................................................................................11
� 5(9,62�'(�/,7(5$785$�������������������������������������������������������������������������������������������������� 2.1 DADOS, INFORMAÇÃO E CONHECIMENTO...................................................................12 2.2 GESTÃO DO CONHECIMENTO E TECNOLOGIA DA INFORMAÇÃO..................................14 2.3 SISTEMAS DE SUPORTE À DECISÃO ............................................................................16 ����� $X[tOLR�j�GHFLVmR�FRPSXWDFLRQDO ������������������������������������������������������������������������ 2.4 DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS .............................................17 ����� ,QWURGXomR����������������������������������������������������������������������������������������������������������� ����� ÈUHDV�GH�$SOLFDomR ��������������������������������������������������������������������������������������������� 2.5 MINERAÇÃO DE DADOS .............................................................................................20 ����� 7pFQLFDV�SUHGLWLYDV�GD�0' ��������������������������������������������������������������������������������� ����� 3UREOHPDV��GHVDILRV��YDQWDJHQV��iUHDV�GH�DSOLFDomR�H�WpFQLFDV�GD�0' ������������ 2.6 CRISP-DM PARA MINERAÇÃO DOS DADOS................................................................29 2.7 REDES NEURAIS ARTIFICIAIS.......................................................................................31 ����� ,QWURGXomR����������������������������������������������������������������������������������������������������������� ����� &DUDFWHUtVWLFDV�H�DUTXLWHWXUDV�GDV�51$V������������������������������������������������������������ ����� 5HGHV�0XOWL/D\HU�3HUFHSWURQ ����������������������������������������������������������������������������� 2.8 GESTÃO DO CONHECIMENTO SOBRE OS EFEITOS DO CLIMA NA SAÚDE HUMANA.........40 2.9 O MODELO DE NOTIFICAÇÃO BRASILEIRO...................................................................43 ����� 'LDJUDPDV�GH�FRQWUROH ��������������������������������������������������������������������������������������� 2.10 DENGUE E SEU VETOR................................................................................................45 ������ 'HQJXH ���������������������������������������������������������������������������������������������������������������� 2.11 INQUÉRITOS SOROLÓGICOS.........................................................................................50 2.12 ESTUDOS RELATADOS................................................................................................52
IV
������ (VWXGR�DSUHVHQWDGR�QD�66%'0¶����������������������������������������������������������������������� ������ 0RGHOR�3DQ�(XURSHX�GH�6D~GH �������������������������������������������������������������������������� ������ 0RGHOR�$OHPmR�GH�6D~GH������������������������������������������������������������������������������������ ������ 2XWURV�PRGHORV�GH�SUHGLomR�H�WUDEDOKRV�HQFRQWUDGRV ��������������������������������������� ������ 7UDEDOKRV�HQFRQWUDGRV�UHODWLYRV�DR�%UDVLO �������������������������������������������������������� ������ 2XWUDV�SXEOLFDo}HV�UHIHUHQWHV�D�'HQJXH������������������������������������������������������������ ������ (VWXGRV�HSLGHPLROyJLFRV�HP�*RLkQLD����������������������������������������������������������������� � 0(72'2/2*,$�������������������������������������������������������������������������������������������������������������������
3.1 CARACTERIZAÇÃO DA PESQUISA................................................................................62 ����� &ODVVLILFDomR�GD�3HVTXLVD ���������������������������������������������������������������������������������� ����� 8QLYHUVR�GD�3HVTXLVD ����������������������������������������������������������������������������������������� 3.2 MATERIAL E MÉTODOS..............................................................................................63 ����� $ERUGDJHP�$GRWDGD ������������������������������������������������������������������������������������������� ����� 'HVFULomR�GR�PpWRGR�&5,63�'0����������������������������������������������������������������������� ����� &ROHWD�GH�'DGRV�������������������������������������������������������������������������������������������������� ����� 5HSUHVHQWDomR�GD�DQiOLVH�GRV�GDGRV ������������������������������������������������������������������ ����� $QiOLVH�GRV�JUiILFRV�H�UHVXOWDGRV�HQFRQWUDGRV�QD�SUHGLomR ������������������������������ 3.3 MODELO PROPOSTO...................................................................................................66 3.4 ENTENDIMENTO DO NEGÓCIO.....................................................................................68 ����� 2EMHWLYRV ������������������������������������������������������������������������������������������������������������� ����� $YDOLDomR�GRV�UHFXUVRV�DWXDLV ���������������������������������������������������������������������������� ����� 2EMHWLYRV�D�VHUHP�DOFDQoDGRV�SHOD�PLQHUDomR�GH�GDGRV ����������������������������������� 3.5 ENTENDIMENTO DOS DADOS......................................................................................72 ����� 'DGRV�,QLFLDLV ����������������������������������������������������������������������������������������������������� ����� 'HVFULomR�GRV�GDGRV ������������������������������������������������������������������������������������������� ����� ([SORUDomR�GRV�GDGRV����������������������������������������������������������������������������������������� ����� 4XDOLGDGH�GRV�GDGRV ������������������������������������������������������������������������������������������ ����� $VSHFWRV�GD�*&�QR�HQWHQGLPHQWR�GRV�GDGRV ����������������������������������������������������� 3.6 PREPARAÇÃO DOS DADOS........................................................................................101 3.7 MODELAGEM ...........................................................................................................102 3.8 APRESENTAÇÃO DOS RESULTADOS...........................................................................116
� $1È/,6(�'26�5(68/7$'26 ����������������������������������������������������������������������������������������������� � &21&/86®(6�(�68*(67®(6�3$5$�75$%$/+26�)878526�������������������������������������������������
5.1 CONSIDERAÇÕES FINAIS...........................................................................................121 5.2 DESTAQUES E CONTRIBUIÇÃO DA PESQUISA.............................................................121 5.3 SUGESTÕES PARA NOVOS TRABALHOS DE PESQUISA.................................................123
5()(5Ç1&,$6�%,%/,2*5È),&$6 ����������������������������������������������������������������������������������������������� */266È5,2��',&,21È5,2�'(�7(5026� ������������������������������������������������������������������������������������� $1(;2�$���62/,&,7$d2�'(�'2$d2�'(�'$'26�$2�6(&5(7È5,2�081,&,3$/�'(�6$Ò'(�'(�*2,Æ1,$���*2 ���������������������������������������������������������������������������������������������������������������������������� $1(;2�%���62/,&,7$d2�'(�'2$d2�'(�'$'26�$2�',5(725�35(6,'(17(�'$�&20'$7$��������������������������������������������������������������������������������������������������������������������������������������������������� $1(;2�&���62/,&,7$d2�'(�'2$d2�'(�'$'26�&/,0È7,&26�$2�0,1,67e5,2�'$�
$*5,&8/785$�(�'2�$%$67(&,0(172 ������������������������������������������������������������������������������������� $1(;2�'���&$/(1'È5,2�(3,'(0,2/Ï*,&2�'(������$�������������������������������������������������������� $1(;2�(���(6&$/$�$1(020e75,&$�%($8)257�$'$37$'$ �������������������������������������������������
V
/,67$�'(�),*85$6�FIGURA 1 - PROCESSO DE CONSTRUÇÃO DE UMA BASE DE REGRAS DE UMA REGIÃO ADAPTADA DE
AGRAWAL E PSAILA (1995, PP.1-2, COM ALTERAÇÕES)......................................................27 FIGURA 2 - REPRESENTAÇÃO DOS QUATRO NÍVEIS DA METODOLOGIA CRISP-DM (SPSS, 2000,
P.09, TRADUÇÃO NOSSA) ....................................................................................................30 FIGURA 3 - REPRESENTAÇÃO DO NÍVEL FASES DA CRISP-DM (SPSS, 2000, P.13, TRADUÇÃO
NOSSA)...............................................................................................................................31 FIGURA 4 - COMPONENTES DO NEURÔNIO BIOLÓGICO (BRAGA; LUDERMIR; CARVALHO,
2000, P.06).........................................................................................................................31 FIGURA 5 - COMPONENTES DO NEURÔNIO DE MCCULLOCH E PITTS (BRAGA; LUDERMIR;
CARVALHO, 2000, P.09).................................................................................................32 FIGURA 6 - ARQUITETURAS DE REDES NEURAIS ARTIFICIAIS – RETIRADA DE HAYKIN (2001,
PP.47-49) ...........................................................................................................................35 FIGURA 7 - FLUXO DE PROCESSAMENTO DO ALGORITMO %$&.�3523$*$7,21 ............................37 FIGURA 8 PREDIÇÃO DE VOLUME DE VENDAS DURANTE CINCO SEMANAS UTILIZANDO RNA COM
A TÉCNICA DE JANELAMENTO (BRAGA; LUDERMIR; CARVALHO, 2000, P.226) .......38 FIGURA 9 - PREDIÇÃO REALIZADA POR ALVARENGA E OLIVEIRA JUNIOR E CARVALHO (2003,
P.19) ..................................................................................................................................39 FIGURA 10 - GRÁFICO DA CURVA DE APRENDIZADO REALIZADA POR OLIVEIRA E ALVARENGA
(2003, P.10) .......................................................................................................................40 FIGURA 11 - GRÁFICO DA PREDIÇÃO REALIZADA POR OLIVEIRA E ALVARENGA (2003 P.11)......40 FIGURA 12 - MUDANÇAS CLIMÁTICAS E SEUS EFEITOS NA SAÚDE HUMANA (OMS, 2003D, P.30,
TRADUÇÃO NOSSA, COM ALTERAÇÕES) ..............................................................................41 FIGURA 13 – DIAGRAMA DE CONTROLE E CASOS NOTIFICADOS DE DENGUE POR SEMANA
EPIDEMIOLÓGICA, GOIÂNIA – GO, 2001 (SIQUEIRA JUNIOR, 2001, P.23)......................45 FIGURA 14 - ASPECTO DE UM $('(6�$(*<37, (MUNSTERMANN, 1995) ...............................46 FIGURA 15 ASPECTO DE UM $('(6�$/%23,&786 (CRUZ, 2004) ...............................................46 FIGURA 16 - TIPOS DE TRANSMISSÃO INDIRETA RECONHECIDA PARA DENGUE (OMS, 2003D,
P.16, TRADUÇÃO NOSSA, COM ALTERAÇÕES)......................................................................47 FIGURA 17 – PAÍSES COM PRESENÇA DE DENGUE EM 2003 (OMS ,2004C, P.74)........................48 FIGURA 18 - SOROTIPOS CIRCULANTES DO VÍRUS DA DENGUE POR ESTADOS, BRASIL, 2004 (SVS ,
2005, P.02).........................................................................................................................49 FIGURA 19 - FORMATO DE ENVIO DE DADOS DOS HOSPITAIS AO DEPARTAMENTO DE SAÚDE
PÚBLICA ALEMÃO (SCHUMANN; LÓPEZ; GRAW , 1998)............................................54 FIGURA 20 - FORMATO DE ENVIO DE DADOS DOS HOSPITAIS AO DEPARTAMENTO DE SAÚDE
PÚBLICA ALEMÃO (SCHUMANN; LÓPEZ; GRAW, 1998).............................................54 FIGURA 21 - ÓBITOS OBSERVADOS E ESTIMADOS POR REGRESSÃO BINOMIAL NEGATIVA E REDE
NEURAL - CEARÁ, JULHO DE 1991 A DEZEMBRO DE 1995 (PENNA, 2004, P.355) .............56 FIGURA 22 - CASOS RELATADOS DE DENGUE NO BRASIL NOS ANOS DE 1986 A 2003 (SIQUEIRA
JÚNIOR, 2005, P.49).........................................................................................................57 FIGURA 23 - NÚMERO DE CASOS RELATADOS DE AGRAVO, ÓBITOS, HOSPITALIZAÇÕES E ANO DA
TIPIFICAÇÃO DOS CASOS DE DENGUE NO BRASIL (SIQUEIRA JÚNIOR, 2005, P.50).........58 FIGURA 24 -PREVALÊNCIA DE DENGUE EM GOIÂNIA , 2001 (SIQUEIRA JÚNIOR (7�$/�, 2004)61 FIGURA 25 - DADOS PRELIMINARES DOS CASOS NOTIFICADOS DE DENGUE POR SEMANA
EPIDEMIOLÓGICA SEGUNDO REGIÃO, BRASIL, 2004 (SVS, 2005) P.01................................66 FIGURA 26 - DADOS PRELIMINARES DOS CASOS NOTIFICADOS DE DENGUE POR SEMANA
EPIDEMIOLÓGICA DA REGIÃO CENTRO-OESTE, BRASIL, 2003-2004 (SVS ,2005) P.5 .........67 FIGURA 27 – DIAGRAMA DE CONTROLE DE DENGUE POR SEMANA EPIDEMIOLÓGICA, GOIÂNIA ,
VI
2003 A 2004, (FRANÇA; ALVES SILVA; AMORIM SILVA, 2004, P.52).....................67 FIGURA 28 TOTAL ANUAL DE REGISTROS DE DENGUE, SINAN, GOIÂNIA , 2001-2004 ...............79 FIGURA 29 – PERCENTUAL ANUAL DE REGISTROS DE DENGUE, APÓS SELEÇÃO, SINAN,
GOIÂNIA , JAN/2001 A ABR/2004 .......................................................................................80 FIGURA 30 - TIPOS E PERCENTUAL DE DENGUE, GOIÂNIA , 2001 A 2004 .....................................80 FIGURA 31 – PERCENTUAL DO TOTAL DAS RESPOSTAS NO CAMPO DENGUE DO SINAN,
GOIÂNIA , 2001-2004 .........................................................................................................81 FIGURA 32 - PERCENTUAL DO TOTAL DAS RESPOSTAS NO CAMPO VACINADO, SINAN,
GOIÂNIA , 2001-2004 .........................................................................................................82 FIGURA 33 - PERCENTUAL POR GÊNERO EM GOIÂNIA , IBGE, 2000 (A); PERCENTUAL POR
GÊNERO NA ANÁLISE DO SINAN, GOIÂNIA , 2001 A 2004 ..................................................83 FIGURA 34 – CASOS CONFIRMADOS DE DENGUE VERSUS NÚMERO DE HABITANTES POR BAIRRO,
GOIÂNIA , 2001 A 2004.......................................................................................................84 FIGURA 35 – PERCENTUAL DE FAIXA ETÁRIA POR ANO, SINAN, GOIÂNIA , 2001-2004 ..............85 FIGURA 36 – PERCENTUAL POR FAIXA ETÁRIA – GOIÂNIA , IBGE, 2000 (A) E PERCENTUAL DE
CASOS CONFIRMADOS DE DENGUE – GOIÂNIA , SINAN, 2001 A 2004.................................86 FIGURA 37 – CASOS CONFIRMADOS DE DENGUE POR BAIRROS VERSUS CEMITÉRIOS EXISTENTES,
GOIÂNIA , 2001-2004 .........................................................................................................87 FIGURA 38 – CASOS CONFIRMADOS DE DENGUE VERSUS PERCENTUAL DE LOTES VAGOS POR
BAIRROS, GOIÂNIA , 2001-2004..........................................................................................87 FIGURA 39 - CASOS CONFIRMADOS DE DENGUE VERSUS PERCENTUAL DE ÁREA VERDE POR
BAIRRO, GOIÂNIA , 2001-2004............................................................................................88 FIGURA 40- CASOS CONFIRMADOS DE DENGUE VERSUS NÚMERO DE FEIRAS LIVRES SEMANAIS
POR BAIRRO, GOIÂNIA , 2001-2004.....................................................................................89 FIGURA 41 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE HOSPITAIS POR BAIRRO,
GOIÂNIA , 2001-2004 .........................................................................................................89 FIGURA 42 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE ESCOLAS, GOIÂNIA ,
2001- 2004 ........................................................................................................................90 FIGURA 43 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE PRÉDIOS POR BAIRRO,
GOIÂNIA , 2001- 2004.........................................................................................................91 FIGURA 44 – PERCENTUAL DE CASOS CONFIRMADOS POR SEMANA EPIDEMIOLÓGICA, GOIÂNIA ,
2001 A 2003.......................................................................................................................91 FIGURA 45 – SÉRIE TEMPORAL DOS CASOS CONFIRMADOS DE DENGUE, GOIÂNIA , 2001 A 2004 93 FIGURA 46 – DIAGRAMA DE CONTROLE DE DENGUE POR SEMANA EPIDEMIOLÓGICA, SMSGO,
GOIÂNIA -2004 .................................................................................................................103 FIGURA 47 - ARQUITETURA DE REDE UTILIZADA, NO ($6<11�3/86� PARA PREDIÇÃO
EPIDEMIOLÓGICA DE DENGUE..........................................................................................106 FIGURA 48 – GRÁFICO DA CURVA DE APRENDIZADO – RODADA 1............................................106 FIGURA 49 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 1 .....107 FIGURA 50– GRÁFICO DA CURVA DE APRENDIZADO – RODADA 2 ............................................110 FIGURA 51 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 2.....111 FIGURA 52 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....112 FIGURA 53 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....113 FIGURA 54 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....115 FIGURA 55 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....116 FIGURA 56 – COMPARAÇÃO DAS PREDIÇÕES DAS TÉCNICAS: DIAGRAMA DE CONTROLE E
MINERAÇÃO DE DADOS PARA O PERÍODO DE DOAÇÃO.......................................................118
VII
/,67$�'(�48$'526�QUADRO 1 - QUADRO DE TÉCNICAS DE MD DESENVOLVIDO A PARTIR DOS AUTORES FAYYAD E
PIATETSKY-SHAPIRO E SMYTH (1996); TURBAN E RAINER E POTTER (2004, P.159) E
DELMATER E HANCOCK (2001)..........................................................................................22 QUADRO 2 - DICIONÁRIO DE DADOS DA TABELA DO SINAN, REFERENTE A PESQUISAS SOBRE O
DENGUE.............................................................................................................................73 QUADRO 3 - DICIONÁRIO DE DADOS SOBRE OS DADOS DO VETOR..............................................75 QUADRO 4 - DICIONÁRIO DE DADOS DA SEPLAN......................................................................75 QUADRO 5 - DICIONÁRIO DE DADOS DA COMDATA ................................................................76 QUADRO 6 - DICIONÁRIO DE DADOS DA TABELA REFERENTE AS SEMANAS EPIDEMIOLÓGICAS....77 QUADRO 7 - DICIONÁRIO DE DADOS DA TABELA REFERENTE AOS DADOS DO 10º DISME ..........77 QUADRO 8- CLASSIFICAÇÃO DOS PERÍODOS ENDÊMICOS E EPIDÊMICOS DE GOIÂNIA ANOS 2001 A
2004 ..................................................................................................................................98 QUADRO 9 - DICIONÁRIO DE DADOS DA TABELA CLASSIFICADORFINAL...........................101 QUADRO 10 – ANÁLISE DOS CASOS CONFIRMADOS DE DENGUE, GOIÂNIA , 2001 A 2004 .........116 QUADRO 11 – ANÁLISE DOS CASOS DE DENGUE VERSUS VARIÁVEL, GOIÂNIA , 2001 A 2004....117
VIII
/,67$�'(�7$%(/$6�TABELA 1 - TOTAL DE REGISTROS ANTES, DEPOIS DA SELEÇÃO E A PERDA.................................79 TABELA 2 - ANÁLISE DOS RESULTADOS DA PREVISÃO FEITA ATRAVÉS DO DIAGRAMA DE
CONTROLE DA SECRETARIA MUNICIPAL DE SAÚDE DE GOIÂNIA - GOIÁS, 2004...............104 TABELA 3 – ANÁLISE DOS RESULTADOS DA PREVISÃO – TÉCNICA 1.........................................106 TABELA 4 – ANÁLISE DOS RESULTADOS DA PREVISÃO - RODADA 2.........................................110 TABELA 5 – ANÁLISE DOS RESULTADOS DA PREVISÃO - RODADA 3.........................................113
IX
/,67$�'(�*5È),&26�QUADRO DE GRÁFICOS 1 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2001..........................................................................................................94 QUADRO DE GRÁFICOS 2 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2002..........................................................................................................95 QUADRO DE GRÁFICOS 3 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2003..........................................................................................................96 QUADRO DE GRÁFICOS 4 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2004..........................................................................................................97 QUADRO DE GRÁFICOS 5 – TREINAMENTO PROPOSTO – RODADA 2 ..........................................109
�
X
/,67$�'(�6,*/$6�10º DISME 10º Distrito de Meteorologia AMPLITUDE Amplitude térmica (medida diária, valor em Graus Celsius) CARESS (SLGHPLRORJLFDO�DQG�6WDWLVWLFDO�'DWD�([SORUDWLRQ�6\VWHP CARLOS &DQFHU�5HJLVWU\�/RZHU�6D[RQ\�COMDATA Companhia de Processamento de Dados do Município de Goiânia CRISP-DM &URVV�,QGXVWULDO�6WDQGDUG�3URFHVV�IRU�'DWD�0LQLQJ CSV &RPPD�6HSDUDWHG�9DOXH�DBF 'DWD�%DVH�)RUPDW�DCBD Descoberta de Conhecimento em Banco de Dados�DH Dengue Hemorrágico DSS 'HFLVLRQ�6XSSRUW�6\VWHP�DW 'DWD�:DUHKRXVLQJ EI Era da Informação�EUA Estados Unidos da América�EWS (DUO\�:DUQLQJ�6\VWHPV�FHD Febre Hemorrágica do Dengue FUNASA Fundação Nacional de Saúde GC Gestão do Conhecimento GIS *HRJUDSKLF�,QIRUPDWLRQ�6\VWHP�HBR +DUYDUG�%XVLQHVV�5HYLHZ�IA Inteligência Artificial�INEMET Instituto Nacional de Meteorologia KDD .QRZOHGJH�'LVFRYHU\�LQ�GDWDEDVHV�MD Mineração de Dados�MGCTI Mestrado em Gestão do Conhecimento e da Tecnologia da Informação MLP 0XOWLOD\HU�3HUFHSWURQ ou�SHUFHSWURQ�PXOWL�FDPDGDV�OMS Organização Mundial de Saúde�PD Índice pluviométrico ou precipitação (medida diária) PIB Produto Interno Bruto�RNAs Redes Neurais Artificiais SAMC 6RXWKHUQ�$IULFD�0DODULD�&RQWURO�SAP Sistemas de Aviso Prévio�SEPLAN Secretaria Municipal de Planejamento SIG Sistema de Informação Geográfica�SIG’S Sistemas de Informações Geográficas SINAN Sistema de Informações de Agravos de Notificação�SIR 6XVFHSWLEOH�,QIHFWHG�,PPXQH SMS Secretaria Municipal de Saúde SMS-GO Secretaria Municipal de Saúde de Goiânia-GO SSD Sistema de Suporte a Decisão SUS Sistema Único de Saúde TEMP Temperatura (média diária, valor em Graus Celsius) TEMPMAX Temperatura máxima (medida diária, valor em Graus Celsius) TEMPMIN Temperatura mínima (medida diária, valor em Graus Celsius) UBV Ultra Baixo Volume UCB Universidade Católica de Brasília URA Umidade Relativa do Ar
XI
URA Umidade relativa do ar (média diária, valor em percentual) URAMAX Umidade relativa do ar máxima (medida diária, valor em percentual) URAMIN Umidade relativa do ar mínima (medida diária, valor em percentual) WHO :RUOG�+HDOWK�2UJDQL]DWLRQ
XII
/,67$�'(�$%5(9,$d®(6�H�J�� (H[HPSOL�JUDWLD), Por exemplo i.e. Isto é
�
5
� ,1752'8d2�“Se GHVHQYROYLGD� H� DSOLFDGD� FRP� VXFHVVR�� D� WHRULD� H� SUiWLFD� GD� JHVWmR� GR�
FRQKHFLPHQWR� VH� WRUQDUi�XPD�GLVFLSOLQD� IXQGDPHQWDO�SDUD�HOLPLQDU�HVSDoRV�TXH� OHYHP�DR� DXPHQWR� GH� TXDOLGDGH� QD� VD~GH� S~EOLFD� SDUD� WRGRV�´ Dr. Ariel Pablos-Mendez,
Diretor do Departamento de Gestão e Compartilhamento do Conhecimento, da
Organização Mundial de Saúde, 2005.
���� ([SRVLomR�GR�$VVXQWR�É necessário o suporte à decisão para vigilância epidemiológica, através de modelos
preditivos, que possam auxiliar o gestor da área de saúde, na tomada de decisão. Assim
ele pode designar seus limitados recursos humanos e financeiros para o tratamento dos
pacientes e para o combate ao vetor urbano de Dengue.
Existem relatos de modelos já utilizados com algum sucesso, na predição, em áreas
como a financeira (H�J� ALVARENGA; OLIVEIRA JUNIOR; CARVALHO, 2003) e a
epidemiológica (H�J� GILL, 1923 DSXG Organização Mundial de Saúde, 2004b) que
podem auxiliar no prognóstico de casos confirmados de Dengue através de técnicas
regressivas de Redes Neurais Artificiais.
A grande vantagem desses modelos preditivos é o preço baixo, quando não,
gratuito, das variáveis (i.e. dados eletrônicos) necessárias para predição. Justifica-se esta
afirmativa, pois os dados (H�J� tomada do vetor, casos notificados) são coletados de forma
compulsória, por diversos órgãos municipais, estaduais e federais, em todo o território
brasileiro.
Nesta dissertação será abordado um modelo preditivo com a granularidade de casos
confirmados de Dengue que é maior que a convencional que trabalha com casos
notificados.
���� ,QWURGXomR�DR�3UREOHPD�A :RUOG�+HDOWK�2UJDQL]DWLRQ (WHO) ou Organização Mundial de Saúde (OMS)
(2004b, p.04) afirma que o conhecimento existente sobre a interação entre o clima e a
saúde, data da época de Aristóteles e a compreensão do assunto tem mais avançado a
6
cada ano. A habilidade de se predizer as interações entre o clima e as doenças infecciosas,
também tem melhorado nos últimos anos. Existe a tendência de se desenvolver modelos
que possibilitem a predição ou o monitoramento de epidemias. Se forem precisos, o seu
valor é inestimável.
O clima tem influência na transmissão de muitas doenças. Algumas delas estão
entre as que mais influenciam o número de óbitos, nos países em desenvolvimento (OMS,
2004b, p.08, 37). Especula-se que ondas de calor ou mudanças climáticas extremas
possam causar impactos significantes na disseminação de doenças contagiosas (OMS,
2004b, p.10).
Sabe-se que algumas doenças infecciosas, principalmente as disseminadas por
vetores (insetos), como o Dengue - estão geograficamente limitadas por padrões
ambientais (H�J� clima, vegetação) (OMS, 2004b, p.10). São tradicionalmente conhecidas
como “doenças da pobreza” (PAIM, 2003, p.563) ou “doenças da modernidade”
(ANDRADE; DANTAS, 2004, p.01) e estão relacionadas a populações de baixo poder
aquisitivo e a países em desenvolvimento, (OMS, 2004b, p.37). (xistem algumas
exceções� FRPR a Austrália e &ingapura. Dentre estas doenças está o Dengue que é
disseminado pelo seu vetor ($HGHV� DHJ\SWL) e que possui influência sazonal (OMS,
2004b).
Na saúde pública, a epidemiologia é uma das áreas na qual o maior número de
estudos e publicações encontrados referentes ao Dengue, é realizado através de inquéritos
sorológicos e estudos estatísticos.
Os modelos de predição existentes e relatados (OMS, 2004b, 2003d, 2000, dentre
outros), utilizam, basicamente, dados históricos para detectar padrões de comportamento
e estimar seus valores no futuro. De forma genérica, empregam-se técnicas matemáticas
e/ou estatísticas para representar a realidade, na qual foram criadas. As estatísticas têm
sido usadas, com algum sucesso, para predição desses padrões.
A abordagem adotada neste trabalho visa explorar o uso das Redes Neurais
Artificiais para a construção de um modelo voltado à predição de casos confirmados de
Dengue e à comparação dos resultados obtidos com o Diagrama de Controle adotado no
Brasil.
7
Assim, a proposta é explorar o uso da técnica de janela de tempo, também
conhecida como janelamento, sobre série de dados temporais para a construção de
modelo preditivo que, com certa margem de confiança, consiga prever o número de casos
confirmados que irão ocorrer em um determinado período, a partir dos dados notificados
de Dengue, contidos no Sistema de Informações de Agravos de Notificação (SINAN) e de
medidas climáticas de uma cidade, neste caso, foi escolhido como objeto de estudo os
dados da cidade de Goiânia - Goiás.
Essa abordagem justifica-se por:
a) As instituições de saúde pública, em todo território brasileiro, notificam, ao
longo dos anos e de forma compulsória, ao Departamento de Vigilância Sanitária da
cidade a que pertencem e à Secretaria Estadual de Saúde de seu Estado, cerca de
trinta e cinco (35) doenças diferentes, determinadas por lei (dentre elas, o os casos
notificados de Dengue). As notificações são feitas na forma de registros
padronizados de prontuários médicos e digitalmente guardadas no SINAN, através
de uma coleção de dados disponíveis, na forma de banco de dados eletrônico
(FUNASA, 2002);
b) O vetor (Aedes aegypti) da doença tem influência sazonal.
���� 'HILQLomR�GD�3HVTXLVD�Predizer, por meio de um modelo baseado em Redes Neurais Artificiais, a
ocorrência de surtos urbanos causados pelos vetores: PRVTXLWR�$HGHV�� possibilitando aos
gestores da área de saúde, suporte à decisão, para o planejamento de combate a
epidemias.
���� 'HOLPLWDomR�GD�3HVTXLVD�Cria um modelo para predição urbana de surtos de Dengue (OMS, 2004b, p.17), e
alimenta esse modelo com dados (i.e. parâmetros climáticos e pacientes confirmados)
Prediz a ocorrência de surtos em uma região, (OMS, 2004b, pp.15-16) e avalia seu valor
de predição (possibilita ao gestor, designar recursos humanos e/ou financeiros para o
tratamento dos pacientes, campanhas informativas e educativas e combate do vetor da
1 “Tipo de mosquito que pode transmitir doenças como a Febre Amarela e o Dengue” (OMS, 1996, p. 01).
8
doença em tela).
���� -XVWLILFDWLYD�GD�3HVTXLVD�A cada dia, gera-se grande quantidade de dados médicos (registrados em
prontuários) e laboratoriais (resultados de exames) de pacientes atendidos por
profissionais de saúde em hospitais ou laboratórios. Esses dados representam as
condições médicas ou doenças que os pacientes apresentam e possibilitam a notificação
de casos de doenças transmissíveis. A notificação é importante, especialmente na
prevenção e disseminação de epidemias2 e pode ser feita de forma semanal, mensal e
anual (SCHUMANN; CHAVEZ; GRAW, 1998, p.01; OMS, 2004b, p.27).
A análise rápida dos dados assegura suporte epidemiológico a gestores de saúde
(OMS, 2004b), através de ações preventivas à disseminação ou ao surgimento de
epidemias (CUMMINGS HW�DO�, 2004, p.345), através do combate ao vetor ou vacinação
da população. Pode ser feita através de:
a) Técnicas de Mineração de Dados, para buscar os padrões de ocorrência e
comportamento das doenças (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996,
p.37);
b) Análise estatística ou de gráficos (OMS, 2004b, p.08,09).
Essa pesquisa utiliza os dados de exames laboratoriais e avaliações médicas do
Sistema Único de Saúde Brasileiro (SUS), do qual setenta por cento (70%) da população
brasileira depende (WESTPHAL, 2000, p.46) e fornece ao gestor da área de saúde bases
para gerenciar seus limitados recursos humanos e financeiros.
���� 5HIHUHQFLDO�7HyULFR�Os Sistemas de Suporte à Decisão fornecem alternativa computacional aos gestores,
para tomada de decisão, em problemas cuja solução não é trivial. Suas principais
vantagens são (TURBAN; RAINER; POTTER, 2004):
a) Permitir tomadas de decisões a partir de grandes fontes (bases) de dados;
b) Superar os limites humanos no processamento e armazenamento de informações;
2 “Doença que ataca ao mesmo tempo muitas pessoas da mesma região” (MICHAELIS, 1998, p.483).
9
c) Reduzir os custos de pesquisa de um projeto;
d) Prover soluções com qualidade e em curto espaço de tempo.
A Mineração de Dados apresenta a possibilidade de gerar, através de
tarefas/técnicas (H�J� regressão e classificação) e aplicativos (VRIWZDUHV) específicos,
informações preditivas que possam fornecer aos gestores, subsídios para tomada de
decisão. Dentre estes VRIWZDUHV�estão os que utilizam as Redes Neurais Artificiais para
este fim (predição) (BRAGA; LUDERMIR; CARVALHO, 2000; ALVARENGA;
OLIVEIRA JUNIOR; CARVALHO, 2003).
As Redes Neurais Artificiais são sistemas de processamento de informações
distribuídos, compostos por elementos computacionais simples (i.e. neurônios artificiais)
e, por serem inspiradas no cérebro humano, apresentam características como a capacidade
de aprendizagem de padrões complexos de informações ou a de generalizar uma
informação aprendida (BAETS; VENGOPAL, 1994 DSXG PASSARI, 2003; BRAGA;
LUDERMIR; CARVALHO, 2000; HAYKIN, 2001; OLIVEIRA; ALVARENGA, 2003).
A OMS (2004b, 2003e, 2000b), enfatiza a necessidade de pesquisas que possam
fornecer suporte à decisão, aos gestores da área de saúde, na predição e combate de surtos
(RXWEUHDNV) de várias doenças que estão sob influência sazonal, incluindo as causadas por
vetores. Em todo mundo, Dengue está entre as doenças que mais afetam a população dos
países em desenvolvimento.
No Brasil, o combate e a prevenção de trinta e cinco doenças diferentes, é feito
através do Modelo Brasileiro de Notificação. Esta notificação, nos hospitais públicos e
estaduais, é feita através de preenchimento de formulários específicos que são enviados à
Secretaria Municipal de Saúde e armazenados em forma digital no Sistema de
Informações de Agravos de Notificação. Em relação a Dengue, que é uma destas doenças,
o modelo é passivo e definido por lei. (FUNASA, 2002).
���� 2EMHWLYRV������� *HUDO�
O objetivo principal deste trabalho é construir um modelo para suporte à tomada de
10
decisão no combate a epidemias de Dengue, utilizando Redes Neurais Artificiais para
predizer o número de casos confirmados dessas doenças, em menor tempo e maior
precisão do que a prática atual.
������ (VSHFtILFRV�Os objetivos específicos desta pesquisa são relacionados a seguir:
• Construção de uma base de conhecimentos epidemiológicos, a partir da
análise de variáveis para diagnóstico e identificação do surto3 a partir das seguintes
fontes de dados:
a) Resultados de exames laboratoriais e avaliações médicas (Dengue),
realizados nos laboratórios e consultórios do Sistema Único de Saúde (SUS)
da cidade de Goiânia–GO, registrados no SINAN;
b) Índice pluviométrico, temperatura e umidade relativa do ar, de Goiânia,
realizado pelo 10º DISME – Distrito de Meteorologia.
• Fornecer bases para a otimização dos recursos humanos e/ou financeiros
utilizados na gestão epidemiológica de Dengue;
• Uso e avaliação da tecnologia baseada em RNAs como instrumento de
análise e predição epidemiológica.
���� +LSyWHVH������� +LSyWHVH�SULQFLSDO�
Um modelo de predição, baseado em Redes Neurais Artificiais, aplicando séries
temporais, pode garantir maior precisão de resultados e melhor qualidade que o modelo
atual utilizado pelo Sistema Brasileiro de Notificação, vigente para Vigilância
Epidemiológica de Dengue.
������ +LSyWHVHV�VHFXQGiULDV�O número de casos confirmados de Dengue em Goiânia-Go, neste período,
3 Definição de Last (2001 apud OMS, 2004, p. 14, tradução nossa): “Uma epidemia (praga) limitada a um local que aumenta na incidência de uma doença (enfermidade). e.g. em uma vila, cidade ou instituição fechada.”
11
apresenta relação com:
a) Mudanças das variáveis climáticas (i.e. apenas algumas variáveis
climáticas influenciam o surto);
b) Características urbanas (H�J� percentual de área verde, número de prédios
por bairro, número de cemitérios) e populacionais (sexo, habitantes por
bairro e faixa etária) apresentadas em Goiânia-GO no período estudado.
���� 2UJDQL]DomR�GR�'RFXPHQWR�O presente trabalho está estruturado em cinco (05) capítulos, a saber:
No Capítulo 1 – Introdução – apresentação das considerações iniciais: ao
conhecimento sobre a interação entre o clima e a saúde; à definição do tema, delimitação
da pesquisa, referencial teórico, justificativa, objetivos e hipóteses desta dissertação.
No Capítulo 2 - Revisão de Literatura – apresentação do referencial teórico sobre
dados, informação e conhecimento. Na seqüência, aborda-se: Gestão do Conhecimento e
Tecnologia da Informação; Sistemas de Suporte à Decisão; Mineração de Dados; Redes
Neurais e Séries Temporais; efeitos do clima sobre a saúde humana; Modelo Brasileiro de
Predição; Dengue, assim como, também, o vetor brasileiro reconhecido ($HGHV�DHJ\SWL) e
os estudos relatados, encontrados.
No Capítulo 3 – Metodologia – exposição dos procedimentos metodológicos para
elaboração do trabalho, incluindo o processo de análise e modelagem de dados, para
especificação do modelo neural e dos critérios de avaliação. Foi utilizada a metodologia
&URVV�,QGXVWULDO�6WDQGDUG�3URFHVV�IRU�'DWD�0LQLQJ� através da aplicação de um estudo
de caso, na cidade de Goiânia–Go e posterior apresentação dos resultados encontrados no
período estudado.
No Capítulo 4 - Apresentação e Análise dos Resultados.
No Capítulo 5 - Conclusões e Sugestões para Trabalhos Futuros, listam-se, também,
as referências citadas e todos os anexos.
12
� 5(9,62�'(�/,7(5$785$�“O valor do conhecimento é intangível, o que para muitos pode não ter sentido,
para outros pode ser a ‘invenção da pólvora’”. Autor desconhecido
���� 'DGRV��,QIRUPDomR�H�&RQKHFLPHQWR�Os dados “são fatos brutos, não organizados para transmitir um significado
específico” (TURBAN; RAINER; POTTER, 2004, p.364). São importantes porque,
através deles, é possível a criação da informação. O que permite a eficiência da
informação é a qualidade dos dados, não a sua quantidade ou o seu conjunto.
Uma informação pode ser caracterizada através de conjunto de itens que tenham
significado (TURBAN; RAINER; POTTER, 2004, p.364) e proporcionem um novo
ponto de vista para a interpretação de eventos ou objetos, tornando visíveis, significados
antes invisíveis. A compreensão de dados (H�J� fatos, textos, gráficos, imagens estáticas,
sons, etc.), por um indivíduo ou conjunto de indivíduos (organização) é uma informação.
Esta informação se completa e, sem sobrecarga, pode ser usada como vantagem
competitiva para tomada de decisão, no ambiente em que foi moldada (MORESI, 2000,
pp.17-18).
“Essa informação pode não ser a mesma do ponto de vista de quem emitiu a
mensagem, pois emissor e receptor são pessoas com experiências distintas” (LEMOS,
2003, p.07).
Pode-se considerar a informação como meio necessário para extrair ou construir o
conhecimento, alterando-o ou reestruturando-o. É o produto capaz de gerar o
conhecimento.
“Conhecimento não é dado e nem informação, mas está relacionado a ambos”
(TEIXEIRA FILHO, 2001, p.21). “É mais valioso e poderoso do que os recursos
naturais” (STEWART, 1998, p.XIII). É o resultado da interpretação, aprendizagem e
utilização da informação para algum fim, especificamente para gerar novas idéias,
resolver problemas ou tomar decisões (STEWART, 1998).
A capacidade de geração de dados, em qualquer organização, é, naturalmente,
13
superior à capacidade de mobilizar os meios e recursos necessários à transformação
desses dados, em informações e, dessas informações, em conhecimento. O significado da
tríade (dados, informações e conhecimento) é bastante contextual e subjetivo. O que é
informação para uma pessoa ou organização pode não passar de dados para outro ente
qualquer. Além do fato de que o conhecimento depende de uma série de condições e de
conceitos bastante abstratos como valor, reflexão, síntese e utilidade, entre outros
(ALVARENGA; JUNIOR; CARVALHO, 2004, p.05).
Capturar e disseminar o conhecimento de uma instituição (organização) não é tarefa
fácil. Embora existam diversos profissionais e técnicas de captura e disseminação, ambos
(profissionais e técnicas) dependem, também, do interesse, comprometimento e dedicação
das pessoas que compõe a organização, em representar e disseminar esse conhecimento.
E aquela que representa e dissemina o conhecimento, tem a capacidade de gerar
diferenciais competitivos importantes.
Por exemplo: para maximizar os lucros em pesquisas, uma organização que possua
várias filiais, desenvolve diversos projetos simultâneos. Provavelmente os profissionais
que compõem as equipes, enfrentam alguns problemas iguais ou semelhantes aos já
ocorridos em projetos anteriores. Se as informações de solução dos problemas anteriores
(técnicas aplicadas) estão mantidas e são compartilhadas dentro da organização, os
especialistas dos novos projetos localizam as soluções e as aplicam de maneira rápida e
eficaz. Outro exemplo interessante, no mesmo sentido, é o de compartilhar, vender ou
comprar informações (soluções) sobre resolução de desafios, em projetos já enfrentados
por outras organizações.
Deve-se ressaltar que o conhecimento pode ser dividido em tácito e explícito
(NONAKA; TAKEUCHI, 1997, p.62; TURBAN; RAINER; POTTER, 2004, p.389). “O
conhecimento tácito é pessoal, específico ao contexto e, assim, difícil de ser formulado e
comunicado. Já o conhecimento explícito ou ‘codificado’, refere-se ao conhecimento
transmissível em linguagem formal e sistemática” (POLANYI, 1966 DSXG NONAKA;
TAKEUCHI, 1997, p.65). O segredo para aquisição do conhecimento está, dentre outros
fatores, na experiência obtida através da convivência entre indivíduos (NONAKA;
TAKEUCHI, 1997, p.69).
Três observações são necessárias aqui. Primeira, o conhecimento, ao contrário da
14
informação, diz respeito a ‘crenças’ e ‘compromissos’. O conhecimento é uma
função de uma atitude, perspectiva ou intenção específica. Segunda, o conhecimento,
ao contrário da informação, está relacionado à ‘ação’. É sempre o conhecimento
‘com algum fim’. E terceira, o conhecimento, como a informação, diz respeito ao
‘significado’. É específico ao contexto e relacional [...] consideramos o
conhecimento como “um processo humano dinâmico de justificar a crença pessoal
com relação à ‘verdade’” (NONAKA; TAKEUCHI, 1997, p.63).
���� *HVWmR�GR�&RQKHFLPHQWR�H�7HFQRORJLD�GD�,QIRUPDomR�A informação e o conhecimento são os diferenciais competitivos que atualmente
são considerados os produtos econômicos mais valorosos que uma organização (empresa,
instituição) pode possuir. Na verdade, o conhecimento tácito vem sendo usado nas
organizações há muito tempo embora o reconhecimento de ele que pode e deve ser
aplicado como vantagem competitiva, seja relativamente recente (TEIXEIRA FILHO
2001, p.22).
A Gestão do Conhecimento (GC), nesse sentido, atinge um campo multidisciplinar,
que possibilita amplas implicações e aplicações em diversas áreas, pois permite que os
pesquisadores possam se tornar profissionais geradores, mantenedores e disseminadores
do conhecimento, em uma instituição (organização). A Tecnologia da Informação (TI),
normalmente associada à GC, pode ser vista como o recurso básico para implantação da
GC nas organizações (DRUCKER, 1999 DSXG LEMOS, 2003, p.06).
Na verdade a GC “é um tipo de gestão pelo qual o reconhecimento do
conhecimento individual e organizacional é fator básico para atingir os resultados
desejados de uma organização” (LEMOS, 2003, p.06). Deve ser difundida entre os
funcionários (também conhecidos como multiplicadores) da organização de forma a
maximizar a confiança no processo de geração, absorção de conhecimento e
produtividade na organização (ARAUJO; FREIRE; MENDES, 1997).
Pode ser vista, através de outros conceitos similares como: �D� “uma coleção de
processos que governa a criação, disseminação e utilização do conhecimento para atingir
plenamente os objetivos da organização” (TEIXEIRA FILHO, 2001, p.22); �E� um
“processo que acumula e cria conhecimento de modo eficiente, gerenciando uma base de
conhecimentos organizacionais para armazenar o conhecimento, e facilitando o
compartilhamento desse conhecimento para permitir sua aplicação eficaz em toda
15
organização” (TURBAN; RAINER; POTTER, 2004, p.389); ou �F� um conjunto de
princípios e ferramentas para otimizar e integrar o processo criativo de criar, desenvolver
e disseminar o conhecimento de forma estratégica e efetiva dentro da organização (OMS,
2005, p.02).
"Existe uma relação sinergética poderosa entre gestão do conhecimento e tecnologia;
esta relação leva a retornos crescentes e sofisticação crescente, em ambas as frentes.
À medida que a tecnologia de informação se torna nossa ferramenta pessoal e nossa
conexão com os outros, aumenta nossa cobiça em acessar ainda mais informação e
conhecimento de outras pessoas, e então demandamos ferramentas de TI ainda
melhores e mais eficientes, que se tornam parte da forma como trabalhamos”
(O'DELL; GRAYSON JR, 1998, p.30).
Embora GC seja um campo novo e em discussão (TURBAN; RAINER; POTTER,
2004, p.388), existe, no mercado, uma enorme quantidade de ferramentas que procuram
gerenciar os conhecimentos das empresas. Infelizmente, nenhuma delas fornece um
modelo que se adapte a todas.
A gestão e o compartilhamento do conhecimento, no que diz respeito aos sistemas
de saúde, representam uma importante oportunidade para melhorar o atendimento e
tratamento de pacientes, particularmente nos países em desenvolvimento, pois podem
trocar experiências sobre campanhas preventivas e combate a doenças (OMS, 2005,
p.01).
A OMS (2005, p.02), no sentido de relatar e pesquisar novas ferramentas e soluções
criou o Departamento de Gestão e Compartilhamento do Conhecimento, que tem, como
tarefa, a construção de uma rede global, visando o compartilhamento de informações de
cunho médico e científico, entre todos os países. Sua estratégia é compartilhar as
abordagens da própria OMS com a perícia em saúde, de forma a encontrar ou criar novas
ferramentas e novas maneiras de se aplicar o conhecimento, aumentando, assim, em todo
o mundo, a qualidade dos sistemas de saúde pública.
Um exemplo prático da atuação desse departamento é o projeto de ligação entre
clínicas de tratamento e acompanhamento de HIV, na África, com plataformas que
disponibilizam dados (incluindo registros médicos eletrônicos) e com comunidades de
aprendizado, em busca de programas de saúde efetivos, que ajudem a aplicar e disseminar
16
campanhas ou práticas preventivas dessa doença (OMS, 2005, p.02).
���� 6LVWHPDV�GH�6XSRUWH�j�'HFLVmR
O decisor normalmente possui capacidade de conhecimento limitada, ao se deparar
com problemas complexos e grandes. Sua habilidade não é suficiente para fornecer
soluções que conduzam a resultados esperados e desejados (EIRMAN; NIEDERMAN;
ADAMS, 1995; TURBAN; RAINER; POTTER, 2004, p.369). Assim, a tomada de
decisão é um aspecto importante para a gerência no planejamento das atividades
operacionais das organizações. É o ato final de um processo que visa resolver um
problema ou um conjunto de problemas, em um domínio de aplicação (HENDRIKS;
VRIENS, 1995; RAFAELI NETO, 2001).
Segundo Hendriks e Vriens (1995) e Rafaeli Neto (2001), os Sistemas de Suporte à
Decisão fornecem a solução para problemas que no domínio geográfico, por exemplo,
tendem a serem novos, complexos, grandes e mal estruturados. Sua complexidade se deve
à interação de uma série de variáveis de natureza complexa (H�J� natureza geográfica,
técnica, organizacional, social, temporal, etc.).
2.3.1 $X[tOLR�j�GHFLVmR�FRPSXWDFLRQDO Os 'HFLVLRQ�6XSSRUW�6\VWHP�±��'66� ou Sistemas de Suporte à Decisão (SSD) são
ferramentas computacionais que, através de consulta à base de dados, auxiliam aos
gerentes na tomada de decisão (ADRIAANS; ZANTIGE, 1996, p.28; DELMATER;
HANCOCK, 2001, p.88; PORTO; AZEVEDO, 1997 DSXG CARVALHO, 2003, p.23;
TURBAN; ARONSON, 1998, p.267; TURBAN; RAINER; POTTER, 2004, pp.369-
372).
Os SSD representam uma abordagem de auxílio computacional, baseada na intensa
utilização de bases e modelos de dados, que proporcionam o diálogo entre o homem e o
computador, na solução de problemas não triviais (CARVALHO, 2003, p.23;
HAMMERS, 2002, p.01; TURBAN; RAINER; POTTER, 2004, pp.369-372).
Possuem quatro características principais: �D� incorporam dados e modelos; �E� são
desenhados para auxiliar gerentes nos seus processos de decisão em tarefas semi-
estruturadas ou não estruturadas; �F� oferecem suporte, mas não substituem o julgamento
17
gerencial; �G� seu objetivo é melhorar a efetividade das decisões e não a eficiência do
processo de tomada de decisão (TURBAN; ARONSON, 1998; TURBAN; RAINER;
POTTER, 2004, pp.369-372).
Os seus usuários podem utilizá-los em três tipos de configurações: �D� ativas
(permite sugestões ou decisões); �E� passivas (não permite sugestões ou decisões); �F� cooperativas (permite que o responsável pelas decisões ou um técnico sob sua orientação,
modifique, refine ou termine o processo de análise) (HÄTTENSCHWILER, 1999 DSXG�GACHET, 2001, p.215).
Em um SSD, deve haver um profissional que domine o problema, para que, através
de informações e concepção intelectual do assunto, possa obter um bom suporte à decisão
(HÄTTENSCHWILER, 1999 DSXG GACHET, 2001, p.215).
O melhor SSD não é aquele que utiliza as melhores técnicas matemáticas ou de
pesquisa a bases de dados, mas sim o que é capaz de induzir as melhores decisões. O SSD
não tem o objetivo de encontrar a solução ótima, mas, sim, auxiliar ao gestor na escolha
de uma alternativa satisfatória ao seu problema (PORTO; AZEVEDO, 1997 DSXG�CARVALHO, 2003, pp.23-24; TURBAN; RAINER; POTTER, 2004, pp.369-372).
São exemplos típicos de SSD, os Sistemas de Informações Geográficas e os
Sistemas Especialistas (TURBAN; ARONSON, 1998, TURBAN; RAINER; POTTER,
2004, p.372, 383). Citam-se como aplicações de SSD o: �D� Planejamento de mercado e
pesquisa; exemplo: geração de um catálogo de vendas, a partir da estimativa das decisões
de compra, que um consumidor pode fazer; �E� Planejamento estratégico e operações;
exemplo: monitoração, análise e geração de fazer relatos das tendências sutis de mercado,
o que pode auxiliar o gestor, a tirar proveito de campos ainda não explorados; �F� Suporte
a vendas; exemplo: executivos de altos escalões recebem relatórios diários de vendas de
produtos por região (TURBAN; ARONSON; 1998; TURBAN; RAINER; POTTER,
2004); e �G� A alocação de água para projetos de irrigação (CARVALHO, 2003).
���� 'HVFREHUWD�GH�&RQKHFLPHQWR�HP�%DVH�GH�'DGRV�“As organizações devem ser capazes de obter, organizar, analisar e interpretar os
dados, para sobreviver nos mercados globais supercompetitivos. E o gerenciamento de
dados é fundamental para todas as funções empresariais”.(TURBAN; RAINER;
18
POTTER, 2004, p.132).
“A maioria das organizações internacionais produzem mais informações em uma
semana que algumas pessoas podem ler em toda a sua vida” [...] “Existe um paradoxo no
crescimento dos dados, quanto mais dados menos informação” (ADRIAANS;
ZANTINGE, 1996, p.02, tradução nossa).
������ ,QWURGXomR�A produção, coleta e armazenagem de dados, no mundo, aumentam em uma
enorme velocidade, tornando impossível a análise adequada para transformá-las em
informações úteis (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.37). As bases
de dados, que podem representar de 65 a 70% do espaço existente em disco (MOORE,
1999, p.01), estão crescendo em tamanho, de duas maneiras: pelo aumento de número de
registros e pelo número de campos (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996,
p.38).
A transformação tradicional de dados em conhecimento usa análise manual e
interpretação. É realizada por especialistas que, através de teorias e ferramentas, extraem
informações úteis, a partir de dados digitais. Ao final do processo, os especialistas geram
relatórios sobre seus estudos, para decisões ou planejamentos, fornecendo suporte à
decisão. Essa maneira tradicional de gerar conhecimento é cara, lenta e altamente
subjetiva (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, pp.37-38; TURBAN;
RAINER; POTTER, 2004, pp.130-132, 362-363).
A transformação dos dados em informação é um processo difícil, pelos seguintes
motivos (TURBAN; RAINER; POTTER, 2004, p.367): �D� a quantidade de dados em
grandes instituições aumenta exponencialmente com o tempo; �E� a coleta de dados é feita
por vários indivíduos de uma organização, usando métodos e dispositivos diversos; �F� os
dados brutos (sem nenhum trabalho de limpeza e em seu estado original) podem ser
armazenados em diferentes formatos, bancos, sistemas e plataformas; �G� somente partes
pequenas dos dados de uma organização são relevantes para uma decisão específica; �H� a
tomada de decisão para uma grande organização requer análise de dados externos; �I� exigências legais, relacionadas aos dados, são diferentes, dependendo da região e mudam
com freqüência; �J� selecionar a ferramenta ideal para um trabalho pode ser um problema,
19
devido ao grande número de produtos comerciais existentes e aos requisitos para operar
essa ferramenta.
É inegável que diante das dificuldades acima listadas e do desgaste humano para
analisar, manualmente, essa grande quantidade de dados, surge o desafio de desenvolver
técnicas, ou aplicativos de automação, capazes de filtrar a informação necessária de
grandes bases de dados e disponibilizá-la em formatos visualmente compreensíveis, que
possam ser utilizados para solução de um problema (ADRIAANS; ZANTIGE, 1996,
p.02; GOEBEL; GRUENWALD, 1999, p.20; MOORE, 1999, p.01).
Nem sempre dados garantem informação e informação traz conhecimento. O
desafio é retirar a informação escondida nas bases de dados, de forma a utilizá-la em
decisões (HAN; KAMBER, 2001, p.279; TURBAN; RAINER; POTTER, 2004, p.362).
Soluções estão sendo pesquisadas e resultados estão sendo obtidos, através de técnicas
oriundas da Inteligência Artificial (IA) (FAYYAD; PIATETSKY-SHAPIRO; SMYTH,
1996, p.37), dentre elas, a Mineração de Dados.
O termo .QRZOHGJH� 'LVFRYHU\� LQ� 'DWDEDVHV� (KDD) ou Descoberta de
Conhecimento em Banco de Dados (DCBD) foi cunhado no primeiro encontro de
pesquisadores da área ocorrido em 1995, em Montreal (ADRIAANS; ZANTINGE, 1996,
p.05).
Foi definido como: “O processo de extração de conhecimento a partir dos dados
registrados numa base de dados, extração esta não trivial de conhecimento implícito,
previamente desconhecido e potencialmente útil, feita a partir dos dados registrados”
(FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.40, tradução nossa).
DCBD é o processo completo de descoberta de conhecimento, a partir de uma base
de dados, e estabelece uma ênfase especial em encontrar padrões de dados,
compreensíveis ou interessantes, que possam ser interpretados visando a criação de
conhecimento (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, pp.39-40;
MEDEIROS OLIVEIRA, 2005, p.01; OLIVEIRA; ALVARENGA, 2003, p.02).
É usado para explorar bases de dados, de maneira a fornecer informações
compreensíveis e úteis, no processo de tomada de decisão, de uma organização. O
problema básico de DCBD é transformar um grande volume de dados, que estão em sua
20
forma primitiva, em outras formas que serão: �D� mais compactas (H�J� um pequeno
relatório); �E� mais abstratas (H�J� um modelo que possa ter sido concebido a partir de
dados); �F� mais proveitosas (H�J� um modelo de predição para estimativa de casos
futuros) (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.37; NOON; HANKINS,
2001, p.01). “O centro do processo é a aplicação de métodos específicos de mineração de
dados, para descoberta e extração de padrões” (AGRAWAL; PSAILA, 1995 DSXG
FAYYAD; PIATETSKY-SHAPIRO, 1996).
2.4.2 ÈUHDV�GH�$SOLFDomR
Dentre outras áreas de aplicação de DCBD, citam-se as seguintes: �D��0DUNHWLQJ�que procura identificar padrões de compras em consumidores, para a determinação dos
produtos que serão colocados em locais vizinhos, maximizando, assim, a venda (venda
cruzada); �E� Monitoração de fraudes eletrônicas em cartões de crédito, que possam
indicar a atividade de lavagem de dinheiro; �F� Predição de problemas em projetos
aéreos, através de relatos de falhas, a partir de agrupamentos; �G� Localização e
classificação de problemas ocorridos em telecomunicações de maneira a evitar
consultas a padrões já conhecidos; �H� Identificação e eliminação de redundância de
dados; �I� Predição epidemiológica, possibilitando ao gestor da área de saúde, o
planejamento de recursos para o atendimento a pacientes infectados ou para o combate
ao vetor de uma determinada doença (dengue) (MEDEIROS OLIVEIRA, 2005, p.01;
CASTRO; ALVARENGA; PRADO, 2004, p.83; CASTRO; ALVARENGA; PRADO,
2005, p.41; DELMATER; HANCOCK, 2001, p.270; FAYYAD; PIATETSKY-
SHAPIRO; SMYTH, 1996, pp.38-39; TURBAN; ARONSON, 1998, p.130;
TURBAN; RAINER; POTTER, 2004, p.159; WANG; WEIGEND, 2004, p.457).
Existem várias propostas para o processo de DCBD, dentre elas as de Fayyad e
Piatetsky-Shapiro e Smyth (1996), Adriaans e Zantinge (1996) e a de Kamp e Grupe
(1997).
���� 0LQHUDomR�GH�'DGRV�O termo mineração de dados, ou GDWD�PLQLQJ� refere-se a uma parte particular do
processo de DCBD (ADRIAANS; ZANTINGE, 1996, p.05; MEDEIROS OLIVEIRA,
2005, p.12), que aplica algoritmos específicos e técnicas próprias, para extração de
novos padrões, a partir de dados eletrônicos conhecidos (FAYYAD; PIATETSKY-
21
SHAPIRO; SMYTH, 1996, p.39).
Mineração de Dados (MD) pode ser definida como um processo automatizado
que, a partir de grandes volumes de dados, gera um conjunto de regras significativas
ou identifica informações (recursos ou tendências ou agrupamentos), que são
dificilmente perceptíveis (BOSE; SUGUMARAN, 1999 DSXG�COFFIN HW� DO�, 2004,
p.02; FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.39; FRAWLEY;
PIATETSKY-SHAPIRO; MATHEUS, 1992 DSXG ELDER, 2004, p.02; REIFER,
2002, p.14) e que podem ser utilizadas com o objetivo de suporte à decisão (HAN;
KAMBER, 2002, p.279; WANG; WEIGEND, 2004, p.457; TURBAN; ARONSON,
1998; TURBAN; RAINER; POTTER, 2004, p.159).
Outras aplicações de MD são (TURBAN; RAINER; POTTER, 2004, p.383): �D� predição automatizada de tendências e comportamentos, através da automatização do
processo de procura de informações (H�J� compras realizadas por clientes no passado)
em bancos de dados, para se prever alvos futuros (H�J� seleção de clientes em
potencial, para determinado produto a ser vendido); �E� detecção automática de
padrões desconhecidos, anteriormente, através da análise dos dados de vendas com a
identificação dos produtos, aparentemente, não relacionados, que geralmente são
vendidos em conjunto, em um determinado dia da semana (H�J� fraldas e cerveja em
uma sexta-feira à noite). Existem diversos projetos em que a MD pode ser aplicada,
dentre eles (ELDER, 2004, p.04): �D� avaliações de crédito; �E� PDUNHWLQJ; �F� predição
de vendas; �G� detecção de fraudes.
Para Fayyad e Piatetsky-Shapiro e Smyth (1996, p.39), o objetivo da DM é a
extração de conhecimento de alto nível, a partir de dados de baixo nível, contidos em
grandes conjuntos de dados (H�J� extrair conhecimento a partir de uma base de dados).
Já para Delmater e Hancock (2001, p.04) o desafio é bem maior: o objetivo definido é
o de extrair conhecimento de alto nível, a partir de dados de alto nível, o que é bem
mais complexo (H�J� extrair conhecimento de um GDWDZDUHKRXVH).
O que deixa a MD eficaz é a aliança entre o que o ser humano faz de melhor
(avaliar/inferir as informações descobertas pela MD) e o que o computador faz de
melhor (procurar relações entre os dados existentes em uma base de dados)
(DELMATER; HANCOCK, 2001, p.09).
22
Na visão de Delmater e Hancock (2001, p.07), a análise da MD desenvolve
modelos de dois tipos: �D� modelos para previsão (predição), que envolvem a
utilização de uma parte ou de todo o conjunto de variáveis existentes, para prever
valores desconhecidos ou futuros, de variáveis de interesse (H�J� desastres naturais,
índices de degradação ambiental, índice de reprodução de vetores, surtos); �E� modelos
para descrição, que busquem padrões em um sistema de forma a torná-los
interpretáveis.
Autores como Fayyad e Piatetsky-Shapiro e Smyth (1996, p.39), Medeiros
Oliveira (2005, pp.13-14) e Turban e Rainer e Potter (2004, p.159) dizem que a
mineração de dados possui várias técnicas (tarefas), dentre elas a classificação, a
regressão, a clusterização e a sumarização.
As tarefas de classificação e a regressão são preditivas, já a clusterização e
sumarização são descritivas. As descritivas se concentram em encontrar padrões que
descrevam os dados de forma interpretável pelos seres humanos. As preditivas
realizam inferências nos dados, para construir modelos que serão usados nas predições
do comportamento de novos dados. Nesta dissertação serão abordadas apenas as
técnicas preditivas.
No Quadro 1, para cada técnica relatada nas obras de Fayyad e Piatetsky-Shapiro
e Smyth (1996) e Turban e Rainer e Potter (2004, p.159), foi especificado o tipo de
modelo relatado por Delmater e Hancock (2001).
4XDGUR�����4XDGUR�GH�WpFQLFDV�GH�0'�GHVHQYROYLGR�D�SDUWLU�GRV�DXWRUHV�)D\\DG�H�3LDWHWVN\�6KDSLUR�H�6P\WK���������7XUEDQ�H�5DLQHU�H�3RWWHU��������S������H�'HOPDWHU�H�+DQFRFN��������
Técnica Descrição dos modelos Tipo
Classificação Pressupõe características definidoras de um grupo específico (como clientes que foram perdidos para concorrentes)
Preditiva
Regressão Prediz um valor numérico com base no comportamento histórico dos dados
Preditiva
Clusterização Possibilita gerar agrupamentos a partir de semelhanças encontradas nos dados.
Descritiva
Associação Procura descobrir se existe algum padrão de relacionamento entre itens existentes nos dados (como o conteúdo de um carrinho de compras)
Descritiva
23
2.5.1 7pFQLFDV�SUHGLWLYDV�GD�0'
A classificação e a regressão são formas de análise de dados, que podem ser
usadas para extrair dois tipos de modelos: �D� os que descrevem classes de dados
importantes; �E� os que atuam na predição de tendência de dados futuros (HAN;
KAMBER, 2001, p.279; PRADO, 1998, p.39; OLIVEIRA; ALVARENGA, 2003,
p.03).
A predição visa estabelecer o valor de um ou mais atributos, em um banco de dados,
a partir de outros atributos presentes [...] A abordagem preditiva não implica,
necessariamente, na previsão de um valor futuro - ‘a característica importante é que
ela faz uma adivinhação educada sobre o valor de um ou mais atributos
desconhecidos, dados os valores de outros atributos conhecidos’ [JOH97] (PRADO,
1998, p.39).
Faz-se, então, necessária, a distinção entre as técnicas preditivas de classificação
e regressão. Na classificação, cada registro (tupla) pertence a uma classe, entre um
conjunto pré-definido de classes. A classe de uma tupla é indicada por um valor
especificado pelo usuário, em um atributo objetivo. As tuplas consistem de atributos
preditivos e um atributo objetivo, este último indicando a que classe esta tupla
pertence (HAN; KAMBER, 2001, p.280). O atributo objetivo é do tipo categórico ou
discreto (i.e. pode tomar apenas um valor dentro de um conjunto de valores discretos)
(H�J� {SIM, NÃO}; {01...10}; {POSITIVO, NEGATIVO, ZONACINZA}),
determinando classes ou categorias.
O princípio da tarefa de classificação é descobrir algum tipo de relacionamento
entre os atributos preditivos e o atributo objetivo, de modo a desvendar um
conhecimento que possa ser utilizado, para prever a classe de uma tupla desconhecida
(OLIVEIRA; ALVARENGA, 2003, p.03).
A regressão, por sua vez, é muito similar à classificação. A regressão é uma
função de aprendizado que mapeia dados ou conjunto de dados de entrada, em uma
saída real numérica. Nessa função, o atributo objetivo é contínuo, isto é, pode tomar
qualquer valor real. O objetivo do algoritmo de regressão é encontrar algum
relacionamento entre os atributos preditivos e o atributo objetivo, de modo a predizer
valores para o atributo objetivo. São exemplos típicos, as predições financeiras e
comerciais.
24
Suponha que, em uma cidade, tenham ocorrido várias endemias ou epidemias de
uma doença ou conjunto de doenças. Essas ocorrências, provavelmente foram
registradas pela Secretaria Municipal de Saúde dessa cidade. Seria interessante utilizar
esses dados, para prever a ocorrência de surtos de uma doença e, assim, possibilitar as
autoridades competentes a planejar melhor seus limitados recursos
(humanos/financeiros), desencadeando ações de vacinação ou combate ao vetor dessa
doença, de forma a melhorar o atendimento aos pacientes e, até mesmo, amenizar o
número de casos confirmados.
No caso de doenças com influência sazonal, a partir dos dados climáticos e
epidemiológicos registrados, um algoritmo de regressão pode descobrir regras que
possam prever o número de casos confirmados, em uma cidade. No caso da regressão,
a informação do surto ocorrido (i.e. número de confirmados) é totalizada em um
atributo (neste caso, o atributo objetivo). Uma vez que se tenha o atributo objetivo
determinado, prepara-se o subconjunto de atributos preditivos, dentre aqueles
existentes na base de dados. Claramente alguns atributos, tais como nome do paciente,
raça, cor dos olhos, estatura, peso, dentre outros, são, de modo geral, irrelevantes para
previsão do surto e, portanto, devem ser desconsiderados.
No caso da predição, para se medir o quão bom é o padrão encontrado (a
chamada acurácia do modelo), basta verificar o número de acertos, em um total de
casos testados (PRADO, 1998, p.39).
São esperadas duas reações distintas às predições: �D� Preparar-se para as
conseqüências das mudanças ocorridas. Por exemplo, no caso de predição de um
número alto de pacientes infectados por uma doença (H�J� dengue), o gestor pode
designar seus limitados recursos humanos/financeiros para o tratamento desses
pacientes, em hospitais; �E� tomar medidas para reverter ou modificar as predições,
reduzindo as incertezas com a produção de informações, evitando, assim, surpresas
com a precipitação dos eventos. Se o cenário previsto é o de um surto, o gestor pode
decidir tentar amenizá-lo, determinando que sejam incrementadas, ou iniciadas,
campanhas de combate ao vetor. (CUMMINGS HW� DO�, 2004, p.345; HANKE;
REITSCH 1995 DSXG PASSARI, 2003, p.08).
MD pode ser considerada uma abordagem eficaz, se comparada às técnicas
25
tradicionais, já que lida com grande quantidade de volume de dados e consegue gerar
padrões para fenômenos complexos, que necessitam de muitos parâmetros. Por
exemplo, a estatística, de modo geral, é orientada para a verificação e validação das
hipóteses cognitivas e a maioria de suas técnicas requer o desenvolvimento de uma
hipótese prévia. Já a MD busca padrões, nas bases de dados, que possam ser utilizados
para algum fim. A grande vantagem da MD, em relação às técnicas estatísticas, é a
possibilidade de explicitar informações, apenas do domínio de especialistas,
escondidas nas bases, através da documentação gerada durante sua realização. Essas
informações podem levantar hipóteses que não haviam sido descobertas, até aquele
momento (PASSARI, 2003, pp 58-60).
������ 3UREOHPDV��GHVDILRV��YDQWDJHQV��iUHDV�GH�DSOLFDomR�H�WpFQLFDV�GD�0'� Em relação aos problemas referentes à MD, os mais comuns são: �D�
representação do conhecimento extraído; �E� complexidade da pesquisa; �F� seleção do
método e técnica mais apropriada da mineração para a pesquisa (FAYYAD;
SHAPIRO-PIATETSKY; SMYTH, 1996).
Além desses problemas, existem alguns desafios a serem vencidos, dentre eles:
�D� o volume da base de dados: as bases, normalmente, possuem centenas de tabelas,
com centenas de campos e talvez milhares de registros, o que pode resultar em uma
variedade enorme de padrões, combinações e hipóteses; �E� dados inconsistentes: além
de atributos com valores nulos, outros, importantes, podem estar ausentes das bases de
dados, pois, na sua concepção, não foram projetadas para DCBD; �F� ruídos nas bases
de dados: é um problema muito comum e grave, indicando que atributos importantes
podem estar perdidos, com valores errados ou colocados em locais incorretos, na base
de dados; �G��interação com o usuário: o profissional ou técnico de MD, deve procurar
conhecimentos, a partir de hipóteses levantadas por seus clientes, que possam ser
utilizados para explicar algum processo, na corporação, ou predizer ocorrências
futuras; �H� representação da informação: se o conhecimento descoberto não for de
fácil acesso e claramente compreendido pelo cliente, pode causar interpretações
errôneas ou ambíguas (FAYYAD; SHAPIRO-PIATETSKY; SMYTH 1996b).
Aproximadamente oitenta por cento dos problemas em MD referem-se às etapas
de preparação dos dados (pré-processamento), enquanto os outros vinte por cento são
26
referentes à etapa de mineração de dados, em si (ADRIAANS; ZANTINGE, 1996).
A extração física de dados oriundos de diversas fontes é uma tarefa
extremamente árida e tediosa, pois pode trazer surpresas desagradáveis, tais como: �D��ocorrência de exceções (H�J� linhas de total no meio do arquivo); �E� apresentação de
arquivos em formatos diferentes, o que exige sua reconstrução em formato desejado
(H�J� $FUREDW� 5HDGHU�� 0LFURVRIW� ([FHO�� 0LFURVRIW� :RUG); �F� falta de padrão na
codificação: instituições diferentes mantêm as mesmas informações, em cadastros
diferentes e independentes (H�J� a carteira de identidade, cartão de crédito, carteira de
motorista) (PRADO, 1998, p.25).
É importante levar em consideração que: �D� é altamente improvável a existência
de uma grande base de dados, sem a presença de algum tipo de ruído, erros ou
inconsistência de dados; �E� mesmo que se tenha a sensação de que todas as
dificuldades de extração foram superadas, a inclusão de versão atual de um arquivo,
pode trazer erros tão grandes, que não há outra opção, a não ser recomeçar o
processamento dos dados.
As técnicas e características de processamento mais comuns são (HAN;
KAMBER, 2001, pp.105-142; PRADO, 1998, pp.28-29): �D� limpeza: preencher,
corrigir ou eliminar dados sem informação; �E� integração: combinar vários dados,
oriundos de várias bases, em um repositório final; �F� transformação de dados: alterar
dados (consolidar) para o formato desejado; �G� redução dos dados: representar, de
forma reduzida, o volume dos dados, sem perder a consistência ou a integridade.
Em relação às aplicações, a MD pode ser utilizada para: �D� segmentação de
mercados: agrupando clientes pela suas características comuns; �E� detecção de fraude:
identifica transações suspeitas que tenham probabilidade de serem fraudadas; �F��PDUNHWLQJ direto: identifica pessoas, com determinado perfil de consumo, para envio
de um tipo específico de catálogo de produtos (H�J� armas, pescaria, roupas, viagens);
�G� análise de tendências: revela diferenças entre o comportamento de um determinado
cliente, em um período de tempo; �H� óleo e gás: analisa dados sísmicos, em busca de
depósitos subterrâneos, que possam ser perfurados com mais facilidade; �I� varejo:
distingue padrões de compras.
27
A MD pode ser utilizada também para predição, nas seguintes áreas: �D� PDUNHWLQJ: busca os melhores clientes, para maximizar as vendas; �E� detecção de
fraude em cartões de crédito; �F� desistência (perda) de clientes: prevê quais os
prováveis clientes a saírem de empresa; �G� seguro e sistemas de saúde: antecipa quais
clientes potenciais para novas apólices; �H� medicina: prevê e indica as terapias
adequadas a cada doença, e a eficácia das drogas (TURBAN; RAINER; POTTER,
2004, p.161).
Além das vantagens e desvantagens já mencionadas, acrescentam-se:
a) A MD não necessita do processamento de todo o banco de dados, para a
geração de regras. Basta que sejam analisadas faixas de dados distintas e desejadas,
dessa base. Através dessa análise, as regras e suas faixas de confiança são geradas
e adicionadas ou, ainda, alteradas, em uma base de regras (também conhecida
como base de conhecimento). Através do acréscimo de novos registros na base de
dados, a base de regras é atualizada com as regras geradas.
A busca de padrões de um local ou região específica pode ser feita e analisada,
através da mudança dos valores existentes, em uma faixa de dados, extraídos de uma
base de dados, conforme pode ser visto na Figura 1.
)LJXUD�����3URFHVVR�GH�FRQVWUXomR�GH�XPD�EDVH�GH�UHJUDV�GH�XPD�UHJLmR�DGDSWDGD�GH�$JUDZDO�H�3VDLOD��������SS������FRP�DOWHUDo}HV��
b) A Mineração de Dados possibilita, além de velocidade na solução de
problemas, o preenchimento de informações, que podem ser a chave para decisões,
em negócios importantes (ELDER, 2004, p.04).
c) Falha no registro dos dados eletrônicos: por algum motivo, os dados
28
não estão representados no universo necessário e, portanto, a informação obtida
pode não ser confiável. Deve haver a preocupação com a completa representação e
disponibilidade das informações, para quem precise delas (DRUCKER, 2001 in
+DUYDUG�%XVLQHVV�5HYLHZ�(HBR) p.18);
d) Os executivos e profissionais especialistas, a partir dos dados que
possuem, precisam expressar corretamente a informação desejam alcançar. Assim,
os responsáveis por gerá-la, não sobrecarregam o processo de transformação de
dados em informação e conseguem fornecer o suporte a decisão (DRUCKER, 2001
LQ HBR, p.19);
e) Reunir, examinar e confirmar as informações extraídas, a partir de
dados válidos, fornece uma análise sofisticada e possibilita conclusões que
resistem a questionamentos críticos (ARGYRIS, 2001 LQ HBR, p.99,100);
f) Os custos associados com a coleção, processamento e armazenamento
de tais tipos de recursos (informações), podem ser altos o que desencoraja o
investimento na geração desta informação (DELMATER; HANCOCK, 2001,
p.05);
g) Os pesquisadores, ou gerentes supõem que, o melhor modelo e as
melhores respostas para um problema, foram encontrados, podendo decidir pelo
encerramento da pesquisa o que pode impedir que um modelo mais preciso seja
encontrado (ELDER, 2004, p.22).
Pode ser realizada, através de vários modelos e ferramentas específicas, como:
�D� &URVV�,QGXVWULDO� 6WDQGDUG� 3URFHVV� IRU� 'DWD� 0LQLQJ� �CRISP-DM��� D� HVFROKLGD�SDUD� HVWD� SHVTXLVD�� �E�� 6DPSOH�� ([SORUH�� 0RGLI\�� 0RGHO�� $VVHVV� �6(00$�� �F��&RPPRQ�$SURDFKHV��'(/0$7(5��+$1&2&.��������S�������.
Existem diversas ferramentas profissionais de mineração de dados, dentre elas,
&OHPHQWLQH da SPSS4; (QWHUSULVH�0LQHU da SAS5; (DV\QQ�3OXV�; ,QWHOOLJHQW�0LQHU da
IBM 7; 6�3OXV e ,QVLJKWIXO�0LQHU 2 da ,QVLJKWIXO�&RUSRUDWLRQ8; 6HH��&�����&XELVW e
4 www.spss.com5 www.sasinstitute.com6 www.easynn.com/easynnplus.html7 www.ibm.com
29
0DJQXP�2SXV da RuleQuest59 e o R10. Academicamente, existem, também, alguns
casos de soluções para 0', dentre eles, o :(.$11 H R�$5$5$��.
���� &5,63�'0�SDUD�PLQHUDomR�GRV�GDGRV�A metodologia CRISP-DM (DELMATER; HANCOCK, 2001, p.61;
CHAPMAN HW� DO�, 1999 DSXG COSTA SOUSA, 2003, p.47; OLIVEIRA;
ALVARENGA, 2003, p.02) foi concebida em 1996, como um guia passo a passo, para
a MD, e propõe um modelo gratuito de processo padrão, para mineração de dados
(SPSS, 2000).
Sua origem deve-se ao consórcio formado por quatro empresas de consultoria: 1&5�6\VWHPV� (QJLQHHULQJ� &RSHQKDJHQ�� 'DLPOHU&KU\VOHU� $*�� 6366� ,QF. e 2+5$
Verzekeringen en Bank Groep (SPSS, 2000 p.2). A CRISP-DM tem como vantagem, não
depender da área de negócio e da tecnologia a ser utilizada na MD, além da fácil
aplicação rapidez, custos mais baixos, viabilidade e facilidade da gestão dos projetos de
alta ou baixa envergadura de MD.
Na descrição dos quatro níveis da CRISP-DM, visto na Figura 2, é utilizado um
modelo de processo hierárquico, composto por um conjunto de tarefas, descritas em
níveis de abstração (SPSS, 2000, p.09):
a) Fases: neste nível, dividido em seis fases principais, estão as tarefas genéricas e os
relacionamentos entre essas tarefas;
b) Tarefas genéricas: neste nível, são apresentadas de forma geral, para cobrir todas
as situações possíveis da MD, mesmo aquelas não previstas (H�J� novas técnicas de
modelagem);
c) Tarefas especializadas: neste nível, estão as descrições de como as ações do nível
genérico, devem ser executadas, em certas situações específicas (H�J� limpeza dos
dados);
8 www.insightful.com9 www.rulequest.com10 www.r-project.org11 www.cs.waikato.ac.nz/~ml/weka/12 www.ucb.br/prg/professores/rogerio/arara/arara.html
30
d) Instância de Processos: neste nível, registram-se as ações, decisões e resultados de
um projeto de MD.
)LJXUD�����5HSUHVHQWDomR�GRV�TXDWUR�QtYHLV�GD�PHWRGRORJLD�&5,63�'0��6366��������S�����WUDGXomR�QRVVD��O primeiro nível (fases), representado na Figura 3, tem as seguintes divisões e
objetivos: ��� Compreensão do Negócio (%XVLQHVV�8QGHUVWDQGLQJ): entender os objetivos
do projeto e seus requisitos, sob o ponto de vista do negócio, para serem convertidos na
definição de um problema de MD; quando se adquire a compreensão dos objetivos e
requisitos do projeto, deve-se definir um plano preliminar, para atingir estes objetivos; ��� Compreensão dos Dados ('DWD�8QGHUVWDQGLQJ): recolher os dados e familiarizar-se com
eles, para: a identificação de possíveis problemas, provocados pela qualidade desses
dados; o descobrimento de perspectivas iniciais, dentro dos dados; a detecção de
subconjuntos interessantes, que permitam formular hipóteses sobre informações
(escondidas), que não estão disponíveis aos gestores; ��� Preparação dos Dados ('DWD�3UHSDUDWLRQ�: construção dos conjuntos de dados� (GDWD� VHWV), para a construção de
modelos, a partir dos dados originais; ��� Modelagem (0RGHOLQJ): seleção, aplicação de
várias técnicas de modelagem de dados e otimização de parâmetros; existem diversas
técnicas que podem ser aplicadas, no mesmo problema de MD, algumas delas com
requisitos específicos, em relação à forma dos dados - é freqüente ter que se voltar à fase
anterior; ��� Avaliação ((YDOXDWLRQ): do ponto de vista da análise dos dados, os modelos,
construídos nesta fase, podem aparentar elevada qualidade; antes de prosseguir para a
fase seguinte, a de operacionalização, é importante rever os passos dados, na construção
do modelo, para garantir que se atinja os objetivos chave (um deles é determinar se existe
alguma questão importante, não considerada); ��� Operacionalização ('HSOR\PHQW)utilização dos modelos criados em ambiente operacional.
31
)LJXUD�����5HSUHVHQWDomR�GR�QtYHO�)DVHV�GD�&5,63�'0��6366��������S�����WUDGXomR�QRVVD� ���� 5HGHV�QHXUDLV�DUWLILFLDLV�
“A gestão eficiente de qualquer corporação, seja ela do setor público ou privado,
industrial ou varejista, requer planejamento. Para um planejamento efetivo é necessário
que se tenha uma expectativa precisa das condições futuras em que a corporação irá
operar, e de como se relacionam os elementos condicionantes desta expectativa”
(PASSARI, 2003, p.08).
2.7.1 ,QWURGXomR
O cérebro humano possui, como células fundamentais, aproximadamente 1011
neurônios. Cada neurônio é dividido em três seções distintas, conforme representado na
Figura 4: �D� corpo da célula; �E� dendritos; �F��axônio. Cada seção possui funções
específicas, porém complementares (BRAGA; LUDERMIR; CARVALHO, 2000, pp.4-5;
HAYKIN, 2001, pp.32-34).
)LJXUD�����&RPSRQHQWHV�GR�QHXU{QLR�ELROyJLFR��%5$*$��/8'(50,5��&$59$/+2��������S�����
32
Os dendritos têm por função, receber as informações (impulsos nervosos) de outros
neurônios e conduzi-las até o corpo celular (soma). A informação é processada neste local
e novos impulsos são gerados. Esses impulsos são transmitidos a outros neurônios,
passando através do axônio, até os dendritos dos neurônios seguintes. O ponto de contato
entre a terminação de um neurônio e o dendrito de outro, é chamado de sinapse. Entre a
sinapse e o dendrito de vários outros neurônios, existe o espaço sináptico (AZEVEDO;
BRASIL; OLIVEIRA, 2000, p.03; BRAGA; LUDERMIR; CARVALHO, 2000, p.06;
HAYKIN, 2001, pp.32-34).
As $UWLILFLDO� 1HXUDO� 1HWZRUNV ou Redes Neurais Artificiais (RNAs) surgiram a
partir do modelo de neurônios artificiais (SHUFHSWURQ), proposto por 0F&XOORFK e 3LWWV (1943 DSXG BRAGA; LUDERMIR; CARVALHO, 2000, p.06; AZEVEDO; BRASIL;
OLIVEIRA, 2000, p.06; TURBAN; RAINER; POTTER, 2004, p.417). É uma
simplificação do que se sabia, até então, sobre neurônio biológico. A composição
(descrição) matemática de um neurônio artificial resultou em um modelo com Q terminais
de entrada [�� [�� ������[Q (que simulam o papel dos dendritos) e, apenas, um terminal de
saída \ (simulando o papel do axônio). Para simular o comportamento das sinapses, os
terminais de entrada possuir pesos acoplados Z�� Z�� �����ZQ, que podem possuir valores
negativos ou positivos, dependendo das sinapses correspondentes, inibitórias ou
excitatórias (HAYKIN, 2001, pp.36-38). “O efeito de uma sinapse particular L no
neurônio pós-sináptico é dado por xiwi” (BRAGA; LUDERMIR; CARVALHO, 2000,
p.08).
)LJXUD�����&RPSRQHQWHV�GR�QHXU{QLR�GH�0F&XOORFK�H�3LWWV��%5$*$��/8'(50,5��&$59$/+2��������S�����
Em suma, nos neurônios artificiais, as conexões emulam os dendritos, pesos imitam
as sinapses, uma função de mapeamento emula o corpo celular e uma saída imita o
33
axônio (BRAGA; LUDERMIR; CARVALHO, 2000, pp.7-8; HAYKIN, 2001, pp.36-37),
conforme pode ser visto na Figura 5. Os neurônios de uma RNA recebem informações de
fontes externas ou de outros neurônios e as transformam, através de pesos, em uma saída.
Esta saída é transmitida para outros neurônios ou para saídas externas (TURBAN;
RAINER; POTTER, 2004, p.418).
De forma genérica, é correto afirmar que as funções básicas de cada neurônio,
presentes em uma rede, seguem a seguinte cronologia: ��� avaliam os valores de entrada;
��� calculam o total dos valores de entrada combinados; ��� comparam o total com um
valor limiar e determinam o valor que será a saída.
������ &DUDFWHUtVWLFDV�H�DUTXLWHWXUDV�GDV�51$V�Soluções computacionais clássicas são implementadas, de forma explícita, em um
sistema, através de regras ou equações. Estas soluções fornecem a garantia de saída
computacional, em problemas para os quais foram desenvolvidas, e possuem limitações
(H�J� não podem generalizar soluções; não são tolerantes a erros e ruídos) (SWINGLER,
1996, p.08).
As RNAs, por outro lado, são sistemas de processamento de informações
distribuídos, compostas por elementos computacionais simples (i.e. neurônios artificiais)
e, por serem inspiradas no cérebro humano, apresentam: �D� a capacidade de aprender ou
descobrir padrões complexos de informações e soluções em problemas, para os quais as
regras ou equações não são facilmente visíveis ou de difícil implementação.Em outras
palavras, as RNAS fornecem boas soluções para problemas, cujo domínio e precisão
formal não são possíveis (por falta de profissionais ou de conhecimento adequado) ou não
são viáveis (seja pelo custo financeiro ou pela necessidade de resposta em baixo tempo),
em soluções computacionais tradicionais; �E� a capacidade de generalizar um problema,
através de um conjunto de dados de treinamento, que não forneça regras explícitas
(AZEVEDO; BRASIL; OLIVEIRA, 2000, pp.03-30; BAETS; VENGOPAL, 1994 DSXG
PASSARI, 2003, p.72; BRAGA; LUDERMIR; CARVALHO 2000, pp.15-27; HAYKIN,
2001, p.28; OLIVEIRA; ALVARENGA, 2003, p.03; SWINGLER, 1996, p.03,08).
Em uma RNA, cada elemento computacional não linear, é chamado de nó ou nodo
e é densamente interconectado, através de conexões diretas. Cada nó recebe um ou mais
34
valores de entrada, que são combinados em um único valor. Com o uso de diferentes
pesos para cada entrada, através de uma função de ativação, gera-se uma saída. Deve-se
ressaltar que o número de elementos que compõem a entrada de uma RNA, não é,
necessariamente, o número de elementos que compõem a saída da mesma RNA
(AZEVEDO; BRASIL; OLIVEIRA, 2000, pp.03-30; BRAGA; LUDERMIR;
CARVALHO 2000, pp.10-13; SWINGLER, 1996, p.03).
Definir a arquitetura de uma RNA é uma decisão importante, uma vez que ela
restringe o tipo de problema a ser tratado pela rede. As principais arquiteturas de redes
são: �D� As que possuem uma camada única, representada pela Figura 6(a): um nó entre
qualquer entrada e qualquer saída; tendem a resolver problemas linearmente separáveis
(i.e. que podem ser separados por uma reta, em um espaço geométrico, no qual os pontos
obedecem a uma equação linear de coordenadas cartesianas); �E� As que possuem
múltiplas camadas, representada pela Figura 6(b): com mais de um neurônio entre alguma
entrada e alguma saída da rede e tendem a resolver problemas não linearmente separáveis
(i.e. possuem o potencial de resolverem problemas complexos) (AZEVEDO; BRASIL;
OLIVEIRA, 2000, pp. 71-72,81-90; BRAGA; LUDERMIR; CARVALHO 2000, p. 11-
12,49, HAYKIN, 2001, pp. 46-47,47-48); �F� As recorrentes, representadas pela Figura
6(c), com a seguinte característica de possuir laços de realimentação (i.e. possuem uma
camada de neurônios que, com seu sinal de saída, alimenta as entradas de todos os outros
neurônios). (HAYKIN, 2001, pp.48-49).
A tecnologia das RNAs, talvez seja a que mais apresenta o profundo poder da MD,
pois elas tentam construir representações internas de modelos ou padrões encontrados
nos dados. A visão do processo das RNAs do tipo MLP a descoberta pode ser feita em
duas fases: na primeira, a seleção dos parâmetros de treinamento do algoritmo, na
segunda, os resultados finais obtidos pela RNA são vistos como uma “caixa preta” (ou
seja, são inexplicáveis) (PASSARI, 2003, p.32; SWINGLER, 1996, p.08); aqui se faz
necessário um apêndice sobre o funcionamento de uma “caixa preta” em uma RNA:
“O funcionamento da RNA se torna uma metáfora de um ato reflexo que, depois de
aprendido, se repete inconscientemente. E este aspecto, que é uma das forças do
paradigma, pois pode ser largamente empregado, constitui, também, em um dos seus
pontos fracos, pois, tal como um ato reflexo, é difícil de explicar o porquê do ato”
(AZEVEDO; BRASIL; OLIVEIRA, 2000, p.18)
35
As RNAs são úteis em diversas aplicações do mundo real, pois lidam com dados
complexos e geralmente incompletos; as primeiras aplicações desenvolvidas nas RNAS
foram: �D� reconhecimento de voz e �E� reconhecimento de padrões visuais.
Atualmente são comuns aplicações como: �D� análise de escrita à mão (utilizados
em SDOPWRSV); �E� controle e automatização de equipamentos em grandes empresas (H�J� montadoras de carros); �F� avaliação de crédito (TURBAN; RAINER; POTTER, 2004,
p.39).
)LJXUD�����$UTXLWHWXUDV�GH�5HGHV�1HXUDLV�$UWLILFLDLV�±�UHWLUDGD�GH�+D\NLQ��������SS��������
36
Diversas áreas empresariais, já utilizam aplicações baseadas em RNAs, dentre as
quais cita-se (TURBAN; RAINER; POTTER, 2004, pp.418-419): �D� a MD� procurando
padrões em bancos de dados grandes e complexos; �E� fraudes fiscais, identificando e
procurando irregularidades; �F� serviços financeiros, identificando padrões de mercado;
�G� avaliação de empréstimo, analisando o cliente, de acordo com seu histórico naquela
instituição; �H� análise de novos produtos, fazendo a previsão de vendas daquele produto
em determinada região; �I� previsão do comportamento do consumidor na Internet, para
ajudar a planejar páginas que possam influenciar em escolha de compra; �J� detecção de
fraudes de cartões de crédito, também analisando padrões de compras.
2.7.3 5HGHV�0XOWL/D\HU�3HUFHSWURQ
As redes SHUFHSWURQ�PXOWL�FDPDGDV ou PXOWLOD\HU�SHUFHSWURQ (MLP) são redes que
possuem mais de uma camada, em sua construção, e apresentam a característica de
resolver problemas complexos São formadas por neurônios artificiais, ligados por
conexões sinápticas e divididas em: �D� camada de entrada, que recebe estímulos do meio
externo; �E� camada interna ou oculta (KLGGHQ), onde ocorre o processamento das
informações e �F� camada de saída, que se comunica com o exterior e apresenta os
resultados (BRAGA; LUDERMIR; CARVALHO 2000; OLIVEIRA JÚNIOR, 2003;
PASSARI, 2003).
A topologia da MLP refere-se ao número de camadas utilizadas. Uma rede MLP
deve ser composta por, pelo menos, três camadas: �D� camada de entrada, que consiste nas
variáveis de entrada do modelo e devem ser conhecidas; �E� camadas intermediárias ou
camadas ocultas, que tornam o modelo mais refinado e não linear, com a capacidade de
aprender padrões mais complexos; �F� camada de saída, que contém um ou mais nós,
representando os resultados finais do processamento (KUO; XUE, 1998 DSXG PASSARI,
2003, p.79).
“Ficou provado que tudo que uma rede pode aprender com Qcamadas
intermediárias pode ser aprendido por uma rede com uma única camada intermediária”
(AZEVEDO; BRASIL; OLIVEIRA, 2000, p.23).
Existem diversos algoritmos de treinamento para RNAs (H�J� EDFN�SURSDJDWLRQ,
FRXQWHUSURSDJDWLRQ), o algoritmo de aprendizado mais conhecido e utilizado para
37
treinamento dessas redes é o EDFN�SURSDJDWLRQ (AZEVEDO; BRASIL; OLIVEIRA,
2000, pp.107-109; RULHEMART; MCCLELLAND, 1986 DSXG BRAGA; LUDERMIR;
CARVALHO 2000, p.59; SWINGLER, 1996, p.10). É um algoritmo supervisionado, que
utiliza pares de entrada e saída desejada para ajustar os pesos da rede, por meio de um
mecanismo de correção de erros. Seu treinamento ocorre nas fases IRUZDUG e EDFNZDUG.
Cada fase percorre a rede em um sentido. A primeira fase (IRUZDUG) é utilizada para
definir a saída da rede, para um dado padrão de entrada. A segunda fase (EDFNZDUG)
“utiliza a saída desejada e a saída fornecida pela rede, para atualizar os pesos de suas
conexões”.(BRAGA; LUDERMIR; CARVALHO 2000, p.59). A Figura 7 foi baseada em
Braga e Ludermir e Carvalho (2000, p.59) e ilustra estas duas fases �D� em uma rede com
uma saída; �E� em uma rede com mais de uma saída.
)LJXUD�����)OX[R�GH�SURFHVVDPHQWR�GR�DOJRULWPR�EDFN�SURSDJDWLRQ�“Um dos problemas enfrentados no treinamento de redes MLP, diz respeito à
definição de seus parâmetros. A seleção dos parâmetros de treinamento do algoritmo
EDFN�SURSDJDWLRQ é um sucesso tão pouco compreendido, que é muitas vezes chamado de
‘magia negra’” (BRAGA; LUDERMIR; CARVALHO 2000, p.66). Outro dos problemas
enfrentados é a ocorrência de RYHUILWWLQJ (excesso de treinamento), pois a rede, em vez de
melhorar, piora a sua taxa de acertos (BRAGA; LUDERMIR; CARVALHO 2000, p.68).
A 7LPH�'HOD\�1HXUDO�1HWZRUN� também é conhecida como atraso de tempo, janela
de tempo ou janelamento. Esta técnica permite que, através de observações passadas,
possa-se realizar o treinamento de uma RNA e predizer ocorrências futuras (LANG;
HINTON, 1988 DSXG BRAGA; LUDERMIR; CARVALHO 2000, p.220, 227;
SWINGLER, 1996, p.43).
38
Existem diversos exemplos bem sucedidos de aplicações de RNAs, na previsão de
séries temporais, com a técnica de janela de tempo. Eis alguns autores (e obras relatadas)
com esta técnica:
a) Braga e Ludermir e Carvalho (2000, p.227): volume de vendas (LANG; HILTON,
1988);
b) Alvarenga e Oliveira Junior e Carvalho (2003, p.14): ��� previsão de ações
(ROSIN, 1997); ��� previsão do IBOVESPA (MORAIS; PORTUGAL, 1999); ��� previsão da demanda de importações brasileiras (SILVA; PORTUGUAL;
CECHIN; 2001); ��� previsão da demanda de energia elétrica de concessionárias
brasileiras (SOTO, 1999); ��� previsão do preço de ovos (TÁPIA; ROISENBERG;
BARRETO, 2000); ��� previsão de venda de cerveja na Austrália (CALÔBA;
SALIBY, 2001);
c) Oliveira; Alvarenga (2003): predição do valor da ação BRTP4 da Brasil Telecom
Participações.
Os autores Braga e Ludermir e Carvalho (2000, p.228) exemplificam a predição do
volume de vendas de um determinado produto, em uma RNA com cinco neurônios de
entrada, sete neurônios na camada intermediária e um neurônio na camada de saída. A
RNA consegue prever, com certa margem de confiança, o volume de vendas, com uma
semana de antecedência. O exemplo dado por esses autores pode ser visto na Figura 8.
)LJXUD���3UHGLomR�GH�YROXPH�GH�YHQGDV�GXUDQWH�FLQFR�VHPDQDV�XWLOL]DQGR�51$�FRP�D��WpFQLFD�GH�MDQHODPHQWR��%5$*$��/8'(50,5��&$59$/+2��������S������
Alvarenga e Oliveira Junior e Carvalho (2003, pp.15-19) utilizaram o simulador
(VRIWZDUH) de redes neurais (DV\11�3OXV, para construção de um modelo para previsão
39
em séries temporais, baseada em RNAs, para o Sistema de Pagamentos Brasileiro. O
modelo foi criado, através da construção de uma RNA, com a seguinte característica: �D� trinta neurônios na camada de entrada, �E� oito na camada intermediária e um na camada
de saída.
Nesse VRIWZDUH� foram aplicados a taxa de aprendizado com o valor 1,00,
momentum 0,60 e com os valores otimizados pelo aplicativo. Os valores previstos são
representados na Figura 9.
)LJXUD������3UHGLomR�UHDOL]DGD�SRU�$OYDUHQJD�H�2OLYHLUD�-XQLRU�H�&DUYDOKR��������S�����Os resultados obtidos por esses autores, demonstram a sazonalidade da série e
podem auxiliar a tomada de decisões, indicando, ao banco, o potencial de depósitos e
aplicações financeiras, oriundas do Sistema Brasileiro de Pagamentos.
Os autores Oliveira e Alvarenga (2003) relatam a construção de um modelo,
utilizado para predição do valor da ação BRTP4, no mercado de capitais. O modelo foi
criado, através da construção de uma RNA, com a seguinte característica: �D� trinta e oito
(38) neurônios na camada de entrada; �E� trinta e oito (38) neurônios na camada
intermediária; (c) dois (02) neurônios na camada de saída.
Foi utilizado o (DV\11�3OXV� com os parâmetros de taxa de aprendizado 0,6,
momentum 0,8 e erro alvo (desejado) 0,05. Os autores relatam que o treinamento foi
realizado com 1.102 amostras, das quais 15 foram escolhidas como amostras de teste. Os
resultados do aprendizado podem ser vistos na Figura 10.
40
)LJXUD������*UiILFR�GD�FXUYD�GH�DSUHQGL]DGR�UHDOL]DGD�SRU�2OLYHLUD�H�$OYDUHQJD��������S�����O erro alcançado nesta predição foi de 0,049916, após 578 ciclos de aprendizado e
os resultados da predição podem ser vistos na Figura 11.
)LJXUD������*UiILFR�GD�SUHGLomR�UHDOL]DGD�SRU�2OLYHLUD�H�$OYDUHQJD�������S�����Em relação aos três artigos acima, todos os autores utilizaram RNAs com o
algoritmo EDFN�SURSDJDWLRQ e possuíam, no período a ser analisado, todo o universo de
variáveis, que seriam trabalhadas. O grande desafio à predição de Dengue, em Goiânia-
Go, com essa técnica e no período de doação, é o percentual estimado pela Divisão de
Epidemiologia da Secretaria Municipal de Saúde de Goiânia, de trinta e cinco a quarenta
por cento de notificações não realizadas. Esse desafio também é enfrentado pelos gestores
da atualidade, na análise dessas informações.
���� *HVWmR�GR�&RQKHFLPHQWR�VREUH�RV�HIHLWRV�GR�FOLPD�QD�VD~GH�KXPDQD�Existem diversas obras (GALE MOORE, 2000, OMS, 2003d, 2004b, 2000b, dentre
outras) que relatam as conseqüências da influência sazonal, em relação às doenças
41
transmitidas por vetores. Nas publicações da OMS (2003d, 2004b), foram abordados os
efeitos das variações climáticas e as técnicas mais conhecidas e utilizadas para medir ou
predizer os seus efeitos sobre a saúde humana. Dentre os provocados pelo clima, estão os
surtos causados por vetores. As mudanças climáticas e seus efeitos (relações),
reconhecidos em diversas áreas, estão representados na Figura 12.
As relações reconhecidas entre o clima e a saúde, incluindo os impactos diretos e
indiretos sobre a humanidade, são diversos. Atingem, de maneira e forma diferentes, as
regiões, os continentes e os países, causando diversos efeitos na saúde da população, de
cada localidade. Entre efeitos na saúde, estão as doenças causadas por vetores e roedores,
que sofrem influência sazonal (OMS, 2003d).
)LJXUD������0XGDQoDV�FOLPiWLFDV�H�VHXV�HIHLWRV�QD�VD~GH�KXPDQD��206������G��S�����WUDGXomR�QRVVD��FRP�DOWHUDo}HV��
As técnicas relatadas nas publicações da OMS (2004b, 2003d), para a predição e
42
detecção de epidemias, que sofrem influência sazonal, são os modelos preditivos e os
Sistemas de Aviso Prévio.
A Organização Mundial de Saúde, em publicações recentes (2000b, 2003d e
2004b), abordou o potencial dos modelos de predição e (DUO\�:DUQLQJ�6\VWHPV (EWS) ou
Sistemas de Aviso Prévio (SAP). São reconhecidos dois tipos de SAP: �D� os
desenvolvidos para epidemiologia; �E� os desenvolvidos para escassez de alimentos
(OMS, 2000b, 2003d). Através da revisão bibliográfica realizada, não foi possível
encontrar trabalhos científicos sobre SAP, aplicados à área de surtos causados por vetores
PRVTXLWR�$HGHV� em regiões urbanas no Brasil.
Os SAP surgiram, através da proposta de Gill (1923 DSXG OMS, 2004b, p.12), para
predizer o surto de doenças infecciosas (malária), baseado nas condições climáticas
(chuva). O modelo foi colocado em prática, na cidade de Punjab, na Índia, entre os anos
1921 e 1942.
Rogers (1923, 1925, 1926 DSXG OMS, 2004b, p.12) descreveu a associação entre
variáveis climáticas (temperatura, chuva, umidade e ventos) e a incidência de doenças
(pneumonia, varíola, lepra e tuberculose), na Índia e em outras localidades. O modelo
nunca foi implementado em larga escala.
Segundo a OMS (2004b, p.12), os estudos já realizados demonstram a utilidade dos
SAP para predizer padrões existentes e futuros de doenças, mesmo sem estabelecer a
relação da associação de fatores climáticos à incidência de doenças. O uso de SAP pode
ajudar a gestores na área de saúde, a desenvolverem planos e concentrarem recursos, onde
forem necessários (PATZ, 1996 DSXG OMS, 2000b, p.10).
Em seu texto, a OMS (2004b, p.12) aponta três fatores para o setor de saúde
explorar os SAP: �D� padronização do diagnóstico, o que possibilita a rápida notificação e
monitoramento de doenças; �E� rede de monitoramento de dados ambientais, a um custo
praticamente inexistente; �F� avanços nos modelos estatísticos e epidemiológicos.
Na sua obra, a OMS (2004b, p.37) relata a não existência e o desconhecimento na
existência de publicações relatando o uso de SAP, ou de modelos implementados, para
auxiliar o suporte a decisões epidemiológicas.
43
A exceção a essa afirmação é o 6RXWKHUQ�$IULFD�0DODULD�&RQWURO (SAMC), que não
publicou suas obras (OMS, 2004b, p.37), pois “não havia coletado os dados apropriados
(H�J� saúde, clima, uso da terra), nos períodos necessários, das regiões afetadas, de forma
adequada” (OMS, 2003d, p.09, tradução nossa).
Na publicação da OMS (2004b, p.16) é dito que: �D� os SAP incorporam, em seu
funcionamento os modelos preditivos; �E� utilizam técnicas estatísticas que podem servir
para predizer a possibilidade de ocorrência de uma epidemia ou predizer o tamanho de
uma epidemia; �F� incluem consideração de condições operacionais de uso e respostas
(nível de acurácia).
Sua predição pode ser feita em semanas, meses ou até mesmo anos (OMS, 2004b,
pp.18-19). Seus principais objetivos são: �D� identificar se uma epidemia irá ocorrer em
uma população, de acordo com um número relatado de casos; �E� predizer o número de
casos, em um período de tempo (OMS, 2004b, p.19).
���� 2PRGHOR�GH�QRWLILFDomR�EUDVLOHLUR�No Brasil, em 1969, foi criado o Sistema de Notificação Semanal de Doenças,
através do qual, as Secretarias Estaduais de Saúde relatavam ao Ministério da Saúde, as
informações dos casos ocorridos naquela região. Em 1975, foi instituído pela lei 6.259,
do mesmo ano, e pelo decreto 78.231, de 1976, o Sistema Nacional de Vigilância
Epidemiológica, que incorporou o conjunto de doenças de maior relevância no país
(FUNASA, 2002, pp.10-11).
O Sistema Único de Saúde foi promulgado em 1990, através da lei 8.080, e através
dele, a descentralização das responsabilidades e funções do sistema de saúde, implicou no
redirecionamento das atividades de vigilância epidemiológica ao município (FUNASA,
2002, pp.10-11). A Portaria n.º 1.943, de 18 de outubro de 2001 do Ministério da Saúde,
aumentou para trinta e cinto, o número de doenças que são compulsórias e, por isto,
devem ser notificadas (FUNASA, 2002, pp.26-27).
Para cada doença, a coleta, notificação13 de casos e geração dos dados são
13 "Notificação é a comunicação da ocorrência de determinada doença ou agravo à saúde, feita à autoridade sanitária, por profissionais de saúde ou qualquer cidadão, para fins de adoção de medidas de intervenção pertinentes" (FUNASA, 2002, p. 15)
44
especificadas no Sistema Nacional de Agravos de Notificação (SINAN). Os dados que
alimentam esse sistema são: �D� dados demográficos, socioeconômicos e ambientais; �E� dados de mortalidade; �F� notificação de surtos e epidemias (FUNASA, 2002).
Encontram-se disponíveis, formulários padronizados do SINAN, para a maioria das
doenças do Sistema de Vigilância Epidemiológica brasileiro, nas unidades de saúde de
atendimento do SUS. Em caso suspeito de alguma dessas doenças, a respectiva ficha é
preenchida e enviada à Secretaria Municipal de Saúde. A notificação é compulsória e
pode ser feita: �D� no local de atendimento; �E��de forma anônima; �F� pela imprensa. O
que facilita, após investigação epidemiológica14, e se necessário, o combate à doença
(FUNASA, 2002, pp.34-37).
������ 'LDJUDPDV�GH�FRQWUROH�O método indicado pela FUNASA (2002, p.48) e adotado em todo Brasil, para
verificação de uma epidemia, é transcrito a seguir:
Um dos métodos utilizados para verificação de ocorrência de uma epidemia é o
DIAGRAMA DE CONTROLE, que consiste na representação gráfica da distribuição da
média mensal e desvio padrão dos valores da freqüência (incidência ou casos) observada,
em um período de tempo (habitualmente 10 anos). A construção desse gráfico pode ser
gerada, procedendo-se da seguinte maneira:
* Verificar se a distribuição do número de casos/incidência da doença, registrado
mensalmente, durante os últimos anos (geralmente dez anos ou mais), apresenta grandes
variações;
* excluem-se os dados referentes a anos epidêmicos;
* calcula-se a média aritmética e os desvios-padrão (pode ser calculado no
programa Excel) de cada distribuição mensal das incidências registradas no período
selecionado;
14 "Investigação epidemiológica é um trabalho de campo, realizado a partir de casos notificados (clinicamente declarados ou suspeitos) e seus contatos, que tem como principais objetivos: identificar fonte e modo de transmissão: grupos expostos a maior risco; fatores determinantes; confirmar diagnóstico; e determinar as principais características epidemiológicas. O seu propósito final é orientar medidas de controle para impedir a ocorrência de novos casos" (FUNASA, 2002, 31).
45
* os valores compreendidos entre aqueles correspondentes à média de cada mês,
acrescidos de 1,96 desvios-padrão e os de cada média mensal, subtraídos 1,96 desvios-
padrão (distribuição normal), correspondem ao nível endêmico da doença, ou seja, o
limite de variação esperada para cada mês;
* representa-se graficamente (diagrama curvilinear) a distribuição das médias e
desvios-padrão da incidência (diagrama de controle);
* quando os valores observados ultrapassam aqueles do limite máximo da variação
esperada, diz-se que está ocorrendo uma epidemia. Dessa maneira, quando uma doença
deixou de ocorrer em uma determinada área, o registro de um único caso pode estar
configurando uma epidemia ou surto.
Ao fim da transcrição, exibe-se um diagrama de controle de Dengue da cidade de
Goiânia-Go no ano 2001 (Figura 13).
)LJXUD����±�'LDJUDPD�GH�FRQWUROH�H�FDVRV�QRWLILFDGRV�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD��*RLkQLD�±�*R��������6,48(,5$�-81,25��������S�����
����� 'HQJXH�H�VHX�9HWRU�O $HGHV�DHJ\SWL� �6WHJRP\D��(Figura 14)�e o�$HGHV�DOERSLFWXV��6NXVH� (Figura 15)
são os vetores conhecidos de Dengue em todo mundo (OMS, 2004, 2003). No Brasil,
nenhuma publicação relata o $HGHV�DOERSLFWXV portando-as.
46
)LJXUD�������$VSHFWR�GH�XP�$HGHV�DHJ\SWL��08167(50$11��������
)LJXUD�����$VSHFWR�GH�XP�$HGHV�DOERSLFWXV� �&58=��������Desconhece-se, através da revisão bibliográfica realizada, publicações nas
Américas, que relatem o $HGHV�DOERSLFWXV portando quaisquer arbovírus, embora Alves
Borges (2001, p.04) relate que “estudos laboratoriais demonstram a competência vetora
do$H�$OERSLFWXV� para transmitir dezoito arbovírus, incluídos em três famílias”.
O relato nesta dissertação será referente ao vetor urbano brasileiro de Dengue, o
$HGHV� DHJ\SWL. Segundo alguns autores (CUMMINGS HW� DO�, 2004, p.345; GALE
MOORE, 2000, p.08; PATZ HW� DO�, 1998, p.01; REBELO HW� DO�, 1999, p.478; OMS,
2004b, pp.24-26, OMS, 2000b, p.07), Dengue possui um vetor que segue séries sazonais
(depende de temperatura e umidade, normalmente com presença de chuva, para se
propagar). A imunidade contra o vírus de Dengue (Den-1, Den-2, Den-3, Den-4) que
contaminou o paciente, é permanente e, para os demais tipos, é de três meses a cinco
anos, na média (FUNASA, 2002, p.186).
Dengue constitui num dos mais importantes problemas de saúde pública, em vários
outros países, exigindo avanços na busca de soluções e obtenção de resultados
satisfatórios nos programas de controle de vetores (BRASSOLATTI; ANDRADE, 2002,
p.244).
47
A prevenção a essas epidemias pode ser feita por meio do combate ao vetor na
forma de: ��� campanhas preventivas, aplicação de veneno nas ruas da cidade; ��� com a
utilização do Ultra Baixo Volume (UBV) (GUBLER, 1989 p.244 DSXG BRASSOLATTI;
ANDRADE, 2000; OMS, 1997, p.57); ��� predadores naturais (PINHEIRO; TADEI,
2002, p.1529; MARTENS HW�DO., 1995, p.04; OMS, 1997, p.59); ��� agentes biológicos
(POLANCZYK; GARCIA; ALVES, 2003, p.01; OMS, 1997, p.58); ��� a soltura
(liberação em locais de risco) de vetores transgênicos (não férteis) (O´BROCHTA, 2002,
pp.247-253).
O vetor pode transmitir o vírus de forma indireta (transmissão horizontal), nas
zonas urbanas e rurais. Na zona rural, a transmissão pode ocorrer do mosquito para
animais, e do mosquito para humanos. Na zona urbana, o vetor transmite as doenças de
um animal (ser humano) a outro (transmissão horizontal), através de um mosquito
infectado. O vetor pode também passar o vírus a sua prole, em sua primeira fase de vida
(transmissão vertical) (OMS, 2004, p.02; OMS, 1996, p.21). A transmissão indireta está
representada na Figura 16.
)LJXUD������7LSRV�GH�WUDQVPLVVmR�LQGLUHWD�UHFRQKHFLGD�SDUD�GHQJXH��206������G��S�����WUDGXomR�QRVVD��FRP�DOWHUDo}HV��
������� 'HQJXH�“A Dengue tem sido relatada nas Américas, há mais de 200 anos” [...] “há
referências de epidemias desde o século XIX” (FUNASA, 2002, p.207). Dengue é um
vírus (arbovirose) (UNICAMP, 2004, p.127) da família )ODYLYLULGDH� gênero )ODYLYLUXV (FUNASA 2002, p.203; HEINZ HW�DO� 2000 DSXG�CORTES, 2003, p.01). De acordo com
as publicações da FUNASA (2002, p.203) e da OMS (2003d, p.14, tradução nossa) “é a
mais importante arbovirose que afeta o ser humano”.
De forma geral, as epidemias desse vírus são identificadas, quando a incidência de
casos acumulados, já atingiu um contingente populacional expressivo, em determinada
área geográfica e, portanto, detectadas de forma tardia (OMS, 2000c, pp.75-88).
É uma doença endêmica em cem países, encontrada em regiões tropicais e
48
subtropicais (Figura 17), predominantemente em regiões urbanas e semi-urbanas. A OMS
estima que ocorram cinqüenta milhões de casos suspeitos ao ano. A vacina contra dengue
vem sendo desenvolvida e ainda não foi testada para uso em larga escala (KHAN HW�DO�,2004, p.85; SRINIVASAN HW�DO. 2004, p.49; OMS, 2003, p.02).
São reconhecidos, no mundo, quatro tipos diferentes do vírus Dengue: Den-1, Den-
2, Den-3 e Den-4. Os tipos Den-1, Den-2 e Den-3 são circulantes em boa parte do Brasil
(SVS, 2005, p.02) (Figura 18). Alguns autores (ALVES BORGES, 2001, pp.18-22;
LOIOLA, 2000, pp.49-55; MSB, 2004, 2005) relatam que o Den-4 não está presente no
Brasil.
�
)LJXUD����±�3DtVHV�FRP�SUHVHQoD�GH�'HQJXH�HP�������206������F��S�����No entanto, a FUNASA (2002, p.207) registrou nos anos de 1981 e 1982,
epidemias comprovadas clínica e laboratorialmente, do Den-4 e Den-1, na cidade de Boa
Vista, em Roraima. Foram registrados, no mesmo período (1981-1982), casos do Den-4
na Venezuela, Equador e Peru (LOIOLA, 2000, pp.49-55). Na obra de )RXTXH e *DULQFL e *DERULW (2004, p.44), há relato da presença dos quatro sorotipos de Dengue na Guiana
Francesa, o que indica, pela proximidade geográfica, a possibilidade de um novo surto no
Brasil.
Os principais hospedeiros do vírus são os humanos. Alguns estudos sugerem que,
em algumas partes do mundo, os macacos podem ser infectados (OMS, 2003, p.02).
49
)LJXUD������6RURWLSRV�FLUFXODQWHV�GR�YtUXV�GD�GHQJXH�SRU�HVWDGRV��%UDVLO��������696���������S�����Dengue, no organismo do vetor, demora de oito a dez dias para se desenvolver e
permanece ativo, até o fim da vida, sem prejudicá-lo (OMS, 2003, p.01). No organismo
humano, os sintomas aparecem, após três dias da picada do vetor contaminado e o vírus
permanece ativo, em média, de cinco a seis dias, período em que os sintomas aparecem
(OMS, 2003, p.02).
Já se registrou a incidência dos casos de Dengue, entre cinqüenta e setenta por cento
da população do Estado do Rio de Janeiro (CREMERJ, 2002 DSXG DENIS, 2003, p.645).
A OMS estima que a incidência possa atingir, entre oitenta e noventa por cento da
população (GUBLER; TRENT 1993 DSXG OMS, 2003, p.51).
Registra-se que um mesmo paciente pode ser infectado por mais de um vírus, ao
mesmo tempo (ROCCO; BARBOSA; KANOMATA, 1998, p.151). A imunidade
humana, quanto a qualquer dos tipos adquiridos de Dengue, é permanente e a infecção
seqüencial por outro tipo do vírus, pode causar a Febre Hemorrágica do Dengue (FHD)
(FUNASA, 2002, p.203, PONTES; RUFFINO NETTO, 1994, p.01; OMS, 2003, p.01).
Epidemias de FHD foram reconhecidas, na década de 1950, nas Filipinas e
Tailândia, afetando a maioria dos países asiáticos, onde se transformou em uma das
principais causas de hospitalização e óbito de crianças. Sem tratamento adequado, pode
causar a morte de um paciente infectado, entre doze e vinte quatro horas. Segundo
estatísticas da OMS, cerca de dois e meio por cento das pessoas com FDH vão a óbito
(OMS, 2003, p.01).
O mais importante vetor de Dengue, nas Américas e na Ásia, são as fêmeas do
$HGHV� DHJ\SWL� Nesses continentes, sua reprodução tem características urbanas. Já, na
50
África, além das áreas urbanas, ocorre, também, em áreas silvestres. Em anos recentes, o
$HGHV�DOERSLFWXV� foi reconhecido (OMS, 1997, p.51) como vetor secundário, na Ásia, e
tornou-se presente em diversos países americanos, dentre eles o Brasil (OMS, 2003,
p.02).
Em diversas publicações (H�J� LIMA HW�DO��� 1999; SILVEIRA RODRIGUES HW�DO�� 2002; SOUSA HW� DO��� 2004; VASCONCELOS HW� DO., 1998), a estimativa dos casos
ocorridos supera a notificação dos órgãos responsáveis, o que dificulta muito o combate
da doença, pois a falta destas informações prejudica a ação e planejamento eficazes dos
gestores da área de saúde para o tratamento dos pacientes e combate ao vetor de Dengue.
Na publicação de NASCIMENTO SOUSA HW�DO� (2004), é relatado que, além dos
elementos (parâmetros) meteorológicos, outros fatores contribuem para a incidência de
Dengue, em uma cidade. Estes fatores podem ser exemplificados, através do modelo
epidemiológico 6XVFHSWLEOH�,QIHFWHG�,PXQH� (SIR), utilizado para estabelecer a dinâmica
da transmissão e com a introdução na população de novos subtipos virais circulantes.
No Brasil, a tipificação laboratorial do Den-1 foi feita em 1996. O Den-2 foi
tipificado em 1990 e finalmente o Den-3, em 2000 (SIQUEIRA JÚNIOR, 2005, p.49).
Todos os surtos do Den-4 detectados, foram controlados e não houve epidemia registrada
depois de 1982.
Publicações recentes (SIQUEIRA JUNIOR HW� DO�, 2004, 2005) relatam que a
ocorrência de Dengue nos anos 2001 e 2002, em toda a América Latina, está concentrada
na população adulta (30 a 49 anos de idade) e, no Brasil, concentrada na faixa etária de 20
a 40 anos de idade.
����� ,QTXpULWRV�VRUROyJLFRV�Inquéritos sorológicos são exames laboratoriais (LOIOLA, 2000, pp.37-43), cujas
amostras são recolhidas de pessoas residentes em locais escolhidos de forma aleatória,
dentro de um mesmo município, e proporcionam estimativa da dimensão de uma
epidemia (FUNASA, 2002, p.272).
Os inquéritos epidemiológicos realizados em populações brasileiras encontram,
mesmo atualmente, sérias dificuldades quanto ao processo de obtenção das amostras
de domicílios. O sorteio por conglomerados em vários estágios, em que o setor
51
censitário é a unidade primária de amostragem, é o método probabilístico
usualmente adotado (Kish, 1965). Informações demográficas sobre os setores
censitários, sorteados no primeiro estágio, podem ser adquiridas na Fundação
Instituto Brasileiro de Geografia e Estatística (IBGE), que também produz cópias
dos mapas construídos para os censos demográficos, realizados a cada 10 anos
(NUNES SILVA; CUNHA; QUINTANILHA, 2003, p.494)
Os inquéritos são importantes para a precisão da avaliação do caso suspeito, por sua
alta eficácia de diagnóstico (CORTES HW� DO., 2003, p.331). Citam-se, em ordem
cronológica de publicação, alguns autores que realizaram inquéritos sorológicos relativos
ao dengue, e os resultados alcançados:
Venâncio da Cunha HW�DO� (1997, p.379) relatam que, em amostragem de crianças
em fase escolar, no ano de 1994, no Município de Paracambi, Estado do Rio de Janeiro, a
positividade do teste de Inibição da Hemaglutinação foi detectada em 39,2% (145/370)
dos casos escolares pesquisados. A freqüência de positividade foi de 53,8% (78/145) para
o sexo feminino, e de 46,2% (67/145) para o sexo masculino. A distribuição por faixa
etária mostrou positividade crescente com o aumento da idade.
Lima HW�DO� (1999, p.566) relatam que, mesmo com a notificação compulsória dos
casos de agravo (448 sendo 57 confirmados), os dados estatísticos, obtidos através de
pesquisa (com 1.113 amostras) realizada três (03) meses após o término da epidemia,
feita com a técnica MAC-ELISA para detecção dos anticorpos IgM Den-1 e Den-2,
apresentaram valores duas vezes superiores aos notificados, e quinze vezes superiores aos
casos laboratoriais relatados, o que indicaria que a epidemia foi muito superior à
inicialmente divulgada.
Vasconcelos HW� DO. (1998, p.447) relatam inquérito baseado em mil trezentas e
quarenta e uma amostras de soro, de nove distritos sanitários, testadas por inibição da
hemaglutinação, sendo classificadas como negativas e positivas, com quarenta e quatro
por cento ou quinhentas e oitenta e oito amostras positivas. Os autores relatam que não
houve diferença da prevalência quanto ao sexo, faixa etária e escolaridade, ao contrário
da condição sócio-econômica que apresentou diferenças estatisticamente significantes.
Silveira Rodrigues HW� DO� (2002, p.160), relatam�estudo realizado em instituto de
correção de menores (com 196 amostras), que indicou o possível nível de disseminação
52
de Dengue, em uma cidade com grande densidade populacional, demonstrando um índice
de infecção muito superior ao oficial.
Cabe salientar, que o preço médio para um kit com 96 (noventa e seis) amostras
(testes individuais) de averiguação de Dengue, com a capacidade de diagnosticar se a
pessoa está com o vírus no momento, ou se já teve contato com o vírus (são kits
diferentes), foi avaliado em um mil e duzentos reais, em fevereiro de 2005.(preço por kit).
Para realizar um inquérito sorológico, com no mínimo mil amostras, seriam necessários
aproximadamente onze kits, o que totalizaria, aproximadamente, treze mil e duzentos
reais, apenas em material para testes laboratoriais.
����� (VWXGRV�UHODWDGRV�������� (VWXGR�DSUHVHQWDGR�QD�66%'0¶���
Esse estudo foi apresentado na ,QWHUQDWLRQDO� &RQIHUHQFH� RQ� 6FLHQWLILF� DQG�6WDWLVWLFDO� 'DWDEDVH� 0DQDJHPHQW� �66'%0¶����� Nele é relatada a arquitetura do
(SLGHPLRORJLFDO�DQG�6WDWLVWLFDO�'DWD�([SORUDWLRQ�6\VWHP (CARESS), baseada no projeto
&DQFHU�5HJLVWU\�/RZHU�6D[RQ\ (CARLOS), iniciado em 1993, na Alemanha. O projeto
CARLOS visou melhorar o acesso às informações, através da unificação de ferramentas
de pesquisa (WIETEK; KAMP, 1997, pp.01-02).
Sua arquitetura é formada pelas seguintes camadas: integração de dados,
questionamento, análise, apresentação visual (feita através de ferramentas) e exploração
interativa (KAMP; SITZMANN; WIETEK, 1997, p.01). O centro de toda a arquitetura
consiste na combinação de dados estatísticos e espaciais (mapas) (WIETEK; KAMP,
1997, p.06).
No CARESS, uma pessoa, através de complexas consultas ao banco de dados e de
operações estatísticas, gera as informações que deseja. Essas consultas podem ser
cíclicas, o que gera complexidade de interpretação e alto tempo de realização da pesquisa
(KAMP; SITZMANN; WIETEK 1997, p.02; WIETEK; KAMP, 1997, p.04).
Essas informações podem ser divididas em: �D� Categorias: região, intervalo de
tempo, propriedades de classificação (H�J� idade, sexo) e não classificativas (H�J� doenças); �E� Resumos: número (H�J� população, casos), medida comparativa (H�J�
53
classificação), medida geral (H�J� nível de significância, testes estatísticos) ou
visualização (H�J� mapas, gráficos ou tabelas) (KAMP; SITZMANN; WIETEK, 1997,
p.01; WIETEK; KAMP, 1997, p.04).
No CARESS, os dados são mantidos em um 'DWDZKDUHKRXVH, agrupados em forma
de metadados e disponíveis para consulta. As consultas em forma de mapas, utilizando
Sistemas de Informações Geográficas, são feitas em duas dimensões (KAMP;
SITZMANN; WIETEK, 1997, p.04).
As estatísticas, obtidas através de agrupamentos dos casos, podem servir como
suporte à decisão, para o tratamento de pacientes (através da pesquisa de tratamentos
similares que foram bem sucedidos), ou na prevenção de novos casos (a partir das
condições ambientais em que as pessoas vivem) (WIETEK; KAMP, 1997).
�������0RGHOR�3DQ�(XURSHX�GH�6D~GH�O Modelo Pan-Europeu de Saúde propõe integrar vários sistemas legados
(programas antigos existentes) de saúde, a fim de utilizar informações de inúmeros
bancos de dados simultâneos. De acordo com a publicação, todos os bancos convergiriam
para a estrutura de um 'DWDZDUHKRXVH, no qual os gestores manejariam informações de
acordo com o perfil dos dados (públicos ou confidenciais) ou o tipo de seu
armazenamento. No modelo Pan-Europeu, foram identificadas três possibilidades de
perfil diferentes (KOVACS HW�DO., 2000, pp.01-07): �D� o perfil de acesso Completo, no
qual os dados privados do paciente são armazenados localmente; �E� o perfil de acesso de
dados Filtrados (parcialmente confidenciais), no qual os dados dos pacientes guardados
por região; �F� o perfil de acesso aos dados Filtrados (confidenciais), no qual os dados dos
pacientes armazenados em âmbito nacional ou internacional.
As desvantagens desse modelo para a criação da informação são: �D� alto tempo
necessário para pesquisa; �E� a alta especialização necessária para operação do
'DWDZDUHKRXVH; �F� subjetividade dos dados (KOVACS HW�DO�, 2000, p.04).
Os conjuntos (grupos) de dados (subjetivos) de sistemas de saúde locais podem ser
assim classificados: �D� Epidemiologia: dados classificados de acordo com a doença,
facilitando a análise geográfica e temporal de alguns pacientes, selecionados de acordo
com as relações entre eles; �E� Orçamento: custo da análise para melhor solução; �F�
54
Recursos humanos: análise da SHUIRUPDQFH de condução, de médicos e outras pessoas;
�G� Recursos materiais: estudos comparativos de instrumentos e infra-estrutura
(utilização, eficiência e custo); �H� Sociologia: estudos podem indicar os benefícios do
bem-estar e os custos de saúde (KOVACS HW�DO., 2000, p.08).
Os autores relatam que o modelo estava sendo implementado no CRYSTAL ':, o
que possibilitaria uma visão geral e transparente do estado clínico dos pacientes, em uma
região.
�������0RGHOR�$OHPmR�GH�6D~GH�No modelo Alemão de Saúde, todas as doenças de notificação compulsória são
analisadas, diariamente, semanalmente, mensalmente ou anualmente, pelo Departamento
de Saúde Pública daquele país (SCHUMANN; LÓPEZ; GRAW 1998). Essas notificações
de doenças são enviadas, em formatos distintos de dados, especificados nas Figuras 19 e
20. Na Figura 19, está representado o formato de envio, dos hospitais ao Departamento de
Saúde Pública Alemão. Na Figura 20, está representado o formato de envio obrigatório de
dados, das companhias seguradoras, ao mesmo departamento de saúde.
)LJXUD������)RUPDWR�GH�HQYLR�GH�GDGRV�GRV�KRVSLWDLV�DR�'HSDUWDPHQWR�GH�6D~GH�3~EOLFD�$OHPmR��6&+80$11��/Ï3(=��*5$:���������
Na Figura 19, Kij representa a freqüência da doença Ki, em uma área geográfica oj
(i.e. distrito ou cidade). Os parâmetros [ta, te] representam o intervalo de tempo.
)LJXUD������)RUPDWR�GH�HQYLR�GH�GDGRV�GRV�KRVSLWDLV�DR�'HSDUWDPHQWR�GH�6D~GH�3~EOLFD�$OHPmR��6&+80$11��/Ï3(=��*5$:��������
O formato de envio dos dados, das companhias seguradoras ao Departamento de
Saúde Alemão, é compulsório e definido por leis daquele país. Essas leis obrigam que a
notificação do caso contenha: tratamento seguido, idade, sexo (dentre outros parâmetros a
serem informados). Na Figura 20, o parâmetro 2 denota o conjunto de áreas geográficas,
.� o tipo da doença e, m1,..., mk, os parâmetros descrevendo o paciente e a doença.
55
Segundo os autores, embora o conjunto de dados 0' possa ser facilmente extraído do
&'� o fluxo de dados é lento e dificulta a predição de epidemias.
�������2XWURV�PRGHORV�GH�SUHGLomR�H�WUDEDOKRV�HQFRQWUDGRV�Rigau-Perez HW�DO� (1999) avaliam a utilidade do Gráfico de Barras, na detecção
de epidemias de Dengue, em Porto Rico, para a vigilância de doenças, em múltiplas
localidades. Durante um período de quatro semanas, observou-se significante aumento
na incidência de Dengue, caracterizado por excesso de casos suspeitos, em mais de duas
semanas, além da média prevista. A apresentação de um índice anual de casos
registrados de Dengue, maior que três por mil foi considerado como epidemia.
Hales HW�DO� (2002) investigam os efeitos potenciais da mudança do clima na saúde
humana, em relação aos arbovetores. Nessa obra, os autores, através de um parâmetro
climático (evaporação de água), avaliaram as mudanças nos limites geográficos da
transmissão de Dengue e o número de possíveis infectados, através de projeções da
população humana e mudanças climáticas.
Os autores relatam que, através de regressões logísticas, com margem de confiança
de oitenta a nove por cento até o ano 2085, o valor aproximado é entre cinco e seis
bilhões de pessoas. De cinqüenta a sessenta por cento da população global projetada,
estariam susceptíveis, em seus limites geográficos atuais, à transmissão de Dengue. Na
construção do modelo, foram utilizados a média mensal das variáveis climáticas (chuva,
temperatura máxima, mínima e média diárias, dentre outras) e o número de casos
notificados da doença.
Penna (2004) realizou um estudo entre as redes neurais e a técnica estatística de
regressão binomial negativa, para predição de cólera, no Ceará. Este estudo teve como
base, os dados de uma epidemia de cólera, ocorrida entre os anos de 1993 e 1994. Foi
utilizada uma rede recorrente, com dois neurônios na camada de entrada (correspondentes
ao ano e ao mês), doze, na camada oculta, um, na camada de saída e um, na de memória.
O treinamento foi feito através do EDFN�SURSDJDWLRQ, com taxa de aprendizado de 0,01 e
momentum de 0,9. Os dados utilizados para treinamento, foram coletados entre janeiro de
1979 e junho de 1991, correspondendo a cento e cinqüenta observações. A predição foi
realizada para o período de agosto de 1991 a dezembro de 1995. Houve o mesmo ajuste
de dados para a técnica de regressão binomial negativa, através da qual foram feitas as
56
predições para o mesmo período. Os resultados são os apresentados na Figura 21.
.
)LJXUD������ÏELWRV�REVHUYDGRV�H�HVWLPDGRV�SRU�UHJUHVVmR�ELQRPLDO�QHJDWLYD�H�UHGH�QHXUDO���&HDUi��-XOKR�GH������D�GH]HPEUR�GH�������3(11$��������S������
Nessa obra, a autora nos relata que os dois modelos alcançaram valores bons de
predição, embora o modelo de regressão binomial negativa estudado, apresentasse menor
variância que o da rede neural (PENNA, 2004, p.355).
������� 7UDEDOKRV�HQFRQWUDGRV�UHODWLYRV�DR�%UDVLO�Siqueira Júnior (2005) faz uma avaliação dos casos de Dengue no Brasil nos anos
situados entre 1981 e 2002. Nessa obra, o autor relata que o Brasil notificou,
aproximadamente, setenta por cento de todos os casos notificados nas Américas.
O autor relata que os casos notificados de Dengue reapareceram nas Américas, na
década de 1960, mas precisamente nas Ilhas Caribenhas e Venezuela; na década de 1970
e na Colômbia e no Brasil, na década de 1980.
O histórico da totalização de casos notificados de dengue, no Brasil, pode ser
demonstrado através da Figura 22. Esta figura apresenta um gráfico que está totalizado
mensalmente, sendo que a barra negra representa o mês de janeiro de cada ano
(SIQUEIRA JÚNIOR, 2005).
57
)LJXUD������&DVRV�UHODWDGRV�GH�GHQJXH�QR�%UDVLO�QRV�DQRV�GH������D�������6,48(,5$�-Ò1,25��������S�����
A Figura 22 fornece informações importantes sobre a ocorrência dos casos de
Dengue no Brasil. A primeira informação é a representação de duas séries temporais
distintas. A segunda informação é a que de forma genérica, no início de cada ano, há um
aumento de número de casos notificados relatados.
A Figura 23 demonstra o número de casos, óbitos, hospitalizações de DH e
tipificação dos casos de Dengue, em todo Brasil, nos anos entre 1996 e 2002, assim como
também FHD, óbitos, hospitalizações e ano de tipificação desse vírus, no Brasil. Nesta
figura pode-se ver o aumento considerável do número de hospitalizações, decorrentes de
complicações relativas ao Dengue ou por FHD.
As últimas pesquisas publicadas no ano de 2004, revelam que houve redução
nacional de 81,8% dos casos notificados, sendo que o estado de Goiás teve decréscimo de
80,7% dos casos de agravo relatados (SVS, 2004, p.05).
58
)LJXUD������1~PHUR�GH�FDVRV�UHODWDGRV�GH�DJUDYR��yELWRV��KRVSLWDOL]Do}HV�H�DQR�GD�WLSLILFDomR�GRV�FDVRV�GH�GHQJXH�QR�%UDVLO��6,48(,5$�-Ò1,25��������S�����
�������2XWUDV�SXEOLFDo}HV�UHIHUHQWHV�D�'HQJXH�Na publicação de Sousa HW� DO� (2004), é relatada uma relação direta entre a
precipitação pluviométrica e o número de casos notificados de Dengue, em Belém-PA, no
período entre 1998 e 2003. Os autores construíram gráficos anuais, divididos em faixas
mensais que, depois de analisados, os levaram a constatar que existe uma maior
incidência de casos de Dengue nos meses considerados mais chuvosos (janeiro, fevereiro,
março e abril). Os autores relacionaram outros parâmetros meteorológicos (temperatura e
umidade relativa) com o surto dessa doença.
Nascimento Sousa HW� DO� (2004), relatam ter utilizado tomada mensal de dados
climáticos (temperatura média, temperatura máxima, temperatura mínima, umidade
relativa do ar e precipitação) entre 1996 e 2000, para determinar, através do método de
coeficientes de incidências mensais, a influência do clima sobre a variação anual média
de casos relatados de Dengue, na cidade de Campina Grande-PB. Os autores relatam que
uma das condições atmosféricas (temperatura mínima) restringe a ação do vetor e o
impede de transmitir o vírus de Dengue. Dizem, ainda, que os elementos (parâmetros)
meteorológicos (chuva, temperatura média e umidade relativa do ar) contribuíram para
incidência da doença, naquela cidade, na faixa de doze a trinta e quatro por cento da
população. Ainda justificam que, “além das condições meteorológicas, existem outras,
causadas por condições nutricionais, sociais, e de defesa imunológica do organismo
59
humano” (NASCIMENTO SOUSA HW�DO�, 2004, p.02) H�J� (relatado pelos autores) e pelo
racionamento de água ocorrido na região.
Andrade e Dantas (2004), em sua obra, avaliam a influência de elementos
meteorológicos, nos casos de várias doenças, dentre elas, Dengue, na cidade de Campina
Grande–PB Os elementos climáticos (temperatura mínima, temperatura máxima,
precipitação, umidade relativa do ar) foram analisados através das médias semanais dos
anos entre 1999 e 2001, totalizando 156 semanas. Foram utilizadas técnicas estatísticas
de regressão linear simples e regressão linear múltipla para determinar a correlação do
número de casos registrados de Dengue e as variações climáticas registradas. O resultado
obtido foi a correlação, considerada, pelos autores, fraca, entre clima (variáveis
climáticas) e o surto de Dengue. Na mesma publicação, é relatado que os elementos
meteorológicos que mais influenciaram na disseminação de Dengue, naquela região,
foram a umidade relativa do ar e a precipitação pluviométrica.
Campus Braga HW�DO� (2004), em artigo, apresentam a regressão linear simples, como
método para predição de Dengue, sobre a região da Paraíba, a partir de uma variável
atmosférica (índice pluviométrico). Os dados adotados para a pesquisa, foram os totais
diários de notificação de Dengue e a precipitação da região. O método tem capacidade de
predição para alguns meses, em relação à distribuição do número de casos relatados de
Dengue. Os resultados encontrados foram de boa acurácia, para alguns municípios da
região estudada.
������� (VWXGRV�HSLGHPLROyJLFRV�HP�*RLkQLD�Em sua dissertação de mestrado, Maciel (1999) - através de métodos estatísticos de
análise epidemiológica descritiva, com construção da série histórica do período, taxas de
ataque (ocorrência) global e específica por idade, sexo e local de residência, com
intervalos de confiança de noventa e cinco por cento - faz uma avaliação epidemiológica,
nos dados notificados de Dengue, no Município de Goiânia, no período entre 1994 e
1997. Na pesquisa, é relatado que o maior número de casos notificados, no período,
ocorreu entre janeiro e maio, também a fase de maior precipitação pluviométrica.
Os resultados encontrados foram: �D� diferença estatística significante entre os
sexos, sendo o feminino o de maior taxa de ataque (ocorrência); �E� faixas etárias mais
60
atingidas, entre vinte e quarenta e nove anos; �F� a região com maior número de
notificações foi a central, com 19,8% dos casos.
É importante ressaltar que, antes da década de 80, não houve notificação do vírus
de Dengue, em Goiânia-Go, portanto, o ano de 1994 foi considerado epidêmico.
Siqueira Júnior (2001), em sua dissertação de mestrado, faz uma avaliação
epidemiológica nos dados notificados de Dengue, no Município de Goiânia. Essa
avaliação, nos dados de notificação, visou oferecer bases para determinar a existência de
epidemia, nos primeiros meses de 2001. Foram utilizadas as técnicas de diagramas de
controle de método analítico-gráfico e método de 6KHZKDUW, para determinar o limite de
alarme para a ocorrência do surto.
Os resultados apresentados foram: �D� a detecção da epidemia (número de casos
notificados comparado ao limite de alarme) por ambas as técnicas. O método analítico-
gráfico, que possibilitou a detecção com duas semanas de antecedência; �E� “identificação
da região Nordeste, como a área inicial, com excesso significativo de casos” (SIQUEIRA
JÚNIOR, 2001, p.06).
Um inquérito populacional foi realizado em mil seiscentos e dez indivíduos, para
avaliar a presença de anticorpos anti-Dengue, através dos testes sorológicos (IgG e IgM),
e os fatores de risco individuais e de área para a ocorrência da infecção no município de
Goiânia em 2001. Foi realizada, através do método .HUQHO, a distribuição espacial da
prevalência na área urbana. Entre os fatores de risco para infecção o resultado
apresentado foi risco em pessoas mais velhas, com baixo nível de educação, menores
salários e em áreas urbanas mais afastadas, das regiões mais valorizadas (SIQUEIRA
JÚNIOR, 2004).
A Figura 25 mostra as estimativas de prevalência de infecção pelo vírus da Dengue
de acordo com a técnica espacial de .HUQHO�para o município de Goiânia. A prevalência
global para região foi de 29,5%.
61
)LJXUD�����SUHYDOrQFLD�GH�GHQJXH�HP�*RLkQLD��������6,48(,5$�-Ò1,25�HW�DO�� ������
62
� 0(72'2/2*,$����� &DUDFWHUL]DomR�GD�SHVTXLVD������� &ODVVLILFDomR�GD�3HVTXLVD�
Este é um trabalho de pesquisa aplicada, que objetiva a criação de modelo
epidemiológico para doenças transmitidas pelo vetor urbano, PRVTXLWR� $HGHV (i.e.
Dengue), que possibilite, com certa margem de confiança, a tomada de decisão aos
gestores de saúde. A classificação da pesquisa quanto ao fim, é explicativa (pretende-
se criar relações, de forma a transformar um conjunto de dados em base de
conhecimento, que prevejam a ocorrência de surtos), quanto ao meio de investigação, e
experimental (pretende-se trabalhar com variáveis independentes e observar como
essas variáveis se comportam). Como a fonte dos dados é interdisciplinar, optou-se, no
caso dos dados, pela pesquisa exploratória descritiva (revisão bibliográfica), com
instrumento de pesquisa documental, visando buscar pesquisas recentes sobre o vetor e
as doenças.
������ 8QLYHUVR�GD�3HVTXLVD�A pesquisa realizada teve como escopo de trabalho, os dados fornecidos, através
de solicitação, pelas seguintes fontes da cidade de Goiânia-GO: �D� 10º Distrito de
Meteorologia (10º DISME); �E� Cia. de Processamento de Dados do Município de
Goiânia (COMDATA); �F��Secretaria Municipal de Saúde de Goiânia (SMS-GO); �G� Divisão de Estudos Sócio Econômicos, pertencente à Secretaria Municipal de
Planejamento (SEPLAN).
O alvo desta pesquisa está direcionado para a criação de modelo epidemiológico,
capaz de prever, com certa margem de confiança, o número de casos confirmados de
Dengue, possibilitando a tomada de decisão/ação (i.e. campanhas de prevenção,
combate ou vacinação de emergência) por parte das autoridades de saúde da cidade
(CUMMINGS HW�DO�, 2004).
O modelo é alimentado conforme as referências bibliográficas (pesquisa
exploratória) e referentes ao vetor das doenças e a parâmetros climáticos,
representados através dos seguintes bancos de dados:
63
a) Dados epidemiológicos – representados pelos exames laboratoriais e
avaliações médicas, registradas no SINAN, e fornecidas pelo
Departamento de Epidemiologia da Secretaria Municipal de Saúde de
Goiânia - Go;
b) Dados (parâmetros) climáticos fornecidos pelo 10º DISME.
���� 0DWHULDO�H�0pWRGRV������� $ERUGDJHP�$GRWDGD�
Por sua característica interdisciplinar, o curso de mestrado da Universidade
Católica de Brasília (UCB), em Gestão do Conhecimento e da Tecnologia da
Informação (MGCTI), possibilita uma abordagem que parte da tecnologia para a gestão
do conhecimento, de forma indutiva e provocativa, a fim de que os processos mentais
atuem para a implantação de modelos formais de Gestão do Conhecimento em várias
áreas. Dentre essas áreas, está a da Saúde, que no momento, tem grande repercussão, no
que tange a ocorrência de epidemias. O processo de análise e descoberta de
conhecimento, utilizado nesta dissertação, baseia-se na metodologia CRISP-DM
(DELMATER; HANCOCK, 2001, p.61; CHAPMAN HW� DO., 1999 DSXG COSTA
SOUSA, 2003, p.47; OLIVEIRA; ALVARENGA, 2003, p.02), através da aplicação em
estudo de caso, para a área fim da Secretaria Municipal de Saúde de Goiânia.
������ 'HVFULomR�GR�PpWRGR�&5,63�'0�O método CRISP-DM (DELMATER; HANCOCK, 2001, p.61; CHAPMAN et
al., 1999 DSXG COSTA SOUSA, 2003, p.47; OLIVEIRA; ALVARENGA, 2003, p.02) é
apresentado por meio de dois modelos básicos: o de referência e o guia do usuário. O
modelo de referência dá uma visão geral do ciclo de um projeto de mineração de dados.
O modelo guia do usuário oferece um detalhamento maior desse processo e será
empregado no estudo de caso.
������ &ROHWD�GH�'DGRV�Concentrada na atividade fim da SMS, a coleta de dados epidemiológicos,
relativos aos casos confirmados de Dengue, para a mineração de dados, foi realizada,
junto ao setor responsável (Departamento de Epidemiologia). Os aspectos sobre o vetor
64
e doenças foram tratados com os profissionais que realizam, diariamente, o serviço de
notificação de doenças e medida da incidência do vetor na cidade (Departamento de
Zoonoses).
Como os órgãos responsáveis pela captação e gerência das informações, relativas
a epidemias e controle do vetor, detêm a competência para lidar com as questões
inerentes ao prontuário de pacientes, os especialistas dessas áreas foram envolvidos e a
SMS proporcionou o acesso ao banco de dados do SINAN, relativo ao Dengue e à
descrição de sua estrutura.
������ 5HSUHVHQWDomR�GD�DQiOLVH�GRV�GDGRV�Representar a análise dos dados para gestores é tarefa aparentemente simples,
mas, na verdade, trata-se, na maioria das vezes, de tarefa complexa, já que emissor e
receptor possuem experiências, formações e bagagens de conhecimento distintas. Para
sanar esta dificuldade, comunicar as investigações realizadas e representar a análise dos
dados para gestores, nesta dissertação, será utilizada a técnica visual de gráficos.
Os gráficos são importantes, pois tornam a comunicação mais rápida, clara e de
fácil assimilação pelo receptor da mensagem. Existem cinco (05) tipos de gráficos
básicos que devem ser utilizados em qualquer pesquisa: �D� o de torta; �E� o de barras;
�F� o de colunas; �G� o de linhas; �H� o de pontos (ZELASNY, 1997, pp.19-36).
Para cada tipo existem especificações: �D� O gráfico de torta deve ser utilizado
para mostrar o tamanho de cada parte como um percentual do total, em, no máximo, seis
divisões (ZELASNY, 1997, pp.38-42); �E� O gráfico de barras, ou de colunas, deve ser
utilizado para demonstrar a variação de um item mensurável (H�J� volume de vendas,
magnitude de rendimento), em um determinado período ou para a comparação entre
diferentes produtos (ZELASNY, 1997, pp.43-45); �F� O gráfico de linhas deve ser
utilizado para mostrar, de forma compacta, se existe tendência de aumento ou
decréscimo em determinado período de tempo (ZELASNY, 1997, pp.48-50); �G� O
gráfico de pontos deve ser utilizado para mostrar a relação entre duas variáveis que
seguem ou não, o padrão que normalmente se esperaria (e.g. pessoas com maior grau de
instrução recebem maiores salários, profissionais com mais tempo de serviço e maior
experiência, realizam tarefas de forma mais rápida e sem necessidade de supervisão).
65
(ZELASNY, 1997, p.56).
No caso de pesquisas que apresentem fortes relações com séries temporais, dois
tipos de gráficos, o de colunas e o de linhas, são os indicados para representar os dados.
No primeiro tipo, o de colunas, deve-se observar o limite máximo de seis ou sete
divisões; já o segundo tipo, o de linhas, deve ser usado para representar mais de sete
divisões (ZELASNY, 1997, p. 36,46-47).
������ $QiOLVH�GRV�JUiILFRV�H�UHVXOWDGRV�HQFRQWUDGRV�QD�SUHGLomR�Escolher gráficos como uma alternativa para melhor representação visual é uma
opção amplamente utilizada em diversas instituições (ZELASNY, 1997). Quando
existem vários gráficos sobre o mesmo assunto, a análise visual pode comprometer a
avaliação sobre qual deles apresenta o melhor resultado. Para sanar essa dúvida, não
resta alternativa, a não ser trabalhar com métricas de análise.
Nesta obra, em termos da análise dos resultados da predição, serão trabalhadas as
seguintes métricas:
a) percentual de erro, representado pelo percentual entre o resultado previsto e o
real (notificado ou confirmado);
b) acurácia da tendência (real versus predita), representada pelo percentual de
número de acertos;
c) erro médio e erro padrão de previsão (observações versus previsões): existe
necessidade de se avaliar as diferenças existentes entre as observações e previsões,
atribuindo um valor numérico que estabeleça a qualidade do estimador utilizado, para
que a avaliação seja abrangente a toda a amostra.
No modelo matemático utilizado nesta dissertação, adotou-se a seguinte diferença
entre os modelos: ���� No caso do erro médio, o modelo utiliza o operador “Valor
Absoluto”; ��� No caso do erro padrão, o modelo utiliza o operador “Elevar ao
quadrado”; O operador Valor Absoluto, aqui utilizado de forma extensiva, não possui
propriedades matemáticas pelas quais se possa fazer uma extensão amostra-população,
já o erro médio é utilizado, apenas, para descrição e não extensão.
66
���� 0RGHOR�3URSRVWR�No Brasil, Dengue é uma doença reemergente e, por isso, as epidemias são um dos
mais importantes problemas de saúde pública, apresentando padrão de contaminação alto,
especialmente em áreas urbanas com elevada densidade populacional (FUNASA, 2002,
p.20). A detecção precoce e a predição de surtos, pelo sistema de vigilância brasileiro, são
essenciais para possibilitar a interrupção da epidemia e o planejamento de combate à
doença.
O número de casos de Dengue relatados em uma (macro/micro) região ou distrito
(de um país, de um estado ou de uma cidade) deve-se às suas próprias características (H�J� densidade demográfica, hidrografia, etc.). Esse número é influenciado por mudanças
climáticas extremas (H�J� chuva, ondas de calor, amplitude térmica, etc.) e forma um
cenário no qual cada variável (H�J� exposição a um novo tipo de vírus, susceptibilidade da
população a este vírus, etc.) possui seu próprio domínio (i.e. número de casos ocorridos,
presença do vetor naquela região, etc.).
O cenário de Dengue no Brasil, em determinado momento histórico, pode ser
representado na forma clássica de séries temporais, através dos relatos das semanas
epidemiológicas. A notificação dos casos de Dengue, em várias regiões brasileiras e no
mesmo período histórico, forma um conjunto de mosaicos, cenários somente explicados
pelas características únicas (H�J� densidade demográfica, influência climática, entrada de
um novo tipo de vírus na região, etc.) que essas regiões apresentam, naquele momento. A
Figura 25 mostra um exemplo desses cenários.
)LJXUD������'DGRV�SUHOLPLQDUHV�GRV�FDVRV�QRWLILFDGRV�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD�VHJXQGR�UHJLmR��%UDVLO��������696��������S����
É possível visualizar os cenários específicos de Dengue, na Figura 26, em uma
67
região escolhida, também na forma de coleção de semanas epidemiológicas.
)LJXUD������'DGRV�SUHOLPLQDUHV�GRV�FDVRV�QRWLILFDGRV�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD�GD�UHJLmR�&HQWUR�2HVWH��%UDVLO�������������696��������S���
O Brasil possui sua própria técnica de predição e combate epidemiológico: o
diagrama de controle (FUNASA, 2002). A técnica, exemplificada na Figura 27, em
cenários específicos na cidade de Goiânia, na forma de coleção de semanas
epidemiológicas.
)LJXUD����±�'LDJUDPD�GH�FRQWUROH�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD��*RLkQLD�������D��������)5$1d$��$/9(6�6,/9$��$025,0�6,/9$��������S�����
As ocorrências de um ano com as de outro, podem ser comparadas – Figura 29 -
através de diagrama que contemple essa possibilidade (FRANÇA; ALVES SILVA;
AMORIM SILVA, 2004, p.52), Na análise do diagrama de controle anterior, Figuras 27,
tem-se o número previsto de casos (média), o limite de alarme (a partir do qual o número
de casos notificados é considerado surto) e o número de casos notificados de uma doença.
68
Os autores Maciel (1999) e Siqueira Júnior (2001) utilizaram pesquisas em bases de
dados. Através de técnicas estatísticas ou diagramas de controle, estimaram a quantidade,
a localização (região) e o perfil de pacientes infectados na cidade em tela.
Existe grande quantidade de obras publicadas que utilizam técnicas estatísticas de
predição já consagradas e que relatam a influência sazonal de Dengue (H�J� ANDRADE;
DANTAS, 2004; CAMPUS BRAGA HW�DO� 2004; FOCKS HW�DO� 1995, RIGATU-PEREZ
HW� DO� 1999; NASCIMENTO SOUSA HW� DO� 2004; SOUSA HW� DO� 2004; SCHREIBER
2001, dentre outras).
Através das publicações da OMS (2003d, 2004b), SVS (2003, 2004, 2005) e dos
autores acima citados (dentre outros), foi possível compilar lista de variáveis que podem
auxiliar o diagnóstico, a localização e a predição de surtos de Dengue. As principais
variáveis são: �D� Mudanças climáticas extremas (H�J� chuva, ondas de calor, amplitude
térmica, etc.); �E� Regionais (H�J� número de casos ocorridos, tipificação do vírus
corrente, susceptibilidade da população ao tipo do vírus, medida do vetor naquela região,
etc.); �F� Físicas da região (H�J� tipo e uso do solo, altitude, vegetação predominante,
características de ocupação territorial, etc.).
A maioria dessas variáveis foi doada por instituições municipais, estaduais e
federais presentes na cidade de Goiânia, que possuem padrões temporais de coleta
distintos, regidos por leis. Algumas das variáveis doadas possuem restrições à publicação
e são de domínio privado.
Assim como relatado pela OMS (2003d, 2004b) em relação às variáveis similares,
não houve possibilidade de análise da amálgama de todas. O problema da impossibilidade
da transformação dos dados para o formato desejado, em tempo hábil, era inesperado e
consumiu aproximadamente três meses da pesquisa. Apenas as variáveis climáticas e
relativas à notificação dessas doenças puderam ser adequadas para o de semanas
epidemiológicas adotado nesta pesquisa.
���� (QWHQGLPHQWR�GR�QHJyFLR�Na fase do CRISP-DM, busca-se a compreensão dos objetivos necessários para o
alcance dos objetivos do projeto. É realizado o levantamento dos requisitos de fontes de
dados e conhecimento de especialistas. Além desses recursos, também são relatados os
69
levantamentos bibliográficos relativos às doenças e, os aspectos legais da disponibilidade
e uso das informações.
������ 2EMHWLYRV�No Brasil, as Secretarias Estaduais e Municipais de Saúde (SMS) são os órgãos
responsáveis pelo controle e combate de surtos de trinta e cinco doenças cuja notificação
é compulsória (FUNASA, 2002). Dentre essas doenças está o Dengue. O seu controle,
combate e prevenção são feitos através de combate ao vetor.
O Departamento de Epidemiologia da Secretaria Municipal de Saúde de Goiânia
estima que cerca de sessenta a sessenta e cinco por cento dos casos de Dengue ocorridos
na cidade de Goiânia, são notificados, o que dificulta o combate ao vetor dessas doenças.
A Secretaria Municipal de Saúde de Goiânia (SMS-GO), assim como as demais
SMS do Brasil, são órgãos que dependem de planejamento prévio (FUNASA; 2002) para
que: �D� suas ações de combate a doenças sejam eficientes e eficazes (FRANÇA; ALVES
SILVA; AMORIM SILVA, 2004); �E� a melhoria contínua de seus sistemas
informatizados proporcione melhor atendimento aos pacientes de uma região (CASTRO,
ARAUJO, 2004; OMS, 2004d).
Na SMS-GO, a Divisão de Vigilância Epidemiológica é responsável pelo cadastro
no SINAN, dos prontuários médicos e seus resultados e pela construção dos diagramas de
controle das doenças de notificação compulsória.
Pode-se então destacar como objetivos principais da Divisão de Vigilância
Epidemiológica (em relação aos dados de Dengue): �D� alimentação de banco de dados do
SINAN; �E� construção de diagramas de controle e, �F� em caso de ocorrência de
epidemias, o diagnóstico e bloqueio perifocal, na área de provável transmissão.
Nas bases de dados do SINAN, que contêm todos os registros classificados como
confirmados, descartados ou suspeitos (i.e. não houve possibilidade de chegar a um
resultado durante a investigação), são mantidos os casos notificados de uma cidade. Cada
região (cidade, estado ou país) tem suas características regionais e físicas próprias e
sofrem diferentes epidemias, em épocas distintas. (OMS, 2003d; 2004b).
A identificação das variáveis climáticas que influenciam o surto de Dengue, em
70
Goiânia, é a etapa secundária do trabalho - a primária é a predição de casos confirmados.
A fase de exploração do espaço do problema é o ponto crítico para um projeto de
mineração de dados e a identificação do problema e sua solução representam duas das
mais importantes fases do projeto de mineração de dados (PYLE 1996 DSXG COSTA
SOUSA, 2003, p.73). Das publicações referentes à predição de Dengue, relatadas por
especialistas e da experiência adquirida durante a fase CRISP-DM, foram selecionados
alguns questionamentos e suas respectivas hipóteses de solução, que serão exploradas
pela mineração de dados, destacando-se as seguintes:
a) Quais as variáveis climáticas que mais contribuem para o menor erro na
variável preditiva (número de casos confirmados) para cidade de Goiânia?
Hipótese: O conjunto de variáveis climáticas influencia o número de casos
confirmados de Dengue.
b) É possível classificar, através dos períodos endêmicos e epidêmicos de Dengue,
as variáveis climáticas de Goiânia?
Hipótese: Períodos endêmicos e epidêmicos de Dengue seguem padrões
meteorológicos.
Com a resolução dessas questões, espera-se fornecer base para suporte ao combate
epidemiológico da doença. Pela análise dos dados e seu entendimento, pode-se identificar
a influência sazonal em relação aos casos confirmados.
������ $YDOLDomR�GRV�UHFXUVRV�DWXDLV�Destina-se à identificação dos recursos necessários para o alcance dos objetivos
deste projeto. É realizado o levantamento dos requisitos de VRIWZDUH, fontes de dados e
conhecimento necessário de especialistas, além de levantamentos sobre a qualidade e
segurança dos resultados.
Iniciando a avaliação, segue abaixo a lista dos recursos disponíveis, em termos de
recursos tecnológicos, dados e informações:
a) Foi utilizada a base de dados referente ao SINAN de Goiânia-GO. Nela estão os
dados cadastrais referentes aos prontuários médicos, em relação ao Dengue. As
71
ocorrências descrevem os resultados das avaliações laboratoriais e médicas
(prova do laço) de cada paciente;
b) Foi utilizada a base de dados referente ao 10º DISME de Goiânia. Nela estão os
dados (parâmetros) climáticos;
c) O equipamento utilizado para execução dos modelos de mineração de dados,
tem as seguintes características: K-7 2600Md, 1 Gbyte de memória, 80 Gbytes
de disco rígido;
d) Simulador de Redes Neurais Artificiais (DV\11�SOXV, disponível na forma livre;
e) Recursos externos disponíveis (acesso a outras bases de dados): dados que não
puderam ser trabalhados na forma temporal (semanas epidemiológicas) adotada
nesta pesquisa.
f) Por seu caráter individual e restrito, o cadastro dos dados do SINAN não pode
ser divulgado, sem a devida autorização, conforme o compromisso de doação
firmado com a Secretaria Municipal de Saúde. A autorização de uso das
informações do cadastro de pacientes, no SINAN, teve sua aprovação baseada
nas restrições impostas pela FUNASA (2002, p.17) e no pedido de doação que
consta do Anexo A.
g) A autorização de uso das informações cadastrais referentes à cidade de Goiânia
foi concedida pela COMDATA, baseada no pedido que consta do Anexo B:
h) As variáveis climáticas foram doadas pelo 10º DISME–Goiânia, para uso
exclusivo desta dissertação de mestrado, conforme pedido do orientador, que
consta do Anexo C.
i) As variáveis referentes à população de Goiânia foram doadas pela Secretaria de
Planejamento daquela cidade e são de domínio público, assim como as doadas
pelo Departamento de Controle de Zoonoses, referentes à medida do vetor
também em Goiânia.
Tendo-se em mãos a autorização para uso das informações e seguindo o modelo
CRISP-DM, pôde-se dar início aos estudos sobre os casos notificados. As bases de dados
72
foram implementadas na plataforma de banco de dados 0LFURVRIW�$FFHVV.������ 2EMHWLYRV�D�VHUHP�DOFDQoDGRV�SHOD�PLQHUDomR�GH�GDGRV�
Tomando-se por base os objetivos desta dissertação, o objetivo principal da
mineração de dados foi o de executar mecanismos de análise e predição sobre a
amálgama do SINAN e 10º DISME, que poderão ser utilizados para planejamento ao
combate a endemias e epidemias de Dengue.
���� (QWHQGLPHQWR�GRV�'DGRV�Durante a fase da coleta, foi realizada investigação preliminar que visou maior
familiarização com os dados, além de avaliação e limpeza.
������ 'DGRV�,QLFLDLV�A cidade de Goiânia, capital do Estado de Goiás, fica localizada entre as
coordenadas geográficas 49º 00’ – 49º 45’ W e 16º 30’ - 17º 00’ S e a sua extensão
territorial é de 741 quilômetros quadrados (SIQUEIRA JÚNIOR 2001, p.09). Nela,
existem, atualmente, duas estações climáticas de coleta, sob a responsabilidade do 10º
DISME. Os dados climáticos doados, para este estudo, são referentes à estação 83423,
localizada em latitude de 16º 40’ S e longitude de 49º 15’ W, com altitude de 741,48
metros.
Os dados utilizados para estudo epidemiológico e sua influência climática foram
coletados a partir dos bancos de dados da Secretaria Municipal de Saúde e do 10º
DISME, no período correspondente a 01 de janeiro de 2001 até 30 de abril de 2004.
Inicialmente, a coleta de dados foi realizada de acordo com o formato de doação
dos arquivos, que, por sua vez, foram importados para o Microsoft Access. A importação
dos dados para aquele banco facilitou sua transformação em informações a serem
analisadas no equipamento onde foi executada a técnica de mineração de dados.
Sobre o gerenciador de Banco de Dados 0LFURVRIW�$FFHVV, as tabelas utilizadas para
extração dos dados necessários à mineração de dados, foram restritas às seguintes:
a) Tabela de prontuários do SINAN de Goiânia – Goiás (0'(1*8(). Número de
registros, 30.495.
73
b) Tabela de semanas epidemiológicas (6(0$1$(3,), referente ao calendário
definido pelo SINAN para todo Brasil. Número de registros, 175.
c) Tabela de parâmetros climáticos (��',60(), referente às variáveis
meteorológicas da cidade de Goiânia, relativa ao período entre 2001 e 2004.
Número de registros gerados, 1.582.
d) Tabela &/$66,),&$'25),1$/ foi gerada pela união das informações das
tabelas eletrônicas: 0'(1*8(�� 6(0$1$(3, e� ��',60(. Nela estão
registrados o número de casos confirmados de Dengue e a sua influência
sazonal representada pela média, definida, D SULRUL, em duas semanas anteriores
à semana epidemiológica pesquisada. Número de registros gerados, 175.
Cabe destacar que as demais variáveis doadas (características físicas e
populacionais da cidade e a medida do vetor) foram convertidas, mas tiveram de ser
descartadas, pois não puderam ser adequadas para o formato do calendário de semanas
epidemiológicas escolhido para esta pesquisa.
������ 'HVFULomR�GRV�GDGRV�Os dados coletados para este estudo estão descritos nos Quadros 2, 3, 4, 5, 6 e 7.
Em cada quadro está contida a estrutura e descrição da tabela de dados, assim como o seu
local de origem, período de abrangência, número de instâncias, formato de doação,
domínio, nome, número de atributos e utilização nesta pesquisa.
Os Quadros estão agrupados conforme os locais de doação. A ordem de descrição
adotada foi a de bancos de dados municipais e, em seguida, o federal. Após cada quadro,
foi feita a descrição dos dados presentes na base. Os bancos de dados municipais
abordados e seus locais de obtenção estão representados nos Quadros 2, 3, 4, 5 e 6.
4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�GR�6,1$1��UHIHUHQWH�D�SHVTXLVDV�VREUH�R�'HQJXH�Domínio Casos notificados de dengue Origem dos Dados Departamento de Epidemiologia da Secretaria
Municipal de Saúde de Goiânia – Goiás Período de abrangência 01/Janeiro/2001 a 30/Abril/2004 Número de Instâncias Ano de 2001 – 06.709
Ano de 2002 – 17.639
74
Ano de 2003 – 08.236 Ano de 200415 – 03.497 Total – 36.081
Formato de doação do arquivo 'DWD�%DVH�)LOH�(DBF)�Formato de trabalho do arquivo0LFURVRIW�$FFHVV�Domínio dos dados Restrito Nome 0'(1*8(�Número de Atributos 87 existentes nos arquivos originais, 13 utilizadas na
CRISP-DM. Utilização Utilizada para geração da tabela CLASSIFICADOR
FINAL Descrição dos Atributos�Dicionário de dados da tabela do SINAN�
Os domínios aqui apresentados são definidos na )LFKD�GH�,QYHVWLJDomR�GH�GHQJXH ID_MUNICIP Código do município onde foi feita
a notificação Domínio: 5208707 (Município de Goiânia)
DT_NOTIFIC Data da notificação NU_IDADE Idade do paciente CS_SEXO Sexo do Paciente Domínio: M; F ID_BAIRRO Código do bairro onde o paciente reside ID_MN_RESI Código do município onde o
paciente reside Domínio: 5208707 (Município de Goiânia)
DENGUE Havia sido infectado com Dengue antes
Domínio: 1 - Sim; 2 - Não; 9 - Ignorado
VACINADO Vacinado contra Febre Amarela Domínio: 1 - Sim; 2 - Não; 9 – Ignorado
FEBRE Teve febre Domínio: 1 - Sim; 2 - Não; 9 – Ignorado
DURACAO Duração da febre em dias LACO Prova do Laço Domínio: Positiva; Negativa; Não Realizada HOSPITALIZ Ocorreu Hospitalização Domínio: Sim; Não; Ignorado CON_CLASSI Resultado final Domínio: 1 – Dengue Clássico; 2 – Dengue com
Complicações; 3 – Febre Hemorrágica de dengue – FHD; 4 – Síndrome do Choque de dengue; 5 – Descartado
No Quadro 2, estão representados os dados do SINAN referentes ao período de
doação. Cada registro desse banco corresponde a uma avaliação médica e/ou exame
laboratorial registrado. Ao total são 36.081 registros de agravo para análise.
No Quadro 3, estão representados os dados referentes às medidas do PRVTXLWR�$HGHV� realizados entre os anos de 2001 e 2004. Cada registro desse banco corresponde ao
índice de %UHWHDX medido, em um determinado período histórico, em um conjunto de
bairros da cidade. É importante ressaltar que foram encontrados os seguintes problemas
na conversão dessa base: �D� a base doada não está em formato que possa facilmente ser
75
transformada em um banco de dados, foi necessária a criação de um campo para
representar o código do bairro e a sua associação manual com os bairros reconhecidos
pela SEPLAN; �E� existem bairros que não estão presentes na amostragem oficial da
SEPLAN; �F� a grafia dos nomes dos bairros dessa doação, não segue nenhuma regra.
4XDGUR�����'LFLRQiULR�GH�GDGRV�VREUH�RV�GDGRV�GR�9HWRU�Domínio Dados Entomológicos sobre o Vetor Origem dos Dados Departamento de Controle de Zoonoses Período de abrangência 22/Março/2002 a 30/Abril/2004. Número total de Instâncias Total – 2.191 Formato de doação do arquivo 12 planilhas do Microsoft Excel Formato de trabalho do arquivo 0LFURVRIW�$FFHVV�Domínio dos dados Público Nome 9,*,B6$1,�Número de Atributos 12 Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL Descrição dos Atributos�
DATAI Data de início DATAF Data de fim CD_BAIRRO Código do Bairro IM_INSP Número de imóveis inspecionados IM_PAAE Número de imóveis com $HGHV�DHJ\SWL IM_PAAL Número de imóveis com $HGHV�DOERSLFWXV DP_PAAE Número de depósitos positivos com $HGHV�DHJ\SWL DP_PAAL Número de depósitos positivos com $HGHV�DOERSLFWXV IIP_MAAE Índice de infestação predial do $HGHV�DHJ\SWL IIP_MAAL Índice de infestação predial do $HGHV�DOERSLFWXV IB_MAAE Índice de %UHWHDX do $HGHV�DHJ\SWL IB_MAAL Índice de %UHWHDX do $HGHV�DOERSLFWXV
No Quadro 4, estão representados os dados referentes ao estudo realizado e
publicado, em 2002, pela SEPLAN, referente ao último censo realizado pelo IBGE, em
2000. Na publicação da SEPLAN, está a lista de todos os bairros reconhecidos por lei,
assim como também, o total de habitantes por sexo e faixa etária, por bairro. É importante
ressaltar que a base doada não possui todos os bairros presentes no cadastro do SINAN.
4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�6(3/$1�Domínio Censo do IBGE publicado pela SEPLAN Origem dos Dados Secretaria de Planejamento (SEPLAN) Período de abrangência 2002 Número total de Instâncias Total – 327 Formato de doação do arquivo $FUREDW�5HDGHU�
15 Os dados existentes referem-se ao ano de 2004, de 01/Janeiro a 30/Abril.
76
Formato de trabalho do arquivo 0LFURVRIW�$FFHVV�Domínio dos dados Público Nome &$5$&7(5,67,&$6%$,55266(3/$1�Número de Atributos 13 Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL Descrição dos Atributos�
CD_BAIRRO Código do bairro NM_BAIRRO Nome do bairro TOTAL População total do bairro POP_H Número de homens do bairro POP_M Número de mulheres do bairro TI00_04 Total de Habitantes com idade entre zero e quatro anos TI05_09 Total de Habitantes com idade entre cinco e nove anos TI10_19 Total de Habitantes com idade entre dez e dezenove anos TI20_29 Total de Habitantes com idade entre vinte e vinte e nove anos TI30_39 Total de Habitantes com idade entre trinta e trinta e nove anos TI40_49 Total de Habitantes com idade entre quarenta e quarenta e nove anos TI50_59 Total de Habitantes com idade entre cinqüenta e cinqüenta e nove
anos TI60 Total de Habitantes com idade superior a sessenta anos
4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�&20'$7$�Domínio Registros da cidade de Goiânia Origem dos Dados COMDATA Período de abrangência Até agosto de 2004 Número total de Instâncias Total – 550 Formato de doação dos dados Texto puro Formato do arquivo 0LFURVRIW�$FFHVV�Domínio dos dados Privado Nome &$5$&7(5Ë67,&$6%$,5526&20'$7$�Número de Atributos 32 Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL Descrição dos Atributos�
CD_BAIRRO Código do Bairro no qual é realizada a feira NM_BAIRRO Nome do Bairro no qual é realizada a feira NR_LT_VAGOS Numero de total de lotes vagos no bairro NR_LT_RES Numero de lotes residenciais NR_LT_COM Numero de lotes comerciais AREA_VERDE Área verde em metros quadrados ASFALTO Domínio: Completamente asfaltado; Parcialmente
asfaltado; Sem asfalto. SEM_INST_SANI Total de lotes sem instalação sanitária COM_INST_SANI Total de lotes sem instalação sanitária HIDROMETRO Total de lotes com hidrômetro CISTERNA Total de lotes com cisterna CISTERNA_HIDROMETRO Total de lotes com cisterna e hidrômetro
77
POCO_ART Total de lotes com poço artesiano SEM_H2O Total de lotes sem água REDE_PUB Total de lotes com rede de esgoto pública FOSSA_SEP Total de lotes com fossa séptica FOSSA_NEGRA Total de lotes com fossa negra SEM_ESGOTO Total de lotes sem esgoto QTDE_FEIRAS Total de feiras livres existentes naquele bairro QTDE_HOSPITAIS Quantidade de hospitais no bairro QTDE_ESCOLAS Quantidade de escolas no bairro NR_PREDIOS Número de prédios (condomínios verticais) existentes no
bairro NR_CEMITERIOS Número de cemitérios por bairro
No Quadro 5, estão representados os dados referentes à doação da COMDATA, em
2004. No conjunto de dados, estão as características físicas referentes a cada bairro. A
base refere-se apenas ao ano 2004 - não foram doados os anos anteriores - e possui
bairros que não estão presentes na publicação da SEPLAN.
4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�UHIHUHQWH�DV�VHPDQDV�HSLGHPLROyJLFDV�Domínio Calendário de semanas epidemiológicas Origem dos Dados Departamento de Vigilância Sanitária Período de abrangência 01/Janeiro/2001 a 30/Abril/2004 Número total de Instâncias Total – 175 Formato de doação dos dados Relatório Formato do arquivo 0LFURVRIW�$FFHVV Domínio dos dados Público Nome 6(0$1$(3,�Número de Atributos 3 Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL Descrição dos Atributos�
INICIO Data do início da semana FIM Data do fim da semana SEM_EPI Semana epidemiológica
No Quadro 6, estão representadas as semanas epidemiológicas do SINAN,
referentes aos anos de 2001 a 2004 (Anexo D).
4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�UHIHUHQWH�DRV�GDGRV�GR�����',60(�Domínio Clima Origem dos Dados Distrito de Meteorologia em Goiás - 10º DISME
pertencente ao Instituto Nacional de Meteorologia (INEMET)
Período de abrangência 01/Janeiro/2001 a 30/Abril/2004 Número total de Instâncias Total – 1.582 Formato de doação dos dados Foram doados 360 arquivos referentes ao clima na
78
cidade de Goiânia. Formato do arquivo Microsoft Access Domínio dos dados Restrito a esta pesquisa Nome ��',60(�Número de Atributos 10 Utilização Utilizada para a geração da tabela CLASSIFICADOR
FINAL Descrição dos Atributos�
DATA Data da avaliação climática N0900 Nebulosidade às 09:00 horas N1800 Nebulosidade às 18:00 horas N2100 Nebulosidade às 21:00 horas PD Índice pluviométrico ou precipitação (medida diária) URA Umidade relativa do ar (média diária, valor em percentual) URAMIN Umidade relativa do ar mínima (medida diária, valor em percentual) URAMAX Umidade relativa do ar máxima (medida diária, valor em percentual) TEMP Temperatura (média diária, valor em Graus Celsius) TEMPMAX Temperatura máxima (medida diária, valor em Graus Celsius) TEMPMIN Temperatura mínima (medida diária, valor em Graus Celsius) AMPLITUDE Amplitude térmica (medida diária, valor em Graus Celsius)
No Quadro 7, estão representados os dados referentes à doação realizada pelo 10º
DISME. No conjunto de dados estão os padrões climáticos. Não houve problemas de
conversão com essa base.
������ ([SORUDomR�GRV�GDGRV�A exploração dos dados foi realizada por meio da linguagem de programação
9LVXDO�%DVLF� na qual, através da lógica de programação estruturada e de comandos SQL,
foram feitas, inicialmente, as seguintes análises:
Em relação à tabela eletrônica�0'(1*8(��a) Foram feitas as seguintes restrições em seus atributos: ��� o campo
CON_CLASSI foi definido como não nulo; ��� os campos ID_MUNICIP e
ID_MN_RESI foram restritos ao código 520870716.
Dessa maneira, eliminaram-se os dados de outras cidades e os resultados das
avaliações médicas não preenchidas e as não condizentes com a pesquisa. Esse
requisito foi utilizado nos anos de 2001, 2002, 2003 e 2004 (Tabela 1 e Figura 28).
16 O código 5208707 é o da cidade de Goiânia, no cadastro de cidades do IBGE.
79
Foi feito um estudo comparativo dos dados que não serão utilizados durante a
análise dos dados.
Ano Existente Após seleção % Perda 2001 6.709 6.178 7,91%2002 17.639 16.617 5,79%2003 8.236 7.577 8,00%2004 3.410 3.301 5,60%Total 35.994 33.673 -
7DEHOD�����7RWDO�GH�UHJLVWURV�DQWHV��GHSRLV�GD�VHOHomR�H�D�SHUGD�
)LJXUD����7RWDO�DQXDO�GH�UHJLVWURV�GH�'HQJXH��6,1$1��*RLkQLD������������O porcentual de perda, na Tabela 1, refere-se aos casos registrados de
pacientes de outras cidades, que realizaram exames na cidade de Goiânia, além de
casos no qual o campo CON_CLASSI eventualmente não está preenchido.
O percentual representativo de cada ano, na base, foi calculado e
representado na Figura 29. Constatou-se que o ano 2002, considerado epidêmico
em todo Brasil, (SIQUEIRA JÚNIOR, 2005), apresentou maior percentual, em
relação aos outros anos analisados17.
17 Os dados referentes a 2004 são até o fim do mês de abril.
80
)LJXUD����±�3HUFHQWXDO�DQXDO�GH�UHJLVWURV�GH�'HQJXH��DSyV�VHOHomR���6,1$1��*RLkQLD��-DQ������D�$EU������b) O total de cada tipo de Dengue, em cada prontuário, foi somado de acordo
com o preenchimento do atributo CON_CLASSI; os valores nulos, que
descartaram infecção e os não preenchidos, foram eliminados dessa análise,
representada na Figura 30.
)LJXUD������7LSRV�H�SHUFHQWXDO�GH�GHQJXH��*RLkQLD�������D������Através da Figura 30, pode-se relatar que o percentual de casos notificados
de FHD é baixo, em comparação aos notificados do tipo clássico de dos
confirmados que apresentaram alguma complicação.
c) O atributo DENGUE foi totalizado de acordo com suas respostas e,
através delas, o seu percentual calculado; os valores nulos, que descartaram
81
infecção e os não preenchidos, foram eliminados da análise.
)LJXUD����±�3HUFHQWXDO�GR�WRWDO�GDV�UHVSRVWDV�QR�FDPSR�'(1*8(�GR�6,1$1��*RLkQLD������������A partir da Figura 31, pode-se relatar que o porcentual de casos, nos quais o
paciente não teve contato anterior com o Dengue, é superior aos que o próprio
entrevistado admite não saber se já havia apresentado a doença ou ainda aos que
afirmou ter sido infectado. Esse relato reforça a idéia de que o vírus se dissemina
(através do vetor), em sua maioria, dentre as pessoas que não apresentaram
infecção prévia.
d) O atributo VACINADO foi totalizado de acordo com suas respostas e,
através delas, o seu percentual calculado. Os valores nulos, que descartaram
infecção e não preenchidos, foram eliminados da análise.
De acordo com a Figura 32, pode-se relatar que o porcentual de casos
confirmados, no qual o paciente já foi vacinado contra Febre Amarela, é superior
aos casos em que ele não foi vacinado ou não sabe responder à pergunta. Através
da análise desses dados, é possível concluir que boa parcela dessa população já
está imunizada contra a Febre Amarela, o que justifica a não apresentação de casos
confirmados da doença, pelo SINAN.
82
)LJXUD������3HUFHQWXDO�GR�WRWDO�GDV�UHVSRVWDV�QR�FDPSR�9$&,1$'2��6,1$1��*RLkQLD������������No atributo CON_CLASSI, os valores de 1 a 4, referentes à tipificação
positiva de Dengue, foram convertidos para SIM; o valor 5, referente ao descarte
para NÃO e os valores nulos ou não preenchidos, foram eliminados das análises
que se sucederam.
Na análise da amálgama das tabelas 0'(1*8( e
&$5$&7(5,67,&$6%$,55266(3/$1 surgem as seguintes informações�O gênero dos pacientes com presença do SIM, no atributo (campo) CON_CLASSI,
foi totalizado e comparado ao gênero da somatória da população, com amostragem feita
pelo IBGE, em 2000, como pode ser visto na Figura 33(a).
Na pesquisa do IBGE (2000), a diferença percentual é de quatro vírgula oito
pontos percentuais, em relação aos gêneros, como pode ser demonstrado através da
Figura 33(a), enquanto na totalização do SINAN, a diferença totalizou treze
vírgula cinqüenta e dois pontos percentuais, como visto na Figura 33(b). Foram
encontrados dezessete casos, nos quais o sexo não está preenchido Esses registros
não apresentam percentual representativo (0,06%) da base e não foram eliminados
das pesquisas que se seguiram.
83
)LJXUD������3HUFHQWXDO�SRU�JrQHUR�HP�*RLkQLD��,%*(��������D���3HUFHQWXDO�SRU�JrQHUR�QD�DQiOLVH�GR�6,1$1��*RLkQLD�������D������
Algumas das hipóteses que poderiam ser formuladas para explicar essa
possível diferença de taxas de ataque de Dengue com relação ao sexo são: �D� grupos que permanecem mais tempo dentro do ambiente domiciliar e/ou ambiente
de trabalho e/ou escolar, possuem uma probabilidade maior de infecção/doença;
�E� demanda espontânea dos serviços de saúde que dispõe de atendimento
preferencial à saúde da mulher18.
a) O total de pacientes com presença do SIM, no campo CON_CLASSI, foi
totalizado por bairro e comparado à última amostragem feita pelo IBGE, em 2000.
Na Figura 34, o número de casos confirmados notificados, apresentou
relação, considerada forte, com o número de habitantes relatado pelo IBGE (2000
18 Hipóteses também levantadas por Maciel (1999, p. 66) em sua dissertação de mestrado.
84
DSXG SEPLAN 2002). Os bairros que apresentaram, em 2000, os maiores números
na população, apresentam, no período pesquisado, o maior número de casos
confirmados. Esse relato levanta a necessidade de trabalhos futuros detalhados e
específicos sobre a ocorrência de Dengue em altas densidades populacionais,
naquela cidade.
)LJXUD����±�&DVRV�FRQILUPDGRV�GH�GHQJXH�YHUVXV�Q~PHUR�GH�KDELWDQWHV�SRU�EDLUUR��*RLkQLD�������D������b) O percentual de pacientes, por faixa etária, com presença do SIM no
campo CON_CLASSI, foi totalizado por ano, de acordo com as faixas existentes
na publicação do IBGE, na última amostragem realizada em Goiânia, no ano de
2000.
Na Figura 35, o número de casos confirmados notificados, apresentou relação
de ocorrência (ataque), considerada forte, nos anos pesquisados. As faixas com
maior percentual de ataque foram respectivamente: 20 a 29, 10 a 19 e 30 a 39 anos,
o que caracteriza um padrão de alto risco de infecção, para população jovem, em
Goiânia, nesse período.
Em Goiânia, a predominância relatada por Maciel (1999, p.65), foi relativa às
faixas etárias de 20 a 29 e 30 a 39 anos, enquanto e Siqueira Junior (2001, p.12)
relatou maior ocorrência nas faixas de 30 a 39 e 40 a 49 anos. Esses relatos de
ataque desiguais, no mesmo local de estudo e sobre a mesma doença, indicam que
ela atacou faixas etárias diferentes, em períodos históricos diferentes.
85
)LJXUD����±�3HUFHQWXDO�GH�IDL[D�HWiULD�SRU�DQR��6,1$1��*RLkQLD������������c) O percentual por gênero e faixa etária, com presença do SIM no campo
CON_CLASSI, foi totalizado, nos anos de doação, de acordo com as faixas
existentes na publicação do IBGE, na última amostragem feita em Goiânia, no ano
de 2000, conforme pode ser visto na Figura 36(a). Esse resultado foi comparado
com o percentual obtido, através de pesquisas da SINAN, naquela cidade, por
gênero - Figura 36(b).
Na Figura 36, embora os gêneros apresentem percentuais muito próximos, na
avaliação do IBGE em 2000, o número de casos confirmados notificados, por
gênero e faixa etária, apresentou diferenças significativas nas idades em que
ocorrem os maiores ataques (20 a 29, 30 a 39 anos e 40 a 49 anos).
86
)LJXUD����±�3HUFHQWXDO�SRU�IDL[D�HWiULD�±�*RLkQLD��,%*(��������D���H��3HUFHQWXDO�GH�FDVRV�FRQILUPDGRV�GH�GHQJXH�±�*RLkQLD��6,1$1�������D������
Na análise dos dados das tabelas 0'(1*8( e
&$5$&7(5,67,&$6%$,5526&20'$7$ surgem as seguintes informações:
a) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi totalizado o número de cemitérios existentes e comparado ao número de casos
confirmados, no período de doação, conforme representado na Figura 37.
O número de casos confirmados apresentou relação considerada fraca, com o
número de cemitérios por bairro. Nos dois bairros, onde existem cemitérios, os
relatos são considerados de baixas proporções (aproximadamente 220 casos em
quatro anos).
87
)LJXUD����±�&DVRV�FRQILUPDGRV�GH�'HQJXH�SRU�EDLUURV�YHUVXV�FHPLWpULRV�H[LVWHQWHV��*RLkQLD������������b) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi calculado o percentual de lotes sem construção (i.e. lotes baldios ou vagos) e
comparado ao número de casos confirmados, no período de doação. O
comparativo pode ser visto na Figura 38.
)LJXUD����±�&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�SHUFHQWXDO�GH�ORWHV�YDJRV�SRU�EDLUURV��*RLkQLD������������
O número de casos confirmados notificados apresentou relação considerada
forte, com os menores percentuais de lotes vagos. De forma genérica, pode-se
afirmar que os bairros que apresentaram os menores percentuais de lotes vagos,
são os que apresentam maiores relatos de casos confirmados. O relato reforça a
necessidade de trabalhos futuros detalhados e específicos, dada a ocorrência de
Dengue, nos locais de alta densidade populacional, naquela cidade.
88
c) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi calculado o percentual representativo de área verde existente e comparado ao
número de casos confirmados, no período de doação. O comparativo pode ser
visto na Figura 39.
)LJXUD������&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�SHUFHQWXDO�GH�iUHD�YHUGH�SRU�EDLUUR��*RLkQLD������������O número de casos confirmados apresentou relação considerada forte com os
menores percentuais de área verde por bairro, ou seja, de forma genérica, a partir
da Figura 39 pode-se relatar que os bairros com os menores percentuais de área
verde são os que apresentam mais relatos de casos confirmados. Este relato
demonstra a necessidade de trabalhos futuros, detalhados e específicos, dada a
ocorrência de Dengue nas altas densidades populacionais, em Goiânia. Surge,
também, outro trabalho futuro interessante: quais as diferenças entre os bairros que
apresentam baixo e alto número de casos, mas possuem densidades similares,
aproximadas, de área verde?
d) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado, por bairro, no período de doação. Para cada bairro,
foi computado o número de feiras livres semanais e comparado ao número de
casos confirmados, no período de doação. Este comparativo pode ser visto na
Figura 40.
89
)LJXUD�����&DVRV�FRQILUPDGRV�GH�GHQJXH�YHUVXV�Q~PHUR�GH�IHLUDV�OLYUHV�VHPDQDLV�SRU�EDLUUR��*RLkQLD������������
O número de casos confirmados apresentou relação considerada fraca com o
número de feiras livres, por bairro.
e) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi computada a quantidade de hospitais e comparada ao número de casos
confirmados. Este comparativo pode ser visto na Figura 41.
)LJXUD������&DVRV�FRQILUPDGRV�GH�GHQJXH�YHUVXV�TXDQWLGDGH�GH�KRVSLWDLV�SRU�EDLUUR��*RLkQLD������������O número de casos confirmados apresentou relação considerada fraca, com o
número de hospitais, por bairro. Os cinco bairros com mais de cinco hospitais,
apresentam relatos semelhantes ou inferiores aos que relataram números similares
ou superiores de casos.
90
f) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi computada a quantidade de escolas existentes e comparada ao número de casos
confirmados, no período de doação. Este comparativo pode ser visto na Figura 42.
)LJXUD������&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�TXDQWLGDGH�GH�HVFRODV��*RLkQLD�������������Pode-se relatar, pela análise da Figura 42, que os quatro bairros com mais de
dez hospitais apresentaram números de casos confirmados, semelhantes aos bairros
que não possuem o mesmo número de hospitais.
g) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi computada a quantidade de escolas existentes e comparada ao número de casos
confirmados, no período de doação. Este comparativo pode ser visto na Figura 43.
Pode-se relatar, pela análise da Figura 43, que os sete bairros com mais de
cinqüenta prédios, apresentam relatos semelhantes aos dos bairros que não
possuem o mesmo número de prédios e, portanto, é considerada uma relação fraca.
91
)LJXUD������&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�TXDQWLGDGH�GH�SUpGLRV�SRU�EDLUUR��*RLkQLD�������������Na análise da amálgama das tabelas 0'(1*8(��6(0$1$(3,�e��',60( surgem
as seguintes informações:
a) O percentual de casos confirmados (i.e. com presença de SIM no campo
CON_CLASSI), nos anos de doação 2001, 2002 e 2003, após a seleção e de
acordo com o calendário do SINAN, foi calculado pela respectiva semana
epidemiológica e está representado na Figura 44.
)LJXUD����±�3HUFHQWXDO�GH�FDVRV�FRQILUPDGRV�SRU�VHPDQD�HSLGHPLROyJLFD��*RLkQLD�������D������A Figura 44 demonstra que o maior número de registros de casos, ocorreu
nas semanas epidemiológicas 01 a 20 de 2002. A tendência de concentração de
casos nessas semanas, embora não tão acentuada, pode ser observada também nos
anos subseqüentes, indicando sazonalidade de ocorrência dos casos de dengue, no
92
mesmo período histórico. A mesma tendência de concentração de casos em 2002,
embora em menor escala, pode ser observada nas semanas 43 a 52.
O ano 2002, naquela cidade, apresentou maior índice pluviométrico (em
relação a 2001, 2003 e 2004) e a entrada de um tipo diferente do vírus (Den-3),
para o qual a população não possuía resistência. Esses dois fatores podem ser
vistos como hipóteses para justificar a ocorrência do surto ocorrido naquele ano.
b) O número de casos confirmados, após a seleção por semana
epidemiológica, foi totalizado. Para cada semana epidemiológica, foi feita, em
relação a cada parâmetro climático, a média climática de duas semanas (definida DSULRUL) relativas ao período mínimo que o vetor necessitaria para se desenvolver e
ter capacidade de disseminar o vírus. Foi feito o estudo visual (através de gráficos)
dos anos e das variáveis climáticas que pudessem ter relação com o surto, em cada
ano.
A série temporal completa, dos casos confirmados de Dengue no período de
doação, pode ser vista na Figura 45. Para possibilitar a visualização da influência sazonal
dos parâmetros climáticos em relação aos casos confirmados de Dengue, a série temporal
foi dividida em quatro anos distintos.
93
6pULH�WHPSRUDO�GRV�FDVRV�FRQILUPDGRV�GH�'HQJXH�GH�DFRUGR�FRP�R�FDOHQGiULR�LQWHUQDFLRQDO�GR�6,1$1��*RLkQLD�*R�����������
0
200
400
600
800
1000
1200
1400
1600
1800
S01
S03
S05
S07
S09
S11
S13
S15
S17
S19
S21
S23
S25
S27
S29
S31
S33
S35
S37
S39
S41
S43
S45
S47
S49
S51
S01
S03
S05
S07
S09
S11
S13
S15
S17
S19
S21
S23
S25
S27
S29
S31
S33
S35
S37
S39
S41
S43
S45
S47
S49
S51
S01
S03
S05
S07
S09
S11
S13
S15
S17
S19
S21
S23
S25
S27
S29
S31
S33
S35
S37
S39
S41
S43
S45
S47
S49
S51
S01
S03
S05
S07
S09
S11
S13
S15
S17
6HPDQDV�HSLGHPLROyJLFDV
&DVRV�GH�'HQJXH
)LJXUD����±�6pULH�WHPSRUDO�GRV�FDVRV�FRQILUPDGRV�GH�'HQJXH��*RLkQLD�������D�����
94
Em relação a 2001, os gráficos desenvolvidos foram representados em um quadro,
no qual cada gráfico recebeu uma letra como identificação:
4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������
No Quadro de gráficos 1, relativo a 2001, o gráfico A representa a influência dos
casos em relação à chuva (índice pluviométrico); o B, em relação à média da umidade
relativa do ar (URA); o C, em relação à média da URA mínima; o D, em relação à média
da URA máxima; o E, em relação à média da temperatura média diária; o F, em relação à
média da temperatura máxima diária; o G, em relação à média da temperatura mínima
95
diária e, finalmente, o H, em relação à média da amplitude térmica diária.
Em relação a 2002, os gráficos desenvolvidos foram representados em um quadro,
no qual cada gráfico recebeu uma letra como identificação:
4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������
No Quadro de gráficos 2, relativo ao ano 2002, o gráfico A representa a influência
dos casos em relação à chuva; o B, em relação à média da umidade relativa do ar (URA);
o C, em relação à média da URA mínima; o D, em relação à média da URA máxima; o E,
em relação à média da temperatura média diária; o F, em relação à média da temperatura
máxima diária; o G, em relação à média da temperatura mínima diária e, finalmente, o H,
96
em relação à média da amplitude térmica diária.
Em relação a 2003, os gráficos desenvolvidos foram representados em um quadro,
no qual cada gráfico recebeu uma letra como identificação:
4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������
No Quadro de gráficos 3, relativo ao ano 2004 (até o período de doação), o gráfico
A representa a influência dos casos em relação à chuva; o B, em relação à média da
umidade relativa do ar (URA); o C, em relação à média da URA mínima; o D, em relação
à média da URA máxima; o E, em relação à média da temperatura média diária; o F, em
relação à média da temperatura máxima diária; o G, em relação à média da temperatura
mínima diária e, finalmente, o H, em relação à média da amplitude térmica diária.
97
Em relação a 2004, os gráficos desenvolvidos foram representados em um quadro,
no qual cada gráfico recebeu uma letra como identificação:
4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������
No Quadro de gráficos 4, relativo ao ano 2004, o gráfico A representa a influência
dos casos em relação à chuva; o B, em relação à média da umidade relativa do ar (URA);
o C, em relação à média da URA mínima; o D, em relação à média da URA máxima; o E,
em relação à média da temperatura média diária; o F, em relação à média da temperatura
máxima diária; o G, em relação à média da temperatura mínima diária e, finalmente, o H,
em relação à média da amplitude térmica diária.
Cabe novamente ressaltar que, no ano de 2002, considerado epidêmico em todo
98
Brasil (SIQUEIRA JÚNIOR et al., 2005), houve a tipificação (detecção) laboratorial do
Den-3, na cidade de Goiânia (tipo de vírus a que a população não tinha resistência). A
variável climática que apresentou maior similaridade com a curva dos casos confirmados
de Dengue notificados, foi o índice pluviométrico, que naquele ano, teve médias
superiores aos anos de 2001, 2003 e 2004.
A Figura 46 demonstra o percentual de casos confirmados por semana
epidemiológica.
Para classificar os períodos endêmicos (baixa concentração de casos) e epidêmicos
(alta concentração de casos) correspondentes aos casos pesquisados de Dengue, foi
necessário o auxílio dos meteorologistas do 10º DISME. Esses meteorologistas
auxiliaram a adaptar a escala anemométrica de %HDXIRUW (Anexo E), a partir da publicação
de Vianello e Alves (1991).
De forma genérica, essa escala foi adaptada para os países de clima temperado e/ou
tropical (Anexo E). A partir de então, os parâmetros climáticos foram classificados,
conforme a característica apresentada nas 178 semanas epidemiológicas, relativas à tabela
6(0$1$(3,. Essa classificação está representada no Quadro 8 e demonstra a influência
sazonal sobre doença. O índice pluviométrico (PD) foi principal parâmetro climático de
influência, durante aquele período, em Goiânia, com a média de duas semanas.
Nos anos analisados, de forma genérica, as semanas epidemiológicas 01 a 20 e 37 a
52 apresentaram maior número de casos, enquanto as semanas 21 a 36, o menor número
de casos. A variável climática que sofre maior alteração é o PD; outras variáveis, como
URA e TEMP, também apresentam influência sazonal. Nas semanas 21 a 36, ela está
com valor igual ou muito próximo de zero (ausência de chuva), enquanto nas outras
semanas, com valores que indicam presença de chuva (> 1,1mm/h).
4XDGUR����&ODVVLILFDomR�GRV�SHUtRGRV�HQGrPLFRV�H�HSLGrPLFRV�GH�*RLkQLD�DQRV������D������Variável climática Períodos endêmicos Períodos epidêmicos
PD Chuvisco fraco Chuva fraca/chuva moderadaURA Desconfortável ou confortável Confortável ou muito úmido URAMIN Desconfortável ou estado de
atenção Confortável
URAMAX Confortável Muito úmido TEMP Clima tropical e subtropical Clima equatorial
99
TEMPMIN Clima tropical e subtropical Clima tropical e subtropical TEMPMAX Clima tropical e subtropical Clima tropical e subtropical AMPLITUDE Clima tropical e subtropical Clima tropical e subtropical
������ 4XDOLGDGH�GRV�GDGRV�Nessa fase, são listados os resultados da verificação da qualidade dos dados do
SINAN, 10º DISME, COMDATA, SEPLAN, Departamento de Vigilância Sanitária e
Departamento de Epidemiologia.
Para preparação dos dados para mineração, os problemas encontrados são tratados
de forma ética e não devem comprometer o resultado esperado. Assim, os registros
atributos com valor faltante, foram descartados da análise e as falhas encontradas no
cadastro foram selecionadas de acordo com os bancos e cronologia abaixo:
a) Historicamente, o cadastro do SINAN (tabela 0'(1*8(), após sua
informatização, vem sofrendo, a cada dia, aperfeiçoamentos, de forma a manter
maior qualidade de informação. As falhas referentes ao cadastro foram: ��� No
campo CS_SEXO, aproximadamente 0,06% registros estavam sem
preenchimento; ��� No campo CON_CLASSI, aproximadamente 6,7% registros
estavam com o valor nulo.
b) O cadastro dos dados meteorológicos realizado pelo 10º DISME (tabela
10DISME), na cidade de Goiânia, não apresentou falhas significativas que
comprometessem sua análise.
c) Historicamente, a SEPLAN mantém o cadastro dos dados relativos aos
bairros oficiais de Goiânia. As atualizações são realizadas no momento em que a
homologação de uma lei torna um bairro oficial e reconhecido. Algumas vezes o
bairro existe na forma de um aglomerado de casas e já possui até mesmo asfalto,
energia elétrica, água e esgoto encanados, mas, ainda assim, o bairro não é
reconhecido. Outras vezes o bairro é homologado, as ruas abertas e asfaltadas,
instalações sanitárias e elétricas implantadas e, mesmo assim, não possui nenhum
morador.
d) A COMDATA, empresa do Município de Goiânia, desenvolve diversos
sistemas e mantém o cadastro dos dados relativos às atividades desse Município.
100
Esses cadastros vêm sendo, diariamente, aperfeiçoados e atualizados, mantendo,
assim, maior qualidade de informação. As falhas encontradas referentes à doação
foram:
I. Não existe padronização entre o nome dos bairros contidos nessa base e
os bairros contidos na publicação da SEPLAN (2002). Para a
associação das bases, foi necessária a criação de uma tupla e a
associação manual, bairro a bairro, entre as tabelas;
II. Existem 223 regiões (bairros) nessa listagem, mas ausentes na
publicação da SEPLAN (2002). Essas regiões condizem, em sua
maioria, a: ��� espaços geográficos a serem povoados (i.e. glebas); ��� Fazendas ou zonas rurais que estão no perímetro urbano; ��� áreas ainda
não reconhecidas como bairros.
e) O Departamento de Controle de Zoonoses realizou, no período estudado,
a tomada do vetor Goiânia e mantém o cadastro dos dados levantados, em
planilhas do aplicativo 0LFURVRIW� ([FHO. As falhas encontradas, referentes ao
cadastro, foram:
I. Não existe padronização entre o nome dos bairros dessa base e os
contidos na publicação da SEPLAN ou nas bases da COMDATA; para
a associação das três bases foi necessária a criação de uma tupla e a
associação manual, bairro a bairro, entre as tabelas;
II. Foram encontrados cerca de trinta bairros (regiões) que não constam em
nenhum dos dois cadastros (SEPLAN ou COMDATA), além dos
nomes dos bairros existentes não seguirem nenhum tipo de padrão, na
sua utilização. Essa base, mesmo depois de totalmente digitada,
associada e conferida, não pôde ser utilizada neste trabalho.
f) O Departamento de Vigilância Sanitária doou, no período estudado, o
calendário epidemiológico do SINAN, em forma de relatório (Anexo D) que,
depois de digitado (tabela 6(0$1$(3,), foi utilizado em toda a pesquisa.
101
������ $VSHFWRV�GD�*&�QR�HQWHQGLPHQWR�GRV�GDGRV�A fase de entendimento dos dados do modelo CRISP-DM está relacionada à
aquisição, seleção e validação do conhecimento. No aspecto organizacional, os
especialistas e publicações recentes (H�J� ALVARENGA, OLIVEIRA JUNIOR,
CARVALHO, 2003; OMS, 2003, 2004, dentre outras) desempenham papel importante, à
medida que determinam os caminhos para identificação e validação dos dados
necessários para a mineração. Já no entendimento dos dados, os especialistas são
provocados, através de processos mentais complexos, para a elaboração de novas idéias
que se tornarão conhecimento útil, para resolução de problemas.
Sem as publicações recentes, não seria possível capturar os requisitos, desde os
dados até o conhecimento para sua avaliação, necessários para solução do problema.
���� 3UHSDUDomR�GRV�GDGRV�Nessa fase e a partir do entendimento dos dados, são gerados os conjuntos que
serão submetidos à ferramenta de análise. Antes de submetê-los, é feita a limpeza dos
dados inconsistentes e faltantes, além da totalização dos casos confirmados e respectivas
médias das variáveis climáticas, de acordo com o calendário do SINAN, adotado para
esta pesquisa.
De acordo com o calendário do SINAN, as semanas epidemiológicas dos anos
2001, 2002 e 2004 têm 52 divisões, já o ano 2003 tem 53 divisões. Para que não haja a
exclusão da semana 53, do ano 2003, foi considerada como a semana um de 2004.
São gerados, na tabela &/$66,),&$'25),1$/, basicamente, os seguintes
conjuntos de dados: �D� total de casos confirmados - originário da tabela de 0'(1*8(,
com dados que não permitem a identificação do paciente; �E� cinqüenta e dois campos
binários indicando qual das semanas epidemiológicas está sendo analisada; �F� média (de
duas semanas) em relação a cada variável climática observada – originária da tabela
10DISME. Esse layout pode ser visto no Quadro 9.
4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�&/$66,),&$'25),1$/�Nome do campo Tipo TamanhoDescrição
NCASOSPOSITIVOS Inteiro 5 Número de casos Notificados
NCASOSPREVISTOS Inteiro 5 Número de casos Previstos
102
S01 ... S52 Lógico 1 Sem. Epidemiológica 01 a 52
PD Inteiro 3 Índice pluviométrico
URA Real 6 Umidade relativa do ar
URAMIN Real 6 Umidade relativa do ar mínima
URAMAX Real 6 Umidade relativa do ar máxima
TEMP Real 6 Temperatura média
TEMPMAX Real 6 Temperatura máxima
TEMPMIN Real 6 Temperatura mínima
AMPLITUDE Inteiro 3 Amplitude térmica
A média dos atributos climáticos seguiu os valores comuns à escala anemométrica
de %HDXIRUW (VIANELLO; ALVES 1991). Assim sendo, PD foi arredondado sem casas
decimais e as médias de URA, URAMIN, URAMAX, TEMP, TEMPMAX, TEMPMIN e
AMPLITUDE, foram arredondados com duas casas decimais. O valor contido no campo
NCASOSPREVISTOS é o seguinte ao NCASOSPOSITIVOS atual.
���� 0RGHODJHP�No CRISP-DM, a modelagem é a fase em que se escolhe a técnica de mineração de
dados e que apresenta forte interação com a fase de preparação. Acrescenta-se a isso, a
técnica escolhida, que pode ter implicações na formatação dos dados. A técnica de
modelagem a ser utilizada neste trabalho é a de predição, que se destinará à estimativa do
número de casos confirmados, na semana subseqüente à atual.
A predição foi escolhida como técnica, em virtude da necessidade de encontrar
modelos que fossem capazes de estimar, com certa margem de confiança, o número de
casos confirmados de Dengue, em uma cidade. Essa predição possibilita aos gestores, a
destinação de recursos humanos e financeiros para análise das áreas de ocorrência e do
perfil dos pacientes infectados.
Essa simples análise pode fornecer as bases para melhorar o atendimento aos
pacientes além, é claro, do combate ao vetor, nos pontos mais críticos de ocorrência, em
uma cidade. Ações de planejamento podem ser implementadas, por exemplo, através da
localização manual dos casos do SINAN e da análise das últimas N semanas (à escolha
do gestor), em uma ferramenta de Sistema de Informação Geográfica.
103
Foi escolhida a técnica de janelamento de RNAs, por sua capacidade de predição e
pelas existência de diversas obras publicadas. A aplicação dessa técnica consiste em usar,
como entradas de rede, “uma seqüência de valores passados (janela de tempo), da
grandeza que se deseja prever” (ALVARENGA, OLIVEIRA JUNIOR, CARVALHO
2003, p.14).
Para se utilizar a técnica de janelamento precisamos definir as seguintes variáveis
(BRAGA, LUDERMIR, CARVALHO, 2000, p.227):
a) A janela de entrada utiliza um conjunto de valores passados que serão as
entradas da rede neural; por exemplo, 15 valores;
b) A janela de saída utiliza o valor da série com W passos à frente; por exemplo, três
passos à frente;
c) Uma ou um conjunto de variáveis explicativas que podem ajudar no
treinamento da rede; por exemplo, dia, mês ou ano da entrada W�
A Figura 46 é o diagrama de controle, até a semana epidemiológica 16 do ano 2004,
feito pela Divisão de Epidemiologia da Secretaria Municipal de Saúde de Goiânia.
Os dados, contidos na Figura 46, doados em forma de planilha 0LFURVRIW� ([FHO� foram transpostos para a Tabela 2 e analisados. O número de casos previstos foi
comparado ao número de casos notificados, e a tendência de alta ou queda, foi avaliada,
através do acerto apresentado na série.
)LJXUD����±�'LDJUDPD�GH�FRQWUROH�GH�'HQJXH�SRU�VHPDQD�HSLGHPLROyJLFD��606*2��*RLkQLD�������
104
7DEHOD�����$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR�IHLWD�DWUDYpV�GR�'LDJUDPD�GH�&RQWUROH�GD�6HFUHWDULD�0XQLFLSDO�GH�6D~GH�GH�*RLkQLD���*RLiV�������
Resultados Tendência semana/2004previstos notificados % erro real predita acerto S02 25,3 91 259,68 Alta Alta Ok S03 35,8 109 204,47 Alta Alta Ok S04 43 144 234,88 Queda Alta - S05 37,5 217 478,67 Queda Queda Ok S06 36,8 205 457,07 Queda Queda Ok S07 35,8 188 425,14 Alta Queda - S08 37,8 160 323,28 Queda Alta - S09 37,7 165 337,67 Alta Alta Ok S10 42,8 179 318,22 Queda Queda Ok S11 38,2 139 263,87 Alta Alta Ok S12 44,5 203 356,18 Queda Queda Ok S13 42,7 179 319,20 Queda Queda Ok S14 33,8 142 320,12 Alta Queda - S15 44 128 190,91 Queda Alta - S16 43,5 148 240,23 Queda Queda Ok S17 33,3 136 308,41 - - -
Depois da análise dos resultados da predição versus os casos notificados, através do
percentual de erro, analisou-se a tendência, na Tabela 2. Com isso, a taxa de erro
encontrada na tendência foi de 40% e o erro padrão na previsão de 127,2.
Da tabela eletrônica &/$66,),&$'25),1$/, oriunda do aplicativo 0LFURVRIW�$FFHVV� foram selecionados 60 atributos preditivos: NCASOSPOSITIVOS, S01, S02,
...S52, PD, URA, URAMIN, URAMAX, TEMP, TEMPMAX, TEMPMIN,
AMPLITUDE. A classe alvo desta tabela é o campo NCASOSPREVISTOS.
Esta tabela foi importada para o 0LFURVRIW� ([FHO e convertida para o formato
&RPPD� 6HSDUDWHG� 9DOXH (CSV). Após a conversão, o arquivo resultante foi editado,
através do aplicativo 7H[WSDG19� e todas as vírgulas substituídas por pontos.
Os testes foram realizados na forma de estudos, aqui chamados de rodada de testes,
através dos quais, os parâmetros climáticos foram testados em relação ao número de
casos confirmados, naquela semana epidemiológica. Cabe relembrar que, no caso desses
estudos, o que se prediz é o número de casos confirmados e não de casos notificados, o
que indica granularidade superior à da técnica de Diagrama de Controle.
19 Download gratuito através do link ftp://download.textpad.com/pub/textpad4.7/txpptb473.exe
105
Na primeira rodada de testes, foram testadas as seguintes arquiteturas, em relação
aos casos confirmados: �D� sem nenhuma variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA,
AMPLITUDE; �I� PD, AMPLITUDE; �J�� PD, URA, URAMIN, URAMAX, TEMP,
TEMPMIN, TEMPMAX, AMPLITUDE.
Utilizou-se o (DV\11�SOXV����� com a seguinte configuração, para todos os testes:
aprendizado de 0,7, momentum 0,9, erro desejado (alvo) 0,02 e valores otimizados pelo
aplicativo.
A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa
série, apresenta os dados, assim organizados e divididos:
a) As 33.673 instâncias referentes à tabela 0'(1*8( foram agrupadas e
contabilizadas, de acordo com o calendário de semanas epidemiológicas do
SINAN. Esse agrupamento resultou em 173 instâncias.
b) Do total dos 36.081 casos de agravo, 33.673 (93,3% aproximadamente) eram
casos confirmados e 1.582, referentes a medidas climáticas diárias. Os dados
foram separados em treinamento (2001 e 2002), avaliação (2003) e teste (2004).
c) Para treinamento, foram utilizadas 106 instâncias, referentes aos anos de 2001,
2002. Para avaliação, foram utilizadas 53 instâncias, referentes a 2003. Na
predição, foram utilizadas 16 instâncias, referentes aos quatro primeiros meses
de 2004.
O modelo da rede que obteve os melhores resultados dessa série apresenta
cinqüenta e seis neurônios na camada de entrada, treze, na camada intermediária e um, na
camada de saída. O modelo está representado na Figura 47 e apresenta os seguintes
neurônios:
• 52 neurônios binários (um para cada semana do ano), utilizados com o
objetivo de auxiliar à rede a identificar os componentes sazonais da série;
• Um neurônio contendo o valor da observação PD;
• Um neurônio contendo o valor da observação URA;
106
• Um neurônio contendo o valor da observação TEMP;
• Um neurônio contendo o valor da observação atual e,
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).
)LJXUD������$UTXLWHWXUD�GH�UHGH�XWLOL]DGD���QR�(DV\QQ�3OXV��SDUD�SUHGLomR�HSLGHPLROyJLFD�GH�'HQJXH�O gráfico da curva de aprendizado, no aplicativo utilizado, e com essa arquitetura,
está na Figura 48.
)LJXUD����±�*UiILFR�GD�FXUYD�GH�DSUHQGL]DGR�±�5RGDGD���
Os resultados obtidos nessa predição são mostrados na Tabela 3 e na Figura 49.
7DEHOD���±�$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR�±�7pFQLFD���Resultados Tendência
semana/2004confirmados previstos % erro real predita acerto S02 96 39 59,38 Queda Alta - S03 73 32 56,16 Alta Alta Ok S04 102 34 66,67 Alta Alta Ok S05 123 39 68,29 Alta Queda -S06 198 46 76,77 QuedaAlta - S07 179 56 68,72 QuedaAlta - S08 163 43 73,62 QuedaQueda Ok S09 147 44 70,07 QuedaQueda Ok S10 130 33 74,62 Alta Queda -S11 154 37 75,97 QuedaQueda Ok S12 112 29 74,11 Alta Queda -
107
S13 156 39 75,00 Queda Alta - S14 148 31 79,05 Queda Queda Ok S15 113 31 72,57 Queda Alta - S16 89 37 58,43 Alta Queda -S17 126 33 73,81 - - -
)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro encontrada na tendência foi de 26,7% e o erro
padrão 101,8.
Na segunda rodada de testes, foi gerada uma massa de dados, na tentativa de
auxiliar o treinamento da rede. A lógica utilizada é a que se segue: nas dezesseis
primeiras semanas de 2004, o número de casos confirmados notificados totaliza
aproximadamente 56,4% do número encontrado em 2003. Se essas semanas de 2004
forem comparadas às de 2002, o decréscimo chega a aproximadamente 83,6%. Os
cálculos dão a noção de decréscimo do número de casos notificados de Dengue, em 2004,
ao menos em Goiânia, no período estudado. Parte de sua população, em 2002, adquiriu
resistência ao Den-3, após ocorrência de surto.
Em relação ao Brasil, de forma genérica, pode-se afirmar, a partir das Figuras 23 e
24, que: �D� antes de cada ano considerado epidêmico (1987, 1991, 1998, 2002), existe
um ano com tendência crescente do número de casos notificados; �E� sempre depois dos
anos considerados epidêmicos, há redução drástica no número de casos notificados; (b)
108
em média, após quatro anos da ocorrência de um surto, outro ocorre.
A tática adotada visou gerar três anos com a função de ensinar a RNA que, após um
ano epidêmico, acontece queda brusca no número de casos. Para representar essas
informações para rede neural, foram consideradas as trinta e três mil, seiscentas e setenta
e três instâncias (i.e. casos confirmados) agrupadas e contabilizadas, segundo o
calendário do SINAN relativo ao período de estudo, o que resultou em 173 instâncias.
Para o primeiro ano, a fórmula de geração para os campos não binários é a que
se segue.
Sn é a somatória de i, variando de 1 a 3, dividida por 3. Os anos de origem foram
2001, 2002 e 2003.
Em relação ao segundo ano, a fórmula de geração para os campos não binários
é:
Sn é a somatória de i, variando de 1 a 2, dividida por 2. Os anos de origem
foram 2001 e 2003.
Para o terceiro ano, a fórmula de geração para os campos não binários segue a
seguinte seqüência: O número de casos confirmados recebeu o valor do ano 2003, menos
trinta por cento do mesmo campo, nessa tabela e as variáveis climáticas receberam os
valores da média dos anos gerados.
O treinamento dado à rede, pode ser visto no Quadro de gráficos 5, através do qual
vê-se exemplos da ocorrência de decréscimo brusco no número de casos, após um surto.
109
4XDGUR�GH�JUiILFRV���±�7UHLQDPHQWR�SURSRVWR�±�5RGDGD���Foram testadas as seguintes arquiteturas, em relação aos casos confirmados: �D� sem
nenhuma variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA, AMPLITUDE; �I� PD, AMPLITUDE; �J��PD, URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE.
A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa
série, apresenta os dados, assim organizados e divididos:
a) Para treinamento, foram utilizadas 260 instâncias, referentes aos anos de 2001 e
2002, ano de treinamento 1 e ano de treinamento 2;
b) Para avaliação, foram utilizadas 53 instâncias, referentes ano de 2003;
c) Na predição, foram utilizadas 17 instâncias, referentes aos quatro primeiros meses
do ano 2004.
O modelo da rede que obteve os melhores resultados dessa série apresenta
cinqüenta e seis neurônios na camada de entrada, treze, na camada intermediária e um, na
camada de saída. A arquitetura está representada na Figura 47. A camada de entrada
apresenta os seguintes neurônios:
• 52 neurônios binários (um para cada semana) ,utilizados com o objetivo de
auxiliar a rede a identificar os componentes sazonais da série;
• Um neurônio contendo o valor da observação PD;
• Um neurônio contendo o valor da observação URA;
110
• Um neurônio contendo o valor da observação TEMP;
• Um neurônio contendo o valor da observação atual;
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).
O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,
está na Figura 50.
)LJXUD���±�*UiILFR�GD�FXUYD�GH�DSUHQGL]DGR�±�5RGDGD���O erro alcançado, como pode ser visto na Figura 50, foi inferior ao desejado. Os
resultados obtidos, após o treinamento, são mostrados na Tabela 4 e na Figura 51.
7DEHOD���±�$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR����5RGDGD���Resultados Tendência
Semana/2004 confirmadosprevistos % erro real predita acerto S02 96 34 64,58 Queda Alta - S03 73 64 12,33 Alta Alta Ok S04 102 145 42,16 Alta Alta Ok S05 123 161 30,89 Alta Queda -S06 198 145 26,77 QuedaAlta - S07 179 174 2,79 QuedaQueda Ok S08 163 173 6,13 QuedaQueda Ok S09 147 126 14,29 QuedaAlta - S10 130 143 10,00 Alta Alta Ok S11 154 152 1,30 QuedaQueda Ok S12 112 150 33,93 Alta Queda -S13 156 139 10,90 QuedaQueda Ok S14 148 118 20,27 QuedaQueda Ok S15 113 60 46,90 QuedaAlta - S16 89 109 22,47 Alta Queda -S17 126 76 39,68 - - -
111
)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�'HQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro na tendência foi de 46,7% e o erro padrão 35,7.
Na terceira rodada de testes, foi utilizada a mesma massa de dados existente na
primeira rodada. Dessa vez, cada valor dos parâmetros meteorológicos foi substituído
pela respectiva faixa da escala adaptada de %HDXIRUW.Foram testadas as seguintes arquiteturas, em relação aos casos confirmados: �D� sem
nenhuma variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA, AMPLITUDE; �I� PD, AMPLITUDE; �J��PD, URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE.
Utilizou-se o (DV\11�SOXV���� com a seguinte configuração, para todos os testes:
aprendizado de 0,7, momento 0,8, erro desejado (alvo) 0,02% e valores otimizados pelo
aplicativo.
A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa
série, apresenta os dado e foram assim organizados e divididos:
a) As 33.673 instâncias, referentes à tabela MDENGUE, foram agrupadas e
contabilizadas de acordo com o calendário de semanas epidemiológicas do SINAN. O
agrupamento resultou em 173 instâncias.
112
b) Do total dos 36.081 casos de agravo, 33.673 eram casos confirmados e 1.582,
dados referentes a medidas climáticas diárias. Os dados foram separados em treinamento
(2001 e 2002), avaliação (2003) e teste (2004).
c) Para treinamento, foram utilizadas as 128 primeiras instâncias e para avaliação
foram utilizadas as próximas 28 instâncias. Na predição, foram utilizadas 16 instâncias,
referentes aos quatro primeiros meses de 2004.
O modelo da rede que obteve os melhores resultados dessa série apresenta
cinqüenta e seis neurônios, na camada de entrada, treze na camada intermediária e um, na
camada de saída. O modelo apresenta os seguintes neurônios:
• 52 neurônios binários (um para cada semana do ano), utilizados com o
objetivo de auxiliar a rede a identificar os componentes sazonais da série;
• Um neurônio contendo a faixa da observação PD;
• Um neurônio contendo a faixa da observação URAMAX;
• Um neurônio contendo a faixa da observação TEMPMAX;
• Um neurônio contendo o valor da observação atual;
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).
O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,
está na Figura 52.
)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���O erro alcançado na Figura 52 foi inferior ao desejado e os resultados obtidos, após
o treinamento, são mostrados na Tabela 5 e na Figura 53.
113
7DEHOD���±�$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR����5RGDGD���Resultados Tendência
Semana/2004 confirmadosprevistos % erro real predita acerto S02 96 62 35,42 Queda Queda Ok S03 73 53 27,40 Alta Alta Ok S04 102 60 41,18 Alta Alta Ok S05 123 178 44,72 Alta Alta Ok S06 198 258 30,30 Queda Queda Ok S07 179 177 1,12 Queda Queda Ok S08 163 164 0,61 Queda Alta - S09 147 181 23,13 Queda Queda Ok S10 130 150 15,38 Alta Alta Ok S11 154 152 1,30 Queda Alta - S12 112 176 57,14 Alta Queda -S13 156 83 46,79 Queda Queda Ok S14 148 68 54,05 Queda Alta - S15 113 116 2,65 Queda Queda Ok S16 89 72 19,10 Alta Alta Ok S17 126 135 7,14 - - -
)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro na tendência foi de 26,7% o erro padrão 43
aproximadamente.
Foi solicitada a Secretaria Municipal de Saúde de Goiânia a doação dos dados de
Dengue em todo o ano 2004. Todas as rodadas de testes foram novamente feitas, desta
vez, foram preditos os casos notificados de Dengue em Goiânia em todo ano de 2004.
Foram testadas as seguintes arquiteturas, com o (DV\11�SOXV� ��� na seguinte
configuração, para todos os testes: aprendizado de 0,7, momento 0,8, erro desejado (alvo)
114
0,02% e valores otimizados pelo aplicativo.
Em relação aos casos notificados:
Com as médias climáticas: �D� sem nenhuma variável climática; �E� PD, URA,
TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA,
AMPLITUDE; �I� PD, AMPLITUDE; �J�� PD, URA, URAMIN, URAMAX, TEMP,
TEMPMIN, TEMPMAX, AMPLITUDE.
Com a adaptação da estala de %HDXIRUW� feita nesta dissertação: �D� sem nenhuma
variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD,
URAMAX, TEMPMAX; �H� PD, URA, AMPLITUDE; �I� PD, AMPLITUDE; �J��PD,
URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE; �K� PD,
PD_Beaufort, URA, URA_Beaufort, TEMP, TEMP_Beaufort,; �L� PD, PD_Beaufort,
URAMIN, URAMIN_Beaufort, TEMPMIN, TEMPMIN_Beaufort; �M� PD, PD_Beaufort,
URAMAX, URAMAX_Beaufort, TEMPMAX, TEMPMAX_Beaufort; �N� PD,
PD_Beaufort, URA, URA_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort; �O� PD,
PD_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort; �P��PD, PD_Beaufort, URA,
URA_Beaufort, URAMIN, URAMIN_Beaufort, URAMAX, URAMAX_Beaufort,
TEMP, TEMP_Beaufort, TEMPMIN, TEMPMIN_Beaufort, TEMPMAX,
TEMPMAX_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort, �1�� PD, PD_Beaufort,
URA, URA_Beaufort, URAMIN, URAMIN_Beaufort, URAMAX, URAMAX_Beaufort,
TEMP, TEMP_Beaufort, TEMPMIN, TEMPMIN_Beaufort, TEMPMAX,
TEMPMAX_Beaufort.
A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa
série, apresenta os dado e foram assim organizados e divididos:
a) As instâncias, referentes à tabela MDENGUE, foram agrupadas e contabilizadas
de acordo com o calendário de semanas epidemiológicas do SINAN. O agrupamento
resultou em 208 instâncias.
b) Para treinamento, foram utilizadas as 118 primeiras instâncias e para avaliação
foram utilizadas as próximas 38 instâncias. Na predição, foram utilizadas 526 instâncias,
referentes ao ano 2004.
115
O modelo da rede que obteve os melhores resultados dessa série apresenta sessenta
e sete neurônios, na camada de entrada, doze na camada intermediária e um, na camada
de saída. O modelo apresenta os seguintes neurônios:
• 52 neurônios binários (um para cada semana do ano), utilizados com o
objetivo de auxiliar a rede a identificar os componentes sazonais da série;
• Um neurônio contendo a faixa da observação PD;
• Um neurônio contendo a faixa da observação PD_Beaufort;
• Um neurônio contendo a faixa da observação URAMIN;
• Um neurônio contendo a faixa da observação URAMIN_Beaufort;
• Um neurônio contendo a faixa da observação URAMAX;
• Um neurônio contendo a faixa da observação URAMAX_Beaufort;
• Um neurônio contendo a faixa da observação TEMPMAX;
• Um neurônio contendo a faixa da observação TEMPMAX_Beaufort;
• Um neurônio contendo a faixa da observação TEMPMIN;
• Um neurônio contendo a faixa da observação TEMPMIN_Beaufort;
• Um neurônio contendo a faixa da observação TEMP_Beaufort;
• Um neurônio contendo a faixa da observação TEMP;
• Um neurônio contendo o valor da observação atual;
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).
O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,
está na Figura 52.
)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���
116
O erro alcançado na Figura 52 foi inferior ao desejado e os resultados obtidos, após
o treinamento, são mostrados na Figura 53.
)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro na tendência foi de 47,1% e o erro padrão 56,9.
Neste mesmo período o diagrama de controle obteve a taxa de erro na tendência de 45,1%
e o erro padrão 88,3.
���� $SUHVHQWDomR�GRV�UHVXOWDGRV�A partir da metodologia CRISP-DM, foi possível gerar a amálgama (união) dos
bancos de dados e analisar o comportamento dos casos confirmados de dengue em
relação a diversas variáveis, aqui representada, de forma reduzida, nos Quadros 10 e 11.
O estudo dessas relações forneceu bases (LQVLJKWV) para diversos trabalhos futuros,
relatados no Capítulo 5 desta dissertação.
4XDGUR����±�$QiOLVH�GRV�FDVRV�FRQILUPDGRV�GH�'HQJXH��*RLkQLD�������D������Variável Informações
Tipos de dengue em Goiânia, 2001
a 2004
Clássico – 87,87%;
Dengue com complicações – 11,80%
FHD – 0,33%
Percentual das respostas no campo
DENGUE, SINAN, Goiânia, 2001
a 2004
Não havia apresentado infecção anterior –
88,23%;
Havia apresentado infecção anterior – 7,69%;
Ignorado – 3,81%
117
Percentual das respostas no campo
VACINADO, SINAN, Goiânia,
2001 a 2004
Havia sido vacinado contra febre amarela–
77,44%;
Ignorado 14,96%;
Não havia sido vacinado – 7,61%
IBGE, Goiânia, 2000 SINAN, 2001 - 2004Percentual por gênero Homens 47,60% 43,21%
Mulheres 52,40% 56,73% Ignorados - 0,06%
4XDGUR����±�$QiOLVH�GRV�FDVRV�GH�GHQJXH�YHUVXV�YDULiYHO��*RLkQLD�������D������
Variável
Relação apresentada Autores que também
apresentam estas relações nesta cidade
Percentual por faixa etária Forte Maciel (1999), Siqueira Junior (2001)
Número de habitantes por bairro Forte -
Cemitérios por bairro Fraca - Menores percentuais de lotes vagos Forte - Menores percentuais de área verde Forte - Número de feiras livres semanais Fraca - Quantidade de hospitais por bairro Fraca - Quantidade de escolas por bairro Fraca - Quantidade de prédios por bairro Fraca - Influência sazonal Forte -
Com o auxílio de especialistas do 10º DISME, foi feita extensão (adaptação) da
escala anemométrica de %HDXIRUW (VIANELLO; ALVES, 1991). Investigou-se, a partir
dessa adaptação e através de gráficos, a influência sazonal sofrida pelo dengue, através da
média de duas semanas anteriores (definida D SULRUL) a cada semana epidemiológica, em
relação a cada variável climática. Seguindo essa descrição, foi possível analisar os
períodos com alta e baixa concentração de casos. Deve-se levar em consideração que para
cada cidade analisada, através dos passos descritos, os resultados apresentados podem ser
únicos.
Foi analisado o diagrama de controle da Divisão de Epidemiologia da Secretaria
Municipal de Saúde de Goiânia-Goiás, com formato no calendário de semanas
epidemiológicas, referente ao período entre 01/01/2004 e 30/04/2004. Os resultados
obtidos foram analisados e comparados, na Figura 54, com os de duas rodadas que
apresentaram melhores resultados e fornecem, com certa margem de confiança, suporte
118
para predição de Dengue naquela cidade.
Reforça-se a necessidade de investimentos em recursos humanos e financeiros, para
realizar através de outros softwares e outras técnicas, os trabalhos relatados no Capítulo 5
desta dissertação.
)LJXUD����±�FRPSDUDomR�GDV�SUHGLo}HV�GDV�WpFQLFDV��GLDJUDPD�GH�FRQWUROH�H�PLQHUDomR�GH�GDGRV�SDUD�R�SHUtRGR�GH�GRDomR�
119
� $QiOLVH�GRV�UHVXOWDGRV�Ao final da apresentação dos resultados, torna-se importante tecer as seguintes
considerações em relação a: �D� bancos estudados; �E� metodologia adotada; �F� Modelo
Brasileiro de Notificação utilizado para o combate de várias doenças; �G� modelo de
regressão através de redes neurais apresentado; �H� técnica apresentada para predição; �I� objetivos propostos.
a) Em relação aos bancos de dados analisados: nenhum dos bancos avaliados foi
desenvolvido com o fim de DCBD. Mesmo assim, foi possível, através de alto esforço de
conversão, gerar várias informações importantes. A análise dessas informações foi feita
de forma ética, através de gráficos de fácil entendimento, que não identificam os
pacientes infectados ou os bairros da cidade de Goiânia.
b) A CRISP-DM é de fácil utilização, aplicação e possibilita gerar informações
importantes, através da transformação dos dados contidos nas bases (tabelas eletrônicas),
em informações sobre o comportamento dos casos confirmados de Dengue, nos anos de
doação avaliados.
c) O Modelo Brasileiro de Notificação já é consagrado e adotado por lei em todo o
Brasil, há muitos anos, e prediz, com certa margem de confiança, a ocorrência de surtos
de trinta e cinco doenças diferentes. Com essa técnica, na granularidade de semanas
epidemiológicas, é possível fazer a predição em um ou mais anos em relação aos casos
notificados. Além disto, pode-se gerar o limite de alarme, a partir do qual é possível
determinar se existe ou não a ocorrência de uma epidemia.
d) A técnica e arquitetura utilizadas na rede neural implementada no aplicativo
(DV\QQ�3OXV apresentou, nas dezesseis primeiras semanas epidemiológicas do ano 2004,
na cidade de Goiânia, melhor faixa de confiança na predição do número de casos
confirmados de Dengue. Essa técnica carrega a desvantagem de gerar erros expressivos,
conforme o número de passos que, no futuro, serão incrementados (i.e. em vez de gerar a
predição com uma semana de antecedência tenta-se gerar a predição com dez semanas e
obtêm-se erros maiores).
e) Em relação ao objetivo geral e aos específicos (sub-item 1.7.1 e 1.7.2):
120
O objetivo principal foi alcançado, já que construído modelo que forneceu suporte à
tomada de decisão para o combate a epidemias de Dengue, o que possibilitou, neste
estudo de caso, a predição de casos confirmados de Dengue, em menor tempo e maior
precisão do que a prática atual.
Quanto aos objetivos específicos: �D� em Goiânia, de janeiro de 2001 a abril de
2004, o número de casos confirmados de Dengue, no formato de semanas
epidemiológicas, apresentou nítida influência sazonal, principalmente em relação a um
dos parâmetros climáticos (índice pluviométrico); �E� através da difícil transformação de
dados em informações, foram encontradas diversas relações de Dengue com as
características urbanas representadas no Quadro 11.
Além de todos esses resultados, foram encontradas as seguintes informações
importantes: �D� o tipo Clássico de Dengue apresentou o maior percentual de notificações
confirmadas, no período estudado, naquela cidade; deve-se levar em consideração que,
embora a ocorrência de Dengue com complicações e FHD apresentem menores
percentuais de confirmação, são elas que, normalmente, sem tratamento médico
adequado, levam a óbito os pacientes infectados; �E� em relação ao percentual de
respostas no campo DENGUE, da tabela eletrônica 0'(1*8(: em sua maioria, são
notificados pacientes que não haviam apresentado infecção prévia da doença; �F� em
relação ao percentual de respostas no campo VACINADO da tabela 0'(1*8(, a
maioria dos pacientes afirmam terem sido vacinados contra Febre Amarela, o que apóia a
não notificação dos casos confirmados da doença, no período avaliado; �G� em relação ao
percentual por gênero, houve forte relação com o sexo feminino; �H� em relação a
população por bairro, esta apresenta aspecto forte, diretamente proporcional ao número de
habitantes de cada bairro.
121
� &RQFOXV}HV�H�VXJHVW}HV�SDUD�WUDEDOKRV�IXWXURV�“A arte do raciocínio epidemiológico é tirar sábias conclusões de dados
imperfeitos” George W. Comstock.
���� &RQVLGHUDo}HV�ILQDLV�A Mineração de Dados é utilizada pelas organizações de forma crescente, dada a
possibilidade de procurar padrões e de fornecer suporte à decisão, a partir das bases de
dados existentes.
Quanto à CRISP-DM, talvez seu maior benefício seja a possibilidade de aplicação
em grandes ou pequenos projetos de mineração de dados, além de fornecer aos
pesquisadores juniores, um roteiro que possibilite a conclusão de projetos complexos, em
curto espaço de tempo e com poucos recursos financeiros. Convém ainda ressaltar que a
metodologia CRISP-DM, para MD, é de fácil aplicação e fundamental para manter,
relatar ou descobrir o conhecimento especializado existente nas bases de dados de uma
organização. É um roteiro que conduz o profissional a pesquisas que possibilitam
aquisição e representação do conhecimento. No âmbito desta pesquisa, possibilitou a
aquisição e representação ética do conhecimento epidemiológico sobre os casos
notificados de Dengue.
Para ter sucesso em suas pesquisas, segundo Elder (2004, p.27), o profissional
(pesquisador) de MD deve ter persistência (não desistir se os primeiros experimentos não
apresentarem sucesso) e atitude (ser otimista e acreditar que o trabalho poder ser feito);
ser aberto ao trabalho de equipe (aprender com os usuários o que eles sabem, onde
desejam chegar e como comunicar, de modo eficaz, as descobertas obtidas pela MD). Ser,
principalmente, humildade (saber que a tecnologia, sem o apoio e o conhecimento da
equipe, não fornece soluções).
���� 'HVWDTXHV�H�FRQWULEXLomR�GD�SHVTXLVD�Para se obter maior confiabilidade nos resultados, buscou-se a doação de dados em
instituições públicas (municipais e federais), que realizam, de forma compulsória, a coleta
e armazenamento dos dados necessários para esta pesquisa.
Com essa visão, a pesquisa teve como objetivo principal, predizer, com uma
122
semana de antecedência, o número de casos confirmados de Dengue, naquela cidade. Em
relação aos objetivos secundários, foram encontradas relações que devem ser estudadas
com mais profundidade, em trabalhos futuros.
Existem, ainda, duas outras contribuições: �D� o valor de doação de todas as
variáveis para esta pesquisa foi gratuito; �E� a anemométrica de %HDXIRUW foi adaptada
para todos os parâmetros climáticos utilizados para esta pesquisa e, provavelmente, a
mesma adaptação poderá servir para a predição de outras doenças. O simulador de Redes
Neurais (DV\QQ�3OXV atende, com facilidade, a especificação e modelagem, o que
permite, aos pesquisadores, seu uso para novas análises e trabalhos futuros.
Em relação aos resultados da análise e da predição, foram apresentados de duas
formas: �D� para a comunidade científica, com a codificação do nome do bairro, conforme
as questões éticas indicadas por autores consagrados (H�J� TURBAN; RAINER; POTTER
2004, p.503, 507); �E� para os especialistas da SMSGO, através de palestras, planilhas de
dados, do aplicativo 0LFURVRIW� ([FHO, com a identificação dos bairros e locais não
identificados no estudo de caso realizado.
Para a comunidade científica e, em relação aos especialistas da SMSGO, os
resultados apresentados, possibilitam a análise de informações importantes, dentre elas:
a) O percentual relativo a cada ano, em relação ao banco de dados, o que
possibilitou identificar o ano de surto;
b) O pequeno percentual de perda, relativo à escolha desta pesquisa, na predição
dos casos confirmados;
c) A escolha de construção de gráficos estatísticos facilitou a análise de Dengue
versus população, lotes baldios, influência sazonal, etc.;
d) Foram identificadas as taxas de ataque, por sexo e idade;
e) Foram estabelecidos e classificados os períodos que apresentam maior ou
menor concentração de casos confirmados;
f) Foi realizada a predição do número de casos confirmados, através de duas
técnicas distintas e ambas apresentaram valores melhores que a técnica
123
brasileira de predição atual.
���� 6XJHVW}HV�SDUD�QRYRV�WUDEDOKRV�GH�SHVTXLVD�A complexidade e as potencialidades da análise dos bancos de dados eletrônicos
oferecem muitas oportunidades de pesquisa.
Como sugestão para trabalhos futuros que abordem predição epidemiológica: �D� avaliação da predição de casos confirmados de todo o ano 2004; �E� avaliação de outras
RNAs para predição; �F� aplicação do modelo proposto em outras séries e/ou períodos
futuros referentes a outras doenças de notificação compulsória; �G� utilização da técnica
de classificação para identificar os bairros que apresentarão ocorrência de casos
notificados em semana futura, a partir da ocorrência de casos notificados em semana
anterior, em um bairro ou conjunto de bairros; �H� Utilizar a técnica de classificação para
gerar regras de ocorrências em bairros em relação à tomada do vetor na cidade.
Outros trabalhos futuros que não abordam predição epidemiológica são relatados
abaixo:
a) O governo brasileiro criou o cartão SUS, que será utilizado, após a distribuição
em todo território brasileiro, para identificação de seus pacientes, no
atendimento em suas unidades de saúde. Cerca de cinqüenta por cento destes
cartões já foram distribuídos em Goiânia. Sugere-se utilizar a técnica de
classificação, no aplicativo (software) WEKA, para, de uma base de
conhecimento, identificar as faixas etárias menos contempladas e locais nos
quais houve pouca entrega, auxiliando, assim, o planejamento de campanhas de
distribuição em Goiânia-Go.
b) Considerando que, em geral, dados de saúde estão relacionados com várias
formas de dados ambientais (KAMP, 1997; OMS, 2004, pp.14-15), e que,
segundo a prática de gestão, há forte relação entre a existência de acúmulo de
água em objetos abandonados (BRITO; FORATTINI, 2004, p.204); é
necessário que sejam considerados dados relativos a construções inacabadas,
principais praças na cidade, visitas domiciliares realizadas pelos funcionários
que combatem o vetor das doenças (que apresentaram presença do mosquito),
índice de infestação predial (medido semanalmente), índice pluviométrico por
124
bairro (sugeridos pela OMS, 2004, p.15), campanhas preventivas por setor e
locais/forma de combate ao vetor. Com estes dados, provavelmente seria
conseguido um modelo que fornecesse melhores resultados que os obtidos.
Entretanto, estes dados não estão disponíveis, o que desde já aponta para a
necessidade de uma coleta mais refinada de dados relevantes para a gestão das
doenças em tela. Outros dados, embora interessantes, foram descartados pelo
ciclo de vida/reprodução e combate ao vetor, tais dados e motivos de descarte
são: rios (o vetor não coloca seus ovos em água corrente) e lagoas (existem os
predadores naturais como forma de combate). Neste sentido, um trabalho
interessante seria do de verificar, com as bases existentes quais de suas
variáveis apresentam os menores níveis de ruído e que poderiam ser utilizadas
em estudos futuros.
c) Em relação ao Dengue, na cidade estudada, a estimativa é que, entre trinta e
cinco e quarenta por cento dos casos não são relatados por algum motivo. Para
auxiliar a notificação, propõe-se criar um protocolo de notificação virtual que
forneça subsídios para diminuir a perda de notificação de Dengue. Este
protocolo poderia ser criado através de uma interface e seria dividido em duas
partes. A primeira: criar um layout, para notificação por laboratórios e hospitais
estaduais e/ou particulares, para envio de notificações. A segunda: cadastrar
automaticamente os dados recebidos que não estiverem presentes na base do
SINAN.
d) A mesma proposta do protocolo pode ser estendida, de forma genérica, para
outras doenças brasileiras de notificação compulsória que tenham influência
sazonal. Analisados os dados, poderão fornecer informações que auxiliem, ao
gestor de saúde, na tomada de decisão, de forma a melhorar o atendimento aos
pacientes ou a combater a disseminação de uma doença.
e) Fazer um estudo do percentual de notificações, que não os realizados por
inquérito sorológico: sorteio dos pacientes e verificação de exposição ao vírus,
antes da retirada do sangue; em seguida, logo após o mês de março, coletar as
amostras sangüíneas dos mesmos pacientes e, através de técnicas estatísticas,
determinar o percentual de notificações não realizadas.
125
5HIHUrQFLDV�%LEOLRJUiILFDV�ADRIAANS, Pieter; ZANTINGE, Dolf: 'DWD�0LQLQJ� (QJODQG��(G�6\VOORJLF�����S���������AGRAWAL, Rakesh; PSAILA, Guiseppe: $FWLYH�'DWD�0LQLQJ� In Proceedings of the First International Conference on Knowledge Discovery and Data Mining (KDD-95): American Association for Artificial Intelligence. 1995.
ALVARENGA, Rogério; JUNIOR, Odilon N.; CARVALHO, Marcelo R. C.: 8P�PRGHOR�GH�H[WHUQDOL]DomR� GR� FRQKHFLPHQWR� YLVDQGR� VXSRUWH� j� GHFLVmR� H� YDQWDJHQV� FRPSHWLWLYDV�XWLOL]DQGR�DV�PHWRGRORJLDV�&RPPRQNDGV�H�&5,63�'0� KMBRASIL, 2004.
ALVARENGA, Rogério; OLIVEIRA JUNIOR, Waldomiro de; CARVALHO, Marcelo. 'DWDPLQLQJ HP� ILQDQoDV�� 8P� PRGHOR� SDUD� SUHYLVmR� HP� VpULHV� WHPSRUDLV� EDVHDGD� HP�UHGHV� QHXUDLV� ± HVWXGR� GH� SUHYLVmR� VREUH� R� VLVWHPD� GH� SDJDPHQWRV� %UDVLOHLUR�KMBRASIL, Julho 2003.
ALVES BORGES, Sonia Marta dos Anjos ,PSRUWkQFLD� HSLGHPLROyJLFD� GR� $HGHV�$OERSLFWXV� QDV� $PpULFDV� Brasil, Universidade de São Paulo –USP, Dissertação de Mestrado, Outubro 2001, 99p.�ANDRADE, Ionilda Sabrino; DANTAS, Renilson Targino: (VWXGR� GD� LQIOXrQFLD� GH�HOHPHQWRV�PHWHRUROyJLFRV�QRV�FDVRV�GH�FyOHUD��GHQJXH�H�PHQLQJLWH�QD�FLGDGH�GH�&DPSLQD�*UDQGH� XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 10p.
ARAUJO, Vânia M. R. Hermes de; FREIRE, Isa Maria; MENDES, Teresa Cristina M.: 'HPDQGD�GD�,QIRUPDomR�SHOR�VHWRU�LQGXVWULDO�: dois estudos no intervalo de 25 anos. Brasil, Brasília-Df: Ci. Inf.,�v.26 n.3, p. 283-289, set/dez – 1997.�ARGYRIS, Chris:�(QVLQDQGR�3HVVRDV�,QWHOLJHQWHV�D�$SUHQGHU� LQ HARVARD BUSINESS REVIEW: Gestão do Conhecimento�RQ NQRZOHGJH�PDQDJHPHQW: 1991. Tradução de Afonso Celso da Cunha Serra. Brasil. Rio de Janeiro, 6ª Edição. Ed. Campus, 2001. p.82-107.
AZEVEDO, Fernando Mendes de; BRASIL, Lourdes Mattos; OLIVEIRA, Roberto Célio Limão de: 5HGHV� 1HXUDLV� FRP� $SOLFDo}HV� HP� &RQWUROH� H� HP� 6LVWHPDV� (VSHFLDOLVWDV�Florianópolis, Brasil, Visual Books, 2000.
BRAGA, Antônio de Pádua; LUDERMIR, Teresa Bernarda; CARVALHO, André Carlos Ponce de Leon Ferreira: 5HGHV�QHXUDLV�DUWLILFLDLV� ��Teorias e aplicações. Livros Técnicos e Científicos S. A. – LTC, Rio de Janeiro, 262 p, 2000.
BRASSOLATTI, Rejane Cristina; ANDRADE, Carlos Fernando S. $YDOLDomR� GH� XPD�LQWHUYHQomR�HGXFDWLYD�QD�SUHYHQomR�GD�GHQJXH��Brasil. Ciênc. Saúde coletiva. 2002, vol.7, no.2, p.243-251.
BRITO, Marylene de; FORATTINI, Oswaldo Paulo: 3URGXWLYLGDGH�GH�FULDGRXURV�GH�$HGHV�DOERSLFWXV�QR�9DOH�GR�3DUDtED��63��%UDVLO. Brasil, São Paulo,: Isso. Saúde pública;38(2):209-215, abr. 2004.
CAMPOS BRAGA, Giordana HW�DO�:3UHYLVmR�GR�Q~PHUR�GH�FDVRV�GR�GHQJXH�QD�3DUDtED�D�SDUWLU� GD� SUHFLSLWDomR� GH� PRGHORV� DWPRVIpULFRV� UHJLRQDLV�� XIII Congresso Brasileiro de
126
Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 14p.�CARDOSO JUNIOR, Rubens Pinto�HW�DO. 'HWHFomR�GH�$HGHV�DHJ\SWL�H�$HGHV�DOERSLFWXV��QD�]RQD� XUEDQD� GR� PXQLFtSLR� GH� &DWDQGXYD�63�� DSyV� FRQWUROH� GH� HSLGHPLD� GH� GHQJXH�Brasil. Rev. Soc. Bras. Med. Trop. v.30 n.1 Uberaba jan./fev. 1997, vol.30, no.1, p.37-40. ISSN 0037-8682.
CARVALHO, Mirléia Aparecida de 6LVWHPD�GH� VXSRUWH�D�GHFLVmR�SDUD�DORFDomR�GH�iJXD�HP�SURMHWRV�GH�LUULJDomR��Universidade de São Paulo – USP, Tese de Doutorado,Setembro 2003, p.1-193.
CASTRO, Giovanni Gondim; ALVARENGA, Rogério; PRADO, Hércules Antônio: 0RGHOR�SDUD�JHVWmR�HSLGHPLROyJLFD�GR�'HQJXH�H�)HEUH�$PDUHOD��EDVHDGR�HP�6LVWHPDV�GH�6XSRUWH�D 'HFLVmR��0LQHUDomR�GH�'DGRV� H� ,QIRUPDo}HV�(VSDFLDLV��V Workshop de Tecnologia da Informação da UCB. p. 83-84, Setembro 2004.
______: 8VR�GH�PLQHUDomR�GH�GDGRV�SDUD�D�FRQVWUXomR�GH�PRGHOR�SUHGLWLYR�GH�VXUWR�GH�GHQJXH� XWLOL]DQGR� FDVRV� FRQILUPDGRV� GR� 6LVWHPD� GH� ,QIRUPDo}HV� GH� $JUDYRV� GH�1RWLILFDomR��VI Workshop de Tecnologia da Informação da UCB. p. 41-42, Maio 2005.
CASTRO, Giovanni Gondim; ARAUJO, Valdivino Alves. $PSOLDomR�GR�VLVWHPD�GH�FRQWUROH�ODERUDWRULDO�GD� VD~GH�GH�*RLkQLD� Revista da Secretaria Municipal de Saúde, Relatório de Gestão, Artigos, p. 65,66. Dezembro/2004.
COFFIN, Carla HW� DO.: 8VLQJ� ,QWHOOLJHQW� $JHQWV� WR� 5HSXUSRVH� $GPLQLVWUDWLYH� 'DWD� LQ�)RUHFDVWLQJ� 'LVHDVH� 3UHYHQWLRQ� LQ� DQ� 2XWSDWLHQW� &RQWH[W� 7KH� &DVH� RI� 3QHXPRFRFFDO�9DFFLQDWLRQ��USA, Hawaii: Proceedings on 37th Hawaii International Conference on Systems Sciences – 2004, IEEE, 7p. 2004.�CORTES, Luzia M de C HW� DO� &RPSDUDWLYH� LPPXQRORJLFDO� UHFRJQLWLRQ� RI� SURWHLQV� IURP�1HZ� *XLQHD� ³&´� GHQJXH� YLUXV� W\SH� �� SURWRW\SH� DQG� IURP� D� GHQJXH� YLUXV� W\SH� �� VWUDLQ�LVRODWHG� LQ� WKH�6WDWH�RI�5LR�GH�-DQHLUR��%UD]LO. Brasil.�Memorando Instituto Oswaldo Cruz. Abr. 2003, vol.98, no.3, p.331-334. ISSN 0074-0276.
COSTA SOUSA, Paulo de Tarso: 0LQHUDomR� GH�'DGRV� SDUD� LQGXomR� GH� XP�PRGHOR� GH�*HVWmR�GR�&RQKHFLPHQWR���Brasil, Universidade Católica de Brasília – UCB, Dissertação de Mestrado, Março 2003, 167p.
CRUZ, Bruna: (VWXGR� YDL� PRQLWRUDU� UHSURGXomRGH�YHWRUHV�GR�GHQJXH� Brasil. FIOCRUZ, Março/2004.
CUMMINGS, Derek A. T. HW� DO�: 7UDYHOOLQJ� ZDYHV� LQ� WKH� RFFXUUHQFH� RI� GHQJXH�KDHPRUUKDJLF�IHYHU�LQ�7KDLODQG� USA. Nature, Vol. 427, p.344-347, Jan/2004.
CYRINEU TERRA, José Cláudio:� *HVWmR� GR� &RQKHFLPHQWR O grande desafio empresarial:uma abordagem baseada no aprendizado e na criatividade. Brasil. São Paulo, Ed. Negócio, 313p. 2001.
DELMATER, Rhonda; HANCOCK, Monte: 'DWD�0LQLQJ�([SODLQHG�±$ 0DQDJHU�V�*XLGH�WR�&XVWRPHU�&HQWULF�%XVLQHVV�,QWHOOLJHQFH. USA. 392p. Ed. Digital Press. 2001. ISBN:1-55558-231-1.
DENIS, Cristiane K.�HW�DO��0DQLIHVWDo}HV�RWRUULQRODULQJROyJLFDV�HP�SDFLHQWHV�FRP�GHQJXH�
127
Brasil. Set./out. 2003, vol.69, no.5, p.644-647.
DRUCKER, Peter H.:2 DGYHQWR� GD� 1RYD� 2UJDQL]DomR� LQ HARVARD BUSINESS REVIEW: Gestão do Conhecimento�RQ NQRZOHGJH�PDQDJHPHQW: 1998. Tradução de Afonso Celso da Cunha Serra. Brasil. Rio de Janeiro, 6ª Edição. Ed. Campus, 2001. p.9-26
EIRMAN, Michael A; NIEDERMAN, Fred; ADAMS, Carl:'66�7HRU\��D�PRGHO�RI�FRQVWUXFWV�DQG�UHODWLRQVKLSV. P.1-26. Volume 14, Março 1995. ISSN:0167-9236.
ELDER, John:7RS� ��� GDWD�PLQLQJ�PLVWDNHV� :RRG�*ULOOH� %XIIHW�� &KDUORWWHVYLOOH�� 9LUJLQLD��,(((��0DU����������S� FAYYAD, Usama; SHAPIRO-PIATETSKY, Gregory; SMYTH, Padhraic:)URP�'DWD�0LQLQJ�WR�.QRZOHGJH�'LVFRYHU\�LQ�'DWDEDVHV��86$� $PHULFDQ�$VVRFLDWLRQ�IRU�$UWLILFLDO�,QWHOOLJHQFH1996, p. 37-54.
______: $GYDQFHV� LQ� .QRZOHGJH� 'LVFRYHU\� DQG� 'DWD� 0LQLQJ. American Association for Artificial Intelligence, 1996b. 625p. ISBN 0-262-56097-6
FOCKS, Dana A. HW� DO��$ VLPXODWLRQ� PRGHO� RI� WKH� HSLGHPLRORJ\� RI� XUEDQ� GHQJXH� IHYHU��OLWHUDWXUH�DQDO\VLV��PRGHO�GHYHORSPHQW��SUHOLPLQDU\� YDOLGDWLRQ�� DQG� VDPSOHV� RI� VLPXODWLRQ�UHVXOWV. American Journal of Tropical Medicine and Hygiene. 1995. Nr. 53, p. 489-506.
FOUQUE, Florence; BICOUT, Dominique; SABATIER, Philippe:0RGHOLQJ� 7UDQVPLVVLRQ�3RWHQWLDO�RI�0RVTXLWRHV�9HFWRUV�RI�7URSLFDO�'LVHDVHV��FOUQUE, Florence; GARINCI, Romuald; GABORIT, Pascal�(SLGHPLRORJLFDO� DQG�HQWRPRORJLFDO� VXUYHLOODQFH�RI� WKH� FR�FLUFXODWLRQ�RI�'(1����'(1���DQG�'(1�� YLUXVHV� LQ�)UHQFK� *XLDQD�� 7URSLFDO� 0HGLFLQH� � ,QWHUQDWLRQDO� +HDOWKVolume 9, p. 41-46. Janeiro 2004.�FRANÇA, Consuelo Vidica; ALVES SILVA, Marta Maria; AMORIM SILVA, Flúvia Pereira: $o}HV� YLWRULRVDV� QR� FRQWUROH� GD� GHQJXH� HP�*RLkQLD� Revista da Secretaria Municipal de Saúde, Relatório de Gestão, Artigos, p. 51-53. Dezembro/2004.
FUNASA:*XLD�GH�9LJLOkQFLD�(SLGHPLROyJLFD�9ROXPH�,� Brasil, Brasília-Df. Ed. Fundação Nacional de Saúde - FUNASA. 477p. 2002.
GACHET, Alexandre:$ )UDPHZRUN� IRU� 'HYHORSLQJ� 'LVWULEXWHG� &RRSHUDWLYH� 'HFLVLRQ�6XSSRUW� 6\VWHPV� – Inception Phase. Challenges to Informing Clients: A Transdisciplinary Approach. University of Fribourg, Switzerland, 2001.
GALE MOORE, Thomas:,Q� 6LFNQHVV� DQG� LQ� +HDOWK� The Kyoto Protocol versus Global Warming� 6WDQIRUG�8QLYHUVLW\ – 2000.
GOEBEL, Michael; GRUENWALD, Le:$ 6XUYH\�RI�'DWD�0LQLQJ�DQG�.QRZOHGJH�'LVFRYHU\�6RIWZDUH�7RROV� 6LJ.GG�([SORUDWLRQV, -XQH�����, Volume 1, Issue 1: p.20-33, 1999.
HALES HW�DO.:3RWHQWLDO�HIIHFW�RI�SRSXODWLRQ�DQG�FOLPDWH�FKDQJHV�RQ�JOREDO�GLVWULEXWLRQ�RI�GHQJXH�IHYHU��DQ�HPSLULFDO�PRGHO. THE LANCET, Vol 360, p. 830-834, September 2002.
HAMMERS Maryann:0LQH�FRPSDQ\�GDWD�ZLWK�GHFLVLRQ�VXSSRUW�WRROV�� KXPDQ�UHVRXUFH�PDQDJHPHQW� V\VWHPV� – related article� Choosing a Decision-Support System.� Workforce, June 2002, p.1-2.
128
HAN Jiawei; KAMBER Micheline:'DWD�0LQLQJ� &RQFHSWV� DQG� 7HFKLQLTXHV�� 6LPRQ� )UDVHU�8QLYHUVLW\��2001. 550 p.�HAYKIN, Simon:5HGHV� QHXUDLV – Princípios e prática: 1999. Tradução de Paulo Martins Engel. Brasil, Porto Alegre. 2ª Edição. Ed. Bookman, 2001. 900p.
HENDRIKS, Paul; VRIENS, Dirk:&ROODERUDWLYH�H[SORUDWLRQ�RI�VSDWLDO�SUREOHPV� In Initiative on Collaborative Spatial Decision Making 17, Londres, NCGIA, 1995.
KAMP, Vera; GRUPE, Roland:6HPDQWLF� &OLHQW� &DFKLQJ� LQ� D� &OLHQW�6HUYHU�EDVHG� .''�$UFKLWHFWXUH� Alemanha, 1997.
KAMP, Vera; SITZMANN, Lars; WIETEK, Frank:$ VSDWLDO� GDWD� FXEH� FRQFHSW� WR� 6XSSRUW�'DWD� $QDO\VLV� LQ� (QYLURQPHQWDO� (SLGHPLRORJ\. EUA, Washington: 3URFHHGLQJV� RI� WKH� �WK,QWHUQDWLRQDO�&RQIHUHQFH�RQ�6FLHQWLILF�DQG�6WDWLVWLFDO�'DWDEDVH�0DQDJHPHQW� �66'%0¶��� –,(((�&RPSXWHU�6RFLHW\�3UHVV. 4p. 1997.
KAMP, Vera; WIETEK, Frank:,QWHOOLJHQW� 6XSSRUW� IRU�0XOWLGLPHQVLRQDO�'DWD�$QDO\VLV� LQ(QYLURQPHQWDO�(SLGHPLRORJ\� ,QWHUQDWLRQDO�6\PSRVLXP� IDA’97, 12p, 1997.
KHAN A.M. HW� DO .:$QDO\VLV� RI� DQWLJHQLF� KRW�VSRWV� LQ� GHQJXH� YLUXV�� $� ELRLQIRUPDWLFVDSSURDFK LQ First Asian Regional dengue research network meeting. October 2004. Bankok. Thailand.
KOVACS, Zsolt HW�DO.:'DWDEDVH�'HVFULSWLRQ�IRU�D�3DQ�(XURSHDQ�+HDOWKFDUH�6\VWHP� USA, Hawaii: 3URFHHGLQJV�RI�WKH���UG�+DZDLL�,QWHUQDWLRQDO�&RQIHUHQFH�RQ�6\VWHP�6FLHQFHV – 2000. IEEE, 10p, 2000.
LEMOS, Wilda Soares:*HVWmR� GH� &RPSHWrQFLDV: A Utilização do Método Delphi em um Estudo de Caso. 2003. Dissertação de Mestrado (Mestrado em Gestão de Conhecimento e Tecnologia da Informação) - Programa de Pós-Graduação 6WULFWR� 6HQVX em Gestão de Conhecimento e Tecnologia da Informação, Universidade Católica de Brasília –UCB, Brasília-DF.
LIMA, Virgília L C �HW�DO��'HQJXH��LQTXpULWR�VRUROyJLFR�SyV�HSLGrPLFR�HP�]RQD�XUEDQD�GR�(VWDGR�GH�6mR�3DXOR��%UDVLO���Brasil. 5HY��6D~GH�3~EOLFD. Dez. 1999, vol.33, no.6 p.566-574. ISSN 0034-8910.
LOIOLA, Carlos Catão Prates:'HQJXH� QDV� $PpULFDV� in CASTRO GOMES, Almerio de:Informes em Saúde Pública� Universidade de São Paulo – Faculdade de Saúde Pública, 2000.
MACIEL, Ivan José:$YDOLDomR� (SLGHPLROyJLFD� GR� 'HQJXH� QR�0XQLFtSLR� GH�*RLkQLD� QR�3HUtRGR� GH� ����� D� ����� Brasil, UniversidadeFederal de Goiás, Dissertação de Mestrado, 1999, 119p.�MARTENS, Willem J.M. HW�DO�:3RWHQWLDO�,PSDFW�RI�*OREDO�&OLPDWH�&KDQJH�RQ�0DODULD�5LVN��Environmental Health Perspectives Volume 103, Number 5, 11p, May 1995.
MEDEIROS OLIVEIRA, Stanley Robson de:'DWD� WUDQVIRUPDWLRQ� IRU� SULYDF\�SUHVHUYLQJ�GDWD�PLQLQJ� Universidade de Alberta, Canadá, Tese de Doutorado, 2005, 167p.
MELHORAMENTOS:'LFLRQiULR�3UiWLFR�da Língua Portuguesa. Brasil, 10. Ed., São Paulo:
129
Cia. Melhoramentos de São Paulo 1998. ISBN 85-06-01707-6
MICHAELIS:3HTXHQR� 'LFLRQiULR� GD� /tQJXD� 3RUWXJXHVD� Brasil, 5. Ed., São Paulo: Companhia Melhoramentos 1998. ISBN 85-06-02718-7
MOORE, Fred:1HZ� $SSOLFDWLRQV� %UHDN� 7KURXJK� 6WRUDJH� %RXQGDULHV� ± 1HZV� %ULHIV.&RPSXWHU�7HFKQRORJ\�5HYLHZ, 2FW 1999, 2p.
MORESI, 2000:'HOLQHDQGR�R�YDORU�GR�VLVWHPD�GH�LQIRUPDomR�GH�XPD�RUJDQL]DomR� Brasil, Brasília-DF: Ci. Inf., V.29, n.º 1, p. 14-24, jan./abr. 2000.
MSB - Ministério da Saúde do Brasil: Núcleo de comunicação da Secretaria de Vigilância em Saúde – 2 TXH�p�'HQJXH, Maio 2004.
MUNSTERMANN, Leonard:$HGHV�DHJ\SWL� WKH�\HOORZ�IHYHU�PRVTXLWR. National Institutes of Health - National Institute for Allergy and Infectious Diseases. 1995.
NASCIMENTO SOUSA HW� DO.:(IHLWR� GR� FOLPD� VREUH� D� 'HQJXH� QD� FLGDGH� GH� &DPSLQD�*UDQGH� �� 3%. XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 7p.
NONAKA, Ikujiro; TAKEUCHI, Hirotaka:&ULDomR�GH�&RQKHFLPHQWR�QD�(PSUHVD. Como as Empresas Japonesas Geram a Dinâmica da Inovação. Brasil. Editora Campus 2ª Edição. 1997.
NOON, Charles E.; HANKINS, Charles T.:6SDWLDO� 'DWD� 9LVXDOL]DWLRQ� LQ� +HDOWKFDUH��6XSSRUWLQJ� D� )DFLOLW\� /RFDWLRQ� 'HFLVLRQ� YLD� *,6�EDVHG� 0DUNHW� $QDO\VLV�� � ��WK +DZDLL�,QWHUQDWLRQDO�&RQIHUHQFH�RQ�6\VWHP�6FLHQFHV. IEEE, 10p – 2001.
NUNES SILVA, Nilza; CUNHA, Tarcisio Neves; QUINTANILHA, José Alberto:$PRVWUD�PHVWUD� H� JHRSURFHVVDPHQWR�� tecnologias para inquéritos domiciliares. Brasil, São Paulo: Revista Saúde Pública. P.494-502, Fevereiro 2003.
O´BROCHTA� David A.:7UDQVJHQLF� ,QVHFWV��3URJUDPV��7HFKQRORJ\��%HQHILWV��DQG�5LVNV�in: /02V� DQG� WKH� (QYLURQPHQW�� 3URFHHGLQJV� RI� DQ� ,QWHUQDWLRQDO� &RQIHUHQFH�� ����� (C. R. Roseland ed.) Organization of Economic Cooperation and Development, França, Paris. P.247-254, 2002.
O’DELL, Carla, GRAYSON, JR. C. Jackson:,I� 2QO\� :H� .QHZ� :KDW� :H� .QRZ:The Transfer of Internal Knowledge and Best Practice. The Free Press, USA, 1998
OLIVEIRA JÚNIOR, Waldomiro: 3UHYLVmR� GH� VpULHV� WHPSRUDLV� XWLOL]DQGR� UHGHV� QHXUDLV�Estudo de caso: Previsão no sistema de pagamentos Brasileiro. Universidade Católica de Brasília – UCB, Descoberta de conhecimentos em bases de dados, 2003, 40 p.
OLIVEIRA, Emerson Madureira; ALVARENGA, Rogério:'DWD� PLQLQJ� HP� ILQDQoDV: Um exemplo prático utilizando a metodologia CRISP-DM, Brasil, Brasília, Universidade Católicade Brasília, novembro/2003
OMS:.QRZOHGJH�PDQDJHPHQW�DQG�VKDULQJ��.06���Suíça, Genebra, 2p. 2005.
______:)DFW�VKHHW�Q�������December 2001.�Suíça, Genebra. 4p 2004.
______:8VLQJ� FOLPDWH� WR� SUHGLFW� ,QIHFWLRXV� GLVHDVH� RXWEUHDNV� D� UHYLHZ� Suíça, Genebra.
130
&RPPXQLFDEOH� 'LVHDVHV� 6XUYHLOODQFH� DQG� 5HVSRQVH� 3URWHFWLRQ� RI� WKH� +XPDQ� (QYLURQPHQW�5ROO�%DFN�0DODULD� 55p. 2004b.
______:,QWHUQDWLRQDO�7UDYHO�DQG�+HDOWK��Suíça, Genebra. 2004c�______:'HQJXH1HW���:+2�*OREDO�'HQJXH�6XUYHLOODQFH� Suíça, Genebra. 2004d�______::RUOG� 5HSRUW� RQ� � .QRZOHGJH� IRU� %HWWHU�+HDOWK� �� 6WUHQJWKHQLQJ�+HDOWK� 6\VWHPV�Suíça, Genebra. 2004e�______:)DFW�VKHHW�Q������ April 2002.�Suíça, Genebra. 3p 2003.
______:$WLYLGDGHV� GD� 206� QD� 5HJLmR� $IULFDQD� – Relatório Anual de 2002. África, Jonesburgo. 82p. Setembro 2003b.
______:,QWHUQDWLRQDO�7UDYHO�DQG�+HDOWK��Suíça, Genebra. 207p. 2003c.
______:&OLPDWH�FKDQJH�DQG�KXPDQ�KHDOWK - risks and responses. Summary� Suíça, Genebra. 37p. 2003d. ISBN-92.4.159081.5.
______::K\�DLUFUDIW�GLVLQVHFWLRQ"� Suíça� *HQHEUD��3������������2000.
______:&OLPDWH�9DULDELOLW\�DQG�&KDQJH�DQG�WKHLU�+HDOWK�(IIHFWV�LQ�3DFLILF�,VODQG�&RXQWULHV�� :RUNVKRS�5HSRUW� $SLD��6DPRD��6XtoD��*HQHEUD����S��-XOKR�����E���______:'HQJXH� DQG� 'HQJXH� +HPRUUKDJLF� )HYHU – Report on global surveillance of epidemic-prone infectious diseases. Chapter 6: p.75-88, 2000c.
______:9HFWRU�6XUYHLOODQFH�DQG�&RQWURO� LQ�9HFWRU�FRQWURO��PHWKRGV�IRU�XVH�E\�LQGLYLGXDOV�DQG�FRPPXQLWLHV��Genebra. P.48-59. 1997�
______:$JULFXOWXUDO�GHYHORSPHQW�DQG�YHFWRU�ERUQH�GLVHDVHV� Suíça. Genebra. 22p. 1996.
PAIM, Jairnilson Silva:(SLGHPLRORJLD� H� SODQHMDPHQWR�� D� UHFRPSRVLomR� GDV� SUiWLFDV�HSLGHPLROyJLFDV�QD�JHVWmR�GR�686��Brasil: Revista Ciência e Saúde, Associação Brasileira de Pós-graduação em Saúde Coletiva – ABRASCO, Volume 8, n.º2, p. 557-567, 2003, ISSN 1413-8123.�PASSARI, Antônio Fabrizio Lima:([SORUDomR�GH� GDGRV� DXWRPDWL]DGRV� SDUD�SUHYLVmR�GH�YHQGDV�QR�YDUHMR�XWLOL]DQGR�UHGHV�QHXUDLV, São Paulo, Brasil, Universidade de São Paulo -USP, Dissertação de Mestrado, 2003, 150p.
PATZ, Jonathan A. HW� DO�:'HQJXH� )HYHU� (SLGHPLF� 3RWHQWLDO� DV� 3URMHFWHG� E\� *HQHUDO�&LUFXODWLRQ�0RGHOV�RI�*OREDO�&OLPDWH�&KDQJH� Environmental Health Perspectives Volume 106, Number 3, March 1998.
PENNA, Maria Lúcia F.:5HGH� QHXUDO� DUWLILFLDO� SDUD� GHWHFomR� GH VREUHPRUWDOLGDGH�DWULEXtYHO� j� &yOHUD� QR� &HDUi. 5HY�� 6D~GH� 3~EOLFD, Junho 2004, vol.38, no.3, p.351-357. ISSN 0034-8910.
PINHEIRO, Valéria Cristina Soares; TADEI, Wanderli Pedro:$YDOLDomR�GR�HIHLWR�UHVLGXDO�GR�WHPHIyV� HP� ODUYDV� GH� $HGHV� DHJ\SWL� �'LSWHUD�� &XOLFLGDH�� HP� UHFLSLHQWHV� DUWLILFLDLV� HP�
131
0DQDXV�� $PD]RQDV�� %UDVLO�� Idem. Caderno Saúde Pública. Nov./dez. 2002, vol.18, no.6, p.1529-1535.
POLANCZYK, Ricardo Antonio, GARCIA, Marcelo de Oliveira e ALVES, Sérgio Batista:. 3RWHQFLDO� GH� %DFLOOXV� WKXULQJLHQVLV� LVUDHOHQVLV� %HUOLQHU� QR� FRQWUROH� GH� $HGHV� DHJ\SWL.5HYLVWD�6D~GH�3~EOLFD. Dez. 2003, vol.37, no.6, p.813-816. ISSN 0034-8910.
PONTES, Ricardo J. S.; RUFFINO NETTO, Antonio:'HQJXH� HP� ORFDOLGDGH� XUEDQD� GD�UHJLmR� VXGHVWH� GR� %UDVLO�� DVSHFWRV� HSLGHPLROyJLFRV�� Brasil. Revista Saúde Pública. Jun. 1994, vol.28, no.3, p.218-227.
PRADO, Hercules Antônio:$ERUGDJHQV� +tEULGDV� SDUD� 0LQHUDomR� GH� 'DGRV� Exame de qualificação de doutorado. Universidade Federal do Rio Grande do Sul. 1998.
RAFAELI NETO, Silvio Luiz:7RPDGD� GH�'HFLVmR� (VSDFLDO��Uma abordagem sistêmica e implicações tecnológicas. III Workshop Brasileiro de Geoinformática –GeoInfo2001. Brasil. Rio de Janeiro. Instituto Militar de Engenharia, 4 e 5 de outubro de 2001.
REBELO, José Manuel Macário�HW�DO.:'LVWULEXLomR�GH�$HGHV�DHJ\SWL H GR�GHQJXH�QR�(VWDGR�GR�0DUDQKmR�� %UDVLO. &DG�� 6D~GH� 3~EOLFD. Jul./set. 1999, vol.15, no.3, p.477-486. ISSN 0102-311X.
REIFER, Donald J.:�$ /LWWOH�ELW�RI�NQRZOHGJH�LV�D�GDQJHURXV�WKLQJ. IEEE, p14/15, May/June 2002.
RIGAU-PEREZ, José G. HW�DO�:$ 'HULYDWLRQ�%DU�&KDUW�IRU�'HWHFWLQJ�'HQJXH�2XWEUHDNV�LQ�3XHUWR�5LFR� American Journal of Public Health. March 1999, vol. 89, Nr 3, p.374-378.
ROCCO, Iray Maria; BARBOSA, Maria Luisa; KANOMATA, Emilia Hiromi Nakaya. 6LPXOWDQHRXV�LQIHFWLRQ�ZLWK�'HQJXH���DQG���LQ�D�%UD]LOLDQ�SDWLHQW. Brasil. Ver. Inst. `éd. Trop. S. Paulo. Maio/Jun. 1998, vol.40, no.3, p.151-154.
SCHREIBER, Kathleen.:$Q�LQYHVWLJDWLRQ�RI�UHODWLRQVKLSV�EHWZHHQ�FOLPDWH�DQG�GHQJXH�XVLQJ�D ZDWHU�EXGJHWLQJ�WHFKQLTXH��Int. J. Biometorol, March 2001, Nr. 45, p.81-89.
SCHUMANN; H, CHÁVEZ, Norma de López; GRAW, H,-U:9LVXDO�DQDO\VLV�DV�DQ�HIILFLHQW�WRRO� IRU� WKH� H[SORUDWLRQ�RI�KXPDQ�KHDOWK�GDWD� Alemanha: Proceedings of the International Workshop on Geomedical Systems (GEOMED’97).
SEPLAN:$VSHFWRV�GHPRJUiILFRV�GD�SRSXODomR�GH�*RLkQLD��SRU�EDLUUR��VHJXQGR�R�DQR�GH������ Brasil, Goiânia. Secretaria de Planejamento - SEPLAN. 199p, dezembro 2002.
SILVEIRA RODRIGUES, Eugênia Maria HW�DO��(SLGHPLRORJLD�GD�LQIHFomR�SHOD�GHQJXH�HP�5LEHLUmR�3UHWR��63��%UDVLO��Idem. Revista Saúde Pública. Abr. 2002, vol.36, no.2, p.160-165.
SIQUEIRA JUNIOR, João Bosco HW� DO�:+RXVHKROG� VXUYH\� RI� GHQJXH� LQIHFWLRQ� LQ� FHQWUDO�EUD]LO�� VSDWLDO� SRLQW� SDWWHUQ� DQDO\VLV� DQG� ULVN� IDFWRUV� DVVHVVPHQW�� American Journal of Tropical Medicine and Hygiene, nº 71, p 646-651, 11/2004.
______:'HQJXH� DQG� 'HQJXH� +HPRUUKDJLF� )HYHU�� %UD]LO�� ����±������ CDC – Emerging Infectious Diseases, Vol .11, nº 1, p 48-53, 01/2005.
SIQUEIRA JÚNIOR, João Bosco:9LJLOkQFLD� GR� 'HQJXH�� $SOLFDomR� GH� 'LDJUDPDV� GH�&RQWUROH�H�$QiOLVH�(VSDFLDO�QR�0XQLFtSLR�GH�*RLkQLD��*RLiV�Brasil, Universidade Federal
132
de Goiás – UFG,Dissertação de Mestrado, 2001. 53p.
SOUSA HW�DO�:(VWXGR�FRPSDUDWLYR�HQWUH�D�SUHFLSLWDomR�SOXYLRPpWULFD�PHQVDO�H�R�Q~PHUR�PHQVDO� GH� FDVRV� GH� FDVRV� GHQJXH� QRWLILFDGRV� HP�%HOpP�3D� �����������. XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 9p.
SPSS: &5,63�'0�����6WHS�E\�VWHS�GDWD�PLQLQJ�JXLGH��78p. 2000.
SRINIVASAN K.N. HW� DO�:$QDO\VLV� RI� 7�FHOO� HSLWRSH� KRW�VSRWV� LQ� GHQJXH� YLUXV� HQYHORSH�SURWHLQ LQ First Asian Regional dengue research network meeting. October 2004. Bankok. Thailand.
STEWART, Thomas A.:&DSLWDO� ,QWHOHFWXDO – A Nova Abordagem Competitiva das Empresas: 1987. Tradução de Ana Beatriz Rodrigues e Priscilla Martins Celeste. Brasil. Rio de Janeiro. 9ª Edição. Ed. Campus, 1998. 237p.
SVS: Secretaria de Vigilância em Saúde – BRASIL LQ Ministério da Saúde do Brasil -MSB : Núcleo de Comunicação da Secretaria de Vigilância em Saúde. 'HQJXH�EROHWLP�GD�VHPDQD�Q����������, Ministério da Saúde do Brasil.
______:'HQJXH�EROHWLP�GD�VHPDQD�Q����������, Ministério da Saúde do Brasil.
______:'HQJXH�EROHWLP�GD�VHPDQD�Q����������, Ministério da Saúde do Brasil.
SWINGLER, Kevin:$SSO\LQJ� QHXUDO� QHWZRUNV – D SUDFWLFDO� JXLGH. Academic Press, USA, San Diego, 1996. 303p.
TEIXEIRA FILHO, Jayme:*HUHQFLDQGR� FRQKHFLPHQWR. Brasil, Rio de Janeiro, Serviço Nacional de Aprendizagem Comercial. 2ª Edição. 189p. 2001.
TURBAN, Efraim; ARONSON, Jay E.:'HFLVLRQ� 6XSSRUW� 6\VWHPV� DQG� ,QWHOOLJHQW� 6\VWHPV�1HZ�-HUVH\��3UHQWLFH�+DOO����������(GLWLRQ�TURBAN, Efraim; RAINER, Kelly R. Jr.; POTTER, Richard E.:$GPLQLVWUDomR� GH�WHFQRORJLD� GD� LQIRUPDomR – Teoria e prática: 2003. Tradução de Teresa Félix de Souza. Brasil. Rio de Janeiro. 4ª Edição. Ed. Campus, 2004. 598p.
UNICAMP:;,,� &RQJUHVVR� ,QWHUQR� GH� ,QLFLDomR� &LHQWtILFD. Brasil. São Paulo: Ed. Universidade de Campinas (UNICAMP). 398p. Setembro 2004.
VASCONCELOS, Pedro F. C.�HW�DO��(SLGHPLD�GH�GHQJXH�HP�)RUWDOH]D��&HDUi�� LQTXpULWR�VRUR�HSLGHPLROyJLFR� DOHDWyULR��Brasil. 5HY�� 6D~GH�3~EOLFD. Out. 1998, vol.32, no.5, p.447-454. ISSN 0034-8910.
VENÂNCIO DA CUNHA, Rivaldo HW� DO��'HQJXH� LQIHFWLRQ� LQ�3DUDFDPEL�� 6WDWH� RI�5LR� GH�-DQHLUR�����������. Rev. Soc. Bras. Med. Trop. Set./out. 1997, vol.30, no.5, p.379-383. ISSN 0037-8682.
VIANELLO, Rubens Leite; ALVES, Adil Ramier:0HWHRURORJLD� EiVLFD� H� DSOLFDo}HV��Universidade Federal de Viçosa, Imprensa Universitária, p.384-397, Viçosa –Minas Gerais, 1991.
WANG, Hui; WEIGEND, Andreas S.:'DWD� PLQLQJ� IRU� ILQDQFLDO� GHFLVLRQ� PDNLQJ. Ed. Elsevier, 2004, p. 457-460.
133
WESTPHAL, Márcia Faria:2 PRYLPHQWR�FLGDGHV�PXQLFtSLRV�VDXGiYHLV��XP�FRPSURPLVVR�FRP� D� TXDOLGDGH� GH� YLGD. Associação Brasileira de Pós-graduação em Saúde Coletiva –ABRASCO. 2000, Volume 5 número 1. ISSN 1413-8123
WIETEK, Frank; KAMP, Vera: 6SDWLDO�'DWD�$QDO\VLV�6XSSRUW�IRU�&DQFHU�(SLGHPLRORJ\�LQ�&$5(66� *HRPHGLFDO�6\VWHPV (GEO-MED 97), 11p 1997.
ZELASNY Gene�&RPXQLFDomR�YLVXDO�SDUD�H[HFXWLYRV���Utilizando gráficos como poderosa ferramenta de trabalho. Tradução de Aníbal Mari. Brasil. São Paulo, Ed. Futura, 1997. 203p.
134
*ORVViULR��GLFLRQiULR�GH�WHUPRV�� Termo Significado Autor/página Arbovírus Um vírus difundido por artrópodes i.e. um vírus que é
transmitido por insetos ou pequenos aracnídeos WHO, 1996, p. 01
apud Citado por, conforme, segundo Exemplo: (EVANS, 1987, apud SAGE, 1992, p. 2-3) Segundo Silva (apud ABREU, 1999, p. 3) diz ser [...]
SERRA NEGRA, 2003, p. 165
e.g. (latim H[HPSOL�JUDWLD), Por exemplo MELHORAMENTOS, 1998, 1034
Endemia Doença que ocorre constantemente em determinada região. MICHAELIS, 1998, p.468
Epidemia Doença que ataca ao mesmo tempo muitas pessoas da mesma região. (Michaelis, 1998, p.483)
“A ocorrência em uma comunidade ou em uma região, de um número de casos específicos no comportamento de uma doença, ou outros eventos claramente relacionados que indiquem a presença de uma epidemia que varia de acordo com o agente da população exposta e experiência (falta de precedente da exposição à doença e época e lugar da ocorrência)” (LAST, 2001 DSXG WHO, 2004, p. 14, tradução nossa).
i.e. Isto é MELHORAMENTOS, 1998, 1036
Interação Ação recíproca de dois ou mais corpos uns nos outros; Atualização da influência recíproca de corpos inter-relacionados; Ação Recíproca entre o usuário e um equipamento; Ações e relações entre os membros de um grupo ou entre grupos de uma sociedade.
MICHAELIS, 1998, p.691
Investigaçãoepidemiológica
“Investigação epidemiológica é um trabalho de campo, realizado a partir de casos notificados (clinicamente declarados ou suspeitos) e seus contatos, que tem como principais objetivos: identificar fonte e modo de transmissão: grupos expostos a maior risco; fatores determinantes; confirmar diagnóstico; e determinar as principais características epidemiológicas. O seu propósito final é orientar medidas de controle para impedir a ocorrência de novos casos” (FUNASA, 2002, 31).
(FUNASA, 2002, 31).
Iteração Ato e iterar repetir MICHAELIS, 1998, p.710
Modelo É a descrição formal de um sistema. Estas descrições modem possuir muitas formas, dependendo do propósito do modelo. O propósito do modelo é descrever a relação entre a entrada e saída dos dados do sistema.
DELMATER e HANCOCK, 2001, p. 06
Mosquito Aedes
Tipo de mosquito que pode transmitir doenças como a Febre Amarela e o Dengue
WHO, 1996, p. 01
Notificação “Notificação é a comunicação da ocorrência de determinada doença ou agravo à saúde, feita à autoridade sanitária por
FUNASA, 2002, p. 15
135
profissionais de saúde ou qualquer cidadão, para fins de adoção de medidas de intervenção pertinentes” (FUNASA, 2002, p. 15)
Surto “Uma epidemia (praga) limitada a um local que aumenta na incidência de uma doença (enfermidade). e.g. em uma vila, cidade ou instituição fechada”
LAST (2001 DSXGWHO, 2004, p.14, tradução nossa)
Sazonal “Relativo à estação do ano, à sazão” MICHAELIS, 1998, p.1114
136
$QH[R� $ �� 62/,&,7$d2� '(� '2$d2� '(� '$'26� $2� 6(&5(7È5,2�081,&,3$/�'(�6$Ò'(�'(�*2,Æ1,$�� *2
³6U��6HFUHWiULR���
3DUD�GDU� SURVVHJXLPHQWR� H� FRQVROLGDU� D� SHVTXLVD�HIHWXDGD�HP�PLQKD�GLVVHUWDomR� GH� 0HVWUDGR�� QD� 8QLYHUVLGDGH� &DWyOLFD� GH� %UDVtOLD�� QHFHVVLWR� TXH�VHMDP� IRUQHFLGDV�� D� WtWXOR� GH� GRDomR� SDUD� SHVTXLVD� FLHQWtILFD�� DV� LQIRUPDo}HV��%DQFR� GH� GDGRV�� PDSDV�� GDGRV� H� 3.�� SHUWHQFHQWHV� j� 6HFUHWDULD� 0XQLFLSDO� GH�6D~GH�� UHIHUHQWHV� DR� 6LVWHPD� 1DFLRQDO� GH� $JUDYRV� H� 1RWLILFDomR� �6,1$1��� QR�SHUtRGR� GH� ��� MDQHLUR� GH� ����� D� ��� DEULO� GH� ������ VREUH� DV� GRHQoDV�'HQJXH� H�)HEUH�$PDUHOD��� (VFODUHoR�TXH�HVWRX�FLHQWH�GD�UHVSRQVDELOLGDGH�SHOD�QmR�GLYXOJDomR�GRV�GDGRV�SDUD�RXWURV�ILQV�TXH�QmR�DFDGrPLFRV���
2V� GDGRV�� FRQVWDQWHV� QR� 6,1$1�� TXH� QmR� VHUmR� XWLOL]DGRV� QD� QRVVD�SHVTXLVD� VmR�� QRPH� GR� SDFLHQWH�� ORJUDGRXUR�� UDoD�� HVFRODULGDGH�� QXPHUR� GR�FDUWmR�686��QRPH�GD�PmH��WHOHIRQH��RFXSDomR��GHVORFDPHQWR��GDWD�GD�~OWLPD�GRVH�GH� IHEUH� DPDUHOD�� VH� RFRUUHX� D� KRVSLWDOL]DomR�� GDWD� GH� KRVSLWDOL]DomR��PXQLFtSLR�QRPH�HQGHUHoR�WHOHIRQH� GR� KRVSLWDO�� ORFDO� SURYiYHO� GH� LQIHFomR��REVHUYDo}HV�³
137
$QH[R� %� �� 62/,&,7$d2� '(� '2$d2� '(� '$'26� $2� ',5(725�35(6,'(17(�'$�&20'$7$�
³6U��3UHVLGHQWH��3DUD� GDU� SURVVHJXLPHQWR� H� FRQVROLGDU� D� SHVTXLVD� HIHWXDGD� HP� PLQKD�
GLVVHUWDomR�GH�0HVWUDGR��QD�8QLYHUVLGDGH�&DWyOLFD�GH�%UDVtOLD��QHFHVVLWR�TXH�VHMDP�IRUQHFLGDV�� D� WtWXOR� GH� GRDomR� SDUD� SHVTXLVD� FLHQWtILFD�� RV� VHJXLQWHV� GDGRV�UHIHUHQWHV�D�&LGDGH�GH�*RLkQLD���
• &yGLJR�GR�EDLUUR��• 1RPH�GR�EDLUUR��• 1~PHUR�GH�HVFRODV�SRU�EDLUUR��• 1~PHUR�GH�KRVSLWDLV�SRU�EDLUUR��• 1~PHUR�GH�SUpGLRV�SRU�EDLUUR��• 4XDQWLGDGH�WRWDO�GH�ORWHV�SRU�EDLUUR���• 4XDQWLGDGH�WRWDO�GH�ORWHV�UHVLGHQFLDLV�SRU�EDLUUR��• 4XDQWLGDGH�WRWDO�GH�ORWHV�FRPHUFLDLV�SRU�EDLUUR��• 7RWDO�GH�iUHD�YHUGH�SRU�EDLUUR��• $VIDOWR��FRPSOHWDPHQWH�DVIDOWDGR��SDUFLDOPHQWH�DVIDOWDGR��VHP�DVIDOWR���• ,QVWDODomR�6DQLWiULD��&RPSOHWD��6HP���• ÈJXD� �+LGU{PHWUR�� &LVWHUQD�� &LVWHUQD� +LGU{PHWUR�� 3RoR� $UWHVLDQR��6HP���• (QHUJLD�(OpWULFD��• (VJRWR��5HGH�3~EOLFD��)RVVD�6pSWLFD��)RVVD�1HJUD��6HP���
�(VFODUHoR�TXH� HVWRX� FLHQWH� GD� UHVSRQVDELOLGDGH�SHOD�QmR�
GLYXOJDomR�GRV�GDGRV�SDUD�RXWURV�ILQV�TXH�QmR�DFDGrPLFRV�´
138
$QH[R� &� �� 6ROLFLWDomR� GH� GRDomR� GH� GDGRV� &OLPiWLFRV� DR�0LQLVWpULR�GD�$JULFXOWXUD�H�GR�$EDVWHFLPHQWR��
�
³6U��$ODRU�0RDF\U�'¶DOODQW{QLD�-~QLRU��'LUHWRU�GR�����'LVWULWR�GH�0HWHRURORJLD�HP�*RLiV��',60(���&DUR�6U�$ODRU���*RVWDULD�VH�SRVVtYHO�FRQWDU�QRYDPHQWH�FRP�VXD�JUDWLGmR��FRPSUHHQVmR�H�ERD�
YRQWDGH� QR� VHQWLGR� GH� YLDELOL]DU� D� GRDomR� GRV� GDGRV� QHFHVViULDV� DR� SOHQR�GHVHQYROYLPHQWR� H� ILQDOL]DomR� GD� GLVVHUWDomR� GH� 0HVWUDGR� GH� PHX� RULHQWDQGR�*LRYDQQL�*RQGLP���
*LRYDQQL� WrP� GHGLFDGR� IRUWHPHQWH� HP� VXD� SHVTXLVD� TXH� WUDWD� GR�GHVHQYROYLPHQWR�GH�XP�PRGHOR�TXH��DFUHGLWDPRV��VHMD�FDSD]�GH�SUHYHU�HQGHPLDV�H�HSLGHPLDV�GH�)HEUH�$PDUHOD�H�'HQJXH��WHQGR�FRPR�FHQiULR�SDUD�HVWXGR�GH�FDVR�D�FLGDGH�GH�*RLkQLD�� H� TXH� VHMD� HTXLYDOHQWH� RX�DWp�PHVPR�VXSHULRU� DRV�PRGHORV� Mi�H[LVWHQWHV��LQFOXVLYH�RV�XWLOL]DGRV�SHOD�2UJDQL]DomR�0XQGLDO�GH�6D~GH���
Os dados serão utilizados exclusivamente para este projeto de pesquisa e
teremos imenso prazer de citá-los em nossas publicações.“
139
$QH[R�'���&DOHQGiULR�HSLGHPLROyJLFR�GH������D������Semana Epidemiológica Inicio Fim S01 20001231 20010106S02 20010107 20010113S03 20010114 20010120S04 20010121 20010127S05 20010128 20010203S06 20010204 20010210S07 20010211 20010217S08 20010218 20010224S09 20010225 20010303S10 20010304 20010310S11 20010311 20010317S12 20010318 20010324S13 20010325 20010331S14 20010401 20010407S15 20010408 20010414S16 20010415 20010421S17 20010422 20010428S18 20010429 20010505S19 20010506 20010512S20 20010513 20010519S21 20010520 20010526S22 20010527 20010602S23 20010603 20010609S24 20010610 20010616S25 20010617 20010623S26 20010624 20010630S27 20010701 20010707S28 20010708 20010714S29 20010715 20010721S30 20010722 20010728S31 20010729 20010804S32 20010805 20010811S33 20010812 20010818S34 20010819 20010825S35 20010826 20010901S36 20010902 20010908S37 20010909 20010915S38 20010916 20010922S39 20010923 20010929S40 20010930 20011006S41 20011007 20011013S42 20011014 20011020S43 20011021 20011027S44 20011028 20011103S45 20011104 20011110S46 20011111 20011117S47 20011118 20011124S48 20011125 20011201S49 20011202 20011208S50 20011209 20011215S51 20011216 20011222
140
S52 20011223 20011229S01 20011230 20020105S02 20020106 20020112S03 20020113 20020119S04 20020120 20020126S05 20020127 20020202S06 20020203 20020209S07 20020210 20020216S08 20020217 20020223S09 20020224 20020302S10 20020303 20020309S11 20020310 20020316S12 20020317 20020323S13 20020324 20020330S14 20020331 20020406S15 20020407 20020413S16 20020414 20020420S17 20020421 20020427S18 20020428 20020504S19 20020505 20020511S20 20020512 20020518S21 20020519 20020525S22 20020526 20020601S23 20020602 20020608S24 20020609 20020615S25 20020616 20020622S26 20020623 20020629S27 20020630 20020706S28 20020707 20020713S29 20020714 20020720S30 20020721 20020727S31 20020728 20020803S32 20020804 20020810S33 20020811 20020817S34 20020818 20020824S35 20020825 20020831S36 20020901 20020907S37 20020908 20020914S38 20020915 20020921S39 20020922 20020928S40 20020929 20021005S41 20021006 20021012S42 20021013 20021019S43 20021020 20021026S44 20021027 20021102S45 20021103 20021109S46 20021110 20021116S47 20021117 20021123S48 20021124 20021130S49 20021201 20021207S50 20021208 20021214S51 20021215 20021221S52 20021222 20021228S01 20021229 20030104S02 20030105 20030111
141
S03 20030112 20030118S04 20030119 20030125S05 20030126 20030201S06 20030202 20030208S07 20030209 20030215S08 20030216 20020222S09 20030223 20030301S10 20030302 20030308S11 20030309 20030315S12 20030316 20030322S13 20030323 20030329S14 20030330 20030405S15 20030406 20030412S16 20030413 20030419S17 20030420 20030426S18 20030427 20030503S19 20030504 20030510S20 20030511 20030517S21 20030518 20030524S22 20030525 20030531S23 20030601 20030607S24 20030608 20030614S25 20030615 20030621S26 20030622 20030628S27 20030629 20030705S28 20030706 20030712S29 20030713 20030719S30 20030720 20030726S31 20030727 20030802S32 20030803 20030809S33 20030810 20030816S34 20030817 20030823S35 20030824 20030830S36 20030831 20030906S37 20030907 20030913S38 20030914 20030920S39 20030921 20030927S40 20030928 20031004S41 20031005 20031011S42 20031012 20031018S43 20031019 20031025S44 20031026 20031101S45 20031102 20031108S46 20031109 20031115S47 20031116 20031122S48 20031123 20031129S49 20031130 20031206S50 20031207 20031213S51 20031214 20031220S52 20031221 20031227S53 20031228 20040103S01 20040104 20040110S02 20040111 20040117S03 20040118 20040124S04 20040125 20040131
142
S05 20040201 20040207S06 20040208 20040214S07 20040215 20040221S08 20040222 20040228S09 20040229 20040306S10 20040307 20040313S11 20040314 20040320S12 20040321 20040327S13 20040328 20040403S14 20040404 20040410S15 20040411 20040417S16 20040418 20040424S17 20040425 20040501
143
$QH[R�(���(VFDOD�$QHPRPpWULFD�%HDXIRUW�$GDSWDGD�
VENTO Velocidade equivalente na altura padrão de 10m acima de um terreno plano e descoberto
No Beaufort Termo Descritivo
Vel. Med. Nó
m/seg. Km/h Especificações em terra
0 Clma < 1 0 - 0.2 < 1 Não se nota o menor deslocamento nos mais leves objetos. A fumaça eleva-se verticalmente
1 Aragem 1 -3 0.3 -1.5 1 -5 A direção do vento é indicada pelo desvio da fumaça mas não pelos cata-ventos.
2 Brisa leve 4 -6 1.6 - 3.3 6 -11 Sente-se o vento na face; as folhas das árvores são levemente agitadas; os cata-ventos comuns são acionados.
3 Brisa fraca
7 - 10 3.4 -5.4 12 -19 As folhas e os pequenos arbustos ficam em agitação contínua; as bandeiras leves começam a se estender.
4 Brisa moderada
11 - 16 5.5 - 7.9 20 -28 Move-se os pequenos galhos das árvores, poeira e pedaços de papel são levantados.
5 Brisa forte
17 - 21 8.0 -10.7
29 -38 As árvores pequenas com folhagem começam a oscular, aparecem ondas com crista nas superfície dos rios e lagos.
6 Vento fresco
22 - 27 13.9 -17.1
39-49 Galhos maiores das árvores agitadas; ouve-se os assobios produzidos pelo vento ao passar pelos fios telegráficos; torna-se difícil de usar o guarda-chuva.
7 Vento forte
28 - 33 17.2 -20.7
50 -61 Os troncos das árvores oscilam; torna-se difícil andar contra o vento.
8 Ventania 34 - 40 20.8 -24.4
62 -74 Geralmente torna-se impossível andar contra o vento. Quebram-se os galhos das árvores.
9 Ventania forte
41 - 47 24.5 - 28.4
75 -88 Ocorrem pequenos danos nas edificações (telhas, chaminés são arrancadas).
10 Tempestade
48 - 55 24.5 -28.4
89 -102 Raro no interior da terra; as árvores são derrubadas; as edificações sofrem danos materiais consideráveis.
144
11 Tempestadeviolenta
56 - 63 38.5 -32.6
103 -117
É observado muito raramente; produz grandes destruições.
12 Furação 64 - 71 32.7-36.9
118 -133
Poucos danos - as árvores, os arbustos e os trailers serão arrastados se não forem amarrados a algum lugar seguro. Outros tipos de construção serão atingidas de forma mais amena. Destruição parcial ou total de letreiros e anúncios mal instalados. Seqüência de ondas com altura de 1 a 1,5 m acima do normal. Inundação de ruas e estradas próximas à costa. Poucos danos em ancoradouros. As embarcações pequenas têm suas amarras rompidas.
13 Furação 72 -80 37.0 -
41.4 134 -149
Poucos danos - as árvores, os arbustos e os trailers serão arrastados se não forem amarrados a algum lugar seguro. Outros tipos de construção serão atingidas de forma mais amena. Destruição parcial ou total de letreiros e anúncios mal instalados. Seqüência de ondas com altura de 1 a 1,5 m acima do normal. Inundação de ruas e estradas próximas à costa. Poucos danos em ancoradouros. As embarcações pequenas têm suas amarras rompidas.
14 Furação 81 - 89 41.5 -
46.1 150 -166
Danos moderados - danos consideráveis em árvores e arbustos. Perda total de trailers, letreiros e anúncios. Destruição parcial de telhados, portas e janelas. Poucos danos em construções. Seqüência de ondas com altura de 1,8 a 2,4 m acima do normal. Inundação de ruas e estradas próximas à costa. As avenidas que estão em terrenos baixos são interrompidas de 2 a 4 horas antes da chegada do centro do furacão. As marinas ficam inundadas. É obrigatória a retirada
145
dos moradores das áreas costeiras. 15 Furação 90 - 99 46.2 -
50.9 167 -183
Danos moderados - danos consideráveis em árvores e arbustos. Perda total de trailers, letreiros e anúncios. Destruição parcial de telhados, portas e janelas. Poucos danos em construções. Seqüência de ondas com altura de 1,8 a 2,4 m acima do normal. Inundação de ruas e estradas próximas à costa. As avenidas que estão em terrenos baixos são interrompidas de 2 a 4 horas antes da chegada do centro do furacão. As marinas ficam inundadas. É obrigatória a retirada dos moradores das áreas costeiras.
16 Furação 100 - 108
51.0 - 56.0
184 -201
Muitos danos - ramos de árvores são arrancados. Árvores grandes são derrubadas. Anúncios e letreiros são arrastados pelo vento. Danos em telhados, portas e janelas de casas. Danos na estrutura de edifícios pequenos. Trailers são destruídos. Seqüência de ondas com altura de 2,8 a 3,7m acima do normal, inundando a área costeira e destruindo casas próximas ao litoral. Prédios de porte são danificados por causa das ondas. As avenidas de emergência, que estão em terrenos baixos, são interrompidas de 3 a 5 horas antes da chegada do centro do furacão. Os terrenos que estão a 1,5 m ou menos acima do nível do mar são inundados. A água avança cerca de 12 km continente adentro. É exigida a retirada dos moradores das áreas costeiras.
17 Furação 109 - 118
56.1 - 61.2
202 -220
Danos extremos - as árvores são arrastadas pelo vento. Os anúncios e letreiros são arrancados ou destruídos. Grandes danos nos telhados, janelas e portas das casas. Algumas paredes e tetos de residências são completamente destruídos. Trailers são destruídos. Seqüência de ondas com altura de
146
4 a 5,5 m acima do normal. Os terrenos que estão a pelo menos 3 m acima do nível do mar são inundados e a água avança cerca de 9,6 km continente adentro. As avenidas e estradas de emergência, escolhidas para a retirada de moradores, são interrompidas de 3 a 5 horas antes da chegada do centro do furacão. É obrigatória a retirada total de todas as pessoas que morem próximo à costa e que vivam em terrenos baixos, a uma distância de�����NP�GR�PDU�
Fonte: Manual de Observações Meteorológicas - INMET Fração da abóbada celeste coberta por nuvens
Fonte: Manual de Observações Meteorológicas - INMET UMIDADE RELATIVA DO AR (URA) > - 12% Estado de emergência 12 - 20% Estado de alerta 20 - 30% Estado de atenção 30 - 40% Desconfortável 40 - 50% Desconfortável 50 - 60% Confortável 60 - 70% Confortável 70 - 80% Confortável 80 - 90% Muito úmido 90 - 100% Muito úmido Fonte: Unicamp UMIDADE RELATIVA DO AR (URA) > - 12% Árido 12 - 20% Árido 20 - 30% Semi-árido 30 - 40% Subúmido
Divisão da Abóbada Celeste Quantidade de Nuvens 0 - Ausência de nuvens 0 Céu claro 1 - oitavo ou menos de céu
coberto mas não zero 1/10 ou menos, mas não zero Parcialmente nublado
2 - oitavos de céu coberto 2/10 - 3/10 Parcialmente nublado 3 - oitavos de céu coberto 4/10 Parcialmente nublado 4 - oitavos de céu coberto 5/10 Nublado 5 - oitavos de céu coberto 6/10 Nublado 6 - oitavos de céu coberto 7/10 - 8/10 Nublado 7 - oitavos de céu coberto 9/10 ou mais, menos 10/10 Nublado 8 - Céu completamente encoberto 10/10 Encoberto
147
40 - 50% Subúmido 50 - 60% Úmido 60 - 70% Úmido 70 - 80% Úmido 80 - 90% Muito úmido 90 - 100% Muito úmido Classificação Climática segundo Köppen (Vianello, R.L & Alves, A. R., 1991) Modificado TEMPERATURA MÉDIA DO AR (oC) -3 – 10 Clima polar -3 - 18 Clima temperado 18 - 24 Clima tropical/Subtropical 20 - 27 Clima Equatorial 28 - 30 Clima desértico e clima de monções
TEMPERATURA DO AR (oC) -3 – 0 Climar polar 0 – 5 Clima temperado/clima polar 5 – 10 Clima temperado 10 – 15 Clima subtropical 15 – 20 Clima tropical 20 – 25 Clima tropical/Equatorial 25 – 30 Clima tropical/Equatorial 30 - 35 Clima tropical/Equatorial 35 – 40 Clima semi-árido 40 – 45 Clima semi-árido/clima desértico 45 - 50 Clima semi-árido/clima desértico Classificação Climática segundo Köppen (Vianello, R.L & Alves, A. R., 1991) Modificado AMPLITUDE TÉRMICA DIURNA (oC) 1 - 3 Clima Equatorial 3 – 5 Clima Equatorial/ 5 – 7 Clima tropical 7 – 9 Clima tropical 9 – 11 Clima subtropical/ Clima tropical 11 – 13 Clima subtropical/ Clima tropical 13 – 15 Clima subtropical/ Clima tropical 15 – 17 Clima tropical 17 - 19 Clima tropical/ Clima subtropical 19 – 21 Clima tropical/ Clima subtropical 21 – 23 Clima tropical/Clima temperado
continental 23 – 25 Clima tropical 25 - 27 Clima desértico 27 – 29 Clima desértico 29 – 31 Clima desértico 31 – 33 Clima desértico
148
33 - 35 Clima desértico
Evaporação diária (mm) 0 - 1 Clima polar 1 - 5 Clima equatorial/ clima subtropical 5 - 7 Clima tropical 7 - 9 Clima tropical 9 - 11 Clima semi-árido/ clima desértico 11 - 13 Clima semi-árido/ clima desértico 13 - 15 Clima semi-árido/ clima desértico 15 - 17 Clima semi-árido/ clima desértico
Grau de intensidade de precipitação Chuvisco fraco Máx. 0,3mm/h Visibilidade superior a 1.000 metros.
Chuvisco moderado
0,3 - 0,5mm/h Visibilidade entre 500 e 1.000 metros.
Chuvisco forte 0,5 mm/h Visibilidade inferior a 500 metros.
Chuva fraca
1,1 - 5mm/h 0,8 mm/10min As gotas de chuvas são bem destacadas; os pingos nos telhados fracos, poças d’água corrente nas sarjetas das ruas.
5,1 – 15mm/h 6,0 mm/10min 15 – 25mm/h 6,0 mm/10min 25 – 35mm/h 6,0 mm/10min 35 – 45mm/h 6,0 mm/10min
Chuva moderada
45 – 60mm/h 6,0 mm/10min
As gotas de chuva identificam-se bem e ao encontrarem superfícies duras provocam borrifos; o escoamento das águas nas calhas dos telhados vai de um terço a mais da metade de sua capacidade; a queda das chuvas nos telhados provoca ruídos assemelhados a desde um simples chiado até o bater de tambores.
Chuva forte > 60mm/h 10,0mm/10min A chuva cai torrencialmente e todas as demais características são mais acentuadas que as indicadas para chuva moderada.