Estudo e desenvolvimento de uma Ferramenta de Visualização...
Transcript of Estudo e desenvolvimento de uma Ferramenta de Visualização...
UNIVERSIDADE CATÓLICA DE PELOTAS ESCOLA DE INFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
Estudo e desenvolvimento de uma Ferramenta de Visualização de Informações adaptável para
Sistemas de Monitoramento
por Edécio Fernando Iepsen
Trabalho Individual I TI-2006/2-004
Orientador: Prof. Dr. Paulo Roberto Gomes Luzzardi
Co-orientador: Prof. Dr. Stanley Loh
Pelotas, dezembro de 2006
AGRADECIMENTOS
Agradeço a Deus pelo maravilhoso presente da vida e por Jesus Cristo meu Senhor
e Salvador.
A minha mãe, Leonídia, pelo incentivo e confiança em todos os momentos da
minha vida e toda a minha família, meu padastro Wersino, meu irmão Eduardo e minha
irmã Elenice.
A minha namorada Delair, pelos momentos compartilhados.
Ao meu orientador Prof. Dr. Paulo Roberto Gomes Luzzardi, pelo auxílio na
realização deste trabalho e pelo apoio e amizade no decorrer de todas as etapas do
mestrado.
Ao meu co-orientador Prof. Dr. Stanley Loh, pelas importantes contribuições no
desenvolvimento deste trabalho.
A todos os meus amigos e amigas do mestrado (Verlani, Rosaura, Cristiano,
Eduardo, Rogério, João, Conrado, Vanessa, Diego); das instituições de ensino em que atuo
ou atuei: Senac Pelotas (Paulo Ricardo, Mário Capanema, Cléber, Daniele, Maristela...),
Senac Porto Alegre (Franz, Ivonei, Cristiane, Miguel, Isabel...), Santa Margarida (Adriana,
Tiago, Luciane, Renato...), UCPel (Boaventura, Hugo, Cláudia...) e Colégio Objetivo
(Cláudia, Rosali...). Pessoas muito importantes em diversos momentos de minha vida, que
me oportunizaram o desafio do ensinar e compartilharam experiências nesta fascinante arte
do viver e ser feliz.
2
SUMÁRIO
LISTA DE FIGURAS ........................................................................................................... 5
LISTA DE ABREVIATURAS.............................................................................................. 6
LISTA DE TABELAS .......................................................................................................... 7
RESUMO .............................................................................................................................. 8
ABSTRACT ............................................................................................................................ 9
1. Introdução.................................................................................................................... 10
1.1 Motivação.............................................................................................................. 10
1.2 Contexto ................................................................................................................ 12
1.3 Objetivos ............................................................................................................... 13
1.3.1 Objetivos Gerais........................................................................................... 13
1.3.2 Objetivos Específicos................................................................................... 13
1.4 Organização do texto............................................................................................. 13
2. Visualização de Informações....................................................................................... 14
2.1 Técnicas de Visualização de Informações............................................................. 16
2.1.1 Foco + Contexto........................................................................................... 17
2.1.2 Overview + Detail........................................................................................ 18
2.1.3 Cone tree ...................................................................................................... 19
2.1.4 Landscapes (Paisagens) ............................................................................... 20
2.1.5 Browser hiperbólico..................................................................................... 20
2.1.6 Coordenadas Paralelas ................................................................................. 21
2.1.7 Glyphs .......................................................................................................... 22
2.1.8 Table Lens .................................................................................................... 23
2.2 Sistemas de Monitoramento .................................................................................. 24
2.2.1 CIRC (Control Interact Radial Circle)........................................................ 24
2.2.2 Lifelines........................................................................................................ 25
2.2.3 Chat Circles ................................................................................................. 26
2.2.4 TimeMines.................................................................................................... 27
3. Visual Data Mining ..................................................................................................... 29
3.1 Paradigma da Exploração Visual de Dados .......................................................... 30
4. Ferramenta de Visualização de Informações Proposta................................................ 31
4.1 Tipos de Dados...................................................................................................... 32
4.2 Metodologia de Desenvolvimento......................................................................... 33
4.3 Técnica Utilizada pela Ferramenta........................................................................ 34
4.4 Recursos ................................................................................................................ 35
4.5 Referência.............................................................................................................. 35
4.6 Funcionamento ...................................................................................................... 36
5. Estudo de Caso ............................................................................................................ 40
6. Conclusões e futuros trabalhos .................................................................................... 45
7. Referências Bibliográficas........................................................................................... 46
4
LISTA DE FIGURAS Figura 1: Processo de Visualização de Informações ........................................................... 10
Figura 2: Gráficos: Ferramenta visual amplamente utilizada.............................................. 11
Figura 3: Mapa representando a incidência de determinada doença no Mundo ................. 14
Figura 4: Classificação das áreas de Visualização de Dados .............................................. 15
Figura 5: Tipos de gráficos do Microsoft Excel .................................................................. 16
Figura 6: Fisheye Menus: Exemplo da técnica foco+contexto .......................................... 18
Figura 7: Overview + Detail – Recurso do Macromedia Fireworks ................................... 19
Figura 8: Cone Tree: representação de estruturas hierárquicas........................................... 19
Figura 9: www.kartoo.com: representação visual do resultado de buscas na Web ............. 20
Figura 10: Inxight StarTree: Exploração das relações hierárquicas em um contexto ........ 21
Figura 11: Coordenadas Paralelas: identificação das relações entre os dados .................... 22
Figura 12: VisEd: Resultados a partir de ícones representativos ....................................... 22
Figura 13: Inxight TableLens: Descoberta de relacionamentos e tendências a partir de
dados tabulares .................................................................................................................... 23
Figura 14: CIRC de monitoramento de acessos ao ENSINET............................................ 25
Figura 15: Lifelines: Visualização de dados de tratamentos de pacientes........................... 26
Figura 16: Interface gráfica do Chat Circles ....................................................................... 27
Figura 17: TimeMines: identificação de palavras em destaque em períodos de tempo ...... 28
Figura 18: Estrutura de tabelas no modelo mestre/detalhe.................................................. 31
Figura 19: Exemplo de Uso da Técnica das Coordenadas Paralelas................................... 34
Figura 20: Processo de Exportação de Tabelas para XML no Microsoft Access................ 37
Figura 21: Conteúdo do Arquivo XML Gerado pela Exportação ....................................... 37
Figura 22: Diagrama de funcionamento da ferramenta de Visualização de Informações... 39
Figura 23: Formulário Web inicial para indicação das tabelas, relacionamentos e
configurações do sistema..................................................................................................... 40
Figura 24: Uso da ferramenta em um tradicional sistema de controle de vendas ............... 42
Figura 25: Hierarquia faz com os produtos do grupo sejam exibidos ................................. 43
Figura 26: Destacar exibe a linha do item em cor diferente................................................ 43
5
LISTA DE ABREVIATURAS CIRC Control Interact Radial Circle
PHP Hypertext Preprocessor
XML Extensible Markup Language
SGBDs Sistemas Gerenciadores de Bancos de Dados
W3C World Wide Web Consortium
JPEG Joint Photographic Experts Group
PNG Portable Network Graphics
GIF Graphics Interchange Format
TIFF Tagged Image File Format
6
LISTA DE TABELAS
Tabela 1 - Atributos da Tabela Produtos do Estudo de Caso ............................................. 41
Tabela 2 - Atributos da Tabela Vendas do Estudo de Caso ............................................... 41
7
RESUMO
A Visualização de Informações é uma área da computação gráfica que procura
representar informações graficamente, permitindo com isso uma melhor compreensão de
um grande volume de informações, geralmente obtidas a partir da mineração de dados em
enormes bancos de dados, textos, hiperdocumentos, etc. Permite também identificar
padrões ou ainda detectar novas informações até então imperceptíveis devido a sua forma
de representação. A representação visual gerada deve permitir a interação do usuário –
sendo este o sujeito da operação. O presente trabalho descreve esta área da computação
gráfica, fazendo uma análise das ferramentas de Visualização de Informações em geral,
enfatizando os sistemas de monitoramento – que são utilizados para a identificação de
padrões de comportamento e que servem de apoio para a tomada de decisões estratégicas
em uma instituição. Ao final, é apresentada uma ferramenta para visual data mining
executada na Web para relacionar, através da técnica das Coordenadas Paralelas, o
desempenho de sistemas baseados em banco de dados relacionais do tipo mestre/detalhe,
amplamente utilizado em sistemas de monitoramento. O diferencial desta ferramenta, além
de rodar diretamente na Web, é a sua capacidade de se adaptar a diversos sistemas, a partir
dos arquivos mestre/detalhe exportados pelo usuário no formato XML.
Palavras-Chave: Visualização de Informações, Técnicas de Visualização de Informações,
Mineração de Dados, Visual Data Mining
8
TITLE: “Study and development of an Adaptable Information Visualization Tool for Monitoring Systems”
ABSTRACT Abstract: Information visualization is a field of graphic computing which aims to represent
information in graphic mode, allowing better understanding of a great amount of
information obtained usually from data mining in large databases, texts, hyperdocuments,
etc. It also allows identifying standards or even detecting new information which was not
previously able to be detected due to its way of representation. The generated visualization
must allow interaction with the user – being users the subjects of the operation. The
present study describes this field of graphic computing, analyzing general information
visualization tools with emphasis on monitoring systems – which are used for the
identification of behavior standards, and serve as support for strategic decision making in
a given institution. In the end, a tool for visual data mining is presented, executed on Web
for relating, through of the Parallel Cordinate technique, the performance of systems
based on relational databases of master/detail type, widely used in monitoring systems.
The differential of this tolls, besides running directly on Web, is its capacity to adapt to
several systems, from the master/detail archives exported by the uses in XML format.
Keywords: Information Visualization, Information Visualization Techniques, Data Mining,
Visual Data Mining
9
1. Introdução
1.1 Motivação
Diversas são as expressões que fazem parte da nossa cultura e que são ditas
naturalmente sem maiores considerações. Uma delas é “uma imagem vale por mil
palavras”. E não é preciso descrever muito para exemplificar o que esta expressão quer
dizer. Pode-se escrever linhas e linhas sobre a beleza de uma paisagem, mas dificilmente se
transmite a mesma sensação produzida por uma imagem exibindo o local. O mesmo vale
para informações cadastrais, principalmente de gigantescas bases de dados. Pode-se tomar
como exemplo um sistema que acompanha as internações e tratamentos de pacientes de um
hospital. Verificar em quais períodos do ano determinadas doenças são mais freqüentes é
muito mais complexa de ser realizada a partir da análise cadastral dos dados do que a partir
de um gráfico que relacione estes dados. Com base nesta informação medidas preventivas
poderiam ser tomadas. Enfim, o objetivo principal da área de Visualização de Informações
é o de facilitar a compreensão dos dados de um determinado sistema através de
representações visuais geradas a partir de um conjunto de dados, conforme ilustra a Figura
1.
Figura 1: Processo de Visualização de Informações
Vale destacar que uma das principais características desta área é de que, as
ferramentas desenvolvidas para a visualização de informações, devem permitir a interação
do usuário sobre as representações geradas por estes. Para que seja ele, usuário, o sujeito
da análise. A ferramenta apenas exibe uma representação visual, para que a partir dela, seja
explorada a imensa capacidade de percepção visual humana.
Se a falta de informações, ou a dificuldade em obtê-las, era um dos principais
problemas enfrentados há algum tempo, hoje convive-se com um problema oposto: o
10
excesso de informações dificulta a localização daquilo que realmente se precisa, ou muitas
vezes, impõe-se longas análises para a obtenção dos resultados almejados. Uma pesquisa
no Google, por exemplo, retorna centenas ou, por vezes, milhares de indicações de
páginas, mas em geral, não se utiliza mais de dois ou três links. Uma pesquisa sobre o
WebSearch [4] indicou que apenas 15% dos usuários acessam mais que uma página
resultante de uma consulta. Formas de visualizar e agrupar melhor os resultados de
pesquisas na web estão sendo desenvolvidas, como, por exemplo, o programa kartoo
(www.kartoo.com), descrito na seção 2.1.4.
Outro exemplo presente no nosso dia-a-dia é a geração de gráficos em planilhas
de cálculos, como exemplificado na Figura 2 que compara “locações” e “desocupações” de
imóveis de uma determinada imobiliária. A análise do gráfico facilita em muito a
percepção de informações do tipo: quais meses do ano apresentaram melhores resultados?
Quais os meses em que as desocupações superaram as locações? Quais os meses com o
menor número de locações?
Figura 2: Gráficos: Ferramenta visual amplamente utilizada
Além do exemplo citado acima, pode-se destacar vários outros campos onde a
área de visualização de informações pode ser útil para auxiliar na obtenção de
representações que facilitem a análise e compreensão dos dados.
A constatação de padrões ou de características visuais, presentes em imagens,
contribui de forma muito mais significativa para o processo de compreensão do que a
simples observação dos dados em sua forma bruta. A construção de uma representação ou
metáfora visual que possibilite essa observação pode ser conseguida organizando os dados
segundo algum critério e apresentando-os de forma gráfica. Em geral, visualizações
11
acabam possibilitando a recuperação de informações relevantes e a construção de novos
conhecimentos [7].
1.2 Contexto
A área da Visualização de Informações é uma área da computação que
procura representar informações de modo gráfico, permitindo com isso uma melhor
compreensão de um grande volume de informações textuais ou a visualização das
informações obtidas a partir da mineração em grandes bancos de dados, etc. Permite
também identificar padrões ou ainda detectar novas informações até então
imperceptíveis devido a sua forma visual de representação.
O trabalho a ser realizado pretende apresentar uma revisão bibliográfica do
estado da arte na área de visualização de informações, descrevendo as principais
técnicas de visualização com maior ênfase às técnicas de monitoramento de sistemas.
Também irá descrever sobre Visual Data Mining, técnica que une recursos de
Mineração de Dados com Visualização de Informações.
A utilização de ferramentas para Visualização de Informações para sistemas
de monitoramento é adequada para permitir acompanhamento e avaliação da dinâmica
das interações que ocorrem nos respectivos sistemas.
Este trabalho pretende ainda realizar um estudo para analisar a viabilidade da
implementação de algumas técnicas de Visualização de Informações para uso em
dispositivos móveis, através da linguagem Java / J2ME. Em seguida pretende-se
implementar um protótipo da técnica de Coordenadas Paralelas para desktop, via web,
utilizando a linguagem PHP.
Para avaliação da ferramenta Web desenvolvida será submetida uma base de
dados de um sistema de controle de estoque para realização de testes e validação do
protótipo. Os resultados serão apresentados e analisados no final deste trabalho.
12
1.3 Objetivos
1.3.1 Objetivos Gerais
Desenvolver uma ferramenta visual adaptável a diversos sistemas de
monitoramentos, utilizando uma técnica de Visualização de Informações conhecida
como “Coordenadas Paralelas”.
1.3.2 Objetivos Específicos
1. Aprofundar os conhecimentos na área de Visualização de Informações,
compreendendo as principais técnicas e ferramentas utilizadas atualmente;
2. Estudar os recursos de Mineração de Dados necessários para a organização das
informações a serem submetidas a ferramenta para que possa ser gerada uma
representação visual eficiente.
3. Elaborar um protótipo de uma ferramenta para visualização de informações para
sistemas de monitoramento, via web, utilizando a técnica das Coordenadas
Paralelas.
4. Estudar a viabilidade da implementação das técnicas de Visualização de
Informações para geração de representações visuais em dispositivos móveis.
1.4 Organização do texto
Este trabalho está organizado da seguinte forma: No capítulo 1 é descrito uma
introdução sobre o assunto. No capítulo 2 é realizada uma apresentação da área de
Visualização de Informações, bem como, sua classificação. Ainda neste capítulo, são
destacadas técnicas de visualização de informações e apresentadas ferramentas de
monitoração de sistemas. O capítulo 3 descreve Visual Data Mining e os recursos que uma
ferramenta de visualização de informações deve possuir. Em seguida, capítulo 4, é
apresentada a ferramenta Web desenvolvida através da técnica das Coordenadas Paralelas
para acompanhar o desempenho de sistemas de monitoramento organizados no formato
“mestre/detalhe” de bancos de dados relacionais. O capítulo 5 mostra um caso de uso da
ferramenta aplicado a um sistema de controle de vendas de produtos de um supermercado.
E, no capítulo 6, são feitos comentários finais e indicações sobre trabalhos futuros.
13
2. Visualização de Informações
A visualização de informações é uma área da computação gráfica, que tem por
objetivo a geração de imagens que facilitem a compreensão humana sobre determinado
assunto.
Combinando aspectos de computação gráfica, interfaces homem-máquina e
mineração de dados [2] [1] [10], a visualização de informações permite a apresentação de
dados de forma gráfica de modo que o usuário possa utilizar sua percepção visual para
melhor analisar e compreender as informações [3] [12] [23].
No mundo atual, em que convive-se com excesso de informações e grande
competitividade, o uso de ferramentas que auxiliem o homem no entendimento de dados
sobre uma área é de extrema utilidade. Sabe-se que a capacidade humana de lidar com
informações visuais é muito maior do que com dados textuais. Observe o exemplo da
Figura 3. Nela é apresentado um mapa indicando os locais onde a incidência de
determinada doença é maior, sendo que as cores mais intensas representam os países mais
afetados. A representação visual gerada torna muito mais fácil a compreensão e
assimilação do que seria apresentado em um texto sobre o assunto.
Figura 3: Mapa representando a incidência de determinada doença no Mundo
Resumidamente, as técnicas de visualização de informações procuram representar
graficamente dados de um determinado domínio de aplicação de modo que a representação
visual gerada explore a capacidade de percepção do homem e este, a partir das relações
14
espaciais exibidas, interprete e compreenda as informações apresentadas e, finalmente,
deduza novos conhecimentos [7].
A visualização de informações é uma sub-área da visualização de dados, que por
sua vez é uma sub-área da computação gráfica. Segundo Luzzardi [28], na mesma
hierarquia de classificação da visualização de informações encontram-se a visualização
científica e a visualização de software. A Figura 4 ilustra esta classificação.
Figura 4: Classificação das áreas de Visualização de Dados A Computação Gráfica é a parte da computação destinada a geração, análise e
exibição de imagens em geral. Ela pode possuir uma infinidade de aplicações para
diferentes áreas. Desde a própria informática ao produzir interfaces gráficas para diversos
aplicativos, sistemas operacionais e sites da internet, quanto para produzir animações e
jogos. Também está presente em áreas como, por exemplo, cinema sendo utilizada para a
produção de efeitos especiais, retoques nas imagens de filmes e animações.
Já a área de Visualização de Dados relaciona técnicas para produzir imagens para
uma melhor compreensão dos usuários sobre estas imagens. Quando esses dados
correspondem a medidas associadas a objetos físicos, fenômenos ou posições num domínio
espacial, costuma-se referir a esse conjunto de técnicas como Visualização de Dados
Científicos, ou simplesmente Visualização Científica, enquanto a Visualização de
Informações trata dados abstratos como relacionamentos ou informações inferidas a partir
dos dados mensurados [7].
A visualização de software é uma área particular da computação que auxilia o
programador a analisar e entender a estrutura e o funcionamento de grandes programas, em
um nível maior de abstração do que quando comparado a uma simples leitura do código
fonte [11].
15
2.1 Técnicas de Visualização de Informações
As técnicas de visualização de informações já desenvolvidas utilizam
representações ou metáforas visuais para exibir graficamente dados que geralmente não
possuem representação direta, óbvia e natural. Em diversas técnicas, freqüentemente, os
autores buscam inspiração em objetos do mundo real (ou geométricos), para mapear o
conjunto de informações. As técnicas de visualização podem utilizar representações visuais
1D, 2D ou 3D, não necessariamente de acordo com a dimensão do espaço de informação
[16].
Neste capítulo pretende-se apresentar técnicas de visualização de informações,
bem como, as ferramentas utilizadas para gerá-las. Assim como no processo da criação de
um gráfico em programas de planilhas eletrônicas, onde são apresentados diversos
formatos para a criação de um gráfico (Figura 5), sendo que a adequação do subtipo do
gráfico depende de vários fatores, a construção de ferramentas para visualização de
informações segue a mesma lógica. Há ferramentas mais ou menos adequadas para
representar determinados tipos de informações.
Figura 5: Tipos de gráficos do Microsoft Excel
A construção de sistemas para visualização de informações pode, portanto, se
tornar muito complexa em virtude: a) da necessidade de criação de uma metáfora visual
que permita codificar visualmente o conjunto de informações com o grau de fidelidade
necessário à aplicação; b) dos mecanismos de interação necessários para manipular os
16
freqüentemente volumosos e/ou complexos conjuntos de dados, e c) da freqüente
necessidade de implementar algoritmos geométricos complexos tanto para a criação da
representação visual como para sua manipulação. Estes aspectos levam, diretamente, a
questões de projeto de interfaces gráficas e avaliação de usabilidade, inerentes ao contexto
de interação homem-computador. Além disto, é cada vez mais necessária a integração com
sistemas de mineração de dados [12], já que a busca em facilitar o entendimento dos dados
passa pelo reconhecimento de padrões, estruturas e outras informações ocultas no próprio
conjunto de dados [7].
As técnicas de Visualização de Informações apresentadas a seguir contemplam a
representação de conjuntos de dados semelhantes aos utilizados para o desenvolvimento da
ferramenta proposta neste trabalho. Uma vez que inúmeras são as técnicas de
representação visual que poderiam ser destacadas neste tópico.
2.1.1 Foco + Contexto
É uma técnica que permite exibir um conjunto de informações ao usuário, onde
ele pode destacar a parte de seu interesse – geralmente ampliando a informação
selecionada [21]. Este tipo de técnica proporciona uma visão geral dos dados (contexto) e o
detalhamento do que é importante (foco) para o usuário do sistema (Figura 6). As técnicas
do tipo foco+contexto são também conhecidas como Fisheye, por justamente simular um
olho de peixe.
17
Figura 6: Fisheye Menus: Exemplo da técnica foco+contexto 1
2.1.2 Overview + Detail
Esta técnica é bastante semelhante a apresentada anteriormente, contudo, nesta
forma de visualização, a região selecionada pelo usuário é exibida em um quadro, onde são
apresentados maiores detalhes das informações contidas na região destacada, conforme
ilustra a figura 7.
Em geral, as ferramentas de visualização que utilizam esta técnica, permitem
identificar o local visualizado em destaque (detail) da representação maior (overview), por
regiões sombreadas ou quadros com espessas linhas de referência com cores destacadas da
imagem. Esta abordagem é amplamente utilizada em ferramentas gráficas de manipulação
de imagens e animações.
1 Disponível em http://www.cs.umd.edu/hcil/fisheyemenu/fisheyemenu-demo.shtml (acesso
em Junho/2006)
18
Figura 7: Overview + Detail – Recurso do Macromedia Fireworks
2.1.3 Cone tree
A técnica Cone Tree (Figura 8) é utilizada para representar de forma
tridimensional as informações hierárquicas de um sistema. O retângulo superior representa
o elemento raiz da estrutura e todos os seus filhos são dispostos abaixo deste guardando a
relação subordinada, fácil de interpretar pela forma como é apresentada a relação [20].
Figura 8: Cone Tree: representação de estruturas hierárquicas
19
2.1.4 Landscapes (Paisagens)
Este tipo de técnica de visualização faz uso de paisagens (landscapes) para a
representação das inter-relações de grupos de dados contendo imagens metafóricas
relacionadas. Esta proposta tem sido utilizada, entre outras aplicações, para indicar a
similaridade e o relacionamento entre documentos de texto com base em palavras chaves.
Uma ferramenta que utiliza esta técnica é o kartoo , um site de metabusca na web
(figura 9). Nele, ao posicionar o mouse sobre cada representação, linhas ligando as
imagens apresentadas sobre a paisagem indicam as relações que os documentos possuem
entre si. Caso os documentos não tenham relações uns com os outros, a linha não é exibida.
Figura 9: www.kartoo.com: representação visual do resultado de buscas na Web
2.1.5 Browser hiperbólico
Nesta modalidade de Visualização de Informações um grafo representa a estrutura
e o relacionamento entre os objetos. Os grafos são modelos matemáticos amplamente
utilizados em visualização de informações, que são formados por estruturas simples que
consistem de um conjunto de vértices e um conjunto de arestas. Os vértices representam as
informações identificadas em uma estrutura e os vértices indicam as relações entre estas
informações.
20
Muitas das ferramentas de visualização combinam duas ou mais técnicas para
ampliar os recursos de apresentação das informações e interação com o usuário, como é o
caso da Hyperbolic Tree Magnifind, utilizada no software de navegação da Inxight
(www.inxight.com), exemplificado na figura 10. Nele um grafo indica a relação entre as
palavras-chaves identificadas em uma consulta.
Figura 10: Inxight StarTree: Exploração das relações hierárquicas em um contexto
2.1.6 Coordenadas Paralelas
A técnica de Coordenadas Paralelas proposta por Inselberg [13] permite relacionar
informações entre si adicionando a estas relações indicações temporais em que ocorreram
os dados exibidos na representação visual. Observe a ilustração apresentada na figura 11,
onde várias informações sobre alunos são relacionadas.
De modo geral, Coordenadas Paralelas são adequadas para mineração de dados
com várias dimensões, pois permitem transformar a busca por relações entre variáveis de
um problema em um processo mais intuitivo de reconhecimento de padrões 2D. A técnica
enfatiza, principalmente, relações entre eixos adjacentes e conjuntos de dados que possuem
padrões similares [11].
21
Figura 11: Coordenadas Paralelas: identificação das relações entre os dados
2.1.7 Glyphs
Glyphs são técnicas de visualização de informações bastante utilizadas para
representar tabelas de resultados, onde ícones identificam a classificação de determinadas
informações em uma tabela. A variação das imagens representativas, bem como, suas
cores, dimensões são facilmente associadas ao que elas procuram descrever (Figura 12).
Figura 12: VisEd: Resultados a partir de ícones representativos
Um dos primeiros trabalhos sobre esse tema foi apresentado por Chernoff [9],
onde os atributos visuais dos ícones são explorados de uma forma bastante particular.
22
Chernoff observou que os seres humanos são muito sensíveis a uma grande variedade de
expressões faciais. Ele então sugeriu a utilização de ícones representando faces, onde
algumas características como o tamanho dos olhos, a altura da sobrancelha e a forma da
boca pudessem ser associados a cada atributo da informação. Chernoff aplicou sua técnica
para estudar exemplos geológicos, com cada face cobrindo dezoito atributos. Sua técnica
ficou conhecida como Chernoff Faces.
2.1.8 Table Lens
A técnica Table Lens [19] é uma forma efetiva para o entendimento de dados
numéricos e categóricos multidimensionais. Essa técnica permite a visualização de uma
tabela onde os dados de interesse aparecem expandidos e os demais itens, de forma
compactada (Figura 13). As linhas da tabela são vistas como linhas de pixels. A técnica
possibilita interação do usuário para focalizar linhas ou colunas, o que causa a ampliação
das mesmas enquanto mantém compactado o contexto ao seu redor.
Figura 13: Inxight TableLens: Descoberta de relacionamentos e tendências a partir de dados tabulares
23
2.2 Sistemas de Monitoramento
Os sistemas de monitoramento verificam e acompanham as atividades que
ocorrem em um sistema, fornecendo aos seus administradores características do sistema,
como a freqüência de determinados acontecimentos. Servem de base para análises e
tomadas de decisão a respeito das ações a serem tomadas para a manutenção e ou
melhorias do mesmo.
Diversas são as ferramentas que realizam controle sobre tarefas de
monitoramento. Se enquadram neste grupo os sistemas de controle de ensino à distância e
acompanhamento médico de pacientes, descritos a seguir, nos exemplos de sistemas de
monitoramento. Estas atividades tendem a gerar um volume muito grande de registros nas
bases de dados que a controlam, sendo que o desenvolvimento de ferramentas de
visualização podem ser muito úteis para a identificação de padrões e a percepção de
anomalias no comportamento dos agentes destes sistemas.
Ainda como exemplos de sistemas de monitoramento pode-se citar os sistemas de
controle de venda de passagens de um terminal rodoviário, de hospedagens de um hotel ou
de compra/venda de moedas estrangeiras de uma casa de câmbio. No sistema de controle
de passagens de um terminal rodoviário de uma grande cidade, considerando que a emissão
de um bilhete de passagem gera um novo registro, no final de um dia serão milhares de
registros adicionados à base de dados. As tarefas de análises dos dados de sistemas como
este, são áreas férteis para o desenvolvimento de ferramentas de visualização de
informações. Respostas para perguntas como, por exemplo, quais os períodos em que
ocorrem as maiores taxas de vendas de passagens do tipo Golden Class (um tipo especial
de ônibus), podem ser melhor compreendidas se analisadas com o auxílio de ferramentas
de representação visual e interativa dos resultados.
Como ferramentas de visualização de sistemas de monitoramento são
apresentadas as ferramentas CIRC [8], LifeLines [18], Chat Circles [26] e TimeMines [24]
descritos a seguir.
2.2.1 CIRC (Control Interact Radial Circle)
Esta ferramenta de visualização [8] que está em fase de desenvolvimento, permite
acompanhar e avaliar a dinâmica das interações que possam ocorrer no sistema ENSINET,
24
que é um sistema de ensino a distância da UCPel – Universidade Católica de Pelotas. É
uma ferramenta baseada na Web que mostra os monitoramentos dos diversos objetos do
sistema em um gráfico de círculo sub-dividido em setores. No centro é exibido um ícone
informando sobre qual agente está focada a visualização e ao redor cada setor representa a
freqüência de acesso de um objeto. As cores são utilizadas para indicar uma classificação
dos objetos por um determinado assunto.
A figura 14 mostra a exibição simultânea de vários círculos utilizados para
acompanhar a evolução no tempo da freqüência de acesso de um objeto. A ferramenta
possui mecanismos interativos que permitem ao usuário refinar a visualização corrente. A
seleção de um setor através do mouse cria uma nova janela de exibição onde o foco passa a
ser o objeto selecionado.
Figura 14: CIRC de monitoramento de acessos ao ENSINET
2.2.2 Lifelines
Lifelines [18] é uma ferramenta de visualização de informações que faz o
acompanhamento do registro de atendimentos e tratamentos médicos realizados por
pacientes. O sistema exibe um ambiente onde podem ser visualizadas informações sobre o
histórico de um paciente (Figura 15). Registros de atendimentos, problemas de saúde,
hospitalizações e medicamentos são representados como uma linha horizontal, onde ícones
representam eventos, como por exemplo, consultas e exames. Recursos e filtros do
25
programa permitem ao usuário focar em partes da imagem de seu interesse, revelando
maiores detalhes.
A ferramenta LifeLines permite reduzir as chances de esquecimento da análise de
alguma informação sobre a saúde do paciente, além de facilitar a percepção de anomalias e
tendências de doenças das pessoas cadastradas. Com a ação do mouse e opções de menus,
o usuário pode ampliar a linha do tempo de análise dos tratamentos e diagnósticos obtidos.
Figura 15: Lifelines: Visualização de dados de tratamentos de pacientes
2.2.3 Chat Circles
O Chat Circles [26] é uma interface gráfica para conversações simultâneas que
usa formas abstratas para representar as identidades e atividades de seus participantes. O
objetivo desta ferramenta é usar gráficos para conduzir a dinâmica das conversas, assim
como para revelar o padrão de atividades que surgem através da interação entre os
usuários.
Cada participante é representado por um círculo colorido na tela onde sua palavra
é exibida (Figura 16). O círculo cresce e se ilumina com cada mensagem e “desbota” e
26
diminui nos períodos de silêncio, não desaparecendo completamente enquanto o
participante estiver conectado no chat.
Figura 16: Interface gráfica do Chat Circles
2.2.4 TimeMines
O sistema TimeMines [24] é uma ferramenta que gera automaticamente uma linha
do tempo de palavras que se relacionam, a partir da análise de textos com tags que
identificam as datas em que elas ocorreram. TimeMines detecta, classifica e agrupa
características semânticas das palavras baseadas em suas propriedades estatísticas de
ocorrência em um texto.
No gráfico exibido pelo TimeMines (Figura 17) ao posicionar sobre uma palavra
destacada, outras palavras que se relacionam com a palavra em destaque são apresentadas,
permitindo identificar seus relacionamentos.
27
Figura 17: TimeMines: identificação de palavras em destaque em períodos de tempo
28
3. Visual Data Mining
Para gerar uma visualização das informações a partir de um grande volume de
dados é necessário, inicialmente, selecionar e organizar estes dados de forma que eles
possam transmitir concisamente uma informação. Não basta simplesmente transformar
dados textuais em representações gráficas. A visual data mining consiste na junção das
técnicas de Mineração de Dados com as técnicas de Visualização de Informações.
A área de Mineração de Dados, ou Descoberta do Conhecimento em bases de
dados, consiste em um processo não-trivial de identificar, em bases de dados, padrões que
sejam válidos, novos, potencialmente úteis e compreensíveis ao usuário. Diversas são as
técnicas e ferramentas inteligentes e automáticas utilizadas para auxiliar pessoas a analisar
grandes volumes de dados para garimpar conhecimento útil [15].
Dentre as técnicas de mineração de dados a serem utilizadas para a preparação dos
dados submetidos a uma ferramenta de visualização de informações podemos destacar: a)
classificação: tem por objetivo alocar elementos em classes pré-existentes; b) clustering:
identifica grupos e avalia as similaridades existentes entre eles; c) análise de séries
temporais: que procura encontrar padrões na repetição seguida de valores.
Para a mineração de dados ser efetiva, é importante incluir o usuário no processo
de exploração de dados e combinar flexibilidade, criatividade e conhecimento geral do
homem com a capacidade de armazenagem e o enorme poder computacional dos
computadores de hoje. A idéia básica da visual data mining é apresentar os dados de
alguma forma visual, permitir ao usuário obter uma visão dos dados, tirar conclusões e
interagir diretamente com os dados [14].
Portanto, a utilização da visual data mining tem como principal objetivo integrar o
usuário no processo de exploração de dados, aplicando as suas habilidades de percepção
das características das informações apresentadas graficamente. Cabe ao usuário interagir
com a ferramenta visual para obter dela as evidências de que um determinado padrão ou de
que uma nova informação possa ser descoberta.
29
3.1 Paradigma da Exploração Visual de Dados
Segundo Keim [14], em seu artigo “Information Visualization and Visual Data
Mining”, a exploração visual de dados geralmente segue um processo de três etapas:
Overview, zoom and filter e details-on-demand (que também é chamado Information
Seeking Mantra).
A tecnologia de visualização pode ser usada em todas as etapas do processo de
exploração de dados, visto que a ferramenta de visual data mining deve: a) exibir uma
visão geral dos dados e permitir ao usuário investigar detalhes que possam ser úteis para a
descoberta de novas informações; b) interagir com a ferramenta para ampliar ou reduzir a
visualização dos dados e definir filtros que possam facilitar a análise e exploração dos
dados; c) ocultar ou ampliar as informações sobre o conjunto de dados apresentados na
representação visual.
30
4. Ferramenta de Visualização de Informações Proposta
Inúmeras aplicações que utilizam banco de dados estão organizadas no formato
“mestre/detalhe”. Neles, há uma tabela principal e uma tabela relacionada a ela que
armazena interações do sistema sobre estes dados. A ferramenta Web de visualização de
informações desenvolvida é genérica para estes sistemas e está disponível para uso no
endereço eletrônico www.edecio.com.br/visinfo.
A idéia do desenvolvimento desta ferramenta surgiu a partir da observação de que
a estrutura das tabelas de aplicativos como controles de estoque, controles acadêmicos,
consultórios médicos, hospitais, etc. possuem uma estrutura semelhante: tem-se produtos e
vendas destes produtos; tem-se pacientes e consultas realizadas por estes pacientes no
decorrer de um intervalo de tempo. Ou seja, para uma tabela “mestre” há uma tabela
“detalhe” com indicações de ocorrências na tabela “mestre”.
Observe os modelos típicos de estruturação destes tipos de tabelas na figura 18,
que apresenta o relacionamento entre a tabela Veículos (mestre) e a tabela Locações
(detalhe) de um tradicional sistema de controle de locações de veículos de uma Auto-
Locadora.
Figura 18: Estrutura de tabelas no modelo mestre/detalhe
Muitas instituições têm nos sistemas que utilizam tabelas estruturadas no modelo
“mestre/detalhe” as informações que são o foco principal das suas atividades. Desenvolver
uma ferramenta visual que possa facilitar a análise dos dados destes sistemas pode
significar, em alguns casos, a percepção do desempenho da própria instituição.
31
4.1 Tipos de Dados
Uma das características de maior destaque da ferramenta proposta é o fato dela ser
adaptável aos dados a serem submetidos pelo usuário, ampliando em muito a sua
utilização. Estes dados devem ser estruturados oriundos de Sistemas Gerenciadores de
Bancos de Dados que permitam a sua exportação no formato XML (recurso disponível na
maioria dos SGBDs atuais).
Para um correto funcionamento da ferramenta proposta os dados necessitam estar
organizados e possuir algumas características de estruturação e conteúdo, descritas a
seguir:
Tabela Principal:
• Deve possuir, no mínimo, um atributo (campo) a ser utilizado para exibição da
listagem dos dados, a partir do qual os dados serão agrupados e também sobre
o qual podem ser definidos filtros;
• Atributo que estabelece o relacionamento com a tabela das interações (chave
estrangeira), sendo eles do mesmo tipo;
Tabela de Monitoramentos:
• Atributo que estabelece o relacionamento com a tabela principal, sendo do
mesmo tipo de dado;
• Atributo que indica a data de ocorrência do evento a ser analisado, que será
exibido no eixo temporal da representação visual;
• Um ou mais atributos do tipo numéricos sobre os quais serão realizados os
cálculos a serem representados na ferramenta. Estes atributos são
recomendados, porém não obrigatórios, visto que o cálculo básico de
contagem de ocorrências das interações pode ser exibido, a partir dos dois
atributos indicados acima.
32
4.2 Metodologia de Desenvolvimento
Para construir uma nova ferramenta de Visualização de Informações, segundo
Ferreira e Nascimento [11], deve-se utilizar uma metodologia que contemple as seguintes
etapas:
• Estudo do problema e dos dados a serem visualizados
• Construção de visualizações
• Definição dos mecanismos de interação
• Implementação de um sistema protótipo
• Avaliação das visualizações
Etapas estas, cuidadosamente observadas no desenvolvimento da ferramenta
proposta. Na primeira etapa, como a característica da ferramenta é de ser adaptável a um
amplo conjunto de dados, o estudo foi realizado a partir da estruturação das bases de dados
a serem submetidas à ferramenta.
Justamente o fato de a ferramenta ser desenvolvida para utilização em qualquer
sistema de monitoramento, onde dados com variações temporais e agrupamentos em níveis
hierárquicos podem ser analisados, fez com que a construção de visualizações ficassem
restritas as técnicas que oportunizassem este tipo de exibição dos dados, sendo escolhida a
técnica das Coordenadas Paralelas.
Sobre os mecanismos de interação disponíveis, a ferramenta proposta dispõem de
filtros, seleção para comparação de itens, exibição/ocultação de dados de forma hierárquica
– detalhados no capítulo 5. Resta ainda a ser feito a avaliação das visualizações geradas
pela ferramenta, onde pretende-se estimular a utilização da ferramenta, disponível na Web,
por empresas dos diversos sistemas que trabalham com banco de dados organizados no
modelo “mestre/detalhe”. A partir desta avaliação novos mecanismos de interação podem
ser adicionados à ferramenta.
Além do conhecimento dessa metodologia, para desenvolver uma ferramenta de
Visualização de Informações, é necessário ter o domínio de uma linguagem de
programação com suporte à construção de interfaces gráficas (como é o caso do PHP, Java,
C/C++), ótimos conhecimentos de estruturas de dados avançadas e de algoritmos,
conhecimento de OpenGL e de XML e de conceitos e técnicas de avaliação de usabilidade
da área de Interação Homem-Computador [11].
33
4.3 Técnica Utilizada pela Ferramenta
O tipo de técnica de Visualização de Informações mais adequado para a
representação dos dados estruturados no formato mestre/detalhe é o das Coordenadas
Paralelas, onde os grupos de registros da tabela mestre são representados em linhas do
tempo, enquanto que, os valores obtidos na tabela detalhe (dos monitoramentos) são
representados nas “coordenadas paralelas” da técnica.
Observe a representação visual exibida na figura 19, onde as locações de filmes
agrupados por gênero são demonstradas. Com a técnica das Coordenadas Paralelas pode-
se:
• Utilizar a coluna inicial para exibir os grupos da tabela principal;
• Fazer com que cada coluna da representação visual contenha um período a ser
analisado, no exemplo, os meses do ano;
• Demonstrar pelo local em que as linhas percorrem estas colunas o valor
aproximado de locações do grupo em cada um dos meses;
• Exibir após a coluna final a faixa de valores representada.
Figura 19: Exemplo de Uso da Técnica das Coordenadas Paralelas
34
4.4 Recursos
A ferramenta proposta esta sendo desenvolvida para a Web através da linguagem
PHP, com suporte as bases de dados no formato XML. Os dados são convertidos para uma
base de dados em MySQL, tradicionalmente utilizado em conjunto com a linguagem PHP.
O formato XML, que significa eXtensible Markup Language é uma especificação
criada pela W3C, desenvolvida especialmente para documentos da Web, que pretende ser
uma linguagem universal para a troca de informações de forma estruturada através da
Internet. Permite que os programadores transportem dados de um servidor para outro da
rede de forma transparente e organizada [6].
A linguagem PHP, de Hypertext Preprocessor (pré-processador de hipertexto), é
uma linguagem de programação open source, mundialmente utilizada, sendo que suas
aplicações principais são o desenvolvimento de sites dinâmicos para o ambiente web [22].
Possui suporte a criação e manipulação de imagens em vários formatos, tais como JPEG,
PNG, GIF e TIFF. Esta funcionalidade está disponível no PHP mediante a presença da
biblioteca de imagens GD (disponível para download em http://www.boutell.com/gd/).
O banco de dados MySQL é um sistema de gerenciamento de banco de dados
relacionais que permite a criação e manipulação de tabelas através de comandos SQL e é
amplamente utilizado na internet, estando disponível na maioria dos servidores Web [25].
4.5 Referência
A ferramenta tem como referência o paradigma do processo de construção da
visualização e interação com o usuário em três etapas (visão geral, zoom & filtro e detalhe
por demanda) da visual data mining proposta por Keim [14], descrito no capítulo anterior.
Primeiramente a ferramenta exibe uma visão geral dos dados obtidos a partir da
tabela principal e da tabela de monitoramentos. Os registros da tabela principal são
agrupados a partir da hierarquia selecionada pelo usuário no formulário inicial da
ferramenta.
35
Após a indicação das tabelas, relacionamentos, atributos de agrupamento, filtro e
de controle do eixo temporal, a ferramenta exibe uma representação visual com os valores
default do sistema. A partir desta representação, permite ao usuário ampliar e restringir
(filtrar) a visualização dos registros “clicando” sobre eles. Ainda nesta etapa, Keim sugere
a especificação de filtros para melhor visualizar os dados sobre os quais o usuário pode
identificar a incidência de prováveis padrões ou a descoberta de novas informações. Para
isso, através do formulário exibido no frame superior da ferramenta, o usuário pode definir
filtros selecionando os dados do seu interesse.
Detalhes por demanda, indicado na 3ª etapa do processo de visual data mining, é
um método usado no estágio da transformação de dados para ampliar um pequeno conjunto
de objetos, revelando mais informações sobre eles [16]. Para esta etapa a ferramenta
permite a seleção entre duas formas de destacar os itens apresentados no formulário:
visualização da hierarquia ou destacar o item selecionado. Através da escolha do modo de
seleção dos dados, permite ao usuário ampliar o detalhamento dos itens a serem
apresentados ou então destacar um item, comparando o seu desempenho com todos os
demais, ou ainda, relacionando dois ou mais itens específicos.
4.6 Funcionamento
Para utilizar a ferramenta o usuário deve inicialmente exportar sua base de dados
para o formato XML, conforme ilustra a figura 20, onde uma base de dados do Microsoft
Access é exportada para este formato. Observe o conteúdo do arquivo XML gerado na
figura 21.
Em seguida, ele precisa acessar o site da ferramenta, www.edecio.com.br/visinfo,
e selecionar estes arquivos XML, mestre e detalhe, para serem enviados para a ferramenta.
A partir deste ponto, o sistema identifica a estrutura das tabelas e submete esta estrutura
para que o usuário indique os atributos que definem o relacionamento entre a tabela
principal e a tabela de monitoramentos. Após, o usuário deve fazer a seleção da hierarquia
dos atributos da tabela principal em que ele quer que os dados fiquem organizados (podem
ser definidos até quatro atributos). Ou seja, qual o grupo principal será inicialmente
exibido pela ferramenta e quais os subgrupos estarão subordinados a ele.
36
Figura 20: Processo de Exportação de Tabelas para XML no Microsoft Access
Figura 21: Conteúdo do Arquivo XML Gerado pela Exportação
37
A ferramenta, a seguir, gera uma visualização padrão com todos os dados sendo
exibidos, agrupados pelo primeiro nível de hierarquia indicado pelo usuário, totalizados
pela contagem dos registros, com as cores indicativas de desempenho (+/-), com as datas
totalizadas por intervalo de ano e abrangendo todo o período de tempo constante nas
tabelas importadas, ou seja, as configurações default do sistema.
A partir desta primeira visualização o sistema fica no aguardo de interações do
usuário, permitindo as seguintes especificações:
• filtros para a seleção de registros conforme a hierarquia dos atributos indicado pelo
usuário na tabela principal;
• filtros pelo campo data definido na tabela dos monitoramentos, para a composição
do eixo temporal;
• modificações na configuração da exibição das cores das coordenadas, fazendo com
que as coordenadas possam ser exibidas com cores indicativas de crescimento ou
decrescimento no período;
• clique sobre um item exibido no gráfico fazendo com que a linha do mesmo seja
destacada (caso esteja configurado Seleção: Destacar) ou para ser ampliada ou
reduzida a hierarquia dos itens exibidos (Seleção: Hierarquia);
• seleção do tipo de cálculo a ser representado no gráfico. Inicialmente a ferramenta
exibe as coordenadas do gráfico a partir da contagem dos registros da tabela de
monitoramentos que ocorreram em cada um dos períodos apresentados. O usuário
pode trocar para soma e média, informando em seguida qual o campo deverá
somado.
• seleção do período de exibição de tempo no eixo temporal. Podem ser selecionadas
as opções: ano, mês, quinzena, semana e dia.
A figura 22 ilustra as etapas, bem como, as interações possíveis dos usuários na
utilização da ferramenta de visualização desenvolvida.
38
Figura 22: Diagrama de funcionamento da ferramenta de Visualização de Informações
39
5. Estudo de Caso
Para uma melhor compreensão das características da ferramenta de visualização
desenvolvida será apresentado um exemplo de uso da ferramenta aplicada a um sistema
real. O sistema contém as tabelas Produtos e Vendas, que realizam o controle das vendas
de um determinado supermercado. As tabelas estão inicialmente armazenadas no Microsoft
Access e são exportadas para “produtos.xml” e “vendas.xml”. A figura 23 exibe o
formulário preenchido com as tabelas, relacionamentos e parâmetros iniciais do sistema.
Figura 23: Formulário Web inicial para indicação das tabelas, relacionamentos e configurações do sistema
As tabelas de produtos e de vendas contém os atributos indicados nas tabelas 1 e 2
(formato do Microsoft Access).
40
Produtos
Código Número
Descricao Texto
Genero Texto
Peso Número
Validade Data/Hora
Quantidade Número
Preco Moeda
Tabela 1: Atributos da tabela Produtos
Vendas
Numero Número
CodPro Texto
Quant Texto
Preço Número
DtMov Data/Hora
Tabela 2: Atributos da tabela Vendas
A partir do preenchimento do formulário com a indicação da tabela de
“produtos.xml” como tabela mestre e a tabela de “vendas.xml” como sendo a tabela dos
monitoramentos a ferramenta gera uma visualização inicial sobre a qual o usuário poderá
interagir (figura 24).
41
Figura 24: Uso da ferramenta em um tradicional sistema de controle de vendas
O gráfico inicialmente apresentado, conforme ilustra a figura 24, exibe os grupos
de produtos classificados conforme a estrutura do arquivo XML de produtos. No eixo
temporal, os dados da tabela de monitoramentos (vendas.xml) são totalizados e agrupados
inicialmente pelos anos que constam nesta tabela. Dentre as várias opções que podem ser
configuradas pelo usuário, podem-se destacar:
• Cores: permitem ao usuário indicar a forma de uso das cores no gráfico. Ele
pode optar por utilizar cores diferentes para cada item apresentado ou cores
indicativas de acréscimo (+) ou decréscimo (-) nas interações da tabela
detalhe. As cores diferentes permitem acompanhar melhor o desempenho de
um item ou de um grupo de itens no decorrer do período visualizado. Já as
cores indicativas servem para que o usuário tenha uma visão geral do
desempenho dos itens de um período para outro. Por exemplo, se do ano de
2002 para o ano de 2003 prevalecer a cor verde sobre a cor vermelha, é sinal
de que houve uma melhora geral nas vendas dos produtos neste período.
42
• Seleção: serve para definir se a seleção de um item no gráfico fará a
ferramenta ampliar ou reduzir o nível de detalhamento dos itens apresentados
ou destacar este item em comparação aos demais. As figuras 25 e 26
relacionam os dois tipos de interação do gráfico disponíveis neste item. Caso
Hierarquia esteja selecionado, um clique sobre Alimentos faz com que os
produtos do grupo Alimentos fossem apresentados. Porém, se Destacar estiver
selecionado, clicar sobre um item modifica a cor deste item, destacando-o dos
demais. O usuário pode destacar/relacionar quantos produtos ele desejar,
sendo que a ferramenta, neste caso, exibe cada item de um cor diferente.
Figura 25: Hierarquia faz com os produtos do grupo sejam exibidos
Figura 26: Destacar exibe a linha do item em cor diferente
43
• Cálculo: indica o tipo de cálculo a ser aplicado sobre os itens da tabela
detalhe. O usuário pode selecionar entre Somar, Contar ou Calcular o valor
médio. No caso da soma ou média é necessário também indicar o campo
sobre o qual será realizado o cálculo. Dependendo do sistema a ser analisado,
pode ser mais interessante para o usuário saber quantas vezes um determinado
produto foi vendido, ou então o montante total de vendas, ou ainda, efetuar o
cálculo sobre o número médio de vendas dos itens em comparação aos
demais.
• Exibir: permite ao usuário selecionar o intervalo de tempo a ser exibido no
gráfico. O usuário pode selecionar entre Ano, Mês, Quinzena, Semana e
Dia. Serve também para ampliar a análise sobre os dados relacionados com o
período de tempo em que as interações ocorrem. Possibilita ao usuário checar
indicações do tipo: quais os meses em que determinados produtos têm
acréscimo de venda, semanas em que o movimento de vendas no geral
aumenta ou diminui, etc.
44
6. Conclusões e futuros trabalhos
A área de visualização de informações apresenta um campo que permite o
desenvolvimento de diversas ferramentas a serem utilizadas para facilitar a compreensão
dos mais variados assuntos. Este artigo fez a descrição dos conceitos utilizados nesta área
da ciência bem como de técnicas e ferramentas utilizadas para suas representações. Fez
também a apresentação de uma ferramenta Web criada para a visualização das informações
geradas por sistemas de bancos de dados relacionais do tipo “mestre/detalhe”.
O grande diferencial da ferramenta é o fato de que ela inicialmente solicita os
dados, no formato XML, a serem enviados para a análise, fazendo com que a ferramenta
possa ser utilizada para os mais diversos sistemas de monitoramentos. Como, por exemplo,
para sistemas de controle de internações de pacientes em um hospital. Informações como:
quais os períodos de maior internação, quais os grupos de pacientes que mais realizam
consultas, ou então, se forem relacionados os dados dos médicos com as internações, outro
conjunto importante de informações poderiam ser obtidas através da ferramenta.
Um estudo de caso foi apresentado, onde os dados de um sistema de controle de
vendas de um supermercado foram submetidos ao software para representação. Diversas
são as percepções que puderam ser obtidas com a ferramenta, tais como: qual o
desempenho geral da venda de produtos de um ano para outro, quais os grupos de produtos
que apresentaram crescimento no período analisado, quais os produtos em queda de venda,
etc.
O passo seguinte a apresentação deste artigo será a realização das devidas análises
de desempenho da ferramenta apresentada, buscando a realização de adequações e
aperfeiçoamentos. Para tanto serão submetidos dados de outros sistemas e realizadas
pesquisas com os administradores das instituições com os dados submetidos a ferramenta
para colher sugestões e análises.
Na seqüência, serão realizados estudos para verificar a viabilidade do uso desta
ferramenta de visualização de informações em dispositivos móveis. Tarefa esta que
inicialmente se parece bastante complexa, visto que a capacidade de processamento e
tamanho da tela destes dispositivos é muito reduzida.
45
7. Referências Bibliográficas [1] Agrawal, R.; Data mining: the quest perspective. In: EDBT SUMMER SCHOOL, 1995, Gubbio, Italy. Available in: <http://www.almaden.ibm.com/cs/quest>. Access in: 10 april 2002.
[2] Agrawal, R.; Imielinski, T.; Database mining: a performance perspective. IEEE Transactions on Knowledge and Data Engineering, New York, v. 5, n. 6, p. 914-925, Dec. 1993.
[3] Ahlberg, C.; Shneiderman, B.; Visual Information Seeking: Tight Coupling of Dynamic Query Filters with Starfield Displays. In ACM Conference on Human Factors in Computing Systems, pages 313–317, 479–480, 1994
[4] Almeida, R. Q.; WebSearch. Instituto Agronômico de Campinas. 2004. Unicamp: Campinas – São Paulo.
[5] Card, S.K.; Mackinlay, J.D.; Shneiderman, B.; Information Visualization. In: Readings in Information Visualization - Using Visualization to Think. San Francisco, Morgan Kaufmann Publications, 1999. pp. 1-34.
[6] Castro, E.; XML para a World Wide Web. Campus, Campus, São Paulo, 2001
[7] Cava, R. A.; Chubachi, O. M.; Freitas, C. M.; Luzzardi, P. R. G. Introdução à Visualização de Informações, 2001. UFRGS: Revista RITA, Porto Alegre.
[8] Cava, R. A.; Luzzardi, P. R. G.; Baltar, M. G. Afonso, F. A. Duarte, G. D.; Ferramenta de Visualização de Monitoramentos (CIRC Control Interact Radial Circle). UCPel – Pelotas, 2005.
[9] Chernoff, H.; The use of faces to represent points in k-dimensional space graphically. Journal of the American Statistical Association 68, pages 361–368. 1973
[10] Fayyad, U.; et al. (Ed.). Advances in Knowledge Discovery and Data Mining. Cambridge: MIT Press, 1996.
[11] Ferreira, C. B. R.; Nascimento, H. A. D.; Visualização de Informações – Uma Abordagem Prática, Congresso SBC, 2005 – São Leopoldo. RS, Brasil.
[12] Gershon, N.; Eick, S.; Information Visualization. IEEE Computer Graphics and Applications, Los Alamitos, v. 17, n. 4, p. 29-31, July/Aug. 1997.
[13] Inselberg, A.; Multidimensional detective. In IEEE Symposium on Information Visualization (InfoVis ’97), pages 100–107, Washington - Brussels - Tokyo. IEEE. October. 1997.
[14] Keim, D. A.; Information Visualization and Visual Data Mining. Ieee Transactions On Visualization And Computer Graphics, Vol. 7, No. 1, January-March 2002
46
[15] Loh, S.; Garin, R. S.; Web Intelligence – Inteligência Artificial para Descoberta de Conhecimento na Web. 2001, www.inf.unisinos.br
[16] Luzzardi, P. R. G.; Critérios de Avaliação de Técnicas de Visualização de Informações Hierárquicas. Tese de Doutorado, 2003. UFRGS: Porto Alegre.
[17] Muchow, J. W.; Core J2ME Tecnologia & MIDP, Pearson Makron Books, São Paulo, 2004
[18] Plaisant, C.; Shneiderman, B.; LifeLines: Using Visualization to Enhance Navigation and Analysis of Patient Records. Revised version appeared in 1998 American Medical Informatics Association Annual Fall Symposium (Orlando, Nov. 9-11, 1998).
[19] Rao, R.; Card, S. K.; (1994). The table lens: Merging graphical and symbolic representation in an interactive focus + context visualization for tabular information. In Proceedings of ACM Conference on Human Factors in Software, pages 318–322. ACM-Press.
[20] Robertson, G.; Card, S.; Mackinlay, J.; Cone Trees: Animated 3D Visualizations of Hierarchical Information. Proceedings of ACM CHI´91 ,1991, pp. 189-194.
[21] Shneiderman, B. The eyes have it: a task by data type taxonomy for information visualizations. Proceedings of IEEE Symposium on Visual Languages, Boulder, CO, September 3-6, 1996. pp. 336-343.
[22] Soares, W. PHP 5: Conceitos, Programação e Integração com Banco de Dados. Editora Érica, São Paulo, 2004.
[23] Spence, R. Information Visualization. ACM Press and Addison-Wesley, 2001.
[24] Swan, R.; Jensen, D.; TimeMines: Constructing Timelines with Statistical Models of Word Usage; Department of Computer Science, University of Massachusetts - Amherst, Massachusetts USA.
[25] Thomson, L.; Welling, L.; PHP e MySQL: Desenvolvimento Web. Elsevier, Rio de Janeiro, 2005.
[26] Viegas, F.; Donath, J.; Chat Circles. Computing System, New York: NY, USA. ACM Press new York, NY, USA, 1999.
Agradecimentos: Este trabalho conta com o apoio do CNPq, FAPERGS, UCPel e SENAC.
47