0 Programa de Pós-Graduação Interunidades NELSON ROBERTO ...
Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia –...
Transcript of Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia –...
![Page 1: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/1.jpg)
Universidade de São PauloPrograma de Pós-Graduação Interunidades
Bioengenharia – EESC/FMRP/IQSC
COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA
CAPES
Sousa1, T.H.S.;Delbem2, A.C.B.; Policastro2, A.C.; Garrat, 4R. C. 1Bioengenharia-São Carlos-USP; 2ICMC-São Carlos-USP, 4IFSC-
São Carlos - USP
![Page 2: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/2.jpg)
___________________________________________________________SUMÁRIO
sumário
Motivação
Introdução
Objetivo
Materiais e Métodos
Resultados
Conclusão
![Page 3: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/3.jpg)
Método laboratorial para a evolução de moléculas por meio de mutações. Obtenção de propriedades desejadas. Evolução de proteínas in vitro.
descobrimento de novas drogas. cura de muitas doenças de origem genética.
Técnica de alto custorequer longo período de tempo.
_________________________________________________________MOTIVAÇÃO
Evolução in vitro
![Page 4: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/4.jpg)
______________________________________________________INTRODUÇÃO
PROTEÍNAS
macromoléculas direta ou indiretamente responsáveis pelo desempenho de praticamente todas as funções metabólicas, estruturais, imunológicas e reprodutivas nos organismos vivos.
Componentes fundamentais de todos os seres vivos. Moléculas orgânicas mais abundantes das células.
LEHNINGER, 1976
![Page 5: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/5.jpg)
______________________________________________________INTRODUÇÃO
PROTEÍNAS
Algumas de suas principais funções: Catálize enzimática; Transporte e armazenamento; Sustentação mecânica; Proteção imunitária e outras.
Principais elementos: C, H, N , O e S. Elementos adicionais: P, Fe, Zn e Cu. Elementos liberados por hidrólise: Aminoácidos
ou -
aminoácidos
![Page 6: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/6.jpg)
Conformação das proteínas______________________________________________________INTRODUÇÃO
Proteínas fibrosas
Proteína Globulares
![Page 7: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/7.jpg)
AMINOÁCIDOS
20 aminoácidos são encontrados nas proteínas (padrão)
Classificados Grupamentos R Polaridade: Hidrofóbicos, Hidrofílicos, Básicos e Ácidos
______________________________________________________INTRODUÇÃO
![Page 8: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/8.jpg)
Proteínas, contidas nas hemácias, responsáveis pelo transporte de O2 , CO2, e íons de H+ .
______________________________________________________INTRODUÇÃO
HEMOGLOBINA
A Hb contém 2 cadeias (141 a.a) e 2 cadeias (146 a.a) liga-se a cada cadeia um grupo heme
![Page 9: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/9.jpg)
HEMOGLOBINA
Desoxihemoglobina
Estado T
Oxiemoglobina
Estado R
________________________________________________________INTRODUÇÃO
![Page 10: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/10.jpg)
Aprendizado de MáquinaAprendizado de Máquina
AM é uma área de pesquisa computacional objetivo é desenvolvimento de sistemas computacionais capazes de aprenderem e adquirirem conhecimento de forma automática.
Algoritmos de Aprendizado: Programa computacional capaz de tomar decisões baseadas em soluções de problemas anteriores.
Exemplos de técnicas de AM: Redes Neurais, SVM, técnica de Árvores de Decisão e Algoritmos Genéticos.
________________________________________________________INTRODUÇÃO
![Page 11: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/11.jpg)
OBJETIVO
Propomos neste trabalho investigar técnicas computacionais inteligentes capazes de determinar a funcionalidade de proteínas mutantes a partir das seqüências de aminoácidos e classificar de maneira correta as mutações da proteína hemoglobina para em seguida predizer as características de uma nova mutação.
______________________________________________________OBJETIVO
![Page 12: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/12.jpg)
________________________________________________MATERIAIS E MÉTODOS
Foram realizados dois estudos:
1) Proteínas (Hemoglobinas - Hb).
Foram utilizadas as cadeias alfa e beta da proteína HB Com 141 e 146 aminoácidos respectivamente.
Um cojunto de dados de proteínas disponíveis em: http://us.expasy.org e http://globin.cse.psu.edu.
adquiridas estruturas primárias da Hb (mutantes) associadas ou não a uma patologia com suas respectivas classificações seqüência original da proteína estudada.
![Page 13: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/13.jpg)
2) Técnicas computacionais inteligentes.
A técnica computacional (AM) Algoritmos C 4.5, Algoritmo SMO, Random Forest, Kstar e FLR para a verificação da funcionalidade de hemoglobinas.
Programa Weka (Waikato Environment Knowledge Analysis) versão 3.2, composto por um conjunto de algoritmos de AM implementados em Java, disponível no site http://www.cs.waikato.ac.nz/ml/weka/ index.htm.
________________________________________________MATERIAIS E MÉTODOS
![Page 14: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/14.jpg)
________________________________________________MATERIAIS E MÉTODOS
METODOLOGIA
Os experimentos seguiram a metodologia 10-fold-cross-validation.
As seqüências foram aleatoriamente separadas em 10 grupos de tamanhos aproximadamente iguais Um grupo foi utilizado como conjunto de novas seqüências apresentadas ao sistema para o aprendizado 9 grupos restantes foram utilizados como seqüências de treinamento dos demais algoritmos.
Após cada treinamento utilizando os 9 grupos, o grupo de teste foi apresentado ao sistema e a média dos erros foi calculada esse processo foi repetido para os 9 grupos restantes.
![Page 15: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/15.jpg)
________________________________________________________RESULTADOS
RESULTADOS
A Tabela 1 apresenta os resultados dos testes que foram realizados com a cadeia alfa da proteína Hemoglobina seqüências mutantes de indivíduos heterozigotos ambientes químicos.
A Tabela 2 apresenta os resultados dos testes que foram realizados com a cadeia beta da proteína Hemoglobina seqüências mutantes de indivíduos heterozigotos ambientes químicos.
Testes realizados AM e AG
![Page 16: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/16.jpg)
________________________________________________________RESULTADOS
Tabela 1 - Erro médio para os indivíduos Heterozigotos da cadeia alfa
Algoritmo Erro Médio Boas Ruins Total
C 4.5 17.9% 114 25 139
SVM 18.7%
Random Forest 17.9%
Kstar 19.4%
FLR 23.7%
Tabela 2 - Erro médio para os indivíduos Heterozigotos da cadeia betaAlgoritmo Erro Médio Boas Ruins Total
C 4.5 36.2% 88 50 138
SVM 29.7%
Random Forest 33.3%
Kstar 26.8%
FLR 31.8%
![Page 17: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/17.jpg)
RESULTADOS________________________________________________________RESULTADOS
A Tabela 3 apresenta os testes que foram realizados com a cadeia beta da proteína Hemoglobina com o Algoritmo Genético Filtro objetivo era selecionar ainda mais as entradas para os classificadores.
A Tabela 4 apresenta os resultados dos testes realizados com a cadeia beta da proteína HemoglobinaAlgoritmo Genético.
![Page 18: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/18.jpg)
Tabela 3 -Algoritmos Genéticos/ Cadeia Beta/ Filtro
________________________________________________________RESULTADOS
Tabela 4 - Algoritmos Genéticos/ Cadeia Beta
Algoritmo Erro Médio Boas Ruins Total
C 4.5 3.6% 197 186 383
SVM 2.1% 197 186
Algoritmo Erro Médio Boas Ruins Total
C 4.5
SVM
383
1.8 %
1.6 %
197
197
186
186
383
383
![Page 19: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/19.jpg)
__________________________________________________________ CONCLUSÃO
CONCLUSÃO
Os testes realizados com os algoritmos escolhidos apresentaram um resultado esperado quando se utilizam técnicas de aprendizado que requerem bancos de dados numerosos.
A utilização de técnicas de aprendizado de máquina, por exemplo, o C 4.5, permite a construção de árvores de decisões que podem revelar a lógica de como é determinada a função de proteínas.
![Page 20: Universidade de São Paulo Programa de Pós-Graduação Interunidades Bioengenharia – EESC/FMRP/IQSC COMPUTAÇÃO INTELIGENTE NO ESTUDO DE VARIANTES DE HEMOGLOBINA.](https://reader036.fdocument.pub/reader036/viewer/2022081518/552fc117497959413d8c831e/html5/thumbnails/20.jpg)
Como apresentado nos resultados experimentais o uso do Algoritmo Genético permitiu que se alcançassem resultados bastante significativos.
Como etapa futura a ser investigada está a criação de um software capaz de predizer futuras mutações da proteína estudada, a partir dos conhecimentos adquiridos.
__________________________________________________________ CONCLUSÃO
CONCLUSÃO