Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/15802
Tipo: | Trabalho de Conclusão de Curso |
Título: | MassFormer: uma abordagem de aprendizado profundo para a predição de espectros de massa |
Autor(es): | Santos, Anderson Miguel Clemente |
Primeiro Orientador: | Aquino, André Luiz Lins de |
metadata.dc.contributor.referee1: | Costa, Danilo Fernandes |
metadata.dc.contributor.referee2: | Alves, Josias jordão Andrade |
Resumo: | Este trabalho apresenta uma investigação detalhada do uso do MassFormer, um modelo baseado em transformer, para a predição de espectros de massa a partir de estruturas moleculares. Utilizando o conjunto de dados público MassBank of North America (MoNA), este estudo explora a eficácia do modelo MassFormer, que é refinado a partir de um modelo Graphormer pré-treinado. O Graphormer, conhecido por sua capacidade de modelar eficientemente dados estruturados como grafos, fornece uma base sólida para o MassFormer ao capturar as interações complexas entre os nós representativos dos átomos em uma molécula. No decorrer deste trabalho, foram implementadas e comparadas duas abordagens de divisão dos dados: uma divisão aleatória simples e uma mais complexa baseada em Scaffold. Ambas as estratégias produziram resultados similares, demonstrando a robustez do modelo em condições variadas. A performance do MassFormer, embora inferior à dos modelos comerciais devido às limitações nos dados públicos disponíveis, mostrou-se promissora, especialmente considerando a possibilidade de melhoria contínua através da contribuição comunitária para o banco de dados MoNA. Este estudo não apenas demonstra a aplicabilidade do MassFormer em contextos acadêmicos e de pesquisa, mas também destaca o potencial para futuras melhorias e expansões na modelagem de espectros de massa, promovendo uma compreensão mais profunda e a aplicação prática em espectrometria de massa. |
Abstract: | This work presents a detailed investigation into the use of the MassFormer, a transformer based model, for predicting mass spectra from molecular structures. Utilizing the public dataset MassBank of North America (MoNA), this study explores the efficacy of the MassFormer model, which is refined from a pre-trained Graphormer model. Graphormer, known for its ability to efficiently model structured data like graphs, provides a solid foundation for the MassFormer by capturing the complex interactions between nodes representing atoms in a molecule. Throughout this work, two approaches to data splitting were implemented and compared: a simple random split and a more complex Scaffold-based split. Both strategies produced similar results, demonstrating the robustness of the model under varied conditions. The performance of the MassFormer, although inferior to commercial models due to the limitations in publicly available data, proved promising, especially considering the potential for continuous improvement through community contributions to the MoNA database. This study not only demonstrates the applicability of the MassFormer in academic and research contexts but also highlights the potential for future improvements and expansions in mass spectrum modeling, promoting a deeper understanding and practical application in mass spectrometry. |
Palavras-chave: | Espectrometria de massa Redes neurais (Computação) Predição de espectros Modelagem molecular. Deep Learning Mass Spectrometry Spectrum Prediction Molecular Modeling |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.department: | Curso de Engenharia da Computação - Bacharelado |
Citação: | SANTOS, Anderson Miguel Clemente. MassFormer: uma abordagem de aprendizado profundo para a predição de espectros de massa. 2025. 54 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/15802 |
Data do documento: | 9-ago-2024 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MassFormer_uma abordagem de aprendizado profundo para a predição de espectros de massa.pdf | MassFormer: uma abordagem de aprendizado profundo para a predição de espectros de massa | 4.19 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.