00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/13695
Tipo: Trabalho de Conclusão de Curso
Título: A large multi-language dataset of open-source software vulnerabilities and their fixes
Autor(es): Lira, Kevin Washington da Silva
Primeiro Orientador: Santos Neto, Baldoino Fonseca dos
metadata.dc.contributor.referee1: Araújo, Ícaro Bezerra Queiroz de
metadata.dc.contributor.referee2: Baia, Davy de Medeiros
Resumo: No cenário atual do aumento progressivo da adoção de ferramentas digitais pela sociedade, softwares de todos os tipos e tamanhos enfrentam constantemente ameaças à sua segurança. No contexto da segurança digital, uma vulnerabilidade é definida como uma fraqueza encontrada em componentes de software e hardware que, quando explorada, resulta em um impacto negativo na confidencialidade, integridade ou disponibilidade do serviço. O processo de mitigação das vulnerabilidades de segurança presentes em soft-wares normalmente envolve alterações de código. Dessa forma, é necessário identificar o trecho de código que introduz uma vulnerabilidade para que seja possível realizar a implementação da correção. Este trabalho apresenta uma metodologia de identificação e extração de códigos vulneráveis em projetos de softwares open-source e seus respectivos patches. Para isso, é apresentada uma ferramenta que identifica as vulnerabilidades de software publicadas e extrai, de forma automática, o código associado. O dataset construído reúne vulnerabilidades de software e seus patches presentes em 3,587 projetos desenvolvidos em 58 linguagens de programação. Além disso, foram realizadas análises com o intuito de verificar a incidência das vulnerabilidades e as características dos fixes desenvolvidos nas principais linguagens do mercado.
Abstract: In the current scenario of progressive increase in the adoption of digital tools by society, software of all types and sizes constantly faces threats to its security. In the context of digital security, a vulnerability is defined as a weakness found in software and hardware components that, when exploited, negatively impact the service’s confidentiality, integrity, or availability. The process of mitigating security vulnerabilities present in software typically involves code changes. Therefore, it is necessary to identify the snippet of code that introduces a vulnerability to implement the correction. This work presents a methodology for identifying and extracting vulnerable codes in open-source software projects and their patches. For this purpose, a tool is presented that identifies published software vulnerabilities and automatically extracts the associated code. The constructed dataset combines software vulnerabilities and their fixes in 3,587 projects developed in 58 programming languages. Furthermore, analyses were carried out to verify the incidence of vulnerabilities and the characteristics of fixes developed in the main languages on the market.
Palavras-chave: Segurança da informação
Ameaça
Vulnerabilidades (Informática)
Software de código aberto
Information security
Threats
Vulnerabilities (Computing)
Open-source software
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: eng
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.department: Curso de Engenharia da Computação - Bacharelado
Citação: LIRA, Kevin Washington da Silva. A large multi-language dataset of open-source software vulnerabilities and their fixes. 2024. 38 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2023.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/13695
Data do documento: 4-dez-2023
Aparece nas coleções:Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
A large multi-language dataset of open-source software vulnerabilities and their fixes.pdf2.58 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.