00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/15045
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Silva, Leandro Dias da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7856968264410259pt_BR
dc.contributor.advisor-co1Lima, Marcos Antonio Barbosa-
dc.contributor.referee1Santos Neto, Baldoino Fonseca dos-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/0306751604362704pt_BR
dc.contributor.referee2Costa, Evandro de Barros-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5760364940162939pt_BR
dc.creatorSantos, Jadson César da Silva-
dc.creator.Latteshttps://lattes.cnpq.br/1538152794946974pt_BR
dc.date.accessioned2024-12-12T17:13:02Z-
dc.date.available2024-12-12-
dc.date.available2024-12-12T17:13:02Z-
dc.date.issued2024-04-30-
dc.identifier.citationSANTOS, Jadson César da Silva. Identificação automática de comentários tóxicos em discussões online: uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina. 2024. 43 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024.pt_BR
dc.identifier.urihttp://www.repositorio.ufal.br/jspui/handle/123456789/15045-
dc.description.abstractThis work addresses the classification of toxic comments present on social media platforms and their impact, using the "Jigsaw Toxic Comment Classification Challenge" dataset from the Kaggle platform. The issue of toxic comments is discussed in relation to the online environment and its negative influence. The study aims to contribute to effective moderation of toxicity on digital platforms through machine learning classification models. The methodology involved initial training, where each model was assigned to a specific class, and those with the highest F1- score were selected for hyperparameter refinement. The algorithms SVM, RF, LR, and LSTM were used, along with the vectorizers TFIDF, CountVectorizer, and Tokenizer (exclusively for LSTM). The results showed satisfactory outcomes, surpassing, in some cases, the expectations of the literature, with cross-validation confirming the robustness of the models. It is concluded that the objectives of the work were achieved, and it is suggested for future analyses to incorporate techniques used in the competition and literature to enhance performance in the competition dataset.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Alagoaspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCurso de Engenharia da Computação - Bachareladopt_BR
dc.publisher.initialsUFALpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectAmbiente online - Comentários Tóxicospt_BR
dc.subjectValidação Cruzadapt_BR
dc.subjectNatural Language Processingpt_BR
dc.subjectMachine Learningpt_BR
dc.subjectText Classificationpt_BR
dc.subjectToxic Commentspt_BR
dc.subjectCross-validationpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleIdentificação automática de comentários tóxicos em discussões online: uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquinapt_BR
dc.title.alternativeAutomatic identification of toxic comments in online discussions: a toxicity analysis using natural language processing and machine learningpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.description.resumoEste trabalho aborda a classificação de comentários tóxicos presentes em plataformas de mídia social e seu impacto, utilizando como base de dados da competição "Jigsaw Toxic Comment Classification Challenge"da plataforma Kaggle. O problema dos comentários tóxicos é discutido em relação ao ambiente online e sua influência negativa. O objetivo do estudo é contribuir para uma moderação eficaz da toxicidade nas plataformas digitais por meio de modelos de classificação de machine learning. A metodologia envolveu treinamentos iniciais, onde cada modelo foi designado para uma classe específica e selecionados aqueles com a maior pontuação F1-score para refinamento dos hiperparâmetros. Foram utilizados os algoritmos SVM, RF, LR e LSTM, juntamente com os vetorizadores TFIDF, CountVectorizer e Tokenizer (exclusivamente para LSTM). Os resultados demonstraram resultados satisfatórios, superando em alguns casos as expectativas da literatura, com validação cruzada que comprovou a robustez dos modelos. Conclui-se que os objetivos do trabalho foram alcançados, e sugere-se para análises futuras a incorporação de técnicas utilizadas na competição e na literatura para melhorar o desempenho na competição da base de dados.pt_BR
Aparece nas coleções:Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Identificação automática de comentários tóxicos em discussões online_uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina.pdfIdentificação automática de comentários tóxicos em discussões online: uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina2.66 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.