Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/15045
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor1 | Silva, Leandro Dias da | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/7856968264410259 | pt_BR |
dc.contributor.advisor-co1 | Lima, Marcos Antonio Barbosa | - |
dc.contributor.referee1 | Santos Neto, Baldoino Fonseca dos | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/0306751604362704 | pt_BR |
dc.contributor.referee2 | Costa, Evandro de Barros | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5760364940162939 | pt_BR |
dc.creator | Santos, Jadson César da Silva | - |
dc.creator.Lattes | https://lattes.cnpq.br/1538152794946974 | pt_BR |
dc.date.accessioned | 2024-12-12T17:13:02Z | - |
dc.date.available | 2024-12-12 | - |
dc.date.available | 2024-12-12T17:13:02Z | - |
dc.date.issued | 2024-04-30 | - |
dc.identifier.citation | SANTOS, Jadson César da Silva. Identificação automática de comentários tóxicos em discussões online: uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina. 2024. 43 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufal.br/jspui/handle/123456789/15045 | - |
dc.description.abstract | This work addresses the classification of toxic comments present on social media platforms and their impact, using the "Jigsaw Toxic Comment Classification Challenge" dataset from the Kaggle platform. The issue of toxic comments is discussed in relation to the online environment and its negative influence. The study aims to contribute to effective moderation of toxicity on digital platforms through machine learning classification models. The methodology involved initial training, where each model was assigned to a specific class, and those with the highest F1- score were selected for hyperparameter refinement. The algorithms SVM, RF, LR, and LSTM were used, along with the vectorizers TFIDF, CountVectorizer, and Tokenizer (exclusively for LSTM). The results showed satisfactory outcomes, surpassing, in some cases, the expectations of the literature, with cross-validation confirming the robustness of the models. It is concluded that the objectives of the work were achieved, and it is suggested for future analyses to incorporate techniques used in the competition and literature to enhance performance in the competition dataset. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Alagoas | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Curso de Engenharia da Computação - Bacharelado | pt_BR |
dc.publisher.initials | UFAL | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Processamento de Linguagem Natural | pt_BR |
dc.subject | Aprendizado do computador | pt_BR |
dc.subject | Ambiente online - Comentários Tóxicos | pt_BR |
dc.subject | Validação Cruzada | pt_BR |
dc.subject | Natural Language Processing | pt_BR |
dc.subject | Machine Learning | pt_BR |
dc.subject | Text Classification | pt_BR |
dc.subject | Toxic Comments | pt_BR |
dc.subject | Cross-validation | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Identificação automática de comentários tóxicos em discussões online: uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina | pt_BR |
dc.title.alternative | Automatic identification of toxic comments in online discussions: a toxicity analysis using natural language processing and machine learning | pt_BR |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.description.resumo | Este trabalho aborda a classificação de comentários tóxicos presentes em plataformas de mídia social e seu impacto, utilizando como base de dados da competição "Jigsaw Toxic Comment Classification Challenge"da plataforma Kaggle. O problema dos comentários tóxicos é discutido em relação ao ambiente online e sua influência negativa. O objetivo do estudo é contribuir para uma moderação eficaz da toxicidade nas plataformas digitais por meio de modelos de classificação de machine learning. A metodologia envolveu treinamentos iniciais, onde cada modelo foi designado para uma classe específica e selecionados aqueles com a maior pontuação F1-score para refinamento dos hiperparâmetros. Foram utilizados os algoritmos SVM, RF, LR e LSTM, juntamente com os vetorizadores TFIDF, CountVectorizer e Tokenizer (exclusivamente para LSTM). Os resultados demonstraram resultados satisfatórios, superando em alguns casos as expectativas da literatura, com validação cruzada que comprovou a robustez dos modelos. Conclui-se que os objetivos do trabalho foram alcançados, e sugere-se para análises futuras a incorporação de técnicas utilizadas na competição e na literatura para melhorar o desempenho na competição da base de dados. | pt_BR |
Aparece nas coleções: | Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Identificação automática de comentários tóxicos em discussões online_uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina.pdf | Identificação automática de comentários tóxicos em discussões online: uma análise de toxidade utilizando processamento de linguagem natural e aprendizado de máquina | 2.66 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.