00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/riufal/1611
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Paes, Rodrigo de Barros-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1967806680644977pt_BR
dc.contributor.advisor-co1Ribeiro, Márcio de Medeiros-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/9300936571715992pt_BR
dc.contributor.referee1Silva, Leandro Dias da-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/7856968264410259pt_BR
dc.contributor.referee2Teixeira, Leopoldo Motta-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2117651910340729pt_BR
dc.creatorAlmeida, Diogo Cabral de-
dc.creator.Latteshttp://lattes.cnpq.br/3777686793145799pt_BR
dc.date.accessioned2017-02-26T22:03:06Z-
dc.date.available2017-02-26-
dc.date.available2017-02-26T22:03:06Z-
dc.date.issued2015-03-31-
dc.identifier.citationALMEIDA, Diogo Cabral de. Pride: uma ferramenta de detecção de similaridade em código-fonte. 2015. 79 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Programa de Pós-Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2015.pt_BR
dc.identifier.urihttp://www.repositorio.ufal.br/handle/riufal/1611-
dc.description.abstractPlagiarism among students of introductory programming courses has been increasing over time. The ease of exchange of information brought by the Internet can be the factor responsible for this increase. In many cases, students try to disguise the plagiarism making some modifications to the source code. However, some masking techniques are extremely complex to be detected and may not be seen with the naked eye. In this dissertation, detection techniques were analyzed and, on this basis, was developed a system able to detect plagiarism in source code. This system is based on the representation code as an abstract syntax tree and Karp-Rabin Greedy String Tiling algorithm. The system was evaluated using a source-code base of students of programming disciplines. Oracle based comparison was performed to compare the system with others. The oracle was created from the manual analysis of the teacher of the subject, which was marked if there was plagiarism or not in each pair of source code. To represent the results, ROC curves and confusion matrices were used. The same procedure was applied to existing systems, allowing direct comparison of results. More specifically, we use the value of the area under the curve and the minimum distance to point (0, 1) of the ROC space, since these figures represent the classification performance. The analysis of results shows that, for the sample used, the developed system obtained higher area under the curve and also the shortest distance to the point (0, 1) of the space ROC. However, we find that the choice of similarity detection tool in source code will depend on conservative or liberal profile of teaching.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Alagoaspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Informáticapt_BR
dc.publisher.initialsUFALpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectCódigo-fontept_BR
dc.subjectLinguagem de programação - Computadorespt_BR
dc.subjectPRIDE (Linguagem de programação de computador)pt_BR
dc.subjectSimilaridadept_BR
dc.subjectPlágiopt_BR
dc.subjectComputer programming languagept_BR
dc.subjectsource codept_BR
dc.subjectPlagiarismpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titlePride: uma ferramenta de detecção de similaridade em código-fontept_BR
dc.title.alternativePride: a tool for detecting similarity in source codept_BR
dc.typeDissertaçãopt_BR
dc.description.resumoO plágio entre alunos de disciplinas introdutórias de programação vem aumentando ao longo do tempo. A facilidade na troca de informações trazida pela Internet pode ser um dos fatores responsáveis por esse aumento. Em muitos casos, os alunos tentam disfarçar o plágio fazendo algumas modïficações no código-fonte. Porém, algumas técnicas de disfarce são extremamente complexas e podem não ser detectadas a olho nu. Neste trabalho, foram analisadas as técnicas de detecção e, com base nelas, foi desenvolvido um sistema capaz de detectar plágio em código-fonte. Este sistema é baseado na representação do código como uma árvore sintática abstrata e no algoritmo Karp-Rabin Greedy String Tiling. O sistema foi avaliado utilizando uma base de códigos-fonte de alunos de disciplinas programação. Foi realizada uma comparação baseada em oráculo para comparar o sistema com os demais. O oráculo foi criado a partir da análise do docente da disciplina, onde foi marcado se havia plágio ou não em cada par de código-fonte. Para representar os resultados, foram utilizadas curvas ROC e matrizes de confusão. O mesmo procedimento foi aplicado aos sistemas já existentes, o que permitiu a comparação direta entre os resultados. Mais específicamente, utilizamos o valor da área sob a curva e a distância mí­nima para o ponto (0, 1) do espaço ROC, uma vez que esses valores representam o desempenho de classificação. A análise dos resultados indica que, para a amostra utilizada, o sistema desenvolvido obteve o maior valor da área sob a curva e também a menor distância para o ponto (0, 1) do espaço ROC. No entanto, concluí­mos que a escolha de uma ferramenta de detecção de similaridade em código-fonte dependerá bastante do período conservador ou liberal do docente.pt_BR
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Pride: uma ferramenta de detecção de similaridade em código-fonte.pdf1.59 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.