Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/riufal/7348
Tipo: | Dissertação |
Título: | Identificação automática da presença social em discussões online escritas em português |
Título(s) alternativo(s): | Automatic identification of social presence in online discussions written in portuguese |
Autor(es): | Teixeira, Jean Barros |
Primeiro Orientador: | Costa, Evandro de Barros |
metadata.dc.contributor.advisor-co1: | Mello, Rafael Ferreira Leite de |
metadata.dc.contributor.referee1: | Brito, Patrick Henrique da Silva |
metadata.dc.contributor.referee2: | Mello, Rafael Ferreira Leite de |
metadata.dc.contributor.referee3: | Rodrigues, Rodrigo Lins |
Resumo: | Esta dissertação de mestrado apresenta um método que permite a identificação automática de mensagens provenientes de fóruns online de ensino a distância escritas em português brasileiro. Particularmente, analisa o problema da codificação de mensagens de discussão segundo as categorias de presença social, um importante construto do modelo de Comunidade de Investigação amplamente utilizado na aprendizagem online. Apesar de existirem técnicas de codificação para a presença social na língua inglesa, a literatura ainda é carente em métodos para as demais línguas, como o português. O método aqui proposto utiliza-se de um conjunto de características provenientes da frequência de palavras e 158 características extraídas de dois recursos, LIWC e Coh-Metrix, disponíveis para análise textual através de técnicas de Mineração de Texto, para criar um classificador para cada uma das três categorias da presença social (Afetiva, Interativa e Coesiva). Para isso foram utilizados três tipos de algoritmos, Random Forest, AdaBoost e XGBoost onde o melhor modelo desenvolvido utilizou o algoritmo XGBoost atingindo 85,68% de acurácia e índice Kappa (k) de 0,71, o que representa uma concordância substancial, e está bem acima do grau de puro acaso. Este trabalho também provê uma análise da natureza da presença social, observando as características de classificação que foram mais relevantes para distinguir as três categorias da presença e uma análise comparativa sobre as principais características identificadas nas fases da presença social em diferentes domínios. |
Abstract: | This M.Sc. dissertation presents a method that allows the automatic identification of messages from distance learning online forums written in Brazilian Portuguese. In particular, it analyzes the problem of coding discussion messages according to the categories of social presence, an important construct of the Community of Inquiry (CoI) model widely used in online learning. Although there are coding techniques for social presence in the English language, the literature is still lacking in methods for other languages, such as Portuguese. The method proposed here uses a set of characteristics derived from the frequency of words and 158 characteristics extracted from two resources, LIWC and Coh-Metrix, available for textual analysis using Text Mining techniques, to create a classifier for each one of the three categories of social presence (Affective, Interactive and Cohesive). For that, three types of algorithms were used, Random Forest, AdaBoost and XGBoost where the best model developed used the XGBoost algorithm reaching 85.68% accuracy and Kappa index (k) of 0.71, which represents a substantial agreement, and is well above the level of pure chance. This work also provides an analysis of the nature of social presence, observing the classification characteristics that were most relevant to distinguish the three categories of presence and a comparative analysis on the main characteristics identified in the phases of social presence in different domains. |
Palavras-chave: | Codificação de mensagens Discussões online Presença social Comunidades de investigação Mineração de textos Social presence Community of inquiry (CoI) model Online discussion Text classification |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Informática |
Citação: | TEIXEIRA, Jean Barros. Identificação automática da presença social em discussões online escritas em português. 2020. 101 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2020. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/handle/riufal/7348 |
Data do documento: | 28-ago-2020 |
Aparece nas coleções: | Dissertações e Teses defendidas na UFAL - IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Identificação automática da presença social em discussões online escritas em português.pdf | 1.33 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.