Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/10781
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor1 | Santos Neto, Baldoino Fonseca dos | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0306751604362704 | pt_BR |
dc.contributor.advisor-co1 | Mello, Rafael Maiani de | - |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/5514393713941443 | pt_BR |
dc.contributor.referee1 | Cordeiro, Thiago Damasceno | - |
dc.contributor.referee2 | Garcia, Alessandro Fabricio | - |
dc.creator | Correia, João Lucas Marques | - |
dc.creator.Lattes | http://lattes.cnpq.br/4700444931437626 | pt_BR |
dc.date.accessioned | 2023-03-28T16:28:38Z | - |
dc.date.available | 2023-03-16 | - |
dc.date.available | 2023-03-28T16:28:38Z | - |
dc.date.issued | 2021-06-09 | - |
dc.identifier.citation | CORREIA, João Lucas Marques. Brazilian data scientists: revealing their challenges and practices on machine learning model development. 2023. 72 f. Dissertação (Mestrado em Informática) – Programa de Pós-Graduação em Informática, Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2021. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufal.br/jspui/handle/123456789/10781 | - |
dc.description.abstract | Data scientists often develop machine learning models to solve a variety of problems in the industry and academy. To build these models, these professionals usually perform activities that are also performed in the traditional software development lifecycle, such as eliciting and implementing requirements. One might argue that data scientists could rely on the engineering of traditional software development to build machine learning models. However, machine learning development presents certain characteristics, which may raise challenges that lead to the need for adopting new practices. The literature lacks in characterizing this knowledge from the perspective of the data scientists. In this work, we characterize challenges and practices addressing the engineering of machine learning models that deserve attention from the research community. To this end, we performed a qualitative study with eight data scientists across five different companies having different levels of experience in developing machine learning models. Our findings suggest that: (i) data processing and feature engineering are the most challenging stages in the development of machine learning models; (ii) it is essential synergy between data scientists and domain experts in most of stages; and (iii) the development of machine learning models lacks the support of a well engineered process. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Alagoas | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Informática | pt_BR |
dc.publisher.initials | UFAL | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Engenharia de software | pt_BR |
dc.subject | Aprendizagem de máquina | pt_BR |
dc.subject | Estudo empírico | pt_BR |
dc.subject | Software engineering | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Practitioner | pt_BR |
dc.subject | Empirical study | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Brazilian data scientists: revealing their challenges and practices on machine learning model development | pt_BR |
dc.title.alternative | Cientistas de dados brasileiros: revelando seus desafios e práticas no desenvolvimento de modelos de aprendizado de máquina | pt_BR |
dc.type | Dissertação | pt_BR |
dc.description.resumo | Cientistas de dados com frequência desenvolvem modelos de aprendizagem de máquina para resolver uma variedade de problemas tanto na indústria como na academia. Para construir esses modelos, estes profissionais executam atividades que também são executadas no ciclo tradicional do desenvolvimento de software, como a elicitação e implementação de requisitos. É factivel argumentar que os cientistas de dados poderiam tirar vantagem dos métodos utilizados pela engenharia de software tradicional para construir modelos de aprendizagem de máquina. Entretanto, o desenvolvimento de código voltado para aprendizagem de máquina possui particularidades que podem levar a desafios que podem que necessitam da adoção de novas práticas de desenvolvimento. De modo que a literatura atual não caracteriza esse tipo de conhecimento do ponto de vista dos cientistas de dados. Neste trabalho, nós caracterizamos os desafios e práticas a respeito da engenharia de modelos de aprendizagem de máquina que merecem atenção da comunidade de pesquisa. Para isto, nós executamos um estudo qualitativo com oito desenvolvedores de software membros de cinco companhias distintas, com diferentes níveis de experiência no desenvolvimento de modelos de aprendizagem de máquina. Nossos achados sugerem que: (i) o processamento de dados e a engenharia de atributos são os estágios de desenvolvimento mais desafiadores durante o desenvolvimento de um modelo de aprendizagem de máquina; (ii) é essencial uma sinergia entre os cientistas de dados e especialistas no domínio da aplicação do modelo; e (iii) o desenvolvimento de modelos de aprendizagem de máquina sofre da falta de suporte de um processo de engenharia bem definido. | pt_BR |
Aparece nas coleções: | Dissertações e Teses defendidas na UFAL - IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Brazilian data scientists_revealing their challenges and practices on machine learning model development.pdf | 1.14 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.