00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) CTEC - CENTRO DE TECNOLOGIA Dissertações e Teses defendidas na UFAL - CTEC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/17415
Tipo: Dissertação
Título: Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo
Título(s) alternativo(s): Machine Learning in predicting carbohydrate accumulation by the microalgae Chlorella vulgaris in continuous cultivation
Autor(es): Ferro, João Victor
Primeiro Orientador: Silva, Carlos Eduardo de Farias
metadata.dc.contributor.advisor-co1: Gama, Brígida Maria Villar da
metadata.dc.contributor.referee1: Pimentel, Wagner Roberto de Oliveira
metadata.dc.contributor.referee2: Coelho, Dayana de Gusmão
Resumo: Neste estudo, foi aplicada a técnica de Machine Learning (ML) para prever a produção de carboidratos pela microalga Chlorella vulgaris em um cultivo contínuo, utilizando variáveis nutricionais (concentração de nitrogênio, 500-75 mg L-1, e fósforo, 200-50 mg L-1, em meio), ambientais (intensidade luminosa entre 150-450 µmol m-2 s-1 e a densidade óptica entre 0,5-20) e operacionais (tempo de residência entre 2,9-4,4 dias e tempo normalizado entre 0-1) como entradas para os modelos preditivos dana produtividade de biomassa e carboidratos e a % de acúmulo de carboidratos em biomassa. A análise do coeficiente de Pearson permitiu identificar correlações significativas entre as variáveis independentes e dependentes, destacando a influência da concentração de nutrientes e da intensidade luminosa na produção de carboidratos. Foi observada alta correlação entre nitrogênio e fósforo, o que pode comprometer a qualidade das regressões devido à colinearidade; como alternativa, a razão N/P foi utilizada para contornar esse problema. O histograma das variáveis evidenciou padrões e tendências nos dados, impactando as predições. Diferentes técnicas de regressão foram implementadas e comparadas, incluindo modelos lineares (Regressão Linear Multivariada, Ridge e LASSO) e não lineares (Random Forest, Redes Neurais e Support Vector Regression – SVR). Os modelos não lineares apresentaram melhor desempenho na previsão de todas as variáveis de saída, especialmente Random Forest e Redes Neurais, que capturaram relações complexas entre as variáveis. O melhor desempenho foi obtido com Random Forest, alcançando R² de 0,9347 e RMSE de 0,2556 para a produtividade de carboidratos, e R² de 0,8962 e RMSE de 0,3222 para a produtividade de biomassa. A otimização dos modelos foi realizada por meio da busca em grade (grid search), permitindo a definição dos melhores hiperparâmetros e melhorando significativamente a acurácia das previsões. Além disso, a validação cruzada foi empregada para evitar overfitting e garantir a generalização dos resultados, tornando os modelos mais robustos e confiáveis. Além da análise estatística dos modelos, foi realizada uma avaliação gráfica dos resíduos para verificar a adequação das predições. Observou-se que, apesar do bom desempenho numérico dos modelos não lineares, os resíduos indicaram um leve viés centralizado, sugerindo que melhorias podem ser alcançadas com a inclusão de novas variáveis de entrada ou ajustes nos pré-processamentos dos dados.
Abstract: In this study, Machine Learning (ML) technique was applied to predict carbohydrate production by the microalgae Chlorella vulgaris in a continuous cultivation, using nutritional (nitrogen concentration, 500-75 mg L-1, and phosphorus, 200-50 mg L-1, in medium), environmental (light intensity between 150-450 µmol m-2 s-1 and optical density between 0.5-20) and operational (residence time between 2.9-4.4 days and normalized time between 0-1) variables as inputs for the predictive models on biomass and carbohydrate productivity and the % of carbohydrate accumulation in biomass. The analysis of Pearson's coefficient allowed to identify significant correlations between the independent and dependent variables, highlighting the influence of nutrient concentration and light on carbohydrate production. A high correlation was observed between nitrogen and phosphorus, which can compromise the quality of the regressions due to collinearity; as an alternative, the N/P ratio was used to circumvent this problem. The histogram of the variables showed patterns and trends in the data, impacting the predictions. Different regression techniques were implemented and compared, including linear models (Multivariate Linear Regression, Ridge and LASSO) and non-linear models (Random Forest, Artificial Neural Networks and Support Vector Regression – SVR). The non-linear models showed better performance in predicting all output variables, especially Random Forest and Neural Networks, which captured complex relationships between the variables. The best performance was obtained with Random Forest, reaching R² of 0.9347 and RMSE of 0.2556 for carbohydrate productivity, and R² of 0.8962 and RMSE of 0.3222 for biomass productivity. The optimization of the models was performed through grid search, allowing the definition of the best hyperparameters and significantly improving the accuracy of the predictions. Furthermore, cross-validation was used to avoid overfitting and ensure generalizability of the results, making the models more robust and reliable. In addition to the statistical analysis of the models, a graphical evaluation of the residuals was performed to verify the adequacy of the predictions. It was observed that, despite the good numerical performance of the nonlinear models, the residuals indicated a slight centralized bias, suggesting that improvements can be achieved with the inclusion of new input variables or adjustments in the data preprocessing.
Palavras-chave: Aprendizado do computador
Redes neurais artificiais
Regressão (Modelos lineares)
Produção de carboidratos
Chlorella vulgaris - Cultivo contínuo
Microalgas
Computer learning
Artificial neural networks
Regression (Linear Models)
Carbohydrate production
Chlorella vulgaris - Continuous cultivation
Microalgae
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Engenharia Química
Citação: FERRO, João Victor. Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo. 2025. 135 f. Dissertação (Mestrado em Engenharia Química) - Centro de Tecnologia, Programa de Pós-Graduação em Engenharia Química, Universidade Federal de Alagoas, Maceió, 2025.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/17415
Data do documento: 21-fev-2025
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - CTEC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo.pdfMachine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo2.82 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.