Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/17415| Tipo: | Dissertação |
| Título: | Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo |
| Título(s) alternativo(s): | Machine Learning in predicting carbohydrate accumulation by the microalgae Chlorella vulgaris in continuous cultivation |
| Autor(es): | Ferro, João Victor |
| Primeiro Orientador: | Silva, Carlos Eduardo de Farias |
| metadata.dc.contributor.advisor-co1: | Gama, Brígida Maria Villar da |
| metadata.dc.contributor.referee1: | Pimentel, Wagner Roberto de Oliveira |
| metadata.dc.contributor.referee2: | Coelho, Dayana de Gusmão |
| Resumo: | Neste estudo, foi aplicada a técnica de Machine Learning (ML) para prever a produção de carboidratos pela microalga Chlorella vulgaris em um cultivo contínuo, utilizando variáveis nutricionais (concentração de nitrogênio, 500-75 mg L-1, e fósforo, 200-50 mg L-1, em meio), ambientais (intensidade luminosa entre 150-450 µmol m-2 s-1 e a densidade óptica entre 0,5-20) e operacionais (tempo de residência entre 2,9-4,4 dias e tempo normalizado entre 0-1) como entradas para os modelos preditivos dana produtividade de biomassa e carboidratos e a % de acúmulo de carboidratos em biomassa. A análise do coeficiente de Pearson permitiu identificar correlações significativas entre as variáveis independentes e dependentes, destacando a influência da concentração de nutrientes e da intensidade luminosa na produção de carboidratos. Foi observada alta correlação entre nitrogênio e fósforo, o que pode comprometer a qualidade das regressões devido à colinearidade; como alternativa, a razão N/P foi utilizada para contornar esse problema. O histograma das variáveis evidenciou padrões e tendências nos dados, impactando as predições. Diferentes técnicas de regressão foram implementadas e comparadas, incluindo modelos lineares (Regressão Linear Multivariada, Ridge e LASSO) e não lineares (Random Forest, Redes Neurais e Support Vector Regression – SVR). Os modelos não lineares apresentaram melhor desempenho na previsão de todas as variáveis de saída, especialmente Random Forest e Redes Neurais, que capturaram relações complexas entre as variáveis. O melhor desempenho foi obtido com Random Forest, alcançando R² de 0,9347 e RMSE de 0,2556 para a produtividade de carboidratos, e R² de 0,8962 e RMSE de 0,3222 para a produtividade de biomassa. A otimização dos modelos foi realizada por meio da busca em grade (grid search), permitindo a definição dos melhores hiperparâmetros e melhorando significativamente a acurácia das previsões. Além disso, a validação cruzada foi empregada para evitar overfitting e garantir a generalização dos resultados, tornando os modelos mais robustos e confiáveis. Além da análise estatística dos modelos, foi realizada uma avaliação gráfica dos resíduos para verificar a adequação das predições. Observou-se que, apesar do bom desempenho numérico dos modelos não lineares, os resíduos indicaram um leve viés centralizado, sugerindo que melhorias podem ser alcançadas com a inclusão de novas variáveis de entrada ou ajustes nos pré-processamentos dos dados. |
| Abstract: | In this study, Machine Learning (ML) technique was applied to predict carbohydrate production by the microalgae Chlorella vulgaris in a continuous cultivation, using nutritional (nitrogen concentration, 500-75 mg L-1, and phosphorus, 200-50 mg L-1, in medium), environmental (light intensity between 150-450 µmol m-2 s-1 and optical density between 0.5-20) and operational (residence time between 2.9-4.4 days and normalized time between 0-1) variables as inputs for the predictive models on biomass and carbohydrate productivity and the % of carbohydrate accumulation in biomass. The analysis of Pearson's coefficient allowed to identify significant correlations between the independent and dependent variables, highlighting the influence of nutrient concentration and light on carbohydrate production. A high correlation was observed between nitrogen and phosphorus, which can compromise the quality of the regressions due to collinearity; as an alternative, the N/P ratio was used to circumvent this problem. The histogram of the variables showed patterns and trends in the data, impacting the predictions. Different regression techniques were implemented and compared, including linear models (Multivariate Linear Regression, Ridge and LASSO) and non-linear models (Random Forest, Artificial Neural Networks and Support Vector Regression – SVR). The non-linear models showed better performance in predicting all output variables, especially Random Forest and Neural Networks, which captured complex relationships between the variables. The best performance was obtained with Random Forest, reaching R² of 0.9347 and RMSE of 0.2556 for carbohydrate productivity, and R² of 0.8962 and RMSE of 0.3222 for biomass productivity. The optimization of the models was performed through grid search, allowing the definition of the best hyperparameters and significantly improving the accuracy of the predictions. Furthermore, cross-validation was used to avoid overfitting and ensure generalizability of the results, making the models more robust and reliable. In addition to the statistical analysis of the models, a graphical evaluation of the residuals was performed to verify the adequacy of the predictions. It was observed that, despite the good numerical performance of the nonlinear models, the residuals indicated a slight centralized bias, suggesting that improvements can be achieved with the inclusion of new input variables or adjustments in the data preprocessing. |
| Palavras-chave: | Aprendizado do computador Redes neurais artificiais Regressão (Modelos lineares) Produção de carboidratos Chlorella vulgaris - Cultivo contínuo Microalgas Computer learning Artificial neural networks Regression (Linear Models) Carbohydrate production Chlorella vulgaris - Continuous cultivation Microalgae |
| CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA |
| Idioma: | por |
| País: | Brasil |
| Editor: | Universidade Federal de Alagoas |
| Sigla da Instituição: | UFAL |
| metadata.dc.publisher.program: | Programa de Pós-Graduação em Engenharia Química |
| Citação: | FERRO, João Victor. Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo. 2025. 135 f. Dissertação (Mestrado em Engenharia Química) - Centro de Tecnologia, Programa de Pós-Graduação em Engenharia Química, Universidade Federal de Alagoas, Maceió, 2025. |
| Tipo de Acesso: | Acesso Aberto |
| URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/17415 |
| Data do documento: | 21-fev-2025 |
| Aparece nas coleções: | Dissertações e Teses defendidas na UFAL - CTEC |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo.pdf | Machine Learning na predição do acúmulo de carboidratos pela microalga Chlorella vulgaris em cultivo contínuo | 2.82 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.