DESENVOLVIMENTO DE MODELOS DE APRENDIZADO DE MÁQUINA PARA PREDIÇÃO DE TOXICIDADE EM Artemia salina LEACH: SUBSÍDIOS À CONSERVAÇÃO DA BIODIVERSIDADE
Abstract
Os ecossistemas aquáticos e sua biodiversidade desempenham funções essenciais para a
sustentabilidade das comunidades bióticas, na realização de sequestro de carbono e nutrientes, e
consequentemente gerando uma “estabilidade” da fração desses compostos no meio ambiente,
também sendo cruciais para a produção de pescados, abastecimento de água e recreação. No
entanto o uso intensivo de agrotóxicos e produtos químicos industriais, vem sendo considerados
responsáveis por uma queda dramática no número de espécies de organismos aquáticos. A
realização de ensaios experimentais para avaliação completa da toxicidade dessas substâncias
químicas em grande quantidade (em várias doses e concentrações) se torna morosa, onerosa e
representa um problema ético. Com avanços em hardware e software, assim como os grandes
avanços no desenvolvimento de algoritmos de aprendizado de máquina, hoje é possível construir,
validar e implementar tais modelos computacionais para avaliação de ecotoxicidade durante o
registro de novos agrotóxicos, o que torna os modelos de aprendizado de máquina uma alternativa
custo-efetiva para analisar o potencial toxicológico e a identificação prévia de potenciais
contaminantes. Diante do exposto, o presente projeto tem como objetivo desenvolver modelos de
aprendizado de máquina para predição compostos potencialmente tóxicos para organismos
aquáticos. Inicialmente, modelos binários baseados em aprendizado de máquina foram
desenvolvidos para a espécie Artemia salina. Os modelos foram desenvolvidos obedecendo as boas
práticas de validação e através da combinação de diferentes tipos de métodos (e.g., Random Forest
- RF, Support Vector Machine - SVM e Light Gradient Boosting Model - LGBM) e impressões
digitais moleculares (Morgan e FeatMorgan). Dentre os resultados obtidos o melhor foi o com
MCC: 0,74; SE: 0,91; SP: 0,83; PPV: 0,84; NPV: 0,91; Kappa: 0,74 e Acurácia: 0,87.