COMPUTER VISION AS A TOOL TO AID THE ANALYSIS OF SAMPLES CONTAMINATED WITH PARASITE EGGS
REGISTRO DOI: 10.69849/revistaft/dt10202508191920
João Paulo Silva Martins1
Lucas Lima de Araújo2
RESUMO
A identificação de microrganismos em imagens microscópicas de sangue, água e fezes continua sendo um dos grandes desafios da Biomedicina. A diversidade de espécies de parasitas, a semelhança entre eles e as variações no tamanho e formato dos ovos dificultam a análise, mesmo para profissionais experientes. Esse processo demanda tempo, esforço e, em alguns casos, pode gerar incertezas diagnósticas. Com o avanço da Inteligência Artificial, especialmente das Redes Neurais Convolucionais (Convolutional Neural Networks – CNNs), tornou-se possível automatizar e otimizar tarefas de classificação de imagens biomédicas. A aplicação dessas técnicas possibilita categorizações mais rápidas e consistentes, garantindo maior precisão e menor tempo de resposta nos exames laboratoriais. Nesse contexto, este projeto desenvolveu um sistema de detecção de ovos de oito tipos de parasitas: Ancylostoma, Ascaris lumbricoides, Enterobius vermicularis, Fasciola hepatica, Hymenolepis, Schistosoma, Taenia e Trichuris trichiura, utilizando o algoritmo YOLO. Para isso, foi criada uma base de dados manualmente a partir de imagens obtidas na internet. Antes do treinamento, aplicaram-se técnicas de pré-processamento como contrast stretching, greyscale, auto-orient, tile, resize e data augmentation. Essas etapas ampliaram a base original de 2.104 para 5.453 imagens, permitindo maior robustez do modelo. Diferentes combinações de pré-processamento foram testadas, e o modelo final alcançou resultados expressivos: precisão de 96,6%, recall de 94,5% e mAP de 98,6%. Os resultados demonstram que o sistema atende às expectativas para uma versão inicial, mostrando potencial para reduzir o tempo de análise e a taxa de erros em diagnósticos laboratoriais. Espera-se que essa solução contribua significativamente para apoiar profissionais da saúde em exames parasitológicos, oferecendo diagnósticos mais ágeis e confiáveis.
Palavras-chave: Detecção de Objetos. Parasitas. Processamento de Imagens. Redes Neurais Convolucionais. Inteligência Artificial.
1. INTRODUÇÃO
As mudanças provocadas pela globalização decorrentes do avanço tecnológico exigem cada vez mais que o ser humano esteja bem apropriado da linguagem e das ferramentas da cultura digital. Esse avanço permitiu a criação e o desenvolvimento de técnicas computacionais capazes de realizar tarefas nunca imaginadas pelos primeiros engenheiros e cientistas da computação.
Nos últimos anos, a Visão Computacional tem demonstrado ser uma grande aliada nesse progresso. Trata-se de um ramo interdisciplinar da Ciência “que busca fornecer a percepção visual humana (detecção de objetos, contagem, noção de diferentes dimensões) para que computadores possam interpretar imagens e vídeos” (SOUZA e RUHOFF, 2020, p. 155). Sua utilização foi fundamental na evolução de todas as áreas do conhecimento, especialmente a Saúde. Com as novas técnicas de Inteligência Artificial (IA), os métodos de diagnóstico e tratamento de doenças têm se tornado cada vez mais eficazes (BRAGA, et al., 2019, p. 16408).
Com isso, é importante refletir acerca do uso em potencial dessas ferramentas como auxílio ao diagnóstico clínico e laboratorial, buscando reduzir ao máximo suas limitações para que sejam incorporadas como uma etapa fundamental desse processo. Nesse contexto, Santos et al. (2019, p. 388), afirmam que:
“Sistemas computadorizados de auxílio diagnóstico vêm sendo desenvolvidos com o objetivo de melhorar a acurácia dos exames, a consistência na interpretação de imagens médicas, a avaliação prognóstica e o suporte à decisão terapêutica. Essas ferramentas possuem potencial enorme, porém, há ainda limitações para seu uso na rotina clínica. Com o advento da inteligência artificial e do big data, caminhamos para a redução dessas limitações, homogeneização e expansão do uso dessas ferramentas no dia-a-dia dos médicos, tornando cada paciente único, levando a radiologia ao encontro do conceito de abordagem multidisciplinar e medicina de precisão”.
Nessa perspectiva, Santos assevera a relevância do uso de sistemas computacionais associados à técnicas de IA para fins médicos, uma vez que os algoritmos de reconhecimento visual evoluíram o suficiente para se tornarem artefatos poderosos de apoio aos profissionais da saúde.
O diagnóstico de grande parte das doenças causadas por parasitas ainda é realizado por meio de técnicas de microscopia óptica, que podem exigir muito tempo, recursos e uma alta qualificação profissional. Utilizar técnicas de IA para automatizar essas tarefas pode ser um fator fundamental no aperfeiçoamento dos métodos de diagnóstico clínico e laboratorial, auxiliando no trabalho dos profissionais da área.
Muitos sistemas que utilizam essas técnicas vêm sendo desenvolvidos, porém ao analisar o seu desempenho, precisão e acessibilidade, torna-se perceptível a necessidade de um refinamento nos modelos implementados, considerando diferentes métodos para realizar o treinamento. Com isso em mente, o trabalho desenvolvido neste projeto evidenciou, antes de tudo, solucionar o seguinte questionamento:
Como desenvolver um ambiente capaz de realizar análises laboratoriais de vários espécimes de parasitas em tempo real, de forma eficiente e acessível?
Considerando as dificuldades encontradas durante o processo de diagnóstico de doenças parasitárias, é importante analisar todos os recursos e tecnologias disponíveis no mercado atualmente, que são de fácil acesso.
Além de não ser uma tarefa relativamente simples, a análise de imagens laboratoriais pode ser bastante cara e demorada (NOGUEIRA, 2011, p. 11). A falta de profissionais devidamente capacitados ainda é um dos grandes problemas encontrados em laboratórios de diagnóstico médico no mundo todo (PEREIRA, 2018, p. 4). São poucos os equipamentos disponíveis no mercado que realizam um diagnóstico dessas doenças de maneira rápida e precisa (CHIELLE et al., 2020, p. 148). Porém, com as novas técnicas de IA, temos um leque de possibilidades que nos permitem atingir melhores resultados em relação à localização e previsão desses objetos.
Dessa forma, este projeto propõe a criação de um ambiente de detecção automática de ovos de vários espécimes de parasitas diferentes, de maneira simples e de baixo custo, com o propósito de auxiliar os profissionais devidamente capacitados em práticas de diagnóstico clínico e laboratorial.
O objetivo geral deste trabalho é desenvolver um sistema capaz de processar, tratar e analisar imagens laboratoriais microscópicas de amostras contaminadas, de modo a detectar a presença de ovos dos parasitas Ancylostoma, Ascaris lumbricoides, Enterobius vermicularis, Fasciola hepatica, Hymenolepis, Schistosoma, Taenia e Trichuris trichiura. Para isso, será treinado um modelo de detecção de objetos que atuará como ferramenta de suporte ao diagnóstico de doenças parasitárias por meio de técnicas de Inteligência Artificial.
De forma mais específica, busca-se fornecer um ambiente capaz de localizar e classificar em tempo real as oito espécies de parasitas simultaneamente, contribuindo também para o desenvolvimento de novos equipamentos de diagnóstico médico mais acessíveis e eficientes. Pretende-se ainda construir uma base de dados diversificada de espécimes que sirva como suporte à prevenção e ao tratamento de diferentes doenças e condições parasitológicas. Além disso, será avaliada a eficácia da aplicação de técnicas de IA, em especial das Redes Neurais Convolucionais (RNC), no diagnóstico clínico e laboratorial, considerando seu potencial de melhorar a precisão e a agilidade na detecção de parasitas.
2. FUNDAMENTAÇÃO TEÓRICA
2.1 APRENDIZADO DE MÁQUINA
O Aprendizado de Máquina (AM), do inglês Machine Learning, é um ramo da Inteligência Artificial (IA) que vem ganhando destaque nas últimas décadas por possibilitar que sistemas computacionais aprendam a partir de dados e experiências. Em vez de depender de modelos matemáticos rigidamente definidos, o AM identifica padrões e gera soluções por meio da análise de grandes volumes de informações (STEINHEISER, 2020, p. 16).
Os algoritmos de AM podem ser classificados em quatro categorias principais: aprendizado supervisionado, não supervisionado, semi-supervisionado e por reforço. No aprendizado supervisionado, foco deste trabalho, os algoritmos relacionam entradas com saídas conhecidas por meio de rótulos previamente definidos. Esses rótulos podem representar problemas de classificação, quando os valores são discretos, ou de regressão, quando os valores são contínuos (GÉRON, 2019, p. 8-9). O modelo aprende padrões a partir do conjunto de treinamento e, com base nisso, é capaz de realizar previsões para novos dados.
Essa abordagem é amplamente utilizada em problemas que envolvem análise e processamento de imagens, já que a identificação de padrões visuais exige algoritmos capazes de lidar com grande complexidade de informações e elevado poder computacional.
2.2 APRENDIZADO PROFUNDO
O Aprendizado Profundo (Deep Learning – DL) é uma subárea do Aprendizado de Máquina que tem como objetivo desenvolver algoritmos inspirados na forma como os seres humanos adquirem conhecimento (BURNS, 2021). Segundo LeCun et al. (2015), os métodos de aprendizado profundo permitem que máquinas sejam alimentadas com dados brutos e realizem tarefas de classificação e detecção a partir de múltiplos níveis de abstração. A cada camada da rede, novas representações dos dados são aprendidas, resultando em modelos capazes de extrair características complexas e de difícil percepção humana.
Diferentemente dos algoritmos de AM tradicionais, que dependem de um pré processamento extenso e de dados já estruturados, o DL consegue extrair automaticamente as características mais relevantes dos dados de entrada. Essa capacidade elimina grande parte da necessidade de manipulação externa, embora exija grandes volumes de dados e alto poder de processamento para atingir bons níveis de precisão.
2.3 REDES NEURAIS ARTIFICIAIS
As Redes Neurais Artificiais (RNAs) representam a base do Aprendizado Profundo, simulando o comportamento dos neurônios biológicos por meio de conexões artificiais chamadas de sinapses (STEINHEISER, 2020, p. 18). Cada neurônio artificial recebe entradas ponderadas, realiza um somatório desses valores e aplica uma função de ativação, que determina a saída gerada pelo modelo.
A transmissão de informações entre neurônios artificiais ocorre em camadas sucessivas, formando arquiteturas capazes de aprender padrões complexos. A estrutura dessas redes pode variar conforme a necessidade da aplicação, permitindo a construção de modelos mais simples ou altamente sofisticados.
Um marco importante na evolução das RNAs foi o trabalho de Yann LeCun, em 1998, ao desenvolver um reconhecedor de dígitos manuscritos utilizando backpropagation em uma rede feedforward com múltiplas camadas ocultas. Essa arquitetura ficou conhecida como Rede Neural Convolucional (RNC) e estabeleceu a base para muitos dos avanços atuais em processamento e análise de imagens (DATA SCIENCE ACADEMY, 2022).
2.4 REDES NEURAIS CONVOLUCIONAIS
As Redes Neurais Convolucionais (RNCs) surgiram como uma evolução das Redes Neurais Artificiais, com arquitetura voltada especialmente para o processamento de imagens digitais (PASSOS, 2021). Essas redes são capazes de captar informações relevantes de uma imagem fornecida como entrada, atribuindo importâncias diferentes a aspectos e objetos identificados. A grande vantagem é que as RNCs demandam menos pré-processamento em comparação a outros algoritmos de classificação de imagens, pois conseguem extrair automaticamente as características visuais mais significativas (GOODFELLOW; BENGIO; COURVILLE, 2016).
A estrutura básica de uma RNC é composta por três tipos principais de camadas. A camada convolucional é responsável por aplicar filtros ou kernels, que percorrem a imagem para mapear padrões locais e gerar mapas de características (KONE, 2019). Em seguida, a camada de pooling reduz a dimensionalidade desses mapas, agregando informações em valores representativos e diminuindo a necessidade de processamento computacional (DIAS, 2019, p. 30). Finalmente, a camada totalmente conectada organiza os dados extraídos e realiza o processo de classificação (STEINHEISER, 2020, p. 21).
As RNCs simulam a capacidade cognitiva humana de reconhecer padrões visuais e têm sido amplamente aplicadas em tarefas como identificação de rostos, reconhecimento de indivíduos e detecção de objetos em geral. Essa capacidade faz com que estejam entre as técnicas mais relevantes para a Visão Computacional e para aplicações biomédicas que demandam alto grau de precisão.
2.5 VISÃO COMPUTACIONAL
A Visão Computacional é um campo da Ciência da Computação que integra o processamento digital de imagens com a Inteligência Artificial, com o objetivo de interpretar imagens digitais e replicar determinadas funções da visão humana (NEVES; NETO; GONZAGA, 2012). Esse campo tornou-se central em aplicações contemporâneas, permitindo a distinção, classificação e agrupamento de imagens com base em padrões definidos.
No contexto biomédico, a Visão Computacional tem contribuído para diagnósticos mais rápidos e precisos, uma vez que possibilita a automatização da análise de amostras microscópicas, reduzindo o tempo e a taxa de erros associados à interpretação exclusivamente humana.
2.6 DETECÇÃO DE OBJETOS
A detecção de objetos é um dos principais desafios da Visão Computacional. Enquanto a classificação de imagens apenas identifica a categoria a que uma imagem pertence, a detecção busca localizar e categorizar entidades específicas dentro da própria imagem. Esse processo ocorre por meio da definição de caixas delimitadoras, conhecidas como bounding boxes, que envolvem os objetos de interesse e associam medidas de confiança à previsão realizada pelo modelo (SILVA, 2018, p. 42).
O desempenho da detecção depende da qualidade do conjunto de dados utilizado no treinamento, o que inclui imagens rotuladas com precisão. Durante a fase de aprendizado, o modelo aprende a relacionar regiões da imagem com as classes definidas, estabelecendo parâmetros capazes de identificar novos exemplos de maneira confiável. Essa técnica é especialmente importante em aplicações biomédicas, onde a correta identificação de microrganismos ou parasitas pode impactar diretamente em diagnósticos clínicos.
2.7 YOLO
Entre os algoritmos de detecção de objetos mais relevantes destaca-se o YOLO (You Only Look Once). Proposto por Redmon et al. (2016), ele revolucionou a área ao propor que a detecção fosse tratada como um problema de regressão. Diferentemente de abordagens anteriores, que analisavam a imagem em múltiplas passagens, o YOLO processa a imagem em uma única vez, o que possibilita maior velocidade e torna sua aplicação viável em tempo real.
O funcionamento do YOLO baseia-se na divisão da imagem em uma grade SxS, na qual cada célula é responsável por prever caixas delimitadoras, coordenadas (x, y, largura e altura), além de uma medida de confiança sobre a presença de um objeto naquela região (KARIMI, 2021). Esse processo é acompanhado da estimativa da probabilidade de cada classe, tornando possível identificar não apenas a localização, mas também a categoria do objeto encontrado.
O algoritmo se consolidou por apresentar alto nível de precisão aliado a baixo tempo de processamento, sendo amplamente aplicado em sistemas biomédicos, vigilância, veículos autônomos e diagnósticos assistidos por inteligência artificial.
2.8 PARASITOSES
As parasitoses são infecções causadas por organismos parasitas que representam um problema relevante de saúde pública no Brasil, em grande parte associado ao saneamento básico deficiente e às condições de vulnerabilidade social (KASVI, 2019). O parasitismo caracteriza-se por uma relação unilateral em que o parasita se beneficia do hospedeiro, utilizando-o para manter suas funções vitais, crescer e se reproduzir.
Apesar da grande diversidade de espécies parasitárias catalogadas, apenas algumas são capazes de infectar seres humanos. De forma geral, esses organismos são classificados em três grupos: protozoários, helmintos e ectoparasitas (artrópodes). O presente trabalho concentra-se nos helmintos, por sua relevância clínica e pela importância de suas formas diagnósticas.
2.8.1 Helmintos
Os helmintos são organismos multicelulares, muitas vezes visíveis a olho nu, que podem viver de forma livre ou parasitária. São divididos em três grandes subgrupos: platelmintos, nematelmintos e anelídeos (MUÑOZ; FERNANDES, 2013).
Entre os platelmintos, destacam-se os cestódeos, organismos hermafroditas sem aparelho digestivo, como Taenia saginata, Taenia solium, Hymenolepis nana e Hymenolepis diminuta (TRAVASSOS, 1950, p. 125). Outro grupo importante são os trematódeos, de corpo achatado, dotados de ventosas de fixação, como Schistosoma mansoni e Fasciola hepática (TRAVASSOS, 1950, p. 86).
Os nematelmintos, por sua vez, apresentam corpo cilíndrico, simetria bilateral, extremidades afiladas e dimorfismo sexual. Aproximadamente 50 espécies desse grupo estabelecem parasitismo em humanos (MAGALHÃES, 2019), incluindo Ascaris lumbricoides, Trichuris trichiura, Enterobius vermicularis e Ancylostoma. Os anelídeos, embora incluam minhocas e sanguessugas, têm menor importância parasitológica humana (SANTOS, 2020).
No contexto deste trabalho, foram selecionados oito helmintos de relevância clínica e epidemiológica: Ancylostoma, Ascaris lumbricoides, Enterobius vermicularis, Fasciola hepatica, Hymenolepis (nana e diminuta), Schistosoma mansoni, Taenia (saginata e solium) e Trichuris trichiura. A identificação dessas espécies é tradicionalmente realizada pela análise morfológica de seus ovos em amostras fecais, considerando aspectos como forma, tamanho, espessura da casca e estruturas específicas, que são fundamentais para diferenciar as espécies.
Essas características, além de determinantes no diagnóstico laboratorial convencional, também foram essenciais no processo de treinamento do modelo de detecção automática, uma vez que permitiram à rede neural convolucional aprender padrões visuais capazes de distinguir corretamente cada parasita, influenciando diretamente o desempenho final do sistema.
2.9 TRABALHOS RELACIONADOS
O uso de técnicas de Visão Computacional como suporte ao diagnóstico em saúde tem crescido significativamente nos últimos anos. A detecção de objetos em imagens biomédicas é um campo relativamente recente, que ganhou força na última década com o avanço das arquiteturas de aprendizado profundo. Diversos estudos demonstram que algoritmos de Inteligência Artificial podem apoiar o trabalho de profissionais de saúde, reduzindo tempo de análise e aumentando a precisão diagnóstica.
Na área de parasitologia, pesquisas vêm explorando o uso de redes neurais convolucionais e algoritmos de detecção de objetos para identificar parasitas em amostras laboratoriais. Zhang et al. (2021) destacam que, embora ainda em estágio inicial, a aplicação do aprendizado profundo em microbiologia tem grande potencial para superar os limites da análise manual de microscopia, ampliando a detecção de vírus, bactérias, fungos e parasitas.
Entre os trabalhos já desenvolvidos, Chielle (2020) propôs um sistema baseado em duas redes neurais para diagnosticar ovos de seis espécies de parasitas, obtendo bons índices de sensibilidade e especificidade. Tallam et al. (2021) aplicaram redes neurais convolucionais para identificação de caracóis e esquistossomos, atingindo 99% de precisão para hospedeiros e 91% para parasitas, demonstrando o potencial da técnica para auxiliar diagnósticos clínicos.
Oliveira (2019) desenvolveu um modelo utilizando YOLO para detectar ovos de Schistosoma mansoni, alcançando precisão de 68,42% e sensibilidade de 86,6%, embora limitado pela pequena quantidade de imagens no conjunto de testes. Já Shi et al. (2021) construíram um modelo de detecção de Oncomelania hupensis, hospedeiro intermediário do esquistossomo japonicum, utilizando 2.614 imagens. Com a estratégia de aprendizagem por transferência e técnicas de aumento de dados, obtiveram 90% de precisão e 97,5% de acurácia.
Apesar dos avanços, a maioria dos trabalhos analisados foca na detecção de uma única espécie ou de poucas classes, exigindo que uma mesma amostra seja processada por diferentes modelos. Diante disso, este projeto propõe uma abordagem mais abrangente, capaz de detectar simultaneamente oito classes de parasitas distintos em um único sistema, buscando aliar precisão, rapidez e aplicabilidade prática em ambientes laboratoriais.
3. METODOLOGIA
O presente estudo representa o resultado de uma pesquisa explicativa de caráter teórico e experimental, utilizando uma abordagem quanti qualitativa (também conhecida como triangulação), oportunizando a busca de informações sobre a importância do uso de algoritmos de IA como suporte ao diagnóstico clínico de doenças parasitárias. A pesquisa propõe o desenvolvimento de um sistema de detecção de ovos de parasitas em amostras contaminadas utilizando técnicas de Deep Learning.
Realizar uma pesquisa do tipo exploratória permite uma maior proximidade com o universo em que o objeto de estudo está inserido, mesmo que não tenha muito conhecimento sobre o tema. Com isso, o pesquisador pode avaliar e selecionar as técnicas que melhor se enquadram no seu objetivo, por meio de levantamento bibliográfico ou quaisquer meios que auxiliem na compreensão do tema (GIL, 2002, p. 41).
3.1 BASE DE IMAGENS
Considerando que o objetivo geral do trabalho era implementar um sistema capaz de diagnosticar doenças a partir da detecção de objetos muito específicos, foi praticamente impossível encontrar uma base de dados grande o suficiente para abranger todos os espécimes explorados. Por isso, para realizar o treinamento do modelo foi necessário, antes de tudo, construir uma base de dados manual, reunindo imagens de vários repositórios da internet, por meio da ferramenta Download All Images (v.3.1), que possibilitou a captura de um total de 2104 imagens.
As imagens foram armazenadas e rotuladas autonomamente, utilizando a ferramenta Roboflow Annotate, referenciando as 8 classes de parasitas estudadas: Ancylostoma, Ascaris lumbricoides, Enterobius vermicularis, Fasciola hepatica, Hymenolepis, Schistosoma, Taenia e Trichuris trichiura. A ferramenta também conta com um recurso para reduzir o trabalho e o tempo de rotulação, utilizando modelos pré-treinados, porém, por se tratar de objetos muito específicos, foi necessário desenhar as caixas delimitadoras para todas as imagens da base. Nessa etapa foi crucial fazer um estudo mais aprofundado sobre os espécimes, já que conseguir diferenciar cada um dos parasitas foi fundamental para que o modelo realizasse uma classificação correta.
3.2 PRÉ-PROCESSAMENTO
Após a rotulação foi necessário realizar um pré-processamento sobre todas as imagens da base, a fim de melhorar o desempenho final do modelo. Nessa etapa foram executadas quatro técnicas básicas: redimensionamento, habilitação de orientação automática, alteração na escala de cinza, ajuste de contraste e ladrilhamento.
Por padrão, o YOLOv5 realiza o treinamento dos modelos considerando que as imagens utilizadas nessa etapa apresentam dimensões de 640×640, por isso, antes de enviá-las à rede é recomendado que todas passem por esse processo de redimensionamento. Antes de fazer isso, foi importante averiguar se as imagens apresentavam dimensões de altura e largura iguais, considerando que ao redimensioná-las é necessário definir uma característica que mantenham o seu propósito de forma que se adequem à conversão de tamanho. Assim o redimensionamento foi realizado mantendo a proporção das imagens, já que para nesse caso específico, foi a característica que mais se adequou ao padrão de pixels das imagens.
Para evitar problemas quanto à forma como os pixels estavam distribuídos nas imagens da base, foi necessário habilitar as configurações de orientação automática utilizando uma propriedade nativa do Roboflow, a fim de evitar ocorrências em que o modelo poderia capturar informações sobre as imagens de maneira incorreta. Com isso, garantimos que as características das imagens fossem passadas para o modelo no mesmo formato, onde caso o contrário, poderia impactar diretamente no resultado final do trabalho.
Utilizar imagens no formato RGB, na maioria das vezes, faz com que a rede neural leve muito tempo para executar suas operações de convolução. Diminuir a complexidade desses cálculos pode ser uma ótima opção para implementar modelos de detecção com um custo computacional muito menor. Por isso que em vários casos, alterar a escala de cinza das imagens pode ser uma grande aliada durante a fase de treinamento do modelo. Com isso em mente, aplicar essa técnica durante o pré-processamento foi fundamental para garantir um bom desempenho dos modelos treinados com bases de dados muito grandes, considerando que essa tarefa normalmente demoraria muito tempo para ser executada.
Ao analisar o conjunto de dados utilizado no projeto é perceptível que grande parte das imagens apresentam uma característica de baixo contraste. Por isso, foi importante considerar a utilização de alguma técnica que modificasse essa propriedade, garantindo uma melhor visualização das imagens pela própria rede, considerando que o modelo poderia ter dificuldades em localizar determinados espécimes, como também poderia considerar alguns desses ruídos como objetos a serem classificados.
Detectar a ocorrência de pequenos objetos em imagens é um dos problemas mais desafiadores do Processamento Digital de Imagens. Muitas técnicas foram desenvolvidas para tentar contornar as situações em que há a necessidade de se trabalhar com imagens que apresentam essas características específicas. Nesses casos, uma tática muito interessante é dividir as imagens em pequenas partes e colocá-las lado a lado em um processo chamado de ladrilhamento. Essa técnica amplia o detector do modelo em pequenos objetos, permitindo manter uma pequena resolução de entrada necessária para poder executar inferências rápidas.
3.3 TREINAMENTO
O trabalho foi desenvolvido na linguagem de programação Python 3.8, com o auxílio das estruturas PyTorch e YOLOv5, utilizando os pesos pré-treinados dos modelos da COCO. O treinamento foi realizado em cinco experimentos (Quadro 2), objetivando analisar a utilização de métodos de ampliação da base de dados associadas a diferentes técnicas de pré processamento. Em todos os experimentos, essa etapa foi executada considerando um batch size de 16 em um total de 300 épocas, utilizando os hiperparâmetros padrão do YOLO (Tabela 1) no ambiente Google Colaboratory. Para a visualização dos resultados e o tratamento das imagens submetidas no ambiente, foi utilizada a biblioteca OpenCV.
Tabela 1: Hiperparâmetros default para treinamento COCO a partir do zero.

Apesar de o YOLO apresentar uma alta precisão em relação à localização e classificação dos objetos, existem outros modelos que executam essa tarefa de maneira mais eficiente, porém quando consideramos que a análise das amostras pode ser realizada por meio de uma aplicação em tempo real, a utilização dessa técnica acaba se mostrando superior quando comparamos o seu desempenho com o desses modelos.
Nos experimentos que utilizaram a técnica de Data Augmentation, foi necessário aplicar métodos de transformação linear nas imagens para gerar novas instâncias a partir do conjunto de dados original. Para isso, foram adotadas as técnicas de ajuste de saturação, buscando alcançar uma melhor visibilidade dos objetos para o treinamento da rede, uma operação de desfoque para diminuir as distorções geradas durante a captura das amostras, o método de recorte, para auxiliar o modelo a reconhecer objetos parciais ou ocultos nas imagens e uma variação de brilho.
Para construir o modelo, o conjunto de dados foi dividido de forma que 75% das imagens foram separadas para o treinamento, 20% para validação e 5% para teste. As imagens foram selecionadas mantendo a mesma proporção em cada classe para o conjunto de treinamento e como consequência, as classes dos conjuntos de validação e teste ficaram desbalanceadas, sendo distribuídas nas seguintes proporções: Ancylostoma (12,5%), Ascaris Lumbricoides (15,2%), Enterobius Vermicularis (9,5%), Fasciola Hepatica (11,4%), Hymenolepis (13,2%), Schistosoma (14,2%), Taenia (11,9%) e Trichuris Trichiura (12,1%).
3.4 EXPERIMENTOS
Os experimentos foram executados buscando avaliar os impactos que o pré processamento tem no desempenho do modelo. Para isso, foram realizados vários testes, modificando a estrutura das imagens passadas para a rede neural, associadas ao tamanho da base de imagens, após a aplicação do Data Augmentation.
Quadro 1: Execução dos cinco experimentos utilizando diferentes técnicas de pré-processamento.

Após cada execução foi possível verificar como a seleção das técnicas mais adequadas é fundamental para definir a eficiência do modelo. Para tanto, foi importante considerar essa análise utilizando diferentes métricas de avaliação, buscando averiguar se o sistema desenvolvido conseguiu atender às exigências da proposta, se adaptando corretamente ao tipo de problema a ser solucionado.
4. RESULTADOS E DISCUSSÕES
Analisando os resultados dos experimentos, é perceptível que a aplicação da técnica de Data Augmentation contribuiu diretamente para uma melhoria no desempenho dos modelos. Com exceção do modelo desenvolvido no Experimento D, todos conseguiram atingir valores de precisão acima de 75%. Selecionar um modelo dentre os cinco foi fundamental para definir corretamente a estrutura e o funcionamento do sistema. Para isso, foi necessário observar o desempenho de cada um considerando os seus valores de precisão, sensibilidade e mAP retratados na tabela abaixo:
Tabela 2: Métricas de avaliação dos modelos implementados em cada experimento.

Para cada modelo há dois valores diferentes de mAP. O primeiro é calculado quando a métrica IOU de cada modelo é definida com valor máximo de 0,5, enquanto o segundo é calculado utilizando diferentes limiares de IOU, que variam no intervalo de 0,5 à 0,95. De acordo com a tabela, podemos verificar que o modelo desenvolvido no Experimento D obteve um valor de precisão menor que 60%, devido principalmente à baixa resolução das imagens utilizadas no treinamento da rede, ocasionada pelo redimensionamento executado durante a aplicação da técnica de isolar objetos (Figura 28).
Figura 28: Base de dados utilizada nos treinamentos do pior modelo.

Utilizar a técnica de isolar objetos pode ser uma opção em situações onde o objetivo do trabalho é somente classificar corretamente os objetos encontrados nas imagens, sem dar tanta importância à sua localização em si. Nesses casos, a sua aplicação nos dados de treinamento pode ser fundamental para o desenvolvimento de um modelo de alta precisão. Porém, considerando que na análise de amostras clínicas é muito comum encontrarmos mais de uma espécie de organismos ao mesmo tempo em uma única amostra (coinfecção), essa aplicação acaba não sendo viável.
Nas Figuras 29 e 30 podemos observar o funcionamento do sistema utilizando o modelo desenvolvido no Experimento D. No primeiro caso, o sistema recebeu como entrada uma imagem contendo vários ovos de espécimes diferentes, de forma que só conseguiu detectar corretamente a ocorrência de um ovo de Fasciola hepática, com um nível de confiança de 38%. No segundo caso, a mesma imagem ampliada foi passada para o modelo, isolando um único objeto: ovo de Hymenolepis, onde o sistema conseguiu detectar corretamente a sua ocorrência com 97% de confiança.
Figuras 29 e 30: Testes executados utilizando o pior modelo.

É perceptível que o modelo desenvolvido no Experimento E conseguiu atingir valores de precisão (96,6%), sensibilidade (94,5%) e mAP (98,6%), que podem estar associados, principalmente, à aplicação da técnica de Data Augmentation vinculada ao ajuste dos níveis de saturação e iluminação das imagens utilizadas no treinamento do modelo.
Para confirmar essa hipótese, a mesma imagem utilizada no exemplo anterior foi reenviada ao sistema para ser analisada pelo modelo implementado neste experimento (Figura 31), que conseguiu detectar corretamente todas as ocorrências de objetos da imagem.
Figura 31: Teste executado utilizando o melhor modelo.

Com isso, vale ressaltar que a execução dos cinco experimentos confirmam a importância da etapa de pré-processamento no desempenho final do modelo, considerando que a aplicação de diversas técnicas resultou em modelos com diferentes performances, dos quais o Experimento E mostrou ser mais eficiente, atingindo valores acima de 90% para todas as métricas avaliadas.
5. CONSIDERAÇÕES FINAIS
O uso de sistemas computacionais associados à Inteligência Artificial pode se tornar uma peça chave no progresso do diagnóstico clínico e laboratorial. Atualmente, é difícil falar sobre a evolução científica sem que a tecnologia esteja associada a esse processo. A aplicação da tecnologia em exames de diagnóstico por imagem tem demonstrado ser um grande aliado nesse segmento, considerando o seu desempenho, principalmente quando associado ao trabalho de um profissional capacitado. Portanto, neste trabalho foi proposto o desenvolvimento de um sistema que utiliza técnicas de Deep Learning para processar, tratar e analisar imagens laboratoriais microscópicas, de forma a diagnosticar a possível ocorrência de parasitas. O sistema conseguiu alcançar uma precisão de 96,6%, recall de 94,5% e mAP de 98,6%.
Analisando os resultados podemos ver com clareza que o modelo desenvolvido conseguiu atender às expectativas do projeto, principalmente quando comparamos o seu desempenho com o de outros sistemas já implementados. A utilização das técnicas de redimensionamento, aumento de contraste e Data Augmentation foi fundamental nesse processo.
Construir a base de dados foi a tarefa mais desafiadora e demorada do projeto. Ao desenvolver um sistema de detecção de objetos, é importante ter certeza de que as imagens utilizadas na fase de treinamento estão associadas a seus verdadeiros rótulos, por isso o mais indicado é utilizar bases já avaliadas por especialistas no assunto. Porém, por se tratar de um tema que apresenta objetos bastante específicos, não foi possível encontrar uma única base que se adequasse às necessidades da proposta.
Considerando que o sistema ainda está em um estágio inicial, não podemos avaliar sua eficácia em situações reais, por isso o intuito deste trabalho foi descobrir a viabilidade do uso de sistemas computacionais automatizados como suporte ao diagnóstico médico, a partir de uma simples implementação.
5.1 TRABALHOS FUTUROS
Neste trabalho, vários fatores foram estudados e analisados de forma breve e sucinta, por isso, é interessante considerar uma investigação mais detalhada acerca dos métodos utilizados no treinamento dos modelos, propondo a aplicação de novas arquiteturas e variando os seus hiperparâmetros, para tentar aperfeiçoar ainda mais o seu desempenho.
Adquirir novos dados é uma opção de implementação para aumentar a capacidade de diagnóstico do sistema, levando em conta a ampliação da quantidade de classes analisadas, para que o modelo consiga abranger uma maior diversidade de espécies de parasitas. Um bom exemplo de aplicação seria implementar funções para analisar as imagens e realizar a contagem das ocorrências dos espécimes nas amostras, considerando que essa tarefa ainda pode ser realizada manualmente por profissionais da área, sem o auxílio de nenhuma ferramenta automatizada, o que muitas vezes acaba sendo um trabalho cansativo e suscetível a erros.
REFERÊNCIAS
ALVES, G. Detecção de Objetos com YOLO – Uma abordagem moderna. IA Expert Academy. 2020. Disponível em: <https://iaexpert.academy/2020/10/13/deteccao-de-objetos com-yolo-uma-abordagem-moderna/>. Acesso em: 01 de Junho de 2022.
ASAE. Ascaris Lumbricoides. Escola Superior de Biotecnologia. Universidade Católica Portuguesa. 2016. Disponível em: <https://www.asae.gov.pt/seguranca-alimentar/riscos – biologicos/ascaris.aspx>. Acesso em: 06 de Junho de 2022.
Atlas Virtual de Parasitologia. Ancilostomídeo. MIP. UFF. 2016. Disponível em: <atlasparasitologia.sites.uff.br/?cat=11>. Acesso em: 07 de Junho de 2022.
Atlas Virtual de Parasitologia. Ascaris Lumbricoides. MIP. UFF. 2016. Disponível em: <atlasparasitologia.sites.uff.br/?cat=17>. Acesso em: 07 de Junho de 2022.
Atlas Virtual de Parasitologia. Enterobius Vermicularis. MIP. UFF. 2016. Disponível em: <http://atlasparasitologia.sites.uff.br/?p=275>. Acesso em: 07 de Junho de 2022.
BILIK, S. et al. Visual Diagnosis of the Varroa Destructor Parasitic Mite in Honeybees Using Object Detector Techniques. vol. 21. Basel, Switzerland. 2021.
BRAGA, A. V. et al. Machine learning: O Uso da Inteligência Artificial na Medicina. Braz. J. of Develop. Curitiba. vol. 5. n. 9. p. 16407-16413. 2019.
BURNS, E. O que é Deep Learning e como funciona?. TechTarget. 2021. Disponível em: <https://www.techtarget.com/searchenterpriseai/definition/deep-learning-deep-neuralnetwork#:~:text=Deep%20learning%20is%20a%20type,includes%20statistics%20and%20predictive%20modeling.>. Acesso em: 09 de Junho de 2022.
BUTPLOY, N. KANARKARD, W. INTAPAN, P. M. Deep Learning Approach for Ascaris lumbricoides Parasite Egg Classification. Journal of Parasitology Research. 2021. Disponível em: <https://pubmed.ncbi.nlm.nih.gov/33996149/>. Acesso em: 10 de Junho de 2022.
CÂMARA, B. Ascaris Lumbricoides. Biomedicina Padrão. 2015. Disponível em: <https://www.biomedicinapadrao.com.br/2013/12/ascarislumbricoides.html#:~:text=São%20grandes%2C%20com%20cerca%20de,uterina%20e%20formada%20por%20mucopolissacarídeos.&text=Fêmeas%20medem%20de%2020%20a,a%20t er%20uma%20cauda%20curvada>. Acesso em: 11 de Junho de 2022.
CAXIAS, M. Fasciolose humana (Fasciola hepatica): ciclo, sintomas, tratamento, transmissão e prevenção. IBAP. 2021. Disponível em: <https://ibapcursos.com.br/fasciolose humana-fasciola-hepatica>. Acesso em: 11 de Junho de 2022.
Centers of Disease Control and Prevention. Trichuriasis. DPDx. 2017. Disponível em: <https://www.cdc.gov/dpdx/trichuriasis/index.html#:~:text=trichiura%20eggs.,unembryonated%20when%20passed%20in%20stool.>. Acesso em: 11 de Junho de 2022.
CHIELLE, E. O. Desenvolvimento de sistema estruturado com inteligência artificial para apoio no diagnóstico de parasitoses intestinais. Clinical and Biomedical Research, Santa Catarina. v. 40, n. 3. 2020. p. 148-153.
CLARO, M. et al. Utilização de Técnicas de Data Augmentation em Imagens: Teoria e Prática. Livro de Minicursos ERCEMAPI. 2020. Disponível em: <https://sol.sbc.org.br/livros/index.php/sbc/catalog/download/48/217/455-1?inline=1>. Acesso em: 13 de Junho de 2022.
Classificação dos Platelmintos. Só Biologia. Virtuous Tecnologia da Informação, 2008- 2022. Disponível em: <https://www.sobiologia.com.br/conteudos/Reinos2/bioplatelmintos2.php>. Acesso em: 09 de Junho de 2022.
CRÓSTA, A. P. Processamento digital de imagens de sensoriamento remoto. – ed. rev. – Campinas, SP: IG/UNICAMP. 1992. p. 39-40.
Data Science Academy. Deep Learning Book. 2022. Disponível em: <https://www.deeplearningbook.com.br/>. Acesso em: 10 de Junho de 2022.
DIAS, C. A. Fusion functions inspired on the Choquet integral in the pooling layer of Deep Learning Networks. Rio Grande do Norte. 2019. p. 30.
DWYER, B. Quando devo orientar automaticamente minhas imagens?. Roboflow. 2020. Disponível em: <https://blog.roboflow.com/exif-auto-orientation/>. Acesso em: 15 de Junho de 2022.
GANDHI, A. Data Augmentation | How to use Deep Learning when you have Limited Data — Part 2. Nanonets. 2021. Disponível em: <https://nanonets.com/blog/data augmentation-how-to-use-deep-learning-when-you-have-limited-data-part-2/>. Acesso em: 15 de Junho de 2022.
GIL, A. C. Como elaborar projetos de pesquisa. 4ª ed. São Paulo: Atlas S/A. 2002. p. 41.
GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A. Deep Learning. MIT Press: 2016.
HOLMSTRÖM, O. et al. Point-of-care mobile digital microscopy and deep learning for the detection of soil-transmitted helminths and Schistosoma haematobium. Global health action. 2017. p. 49-57.
HUI, J. mAP (mean Average Precision) for Object Detection. Medium. 2018. Disponível em: <https://jonathan-hui.medium.com/map-mean-average-precision-for-object-detection-45c 121 a31173>. Acesso em: 16 de Junho de 2022.
KARIMI, G. Introdução ao algoritmo YOLO para detecção de objetos. Section. 2021. Disponível em: <https://www.section.io/engineering-education/introduction-to-yolo algorithm-for-object-detection/>. Acesso em: 07 de Junho de 2022.
KASVI. Parasitoses: o que são e como diagnosticar. 2019. Disponível em: <https://kasvi.com.br/parasitoses-como-diagnosticadas/>. Acesso em: 06 de Junho de 2022.
KONE, C. A travers les réseaux de neurones à convolution en Deep Learning. ActuIA. 5 de Nov. de 2019. Disponível em: <https://www.actuia.com/contribution/cyrille-kone/a-travers -les-reseaux-de-neurones-a-convolution-en-deep-learning/>. Acesso em: 13 de Junho de 2022.
LEMOS, M. Fasciola hepatica: o que é, sintomas, transmissão e tratamento. Tua Saúde. 2021. Disponível em: <https://www.tuasaude.com/fasciola-hepatica/>. Acesso em: 10 de Junho de 2022.
LI, S. et al. Parasitologist-level classification of apicomplexan parasites and host cell with deep cycle transfer learning. Bioinformatics. Oxford. England. 2020. p. 4498–4505.
LIMA, L. M. SANTOS, J. I. FRANZ, H. C. F. Himenolepiase. Atlas de Parasitologia Clínica e Doenças Infecciosas Associadas ao Sistema Digestivo. 2005-2022. Disponível em: <https://parasitologiaclinica.ufsc.br/index.php/info/conteudo/doencas/helmintoses/himenolepi ase/>. Acesso em: 09 de Junho de 2022.
LIMA, L. M. SANTOS, J. I. FRANZ, H. C. F. Ovos de Taenia spp. Atlas de Parasitologia Clínica e Doenças Infecciosas Associadas ao Sistema Digestivo. 2005-2022. Disponível em: <https://parasitologiaclinica.ufsc.br/index.php/info/conteudo/fotografias/ovos-taenia/>. Acesso em: 10 de Junho de 2022.
LOBO, L. C. Inteligência Artificial e Medicina. Revista Brasileira de Educação Médica. 2017. p. 185-193.
MAGALHÃES, L. Nematelmintos. Toda Matéria. 2019. Disponível em: <https://www.todamateria.com.br/nematelmintos/>. Acesso em: 11 de Junho de 2022.
MUNÕZ, S. FERNANDES, A. P. Texto de referência 7: Principais Doenças Causadas por Helmintos. São Paulo. 2013. p. 165-170.
NEVES, L. A. P.; NETO, H. V.; GONZAGA, A. Avanços em visão computacional. Curitiba: Omnipax, 2012. p. 406.
NOGUEIRA, P. G. F. A. Determining Leishmania Infection Levels by Automatic Analysis of Microscopy Images. Porto, Portugal. 2011. p. 11.
OLIVEIRA, G. H. Desenvolvimento de um sistema para a análise de ovos do parasita schistosoma mansoni por meio de visão computacional. Conselheiro Lafaiete, MG. 2019. p. 27.
PASSOS, B. T. O mundo do ponto de vista das Redes Neurais Convolucionais (RNCs). Ateliware. 2021. Disponível em: <https://ateliware.com/blog/redes-neurais-convolucionais>. Acesso em: 05 de Junho de 2022.
PEDROSA, R. B. Inovação em cuidados à saúde: um estudo da produção dos equipamentos de diagnóstico por imagem. Maceió. 2019. p. 15-16.
PEREIRA, J. S. Contributo para o estudo das necessidades de formação dos profissionais no âmbito dos equipamentos laboratoriais. Lisboa. 2018. p. 4.
PINA, D. B. Captura de dados de proveniência para apoiar a análise de hiperparâmetros em redes de aprendizado profundo. Rio de Janeiro. 2020. p. 7.
PINHEIRO, P. Tricuríase: transmissão, sintomas e tratamento. MD. Saúde. 2022. Disponível em: <https://www.mdsaude.com/doencas-infecciosas/parasitoses/tricuriase>. Acesso em: 11 de Junho de 2022.
RABELO, S. L. PEREIRA, T. A. BEZERRA, F. N. Detecção de cor da pele na melhoria do redimensionamento de imagem baseado em conteúdo. Seminário Integrado de Software e Hardware. Porto Alegre. 2019. p. 137-148.
REDMON, J. R. et al. You Only Look Once: Unified, Real-Time Object Detection. IEEE Conference on Computer Vision and Pattern Recognition. 2016. p. 780.
RODRIGUES, V. Métricas de Avaliação: acurácia, precisão, recall… quais as diferenças?. Medium. 2019. Disponível em: <https://vitorborbarodrigues.medium.com/métricas-de avaliação-acurácia-precisão-recall-quais-as-diferenças-c8f05e0a513c>. Acesso em: 12 de Junho de 2022.
ROSEBROCK, A. Intersecção sobre União (IoU) para detecção de objetos. Py Images Search. 2016. Disponível em: <https://pyimagesearch.com/2016/11/07/intersection-over union-iou-for-object-detection/>. Acesso em: 12 de Junho de 2022.
SAHA, S. A Comprehensive Guide to Convolutional Neural Networks – the ELI5 way. 2018. Disponível em: <https://towardsdatascience.com/a-comprehensive-guide-to convolutional-neural-networks-the-eli5-way-3bd2b1164a53>. Acesso em: 02, Junho de 2022.
SAHIDAN, I. S. et al. Local and Global Contrast Stretching For Color Contrast Enhancement on Ziehl-Neelsen Tissue Section Slide Images. Malaysia. 2008. p. 583.
SANTOS, A. O Parasito – Schistosoma mansoni. Fio – Schisto. 2021. Disponível em: <www.schisto.fiocruz.br/parasito/>. Acesso em: 08 de Junho de 2022.
SANTOS, M. K. et al. Inteligência artificial, aprendizado de máquina, diagnóstico auxiliado por computador e radiômica: avanços da imagem rumo à medicina de precisão. Radiol Bras. Ribeirão Preto, SP. 2019. p. 388.
SANTOS, V. S. Anelídeos. Brasil Escola. 2020. Disponível em: <https://brasilescola.uol.com.br/biologia/filo-annelida.htm>. Acesso em 14 de junho de 2022.
SHI, L. et al. Establishment of a deep learning-based visual model for intelligent recognition of Oncomelania hupensis. China. 2021. p. 445-451.
SILVA, G. R. Detecção de objetos em imagens utilizando técnicas de aprendizagem profunda. Santa Catarina. 2018. p. 48.
SOUZA, F. B. RUHOFF, A. L. Planejamento e gestão territorial: inovação, tecnologia e sustentabilidade. 2020. p. 155.
STEINHEISER, P. W. Estudo do desempenho da detecção de objetos em exames de AgNOR. Florianópolis. 2020. p. 16-21.
TALLAM, K. et al. Identification of Snails and Schistosoma of Medical Importance via Convolutional Neural Networks: A Proof-of-Concept Application for Human Schistosomiasis. Front Public Health. 2021.
TRAVASSOS, L. Introdução ao Estudo da Helmintologia. Revista Brasileira de Biologia. 1950. p. 86, 125.
WANGENHEIM, A. Deep Learning: Detecção de Objetos em Imagens. Lapix. 2018. Santa Catarina.
YAMASHITA, R. et al. Convolutional neural networks: an overview and application in radiology. Insights Into Imaging. v. 9. n. 4. 2018. p. 611-629.
YANG, F. et al. Deep Learning for Smartphone-Based Malaria Parasite Detection in Thick Blood Smears. IEEE journal of biomedical and health informatics. 2020. p. 1427– 1438.
ZHANG, Y. et al. Deep Learning for Imaging and Detection of Microorganisms. Trends in microbiology. 2021. p. 569–572.
1Discente do Curso Programa de Pós-graduação em Informática da Universidade Federal da Paraíba Campus I e mail: joaopsilvam88@gmail.com
2Discente do Curso de Bacharelado em Engenharia da Computação da Universidade Federal da Paraíba Campus I e-mail: lucaslimadeveloper007@gmail.com