REGISTRO DOI: 10.69849/revistaft/ra10202512061550
Emerson Leandro da Silva Silva; Lucas Victor Menezes Pereira; Arleson João Serrão Carvalho; Douglas Sousa Araujo; Diogo Lucas da Silva Ferreira; Felipe Menezes de Abreu; Jader da Silva Oliveira; Matheus Milhome de Lima; Paulo Cristiano Abreu de Jesus; Antonio Carlos dos Reis Bezerra
RESUMO
O diagnóstico precoce do câncer de pele é um desafio central para a saúde pública, especialmente em contextos com acesso limitado a especialistas. Nesse cenário, a inteligência artificial (IA) surge como ferramenta estratégica para apoiar triagens, ampliar a cobertura assistencial e proporcionar análises mais precisas de imagens dermatológicas. Este artigo propõe uma arquitetura conceitual de sistema inteligente para diagnóstico de lesões cutâneas utilizando o dataset público PAD-UFES-20, composto por imagens clínicas e dados estruturados de pacientes atendidos no Sistema Único de Saúde (SUS). O estudo inclui revisão bibliográfica, análise do dataset e definição de módulos arquiteturais baseados em princípios de Engenharia de Software, contemplando entrada, processamento e saída. A proposta enfatiza escalabilidade, modularidade, segurança da informação e interpretabilidade dos modelos de IA, fatores essenciais para uso clínico. Os resultados indicam que abordagens multimodais e arquiteturas bem estruturadas podem aumentar a acurácia e viabilizar a integração prática dessas soluções em ambientes reais, contribuindo para democratizar o acesso ao diagnóstico dermatológico.
Palavras-chaves: Inteligência Artificial; Engenharia de Software; Diagnóstico Médico; Lesões de Pele; PAD-UFES-20; Sistemas Inteligentes; Saúde Digital; Imagens Médicas.
ABSTRACT
Early diagnosis of skin cancer remains a critical challenge for public health systems, especially in regions with limited access to dermatology specialists. In this context, artificial intelligence (AI) emerges as a strategic tool to support triage processes, expand diagnostic coverage, and improve the accuracy of dermatological image analysis. This article proposes a conceptual architecture for an intelligent system aimed at the automated diagnosis of skin lesions using the public PAD-UFES-20 dataset, which includes clinical images and structured patient data collected in the Brazilian Unified Health System (SUS). The study comprises a literature review, dataset analysis, and the definition of an architectural model grounded in Software Engineering principles, organized into input, processing, and output modules. The proposed system highlights scalability, modularity, data security, and model explainability—key aspects for real-world clinical use. Findings suggest that multimodal approaches and welldesigned system architectures can enhance diagnostic performance and enable practical integration of AI solutions into healthcare settings, contributing to more equitable and efficient dermatological screening.
Key words: Artificial Intelligence; Software Engineering; Medical Diagnosis; Skin Lesions; PAD-UFES-20; Intelligent Systems; Digital Health; Medical Imaging.
INTRODUÇÃO
O avanço acelerado das tecnologias digitais tem ampliado significativamente as possibilidades de apoio à área da saúde, especialmente no diagnóstico precoce de doenças. Entre estas, o câncer de pele se destaca pela alta incidência e pela relevância de uma detecção rápida, capaz de reduzir a mortalidade e os custos associados ao tratamento. No Brasil, trata-se de um dos tipos mais comuns de câncer, tornando a triagem eficiente um fator essencial para evitar complicações clínicas graves (PACHECO et al., 2020). Pesquisas recentes demonstram que soluções baseadas em aprendizado profundo alcançam desempenho comparável ao de dermatologistas na identificação de lesões cutâneas (YIN et al., 2022; LIMA; KROHLING, 2022).
Apesar dos avanços, o acesso limitado a especialistas, sobretudo em regiões remotas ou com infraestrutura precária, continua sendo um desafio para o Sistema Único de Saúde (SUS) e outros sistemas públicos (KHAN et al., 2021). Nesse contexto, a Inteligência Artificial (IA) surge como aliada estratégica, com potencial para ampliar a cobertura diagnóstica, reduzir filas de atendimento e otimizar recursos, atuando como fator de democratização do acesso à saúde (ULIANA; KROHLING, 2025). Ferramentas de visão computacional, como redes neurais convolucionais (CNNs), vêm se mostrando particularmente eficazes na análise de imagens médicas, incluindo a detecção de câncer de pele (MEDHAT et al., 2022).
No entanto, o desenvolvimento de sistemas inteligentes aplicados à saúde exige mais do que algoritmos de alto desempenho. É necessária uma base sólida de Engenharia de Software que permita projetar soluções confiáveis, escaláveis e integráveis aos fluxos clínicos existentes. Muitas iniciativas falham justamente por carecer de arquiteturas bem definidas, adaptadas à realidade hospitalar e aos requisitos legais e éticos do setor (STEFFEN, 2025). A aplicação de práticas de engenharia orientadas a modelos, associada a ciclos contínuos de validação, é fundamental para viabilizar a adoção prática dessas tecnologias (BRANDON et al., 2023).
Entre as oportunidades para viabilizar soluções robustas, destaca-se o uso de bases públicas e representativas, como o PAD-UFES-20, composto por imagens clínicas de lesões cutâneas e dados demográficos coletados em unidades do SUS, por meio de smartphones. Com mais de 2 mil imagens e até 21 variáveis clínicas por paciente (PACHECO et al., 2020), o dataset possibilita o desenvolvimento de modelos multimodais, capazes de integrar dados visuais e estruturados, elevando a acurácia diagnóstica (MOHAMED et al., 2025). A explicabilidade dos resultados, apontada como requisito-chave para aceitação por profissionais de saúde (BHARATI; MONDAL; PODDER, 2024), reforça a necessidade de pensar a arquitetura do sistema desde sua concepção.
Diante desse cenário, este trabalho tem como objetivo propor uma arquitetura conceitual de sistema inteligente voltado ao diagnóstico automatizado de lesões cutâneas, utilizando o PAD-UFES-20 como base de dados. A proposta é fundamentada em revisão bibliográfica e análise do dataset, considerando princípios de Engenharia de Software para definir módulos, fluxos, requisitos e potenciais aplicações no contexto da saúde pública brasileira. O foco é a concepção teórica, que possa servir como referência para estudos futuros e implementação prática.
2 REFERENCIAL TEÓRICO
O desenvolvimento de sistemas inteligentes aplicados à saúde exige a integração de conhecimentos provenientes de diferentes áreas, como Inteligência Artificial (IA), Engenharia de Software e ciência de dados médicos. Para fundamentar a proposta apresentada neste trabalho, é necessário compreender não apenas as bases tecnológicas que sustentam a construção de modelos preditivos, mas também as práticas de engenharia que garantem sua viabilidade, segurança e aplicabilidade em contextos clínicos. Esta seção apresenta os conceitos-chave que embasam a pesquisa, abordando a aplicação da IA em saúde, o papel da Engenharia de Software no desenvolvimento de soluções inteligentes, as arquiteturas típicas utilizadas nesse tipo de sistema e a relevância das abordagens multimodais baseadas em dados públicos de saúde.
2.1 Inteligência Artificial Aplicada à Saúde
A inteligência artificial (IA) tem se consolidado como uma das tecnologias mais promissoras para enfrentar desafios complexos em diversas áreas, incluindo a saúde. No contexto médico, a IA tem sido aplicada com sucesso em tarefas como predição de doenças, análise de exames laboratoriais, detecção de anomalias em imagens e apoio à tomada de decisão clínica (Bajwa et al., 2021). Seu principal diferencial está na capacidade de processar grandes volumes de dados com alta velocidade, reconhecendo padrões que muitas vezes passariam despercebidos por profissionais humanos, especialmente em ambientes com alta demanda ou recursos limitados (Chustecki, 2024).
A utilização de modelos de aprendizado de máquina, em especial aqueles baseados em redes neurais profundas, tem permitido a construção de sistemas com desempenho comparável ao de especialistas em áreas como radiologia, oftalmologia e dermatologia ((Litjens et al., 2017). Esses sistemas são capazes de aprender com conjuntos de dados rotulados e, a partir disso, realizar classificações, diagnósticos ou recomendações com base em novos dados inseridos. Na dermatologia, o uso da IA tem sido particularmente explorado para a detecção de lesões cutâneas malignas, como o melanoma, por meio da análise de imagens clínicas (Azeem et al., 2023; Mohamed et al., 2025).
Além da precisão, a IA oferece a vantagem de disponibilidade e escalabilidade. Enquanto o número de especialistas é limitado, os sistemas automatizados podem operar continuamente, servindo como uma ferramenta de apoio valiosa para triagens iniciais, monitoramento remoto e reforço diagnóstico em regiões carentes de infraestrutura médica adequada (Khan et al., 2021).
2.2 Engenharia de Software e o Desenvolvimento de Sistemas Inteligentes
Embora os algoritmos de IA desempenhem papel central nos sistemas inteligentes, a Engenharia de Software é o campo responsável por estruturar e viabilizar sua aplicação prática. Um sistema de apoio à decisão médica não se resume ao modelo preditivo: ele depende de uma arquitetura capaz de organizar o fluxo de dados, garantir a integridade da informação, oferecer uma interface intuitiva para o usuário final (médico ou paciente) e manter padrões de segurança e confiabilidade (Steffen, 2025).
A Engenharia de Software fornece os métodos, práticas e ferramentas necessários para projetar, desenvolver e manter sistemas computacionais robustos e de alta qualidade. No contexto da saúde, isso inclui requisitos específicos como conformidade com normas legais (ex: sigilo médico), interoperabilidade com sistemas de prontuário eletrônico, rastreabilidade de decisões automatizadas e usabilidade para diferentes perfis de usuários (Chustecki, 2024).
Quando aplicada ao desenvolvimento de sistemas baseados em IA, a Engenharia de Software deve lidar com particularidades como a integração entre módulos de pré-processamento de dados, treinamento e validação de modelos, e visualização de resultados. A modelagem adequada da arquitetura do sistema permite que os componentes de IA sejam tratados como serviços encapsulados, facilitando manutenção, escalabilidade e reuso (Bharati; Mondal; Podder, 2024).
2.3 Arquiteturas de Sistemas Inteligentes em Saúde
Sistemas inteligentes voltados ao diagnóstico médico geralmente seguem arquiteturas compostas por três grandes módulos: entrada, processamento e saída (Mohamed et al., 2025). O módulo de entrada é responsável pela coleta dos dados clínicos e/ou imagens, podendo ser integrado a plataformas existentes ou a aplicativos móveis. O módulo de processamento é onde reside o “cérebro” do sistema: algoritmos treinados para reconhecer padrões, classificar tipos de lesões, sugerir diagnósticos ou indicar níveis de risco. O módulo de saída, por sua vez, deve apresentar os resultados de forma compreensível, preferencialmente com níveis de confiança e explicações associadas à decisão automatizada (Bharati; Mondal; Podder, 2024).
Essa estrutura modular favorece a adaptabilidade do sistema a diferentes contextos, como clínicas privadas, hospitais públicos ou unidades de atenção básica. Também permite atualizações independentes dos componentes, como a substituição de um modelo de classificação por outro mais preciso, sem que isso comprometa o funcionamento global da aplicação (Steffen, 2025).
Além disso, sistemas baseados em dados reais precisam ser validados com rigor. Isso exige o uso de conjuntos de dados públicos, como o PAD-UFES-20, que permitem reprodutibilidade científica e comparabilidade entre abordagens (Pacheco et al., 2020).
2.4 Abordagens Multimodais e Dados Públicos de Saúde
Em muitos casos, o diagnóstico médico não depende apenas da imagem, mas também de informações clínicas do paciente, como idade, histórico familiar, hábitos e localização da lesão. Abordagens multimodais, que combinam dados visuais e estruturados, têm mostrado resultados mais robustos por refletirem melhor a prática médica real (Mohamed et al., 2025; Yin et al., 2022)
Nesse cenário, conjuntos de dados que ofereçam ambos os tipos de informação são particularmente valiosos. O PAD-UFES-20 é um exemplo relevante, pois disponibiliza não apenas imagens de lesões de pele, mas também variáveis clínicas relevantes coletadas em contexto real de atendimento ((Pacheco et al., 2020). Trabalhos científicos recentes têm explorado esse potencial, aplicando diferentes modelos para investigar se a fusão de dados pode melhorar a acurácia e a confiabilidade dos diagnósticos automatizados (Lima; Krohling, 2022).
O uso de dados públicos contribui também para a democratização da pesquisa, possibilitando que instituições de ensino e pesquisa desenvolvam soluções viáveis sem depender de parcerias com hospitais privados ou bases de dados comerciais. Essa abertura é especialmente relevante em países em desenvolvimento, onde a inovação tecnológica pode ser um fator decisivo para ampliar o acesso à saúde de qualidade (Ahsan; Siddique, 2021).
3. METODOLOGIA
Este estudo adota uma abordagem qualitativa, descritiva e aplicada, com foco na proposição de uma arquitetura conceitual de sistema inteligente para o diagnóstico de lesões cutâneas, fundamentada no uso do dataset público PADUFES-20 e em evidências extraídas da literatura científica recente.
A metodologia foi organizada em três etapas principais, descritas a seguir.
3.1 Levantamento Bibliográfico
Foi conduzida uma revisão exploratória de literatura com o objetivo de identificar estudos que aplicaram técnicas de Inteligência Artificial ao diagnóstico de lesões cutâneas, com ênfase no uso do dataset PAD-UFES-20. A busca contemplou artigos publicados entre 2020 e 2025, priorizando publicações indexadas nas bases IEEE Xplore, Scopus, PubMed e Google Scholar.
Os critérios de inclusão consideraram:
- Apresentação de propostas metodológicas claras;
- Uso de abordagens multimodais (imagens + dados clínicos);
- Avaliação de desempenho dos modelos;
- Discussão sobre aplicabilidade prática em contextos reais de saúde.
A análise dos trabalhos selecionados permitiu identificar:
- Algoritmos mais recorrentes (como redes neurais convolucionais, modelos híbridos e transformers);
- Principais desafios (desequilíbrio de classes, variabilidade das imagens e explicabilidade dos modelos);
- Lacunas existentes, como a ausência de arquiteturas completas ou integração com fluxos clínicos reais.
3.2 Análise do Dataset PAD-UFES-20
Foi realizada uma análise detalhada do dataset PAD-UFES-20, considerando sua estrutura, composição e aplicabilidade. O conjunto é formado por 2.298 imagens clínicas e variáveis associadas a 1.373 pacientes, contemplando dados como idade, sexo, localização da lesão, histórico familiar e sintomas.
Essa etapa possibilitou:
- Compreender as potencialidades e limitações do dataset;
- Avaliar a viabilidade de uso em modelos de classificação automática;
- Investigar a possibilidade de aplicação de abordagens multimodais, fator determinante para decisões na modelagem arquitetural.
Também foi verificado o balanceamento das classes e a qualidade dos dados, assegurando condições adequadas para estudos de diagnóstico assistido por IA.
3.3 Proposição da Arquitetura Conceitual
A partir da revisão bibliográfica e da análise do dataset, foi elaborada uma arquitetura conceitual composta por três módulos principais: entrada, processamento e saída. O projeto seguiu princípios de Engenharia de Software, priorizando:
- Modularidade;
- Escalabilidade;
- Segurança da informação;
- Explicabilidade dos resultados;
- Integração com sistemas clínicos, como prontuários eletrônicos.
O sistema proposto considera tanto imagens clínicas quanto dados estruturados dos pacientes, utilizando modelos de IA para gerar diagnósticos com índice de confiança e recomendações de conduta. Embora ainda não implementado, o projeto foi pensado para atender requisitos funcionais e não funcionais compatíveis com uso real em ambientes clínicos.
4. O DATASET PAD-UFES-20
O desenvolvimento de sistemas inteligentes confiáveis na área da saúde depende do acesso a bases de dados reais, bem estruturadas e representativas do problema investigado. Nesse cenário, o PAD-UFES-20 se destaca como um dos primeiros datasets públicos brasileiros voltados ao diagnóstico de lesões cutâneas.
Criado para oferecer um conjunto de dados clínicos e imagens dermatológicas obtidas em condições reais de atendimento, o PAD-UFES-20 foi construído utilizando equipamentos acessíveis, como smartphones (PACHECO et al., 2020). O conjunto reúne 2.298 imagens associadas a 1.373 pacientes atendidos no Sistema Único de Saúde (SUS) no estado do Espírito Santo, Brasil.
As imagens refletem a realidade de um centro médico de média complexidade, com variações nas condições de captura, o que as torna mais próximas dos desafios enfrentados por profissionais da rede pública (PACHECO et al., 2020). Essa característica garante maior realismo na modelagem de sistemas diagnósticos e amplia a possibilidade de generalização dos resultados para cenários clínicos reais.
A Tabela 1 apresenta um resumo das principais informações do PAD-UFES-20.
Tabela 1 – Informações Resumidas do Dataset PAD-UFES-20

Fonte: elaborado pelos autores, (2025).
Além das imagens, o PAD-UFES-20 oferece dados clínicos e demográficos organizados em um arquivo tabular. Entre os atributos disponíveis estão: idade, sexo, localização da lesão, presença de sintomas como coceira, sangramento ou mudança de cor, além de histórico familiar de câncer de pele, entre outros (PACHECO et al., 2020, p. 4). Essas variáveis fornecem uma visão mais completa do caso clínico e podem ser utilizadas tanto de forma isolada quanto combinada com as imagens em abordagens multimodais, como destacam Yin et al. (2022), ao demonstrar que a fusão de dados clínicos e visuais melhora a performance de classificadores.
As lesões estão classificadas em seis categorias principais, sendo elas:
- Nevo (NEV),
- Melanoma (MEL),
- Carcinoma Basocelular (BCC),
- Ceratose Actínica (ACK),
- Ceratose Seborreica (SEK),
- Carcinoma Espinocelular (SCC) (PACHECO et al., 2020).
Essa diversidade permite a construção de modelos preditivos capazes de diferenciar condições benignas e malignas, bem como de realizar triagens automáticas com foco em tipos específicos de câncer de pele (Mohamed et al., 2025; Uliana; Krohling, 2025).
Por se tratar de uma base pública, nacional e acessível, o PAD-UFES-20 representa uma oportunidade estratégica para pesquisadores, desenvolvedores e profissionais de saúde interessados em criar soluções tecnológicas validadas com dados reais da população brasileira (Lima; Krohling, 2022). Sua estrutura aberta e bem documentada também facilita a replicação de experimentos, a comparação entre métodos e o desenvolvimento de protótipos com aplicabilidade concreta em ambientes clínicos (Steffen, 2025).
5. Trabalhos Correlatos
Diversas pesquisas recentes têm utilizado o PAD-UFES-20 como base empírica para o desenvolvimento e a validação de sistemas inteligentes voltados ao diagnóstico de lesões cutâneas. Uma das abordagens mais comuns envolve a aplicação de redes neurais convolucionais (CNNs) para a classificação automática de imagens dermatológicas, visando diferenciar tipos de lesões como melanoma, nevo ou carcinoma. Essas redes têm se mostrado eficazes ao extrair características discriminantes a partir das imagens, sobretudo quando combinadas com técnicas de normalização e aumento de dados para mitigar o desequilíbrio entre classes (Uliana; Krohling, 2025). A Figura 3 apresenta um mapa de coocorrência de palavras-chave extraído da base Scopus, que evidencia os termos mais recorrentes e suas conexões nas publicações científicas sobre inteligência artificial aplicada à detecção de lesões de pele.
Figura 3 – Mapa de Coocorrência de Palavras-Chave em Publicações sobre IA e Diagnóstico Dermatológico (Scopus, 2020–2025).

Fonte: elaborado pelos autores, (2025).
A análise de coocorrência de palavras-chave, representada na Figura 3, revela a diversidade e a interconexão dos temas que compõem o campo de estudo sobre inteligência artificial aplicada à dermatologia diagnóstica. Observa-se a centralidade de termos como artificial intelligence, machine learning, diagnosis e human, os quais indicam a predominância de estudos voltados à aplicação de algoritmos preditivos em contextos clínicos. Outros termos relevantes, como deep learning, tumor, diagnostic imaging e clinical trial, reforçam o caráter técnico-científico das abordagens, evidenciando o uso intensivo de modelos computacionais em tarefas de classificação de lesões cutâneas. A presença de termos como human tissue, pathology, therapy e drug therapy indica também a interdisciplinaridade da área, que envolve desde aspectos médicos e biológicos até desafios tecnológicos e metodológicos. Essa visualização corrobora o crescimento e a complexidade do campo, justificando a necessidade de propostas que integrem conhecimentos de engenharia de software, IA e saúde pública, como o sistema conceitual apresentado neste artigo.
Além das CNNs tradicionais, alguns trabalhos têm adotado arquiteturas mais recentes, como EfficientNet e DenseNet, para melhorar o desempenho em tarefas de classificação de imagens de pele (Mohamed et al., 2025; Yin et al., 2022). Também há iniciativas que incorporam dados estruturados aos modelos, utilizando uma abordagem multimodal para aumentar a acurácia diagnóstica. Mohamed et al. (2025) propuseram um sistema híbrido baseado na fusão de imagens e informações clínicas, obtendo resultados superiores em comparação a modelos unicamente visuais.
O próprio artigo introdutório do PAD-UFES-20 já destacava o potencial de combinação entre variáveis clínicas e imagens para formar sistemas mais robustos e adaptáveis à realidade médica brasileira (Pacheco et al., 2020). Essa visão é reforçada por Lima e Krohling (2022), que utilizaram transformers e CNNs sobre conjuntos pequenos de dados com resultados promissores.
Em relação à interpretabilidade dos modelos, alguns estudos têm integrado mapas de calor (heatmaps) e técnicas de atenção visual como forma de explicar as decisões do modelo, o que é fundamental para aumentar a confiabilidade clínica das soluções baseadas em IA (Bharati; Mondal; Podder, 2024; Chustecki, 2024). Essa preocupação também aparece nos trabalhos que discutem a integração desses sistemas em fluxos reais de atendimento, alertando para a necessidade de validação com dados representativos e respeito a aspectos éticos e regulatórios (Steffen, 2025).
Apesar dos avanços, nota-se que muitas dessas pesquisas ainda priorizam métricas de acurácia algorítmica, negligenciando etapas fundamentais de Engenharia de Software, como integração com prontuários eletrônicos, modularidade da arquitetura e usabilidade clínica (Azeem et al., 2023). Assim, há um espaço significativo para propostas que considerem, além da performance técnica, a viabilidade de implantação em sistemas reais, especialmente em contextos como o Sistema Único de Saúde (SUS).
6. Proposta de Arquitetura de Sistema Inteligente
Com base na análise do dataset PAD-UFES-20 e nos trabalhos correlatos que demonstram a viabilidade do diagnóstico automatizado de lesões cutâneas por meio de técnicas de inteligência artificial, propõe-se aqui uma arquitetura conceitual de sistema voltado ao apoio à decisão médica. A proposta tem como objetivo modelar um sistema inteligente que integre dados clínicos e imagens dermatológicas, respeitando os princípios da Engenharia de Software, como modularidade, escalabilidade, segurança e usabilidade (Lima; Krohling, 2022).
A arquitetura sugerida segue uma estrutura modular composta por três grandes blocos funcionais: entrada de dados, processamento e saída de resultados.
6.1 Módulo de Entrada
O módulo de entrada é responsável por coletar informações clínicas e visuais do paciente. Isso inclui:
- Imagens clínicas capturadas por dispositivos móveis, como smartphones, em condições ambulatoriais;
- Dados clínicos como idade, sexo, sintomas associados e histórico familiar de câncer de pele.
Essa abordagem é inspirada nos princípios aplicados na coleta do PAD-UFES20, que se destaca por permitir a integração de dados multimodais em cenários reais de atendimento (Pacheco et al., 2020).
6.2 Módulo de Processamento
O núcleo do sistema é o processamento baseado em algoritmos de inteligência artificial. Redes neurais convolucionais (CNNs), como as utilizadas por Mohamed et al. (2025), podem ser aplicadas à classificação das imagens. Abordagens multimodais também têm se mostrado promissoras, combinando dados clínicos e visuais, como demonstrado por Yin et al. (2022), com aumento na acurácia diagnóstica ao integrar ambos os tipos de entrada.
O uso de técnicas interpretáveis como mapas de calor (heatmaps) é importante para a confiabilidade clínica, conforme discutido por Bajwa et al. (2021), pois fornece ao médico uma justificativa visual da decisão automatizada.
Dessa maneira, a interpretabilidade é um aspecto essencial para a adoção de sistemas inteligentes na prática clínica. Como ilustrado na Figura 2, mapas de calor (heatmaps) podem ser utilizados para destacar as regiões da imagem que influenciaram a decisão automatizada, fornecendo ao médico uma justificativa visual do diagnóstico. A área em vermelho indica a região de maior atenção do modelo durante a análise da imagem, permitindo que o profissional de saúde compreenda os critérios utilizados para a predição.
Figura 2 – Exemplo de Mapa de Calor Gerado por Modelo de IA em Diagnóstico Dermatológico.

Fonte: elaborado pelos autores, (2025).
6.3 Módulo de Saída
Os resultados gerados são apresentados ao usuário em formato compreensível:
- Classificação da lesão (ex: melanoma, BCC);
- Índice de confiança da predição;
- Recomendações clínicas automatizadas.
Essa camada também pode oferecer geração de relatórios e integração com prontuários eletrônicos (Azeem et al., 2023). O objetivo é garantir que os dados não apenas sejam interpretáveis por especialistas, mas também acessíveis para pacientes leigos, respeitando princípios de usabilidade.
6.4 Requisitos Funcionais e Não Funcionais
Para garantir o uso prático do sistema, foram definidos os seguintes requisitos:
Funcionais:
- Upload de imagem e preenchimento de ficha clínica;
- Execução do modelo preditivo;
- Apresentação de diagnóstico com grau de confiança.
Não Funcionais:
- Interface amigável;
- Segurança dos dados clínicos;
- Escalabilidade do sistema;
- Modularidade arquitetural para futuras atualizações.
Tais requisitos são compatíveis com as boas práticas de engenharia para sistemas médicos baseados em IA que reforçam a importância de considerar não apenas o modelo, mas todo o ecossistema de aplicação clínica (Bharati; Mondal; Podder, 2024; Chustecki, 2024),.
6.5 Representação Arquitetural
A arquitetura pode ser representada por um fluxograma modular, conforme sugerido por Steffen (2025), com três camadas: entrada, processamento e saída. Essa separação permite manutenção isolada de componentes, reuso de modelos e adaptação a diferentes ambientes, como clínicas, hospitais ou aplicações móveis.
Essa proposta busca preencher uma lacuna identificada por Uliana e Krohling (2025), que apontam a escassez de trabalhos que abordam a modelagem completa de sistemas e não apenas o desempenho algorítmico. A Figura 1 apresenta a representação esquemática da arquitetura proposta, organizada em módulos funcionais de entrada, processamento e saída, conforme princípios de modularidade e escalabilidade.
Figura 1 – Arquitetura Conceitual do Sistema Inteligente para Diagnóstico de Lesões Cutâneas

Fonte: elaborado pelos autores, (2025).
7. Discussão
A proposta de um sistema inteligente para diagnóstico de lesões cutâneas, estruturado a partir dos dados do PAD-UFES-20, representa uma possibilidade concreta de inovação tecnológica voltada ao setor da saúde. O modelo arquitetural apresentado neste trabalho demonstra que é viável, do ponto de vista da Engenharia de Software, conceber uma solução modular, funcional e adaptável que possa ser utilizada tanto em ambientes clínicos quanto em plataformas digitais acessíveis ao público em geral.
Um dos principais diferenciais dessa proposta está na utilização de dados reais e públicos, coletados em unidades de saúde brasileiras, o que torna o sistema mais adequado à realidade epidemiológica e operacional do país. Segundo Pacheco et al. (2020), o PAD-UFES-20 é um dos primeiros datasets dermatológicos públicos brasileiros e contempla informações multimodais captadas em ambiente clínico real, o que favorece a generalização dos modelos.
Além disso, a presença de atributos clínicos junto às imagens possibilita o uso de abordagens multimodais, que têm se mostrado mais eficazes que os modelos baseados apenas em imagem (Yin et al., 2022). Mohamed et al. (2025) reforçam que a fusão de dados visuais e clínicos pode aumentar significativamente a acurácia dos sistemas preditivos em dermatologia, permitindo uma análise mais rica e contextualizada.
Do ponto de vista técnico, a modularização da arquitetura proposta oferece vantagens como manutenção facilitada, substituição de componentes e integração com outros sistemas. Isso está em linha com o que argumentam Bharati et al. (2024), ao afirmar que uma boa prática em soluções baseadas em IA envolve a separação entre os componentes de entrada, processamento e visualização dos resultados, garantindo escalabilidade e flexibilidade do sistema.
Entretanto, a implementação prática de tais sistemas envolve diversos desafios. Segundo Chustecki (2024), a segurança dos dados e a explicabilidade dos modelos são fatores críticos para a adoção clínica da IA, especialmente em diagnósticos médicos sensíveis como o câncer de pele. A ausência de explicações claras pode comprometer a confiança do usuário no sistema e gerar resistências, como apontado também por Bajwa et al. (2021), que destacam a importância de prover justificativas interpretáveis nos sistemas médicos inteligentes.
Outro obstáculo é a validação clínica. Embora muitos modelos mostrem desempenho promissor em ambiente controlado, sua eficácia em cenários reais depende de testes rigorosos e aprovação por comitês éticos (Ahsan; Siddique, (2021). Isso implica parcerias com instituições de saúde e validação longitudinal, como destacado por Uliana e Krohling (2025), que alertam para a necessidade de adaptar modelos às condições reais de uso e infraestrutura local.
Por fim, é importante destacar que a Engenharia de Software exerce um papel central nesse processo. Conforme argumentado por Steffen (2025), o sucesso de soluções baseadas em IA depende não apenas da qualidade dos modelos, mas da estrutura de software que os sustenta, incluindo segurança, rastreabilidade e usabilidade. Assim, ao propor uma arquitetura sólida e funcional, este trabalho contribui para aproximar a inteligência artificial da prática médica cotidiana, especialmente em contextos com recursos limitados.
8. Conclusão
O progresso da inteligência artificial (IA) nos últimos anos tem remodelado profundamente o cenário da saúde digital, proporcionando meios inovadores para a análise de dados clínicos, apoio à decisão médica e diagnóstico precoce de doenças. Esse avanço tecnológico, aliado à crescente disponibilidade de dados estruturados e imagens médicas de qualidade, abriu caminho para o desenvolvimento de sistemas inteligentes cada vez mais sofisticados e aplicáveis ao contexto clínico. Em especial, o diagnóstico de lesões cutâneas, como melanomas e carcinomas, tem se beneficiado dessas inovações, uma vez que a detecção precoce pode representar a diferença entre tratamentos simples e abordagens invasivas, ou até mesmo entre vida e morte (Litjens et al., 2017).
Neste artigo, propôs-se uma arquitetura conceitual de sistema inteligente voltado ao apoio diagnóstico de lesões de pele, utilizando como base o conjunto de dados PAD-UFES-20. Tal dataset, por reunir imagens clínicas reais e informações estruturadas de pacientes atendidos no Sistema Único de Saúde (SUS), representa uma ferramenta estratégica para o desenvolvimento de soluções tecnológicas alinhadas à realidade brasileira. A proposta aqui desenvolvida considera não apenas os aspectos algorítmicos, mas também os princípios da Engenharia de Software, modelando um sistema modular, escalável e funcionalmente robusto, capaz de integrar dados clínicos e visuais em um fluxo de análise coerente e confiável (Pacheco et al., 2020).
A revisão dos trabalhos correlatos indicou que a maior parte dos estudos foca prioritariamente na performance dos modelos de aprendizado profundo, com pouca atenção à estruturação sistêmica necessária para a aplicação prática dessas soluções (Lima; Krohling, 2022; Mohamed et al., 2025). No entanto, como argumenta Chustecki (2024), a real contribuição da IA para a saúde depende da sua integração eficaz com os fluxos clínicos e das condições reais de uso, o que inclui a usabilidade, segurança, confiabilidade e interpretabilidade dos sistemas implementados. Assim, este trabalho se diferencia ao oferecer uma visão abrangente que contempla a totalidade do sistema, desde a entrada e pré-processamento dos dados até a apresentação final dos resultados e recomendações clínicas automatizadas.
Outro ponto de destaque está no uso de dados públicos e nacionais, um diferencial que torna a proposta mais contextualizada, viável e justa do ponto de vista da equidade no acesso à tecnologia. A utilização do PAD-UFES-20 garante maior representatividade das condições clínicas encontradas na rede pública brasileira, superando a limitação de bases estrangeiras que muitas vezes não refletem as características demográficas, epidemiológicas e operacionais locais (Uliana; Krohling, 2025). Isso favorece o desenvolvimento de soluções que não apenas funcionem em laboratório, mas que possam, de fato, ser aplicadas de maneira eficaz na prática médica nacional.
Do ponto de vista técnico, a arquitetura modular proposta oferece vantagens como manutenção facilitada, capacidade de atualização pontual dos modelos de IA, e adaptabilidade a diferentes contextos tecnológicos, desde grandes hospitais até clínicas remotas com infraestrutura limitada. A estruturação em blocos funcionais independentes, conforme os padrões da Engenharia de Software, também permite a reusabilidade de componentes, a integração com sistemas legados, e a escalabilidade progressiva da aplicação, o que é crucial para iniciativas públicas ou comunitárias com recursos restritos.
Contudo, é necessário reconhecer que a implementação real de um sistema com tais características envolve desafios significativos. Entre eles estão questões éticas, como o tratamento de dados sensíveis e a explicabilidade das decisões algorítmicas; desafios técnicos, como a robustez e a generalização dos modelos; e barreiras culturais, como a resistência de parte dos profissionais de saúde à adoção de soluções automatizadas. Esses obstáculos, embora complexos, não são intransponíveis, e sua superação pode ser facilitada por abordagens interdisciplinares e colaborações entre academia, setor público e indústria tecnológica.
Finalmente, este estudo reforça o papel da Engenharia de Software não apenas como suporte técnico, mas como componente essencial no desenvolvimento de soluções em saúde baseadas em IA. É por meio de uma arquitetura bem definida, segura e centrada no usuário que se torna possível transformar algoritmos promissores em ferramentas úteis, confiáveis e acessíveis para a prática médica cotidiana (Steffen, 2025).
8.1 Recomendações Finais e Trabalhos Futuros
Com base na proposta desenvolvida e nas análises realizadas, algumas direções podem ser apontadas para o aprimoramento e continuidade deste trabalho:
- Implementação prática da arquitetura proposta, por meio do desenvolvimento de um protótipo funcional que possa ser testado em ambiente controlado com um subconjunto dos dados do PAD-UFES-20 (Pacheco et al., 2020).
- Validação clínica dos modelos de IA integrados ao sistema, em parceria com profissionais da área da saúde, para garantir segurança e acurácia no contexto real de aplicação (Ahsan; Siddique, 2021).
- Aprimoramento da explicabilidade dos resultados, por meio da integração de técnicas que possibilitem visualizar ou justificar as decisões tomadas pelos algoritmos, favorecendo a confiança e a aceitação por parte dos usuários (Chustecki, 2024; Khan et al., 2021).
- Adaptação da solução para dispositivos móveis e ambientes com baixa conectividade, visando ampliar o acesso à tecnologia em regiões remotas ou com infraestrutura limitada(Medhat et al., 2022).
- Exploração de outros conjuntos de dados públicos, como estratégia para avaliar a generalização do sistema proposto em diferentes contextos clínicos e populacionais (Uliana; Krohling, 2025).
- Estudos sobre a experiência do usuário e usabilidade do sistema, incluindo testes com médicos e pacientes, com o objetivo de identificar ajustes necessários antes de uma possível implementação em larga escala (Steffen, 2025).
Essas recomendações demonstram que a proposta aqui apresentada não é um ponto final, mas um ponto de partida para iniciativas mais amplas e colaborativas, que envolvam tanto a comunidade acadêmica quanto o setor público de saúde.
REFERÊNCIAS
AHSAN, Md Manjurul; SIDDIQUE, Zahed. Machine learning based disease diagnosis: A comprehensive review. arXiv, , 31 dez. 2021. Disponível em: <http://arxiv.org/abs/2112.15538>. Acesso em: 4 ago. 2025
AZEEM, Muhammad et al. SkinLesNet: Classification of Skin Lesions and Detection of Melanoma Cancer Using a Novel Multi-Layer Deep Convolutional Neural Network. Cancers, v. 16, n. 1, p. 108, 24 dez. 2023.
BAJWA, Junaid et al. Artificial intelligence in healthcare: transforming the practice of medicine. Future Healthcare Journal, v. 8, n. 2, p. e188–e194, jul. 2021.
BHARATI, Subrato; MONDAL, M. Rubaiyat Hossain; PODDER, Prajoy. A Review on Explainable Artificial Intelligence for Healthcare: Why, How, and When? IEEE Transactions on Artificial Intelligence, v. 5, n. 4, p. 1429–1442, abr. 2024.
BRANDON, Colm et al. Model Driven Development for AI-Based Healthcare Systems: A Review. In: STEFFEN, Bernhard (ed.). Bridging the Gap Between AI and Reality. Cham: Springer, 2025. p. 220–238.
CHUSTECKI, Margaret. Benefits and Risks of AI in Health Care: Narrative Review. Interactive Journal of Medical Research, v. 13, p. e53616, 18 nov. 2024.
KHAN, Irfan Ullah et al. Remote Diagnosis and Triaging Model for Skin Cancer Using EfficientNet and Extreme Gradient Boosting. Complexity, v. 2021, n. 1, p. 5591614, jan. 2021.
LIMA, Leandro M. de; KROHLING, Renato A. Exploring Advances in Transformers and CNN for Skin Lesion Diagnosis on Small Datasets. In: [S.l.: S.n.]. v. 13654 p. 282–296.
LITJENS, Geert et al. A survey on deep learning in medical image analysis. Medical Image Analysis, v. 42, p. 60–88, dez. 2017.
MEDHAT, Sara et al. Skin cancer diagnosis using convolutional neural networks for smartphone images: A comparative study. Journal of Radiation Research and Applied Sciences, v. 15, n. 1, p. 262–267, mar. 2022.
MOHAMED, Ensaf Hussein et al. MiSC: A hybrid multi-modal deep learning approach for accurate skin cancer detection. Multimedia Tools and Applications, 4 jun. 2025.
PACHECO, Andre G. C. et al. PAD-UFES-20: A skin lesion dataset composed of patient data and clinical images collected from smartphones. Data in Brief, v. 32, p. 106221, out. 2020.
STEFFEN, Bernhard (ORG.). Bridging the Gap Between AI and Reality: First International Conference, AISoLA 2023, Crete, Greece, October 23–28, 2023, Selected Papers. Cham: Springer Nature Switzerland, 2025. v. 14129
ULIANA, José J. M.; KROHLING, Renato A. Diffusion models applied to skin and oral cancer classification. arXiv, , 28 mar. 2025. Disponível em: <http://arxiv.org/abs/2504.00026>. Acesso em: 4 ago. 2025
YIN, Wenjun et al. A study on skin tumor classification based on dense convolutional networks with fused metadata. Frontiers in Oncology, v. 12, p. 989894, 16 dez. 2022.
