MINERAÇÃO DE DADOS EDUCACIONAIS: UMA REVISÃO SISTEMÁTICA DA LITERATURA

EDUCATIONAL DATA MINING: A SYSTEMATIC LITERATURE REVIEW ABSTRACT

REGISTRO DOI: 10.5281/zenodo.7763620


Francisco Antonio Nascimento1
Fernando Rodrigues Nascimento2
Elaine Ribeiro de Oliveira3
Kátia Romilda Silva do Nascimento4
Tony Thiago Souza Ferreira5
Cleuton Veras de Medeiros6
Antonio Claudiano Matias Oliveira7


RESUMO

Com os avanços tecnológicos a educação vem se modificando muito nos últimos anos, a tecnologia proporcionou uma instrumentação do setor educacional, através de softwares utilizados para o ensino, e na administração virtual dos registros acadêmicos pela gestão das instituições. Com essa evolução existe um grande crescimento no volume e no armazenamento de dados educacionais e também dos alunos, e como essas grandes quantidades de informações precisam ser analisadas, oportunizando assim o uso de Mineração de Dados Educacionais (MDE) para tornar os processos de ensino e aprendizagem mais eficientes, esse método consiste na aplicação de técnicas de mineração de dados, ferramentas, algoritmos e modelos probabilísticos que permitem avaliar um conjunto de dados na área educacional. O artigo tem como objetivo realizar uma revisão sistemática da literatura de modo que se possa observar as técnicas utilizadas para mineração de dados educacionais. Os autores selecionados de modo geral consideram a Árvore de Decisão como o algoritmo mais eficiente, e informam que os atributos que mais influenciam nas análises são os relacionados a notas, faltas e demais atividades realizadas pelos estudantes.

Palavras-chave: Mineração de dados; Educação; Algoritmos; Aprendizagem; Dados educacionais;

ABSTRACT

With technological advances, education has been changing a lot in recent years, technology has provided an instrumentation of the educational sector, through software used for teaching, and in the virtual administration of academic records by the management of institutions. With this evolution, there is a great growth in the volume and storage of educational data and also of students, and how these large amounts of information need to be analyzed, thus providing opportunities for the use of Educational Data Mining (MDE) to make teaching processes and For more efficient learning, this method consists of applying data mining techniques, tools, algorithms and probabilistic models that allow evaluating a set of data in the educational field. The article aims to carry out a systematic review of the literature so that the techniques used for mining educational data can be observed. The selected authors generally consider the Decision Tree as the most efficient algorithm, and report that the attributes that most influence the analyzes are those related to grades, absences and other activities performed by students.

Keywords: Data mining; Education; Algorithms; Learning; Educational data;

1 INTRODUÇÃO

Com os diversos avanços tecnológicos a educação vem se modificando muito nos últimos anos, isso ocorreu pois a tecnologia proporcionou uma instrumentação do setor educacional, tanto através de softwares utilizados para o ensino, como na administração virtual dos registros acadêmicos pela gestão das instituições, além do uso da internet para aprendizagem pelos estudantes (Souza, 2021). 

Todos os fatores supracitados impulsionam um grande crescimento no volume e no armazenamento de dados educacionais e também dos alunos, e como essas grandes quantidades de informações precisam ser analisadas, é muito importante poder utilizar recursos computacionais para otimizar tempo e qualidade. Isso oportuniza o uso de Mineração de Dados Educacionais (MDE) para tornar os processos de ensino e aprendizagem mais eficientes, já que essa metodologia pode ser aplicada em várias áreas para diversas finalidades (Vivian, 2022). 

De acordo com Marques (2022), no método do MDE existe a aplicação de técnicas de mineração de dados e também pode ter a aplicação de modelos probabilísticos, em dados na área da educação. Para aplicar a MDE é importante entender quais ferramentas utilizar e também compreender quais técnicas mais se enquadram no contexto estudado. Uma solução utilizada para conhecer e compreender as principais ferramentas utilizadas, técnicas e fatores explorados no contexto estudado, é realizar uma Revisão Sistemática de Literatura (RSL), que é uma análise de materiais encontrados na literatura, que expõe os métodos que podem ser replicados. 

De acordo com Souza (2021), o MDE tem como principal objetivo na área acadêmica a previsão do desempenho e da performance dos alunos ao longo do curso, assim a instituição pode realizar intervenções caso necessário a fim de melhorar o processo de aprendizagem dos alunos. Essa investigação é importante não só para a vida acadêmica e profissional do aluno, como também para a universidade, já que ela é avaliada pela qualidade do seu trabalho, que é diretamente refletida no desempenho do seu aluno. 

Na literatura, existem muitos trabalhos onde a educação, e mais precisamente o ensino superior, é o objeto de estudo, Choji (2021), descreve que além da performance e desempenho dos alunos, também se é discutido sobre outros fatores que influenciam a permanência dos estudantes nas universidade, como problemas de desigualdade social, equidade e representatividade de gênero e também no acesso a universidades, etc.  Com o contexto apresentado, o presente artigo tem como objetivo realizar uma revisão sistemática da literatura de modo que se possa observar as técnicas utilizadas para mineração de dados educacionais, bem como compreender os atributos analisados pelos autores por meio da técnica. 

O interesse na temática do artigo é para compreender a dinâmica que ocorre entre ambiente educacional e evolução tecnológica, questionando como é realizado a mineração de dados educacionais, quais seus benefícios e dificuldades, bem como isso vem impactando nos processos de aprendizagem e de gestão. Com essa revisão sistemática da literatura, pretende-se compreender quais meios mais avaliados por meio da mineração de dados educacionais, e de que forma esses dados são extraídos e analisados? como a mineração de dados auxilia na gestão educacional em melhores tomadas de decisão. A justificativa do estudo ocorre em função da evolução tecnológica, ela deve ser melhor estudada e compreendida na área educacional, de modo que possa fornecer e otimizar os processos envolvidos nessa área. 

Essa revisão sistemática da literatura está organizada em seções: a seção dois apresenta trabalhos relacionados ao tema tratado, a seção três apresenta a fundamentação teórica sobre o tema, a quarta seção irá descrever a metodologia, a quinta seção irá descrever os resultados encontrados durante o estudos e as considerações finais sobre o mesmo conforme a seguir.

2 TRABALHO RELACIONADOS

Marques e Silva (2022), realizou uma revisão sistemática da literatura para identificar as principais ferramentas e técnicas da mineração de dados, e também os principais fatores relacionados à retenção acadêmica. Sua revisão resultou em 9 trabalhos acadêmicos, dos quais 6 foram selecionados para extrair as informações, onde foi analisada a retenção acadêmica nos últimos 10 anos. No seu trabalho, foi verificado que a técnica de Classificação vem sendo muito utilizada e tem gerado alta precisão com relação à previsão na tendência de retenção académica.

Souza (2021), estudou através de uma revisão sistemática da literatura a previsão de desempenho de alunos, através da mineração de dados educacionais, e comparar as técnicas de Aprendizagem de Máquina (AM) e Aprendizagem Profunda (AP) utilizando um conjunto de dados públicos. Em seus resultados, foi identificado que os modelos gerados a partir de Aprendizagem Profunda possuem um desempenho superior, com acuracidade de 94%, também foi verificado que atributos relacionados às atividades escolares predizem melhor o desempenho dos alunos do os atributos relacionados a características socioeconômicas e demográficas.

Vivian et al. (2022), buscou entender o sentimento e emoções em ambientes virtuais pelos alunos através de uma revisão sistemática da literatura, onde utilizou a mineração de dados educacionais. Com esse estudo é possível identificar padrões e possíveis deficiências nos processos de aprendizagem. A autora encontrou como resultado que existe a predominância de algoritmos de aprendizado de máquina para análise de sentimentos, onde são avaliados os cursos e professores, a satisfação dos alunos e a eficácia do ambiente virtual de aprendizagem, a maioria dos estudos exploram também como polaridade de sentimento o positivo, neutro e negativo. 

Souza e Cazella (2022), realizaram uma pesquisa onde o objetivo foi realizar a previsão do desempenho de alunos, através de dados públicos e algoritmos de regressão, utilizando duas bases de dados, uma para disciplina de português e outra para disciplina de matemática. Para isso, os autores realizaram uma revisão sistemática da literatura e utilizaram a técnica de mineração de dados educacionais. Como resultado, os autores constataram que atributos relacionados às atividades escolares predizem melhor o desempenho dos alunos do que os dados socioeconômicos, apesar desses também influenciarem no resultado. Também foi constatado que o algoritmo Random Forest teve um melhor desempenho para os dados da disciplina de português, enquanto para a disciplina de matemática o algoritmo mais preciso foi o de Árvores de Decisão. 

Choji et al. (2021), realizou uma pesquisa com mineração de dados educacionais a fim de apresentar uma análise sobre dados da realização do Enade na cidade de Araçatuba/SP. O estudo de caso foi realizado levando em consideração o perfil socioeconômico dos estudantes que concluíram a graduação na cidade entre 2016 e 2018. Os autores chegaram na conclusão de que os alunos declarados brancos que escolhiam as instituições como forma de ingressar no mercado de trabalho tem a tendência de ter notas baixas no Enade, enquanto os alunos autodeclarados pardos, pretos ou indígenas com a mesma motivação do primeiro grupo, apresentam uma nota maior na avaliação do Enade.

3. FUNDAMENTOS TEÓRICOS E REVISÃO BIBLIOGRÁFICAS DO TEMA

A Mineração de Dados Educacionais é uma disciplina emergente, e que está preocupada em desenvolver métodos para explorar dados únicos e cada vez em maior demanda, que são provenientes da área educacional, de modo que se possa compreender melhor os alunos, instituições e todo o universo em torno do aprendizado e ensino (Souza e Santos, 2021).

De acordo com Souza (2020), o MDE, ou mineração de dados educacionais, empregam técnicas comuns de mineração de dados, sendo as principais as Regras de Associação, onde o banco de dados é considerado como um conjunto de transações, que por sua vez são compostas por um conjunto de itens que, em transações do conjunto de dados, ocorrem simultaneamente. 

Uma regra de associação tem a forma X => Y, onde X = {x1, x2, …, xn} e Y = {y1, y2, …, yn} são conjuntos de itens, com xi e yj, sendo itens distintos para todo i e j. Essa associação indica que, se um cliente comprar X, provavelmente comprará Y. Pode ser aplicado, por exemplo, na área de marketing para se descobrir pessoas que compram de forma associada dois produtos diferentes (Souza, 2020). 

Classificação é uma técnica de análise de dados que funciona extraindo modelos de descrição de determinado conjunto de dados, seu objetivo é descobrir uma função que mapeie um conjunto de registros em um conjunto de classes, para então replicar essa função em outros conjuntos de classes, prevendo assim em qual classe determinado registro se enquadra. Árvore de decisão é um método adequado quando o objetivo da mineração é predição de saídas ou classificação de dados. Esse método tem a estrutura de uma árvore, onde cada nó interno (não-folha) é compreendido como um atributo de teste, e cada nó folha ou nó terminal tem um rótulo de classe, o nó raiz é como se chama o nó de mais alto nível em uma árvore de decisão. Agrupamento, ou clustering, possui como objetivo descobrir os dados que se agrupam de forma natural, e classificar os dados em diferentes grupos ou categorias, que inicialmente não são conhecidos, onde os registros em um grupo devem ser semelhantes entre si e diferente dos registros de outros grupos. No MDE é possível descobrir grupos de escola ou grupos de alunos, onde é possível identificar suas similaridades e diferenças, além de se analisar os elementos que compõem cada grupo, identificando suas características. (Souza, 2020).

De acordo com Souza e Santos (2021), a mineração é um conjunto de técnicas computacionais que visam extrair informações de grandes massas de dados, como no caso estudado os dados são provenientes de natureza diversa quando comparado com os dados utilizados nas minerações tradicionais, tem-se a necessidade de se realizar estudos, adaptações e criar novas abordagens para a MDE.

4. PROCEDIMENTOS METODOLÓGICOS DA REVISÃO SISTEMÁTICA

Para Kitchenham e Charters (2007), a Revisão Sistemática da literatura (RSL) segue um caminho metodológico bem definido que mostra contribuições para um tema ou fenômeno de forma imparcial e repetível e analisa questões específicas de pesquisa. 

Permite agregar e avaliar a evidência empírica de um determinado campo de estudo com base na análise de resultados de investigação relevantes sobre o tema de interesse, tirando assim conclusões sobre as questões de investigação definidas. Para isso, aplicamos mecanismos de busca, com o objetivo de criar um levantamento de investigação sobre mineração de dados educacionais.

Assim, neste trabalho o protocolo RSL será desenvolvido de acordo com os modelos propostos por Kitchenham e Charters (2007) abrangendo as seguintes fases: planejamento, implementação e resultados.

A primeira fase correspondeu ao planejamento desta pesquisa, definido como objetivo principal desta revisão sistemática: entender quais mídias são mais consideradas pela mineração de dados educacionais e como esses dados são retirados e analisados e como a mineração de dados auxilia na gestão educacional para uma melhor tomada de decisão.

Em seguida, na segunda etapa, três questões principais foram desenvolvidas para auxiliar a pesquisa e a interpretação dos resultados, a fim de contextualizar qualitativamente o tema e reconhecer quantitativamente alguns dados da pesquisa desta temática.

O artigo se trata de uma pesquisa bibliográfica sobre a mineração de dados educacionais, para tal, foi realizada uma análise do estado da arte através de uma Revisão Sistemática da Literatura (RSL), utilizando-se também como base o trabalho apresentado por Souza (2021). A autora possui grande experiência e muitos artigos publicados tanto sozinha como em conjunto com outros autores dentro da área explorada, o que permite extrair de seus trabalhos inúmeros aprendizados e compreender melhor o universo de mineração de dados educacionais. No total foram utilizados 4 artigos para a realização das análises necessárias. Na Figura 1 é descrito as etapas do processo de pesquisa e seleção dos artigos

Figura 1: Etapas do processo de pesquisa e seleção de artigos.

Fonte: Elaborado pelo autor (2022).

Podemos observar que no Quadro 1 é apresentado o total de artigos encontrados através dos critérios de inclusão, exclusão e qualidade, por cada sítio eletrônico, tendo sido encontrados 750 no Periódicos CAPES, 93 no Banco de Dados da USP e 519 Scholar Google.

Quadro 1: Resultado das pesquisas realizadas.

Base Fase 1Fase 2Fase 3
Periódicos CAPES75042
Banco de Dados da USP9330
Scholar Google51932
Total 1.362104

Fonte: Elaborado pelo autor (2022).

4.1 Questões de Pesquisa

Para responder às questões apresentadas na Revisão Sistemática da Literatura, foram elaboradas três questões que servem como norteadoras do estudo e da análise dos artigos encontrados. São elas:

Quadro 1 –.Questões norteadora

QuestõesDescrição
Q1:Quais atributos são mais avaliados por meio da mineração de dados educacionais?
Q2:De que forma esses dados são extraídos e analisados?
Q3:Qual a conclusão dos autores com relação à mineração de dados educacionais?

Fonte: Elaborado pelo autor (2022).

4.2 Estratégias de Busca

A estratégia de busca dessa revisão foi separada em duas etapas, a primeira está relacionada com a definição de palavras chave, já a segunda está relacionada com a pesquisa em bibliotecas digitais, que serão utilizadas como fonte de estudo do tema proposto (KITCHENHAM; CHARTERS, 2007). 

4.3 Palavras-chave

Palavras-chave 1: Aprendizado de máquinas; Educometria; Predição e retropredição; Análise fatorial; 

Palavras-chave 2: BigData; Aprendizagem; Análise e estatística multivariada; Classificação de padrões; 

Palavras-chave 3: Mineração de dados; Dados educacionais; Extração de atributos e características; Quantificação de incertezas; 

4.4 String de Busca

Quadro 2 String de busca utilizada nas bases de dados.

Fonte: Elaborado pelo autor (2022).

4.5 Bases de dados e processo de extração

O processo de busca de artigos ocorreu utilizando-se as principais bases eletrônicas e científicas de dados que respondessem Q1, Q2 e Q3. A Revisão Sistemática da Literatura considerou a busca automática com os critérios de inclusão, exclusão e de qualidade, e foi observado a experiência do pesquisador, além de ser optado pelas pesquisas realizadas no Brasil, onde foram analisados dados relacionados à educação do país. Os artigos científicos considerados possuem no máximo 5 anos de publicação e estão escritos em língua portuguesa. O quadro 3 mostra a base bibliográfica utilizada para a obtenção dos estudos. 

Quadro 3 – Bases de Dados da Pesquisa e Endereço (Link)

Base de DadosEndereço EletrônicoTipo de busca
Periódicos CAPEShttps://www.gov.br/capes/pt-brAutomática
Banco de dados bibliográficos da USP https://dedalus.usp.br/FAutomática
Scholar Google https://scholar.google.com.brAutomática

Fonte: Elaborado pelo autor (2022).

4.6 Critérios de Inclusão, Exclusão e Qualidade

Um passo importante para a realização da Revisão Sistemática da Literatura é a criação de critérios para auxiliar na boa seleção de material bibliográfico. Esses critérios estão separados em três categorias: Critérios de inclusão, critérios de exclusão e Critérios de qualidade. Os artigos foram obtidos a partir dos strings de busca que foram implementados nas bases de dados a partir das questões elaboradas para o estudo e selecionadas através dos critérios definidos no Quadro 4.

Quadro 4 – Critérios de Inclusão, Exclusão e Qualidade

Fonte: Elaborado pelos autores (2022).

5. RESULTADOS E DISCUSSÃO

Após realizar as seleções dos artigos e serem utilizados os critérios de inclusão, exclusão e de qualidade, chegou-se a 4 trabalhos que se destacavam dentro do tema abordado, onde o objetivo dos autores era analisar o desempenho dos alunos, através do uso de mineração de dados.

Quadro 5 – Artigos selecionados.

AutoresAno de PublicaçãoTema
SOUZA, V.F.2021Mineração de dados educacionais com aprendizagemde máquina.
MARQUES, L.T., MARQUES, B.T., SILVA, C.A.M.2022A Descoberta das Causas da Retenção Acadêmica Utilizando Mineração de Dados: Uma Revisão Sistemática da Literatura
SOUZA, V.F., SANTOS, T.C.B.2021Processo de Mineração de Dados Educacionais aplicado na Previsão do Desempenho de Alunos: Uma comparação entre as Técnicas de Aprendizagem de Máquina e Aprendizagem Profunda
SOUZA, V.F., CAZELLA, S.C.2022Mineração de dados educacionais com algoritmos de regressão: um estudo sobre a predição de desempenho.

Fonte: O autor (2022).

Os artigos selecionados foram então lidos na íntegra e uma planilha eletrônica foi utilizada para extrair os dados principais, a fim de responder às questões de pesquisa. A discussão ocorre por meio da sistematização de questões conduzidas para fins de pesquisa. Posteriormente, procedeu-se à síntese destes dados e à análise dos resultados para a elaboração do relatório final que será apresentado na secção seguinte.

Q1: Quais atributos são mais avaliados por meio da mineração de dados educacionais?

Souza (2021), Marques et al. (2022), Souza e Santos (2021), informam que os atributos avaliados e que mais influenciam no desempenho dos alunos são as notas, a frequência de faltas, o nível de interesse pelo conteúdo, além de outros atributos não especificados pelos autores, mas todos se relacionam com o desempenho das atividades escolares desempenhadas pelo aluno. O atributo sócio econômico tem influência, mas não tem um grande impacto no desempenho, segundo o estudo dos autores. Souza e Cazella (2022), também incluíram como atributos influenciadores a vontade dos alunos de cursarem o ensino superior, e o nível de escolaridade do pai e da mãe. 

Q2: De que forma esses dados são extraídos e analisados?

Para a extração de dados, Souza (2021), Souza e Santos (2021) e Souza e Cazella (2022), realizaram a coleta de dados no repositório de dados públicos, UCI – Machine Learning, esses dados são informações sobre os alunos e sobre seu desempenho acadêmico. Para tratar os dados utilizaram a linguagem de programação e ciência de dados R, onde os autores juntaram todos os dados dos alunos em uma única base, criaram níveis de classificação, formataram os dados como Data Frame, dividiram a base de dados em treinamento e teste, e transformaram o atributo a serem previsto, no caso o desempenho dos alunos. O método de análise foi o de Treinamento e Teste, onde a base de dados é dividida de forma aleatória em dois grupos, um de Treinamento e outro de Teste. 

Marques et al (2022) realizaram uma revisão sistemática da literatura, portanto sua coleta de dados foi através de critérios de inclusão, exclusão e qualidade de artigos, selecionando aquelas que se enquadrar dentro dos seus critérios. 

Q3: Qual a conclusão dos autores com relação à mineração de dados educacionais?

Souza (2021), constatou que o algoritmo Árvore de Decisão foi o mais preciso em sua pesquisa, e que uma base de dados formadas por registros de notas, frequência e características demográficas, ou seja os aspectos sociais e escolares é suficiente para gerar modelos eficazes para prever o desempenho dos alunos. Marques et al. (2022), também concluíram que o método de Classificação é um dos mais utilizados na literatura, e que dentre os algoritmos a Árvore de Decisão e Naive Bayes são os mais utilizados, para diversas finalidades. Dentre as ferramentas, os autores identificaram como as mais utilizadas as ferramentas JMP, WEKA e STATISTICA 12, dentre os atributos que influenciam a retenção dos alunos nas instituições, os autores destacaram que os mais influentes são em relação a visão do aluno sobre a instituição, como falta de suporte da mesma, por exemplo. Souza e Santos (2021) e Souza e Cazella (2022), concluíram que além da Árvore de Decisão, outros algoritmos em suas pesquisas também apresentaram grande eficiência, são eles o Random Forest, Suport Vector Machine e RNAM. Os autores concordam também que os atributos que mais influenciam nos dados e na predição sobre o desempenho dos alunos são os dados mais recentes, principalmente os ligados a notas e faltas dos estudantes. 

6. CONCLUSÃO 

Os artigos selecionados através dos critérios de inclusão, exclusão e de qualidade apresentaram bom conteúdo teórico, onde foi possível compreender bem sobre o tema abordado, sua importância e como pode influenciar na gestão educacional. 

Durante a Revisão Sistemática da Literatura realizada, foi possível perceber que a Mineração de Dados Educacionais é uma área muito abrangente, mas que ainda precisa ser mais estudada e estruturada, já que os dados são diversos e muito volumosos, visto que a área educacional é bem ampla.  

Porém, constatou-se que a utilização de dados educacionais beneficia de várias formas o trabalho da gestão escolar. Foi possível por meio dessa pesquisa compreender que o algoritmo Árvore de Decisão é o que mais se destacou na literatura como sendo o mais eficaz, e que os atributos socioeconômicos dos alunos possuem influência, mas não interferem tão fortemente na predição de desempenho dos alunos como os atributos relacionados a notas, faltas, e demais atividades realizadas pelo estudante. Entretanto, alguns questionamentos ainda não foram respondidos de maneira satisfatória com esta RSL, o que leva à necessidade de aumentar a proposta da pesquisa para outras bases de dados.

Portanto, como    trabalho    futuro    desta    revisão, deseja-se    um aprofundamento sobre a mineração de dados educacionais, com foco numa gestão educacional para uma melhor tomada de decisão, e que otimize e potencialize o uso dos dados educacionais para a melhoria dos resultados de aprendizagem.

REFERÊNCIAS

CHOJI, M.F; DAMASCENO, C. D. N; BITTENCOURT, I. I; ISOTANI, S. Mineração de dados do Enade de 2016 a 2018: uma análise sobre o município de Araçatuba/SP. RENOTE, Porto Alegre, v. 19, n. 2, p. 183–192, 2021. 

DERMEVAL, D.; COELHO, J. A. P. M.; BITTENCOURT, I. I. Mapeamento Sistemático e Revisão Sistemática da Literatura em Informática na Educação. In: JAQUES, P. A.; SIQUEIRA, S.; BITTENCOURT, I.; PIMENTEL, M. (Ed). Metodologia de Pesquisa Científica em Informática na Educação: Abordagem Quantitativa. Porto Alegre: SBC, 2020. 

FERNANDES, F. T.; CHIAVEGATTO, A. D. P. Perspectivas do uso de mineração de dados e aprendizado de máquina em saúde e segurança no trabalho. Revista Brasileira de Saúde Ocupacional. 2019, v. 44. 

KITCHENHAM, B.    (2004).    Procedures    for    performing    systematic    reviews.    Keele,    UK,    Keele University,    33(2004),    1-26. Disponível    em: https://www.inf.ufsc.br/~aldo.vw/kitchenham.pdf 

KITCHENHAM, B.; CHARTERS, S. Guidelines for performing Systematic Literature Reviews in Software Engineering . Technical Report EBSE 2007-001, Keele University and Durham University Joint Report, 2007.  

MARQUES, L.T., MARQUES, B.T., SILVA, C.A.M. . A Descoberta das Causas da Retenção Acadêmica Utilizando Mineração de Dados: Uma Revisão Sistemática da Literatura. RENOTE, Porto Alegre, v. 20, n. 1, p. 263–272, 2022. 

SOUZA, V. F. Mineração de dados educacionais em um mooc brasileiro. EaD & Tecnologias Digitais na Educação, [S. l.], v. 8, n. 10, p. 62–78, 2020

SOUZA, V. F. Mineração de dados educacionais com aprendizagem de máquina. Revista Educar Mais, [S. l.], v. 5, n. 4, p. 766–787, 2021. DOI: 10.15536/reducarmais.5.2021.2417. Disponível em: https://periodicos.ifsul.edu.br/index.php/educarmais/article/view/2417. Acesso em: 3 dez. 2022.

SOUZA, V.F., CAZELLA, S.C. Mineração de dados educacionais com algoritmos de regressão: um estudo sobre a predição do desempenho. Revista Educar Mais, [S. l.], v. 6, p. 183–198, 2022. 

SOUZA, V.F., SANTOS, T.C.B. Processo de Mineração de Dados Educacionais aplicado na Previsão do Desempenho de Alunos: Uma comparação entre as Técnicas de Aprendizagem de Máquina e Aprendizagem Profunda. Revista Brasileira de Informática na Educação – RBIE, 2021. 

VIVIAN, R. L. et al. Mineração de Dados Educacionais e Análise de Sentimentos em Ambientes Virtuais de Aprendizagem: um Mapeamento Sistemático. EaD em Foco, v. 12, n. 2, e1786, 2022.


1Graduado em Matemática pela Universidade Estadual Vale do Acaraú – UVA (2011). Especialista em Gestão Escolar pela Faculdade Ieducare. MBA em Gestão e Políticas Públicas Municipais, Mestrado com pesquisas na área de tecnologia aplicada a educação pela Universidade Federal do Ceará (UFC). Atualmente estuda doutorado na área de pesquisa em Avaliação da Efetividade e do Desempenho da Aprendizagem com Análise Multidimensional e Multilinear, em Engenharia de Teleinformática,(UFC). Membro do Grupo de Estudos Tecendo Redes Cognitivas de Aprendizagem (G-TERCOA / UFC), Membro do Laboratório de Pesquisas e Avaliações Métricas e Cultura Digital Maker (LABPAM/CDMaker)
https://orcid.org/0000-0001-7867-8143
e-mail. professortoinhonasc@gmail.com

2Licenciado em Matemática e Mestrando em em Engenharia Elétrica e de Computação (UFC)
e-mail. Fernandorodrigues0007@gmail.com

3Pós-Doutorado em Administração na UFPB (2018-2019), Doutora em administração pela PUC/SP (2017) e Mestre em Administração pela PUC/SP (2011). Mestre em administração – gestão em negócios pela Universidade Vale do Rio Verde (2001). Especialização em Gerência Financeira- UNINCOR (1995), Graduação em ciências Contábeis pela Universidade Vale do Rio Verde (1994), Graduação em administração pela Universidade Vale do Rio Verde (1991) . Tem experiência como docente na área da Administração e coordenação . Foi editora gerente da Revista Administração em Diálogo (RAD) PUC/SP (2013/2016). Experiências em pericias em administração e contábeis. Avaliadora do INEP/MEC e do CEE/MG. Interesse em pesquisas nas áreas : Marketing; Comportamento do consumidor; Cultura de Consumo e Transformative Consumer Research (TCR) , Service Dominant Logic – ( LDS) e Transformative Service Research ? TSR.
ORCID: https://orcid.org/0000-0003-3556-4239
E-mail: eribeirooliveira@yahoo.com.br

4Mestranda em Ensino de Ciências e Matemática (Universidade Federal do Ceará); Especialista em Gestão Educacional (Instituto Superior de Teologia Aplicada, INTA, Brasil); Licenciada em Matemática (Universidade Estadual Vale do Acaraú, UVA – CE); Professora da rede pública de ensino municipal e estadual; Diretora do Colégio Gênesis (rede privada de ensino, em Canindé – CE); Coordenadora Escolar na EEEP Capelão Frei Orlando (Canindé – CE); Diretora da EEEP Luiz Gonzaga Fonseca Mota (Amontada- CE); Atualmente é Diretora na Escola Estadual de Educação Profissional Francisco Paiva Tavares, no Município de Caridade – CE. Possui experiência na área educacional com ênfase em matemática e gestão escolar.
https://orcid.org/0000-0001-6898-2088
E-mail: kati-sn@hotmail.com

5Mestre em Engenharia Agrícola; Tecnólogo em Recursos Hídricos; Graduando em Matemática; Professor do Ensino Médio, nas disciplinas de Matemática e física (2009 – 2016); Professor em disciplinas de exatas no ensino superior (2012 – 2016) Secretário Municipal de Educação de Jijoca de Jericoacoara (2017-2020), Secretário Municipal de Educação de Jijoca de Jericoacoara (2021 aos dias atuais).
E-mail: tony_thiago@hotmail.com

6Graduado em Letras – Português / Inglês e pós graduado em gestão escolar e gestão de liderança. Atualmente sou coordenador pedagógico na escola Francisco Sales de Carvalho no município de Jijoca de Jericoacoara.
E-mail: Cleutonmedeiros9@hotmail.com

7Possui Especialização em Mídias na Educação pela Universidade Federal do Ceará (2013), Bacharelado em Sistemas de Informação pela Universidade Federal do Ceará (2014) e Licenciatura Plena em Português e Inglês pela Universidade Estadual Vale do Acaraú (2005). Atualmente compõe o corpo docente do Ensino Médio Integrado (EMI) do Instituto Centro de Ensino Tecnológico (Centec) e também com a Coordenação de Curso Técnico em Informática da EEEP Antônio Rodrigues de Oliveira, Pedra Branca – CE
E-mail: claudiomatias.3c@gmail.com