EXD METHOD AND DATA SCIENCE SCIENCE: AN APPROACH ON EDUCATION AND DEVELOPMENT
REGISTRO DOI: 10.69849/revistaft/pa10202505111335
Débora Costa de Sousa1
Dr. João Batista Furlan Duarte2
Resumo
A pesquisa apresenta o método “EXD”, que utiliza a análise de dados para observar e avaliar tendências de índices relacionados aos indicadores criados a partir do método. O método “EXD” (Educação x Desenvolvimento) é uma abordagem inovadora desenvolvida para analisar a relação entre indicadores educacionais e fatores de desenvolvimento socioeconômico. Ele combina técnicas de ciência de dados, estatística descritiva e inferencial para criar e avaliar índices educacionais – iE, índice de Educação, iX, índice de Desempenho Escolar, e iD, índice de Desenvolvimento. Esses índices são derivados de variáveis, como taxas de rendimento escolar, distorção idade-série, qualificação docente e remuneração, permitindo uma análise quantitativa aprofundada das tendências educacionais e seus impactos no desenvolvimento. Os resultados reforçam a importância da educação como vetor de transformação social e econômica, fornecendo indicativos valorosos baseados em dados para orientar políticas públicas mais eficazes e direcionadas.
Palavras-chave: Método EXD; Indicadores Educacionais; Ciência de dados; Educação pública.
1 INTRODUÇÃO
Sabe-se que uma das funções da academia é transformar a realidade para o progresso, e nós brasileiros, enquanto sociedade democrática, sabemos que é importante partilhar saberes para a evolução do bem comum e dos indivíduos que estão inseridos nesse contexto. Desde a Antiguidade, filósofos como Platão e Aristóteles defenderam a importância da educação para a formação de cidadãos conscientes e críticos, capazes de contribuir para o bem-estar coletivo. No século XXI, a complexidade dos desafios globais requer uma abordagem ainda mais robusta e interdisciplinar da educação, que transcenda as barreiras entre as ciências da vida, da natureza e da sociedade (Floriani, 2008), de tal modo, ela não é apenas um direito fundamental, mas também um vetor de transformação social.
Além disso, a educação pode promover mudanças comportamentais e culturais indispensáveis para a sustentabilidade. Uma educação de qualidade tem a capacidade de formar os indivíduos para a tomada de decisões informadas e responsáveis, podendo assim incentivar práticas que respeitem e protejam o meio ambiente promovendo a equidade e a inclusão, reduzindo desigualdades.
O ensino, para além de abordar o conteúdo acadêmico, também pode enfatizar valores e atitudes que fomentem a cidadania ativa e a responsabilidade social. E é possível formar indivíduos que compreendam os problemas globais.
Assim, a educação emerge como uma ferramenta poderosa para a construção de um futuro mais justo e sustentável, capaz de enfrentar os desafios complexos e interligados do nosso tempo. Nesse sentido, Jacobi (1999) pontua o processo de empoderamento dos indivíduos e a capacitação para tomada de decisões em questões relacionadas ao meio ambiente, que impactam a economia e a sociedade como um todo, e com as quais as novas gerações terão que lidar.
Ademais, o acesso a uma educação inclusiva e equitativa contribui para a redução das desigualdades sociais e econômicas, promovendo uma distribuição de oportunidades e recursos, uma vez que a educação pode promover valores de igualdade, respeito e cooperação, pois tem a habilidade de capacitar os indivíduos, e também pode contribuir para a criação de uma sociedade mais harmoniosa.
Diante desses desafios, torna-se essencial adotar abordagens que permitam compreender melhor os fatores que influenciam a qualidade da educação. A análise de dados surge como um instrumento fundamental para mensurar o impacto de variáveis educacionais, possibilitando uma gestão educacional estratégica e orientada por evidências. No campo da educação, a análise de dados é uma ferramenta poderosa que permite identificar padrões, prever tendências e apoiar a tomada de decisões informadas. Na era da informação, a capacidade de coletar, processar e analisar grandes volumes de dados oferece uma vantagem estratégica para gestores e educadores. Ao utilizar técnicas avançadas de análise de dados, é possível desenvolver estratégias mais eficientes e personalizadas para melhorar a qualidade do ensino e promover o desenvolvimento da cidade. Assim, a educação torna-se mais adequada às necessidades dessa sociedade.
Sabe-se que políticas educacionais mais eficazes promovem a equidade, a qualidade do ensino e, consequentemente, um desenvolvimento sustentável (Claro; Claro; Amancio, 2008). Através desta abordagem, pretende-se destacar a importância da educação como um motor de transformação social e econômica para a cidade.
Para que essas políticas sejam formuladas e aprimoradas de maneira eficaz, é fundamental compreender como os indicadores educacionais se relacionam com o desenvolvimento socioeconômico da cidade. Nesse sentido, a análise quantitativa se torna uma ferramenta essencial para embasar decisões estratégicas.
A elaboração do presente artigo é parte do resultado da Dissertação intitulada MÉTODO “EXD” E A CIÊNCIA DE DADOS: UMA ABORDAGEM SOBRE EDUCAÇÃO E DESENVOLVIMENTO DE FORTALEZA, Universidade de Fortaleza – (UNIFOR), para obtenção do grau de mestra. O trabalho mencionado aborda aspectosda educação pública empregando ferramentas de ciência de dados em indicadores que refletem esses aspectos.
Espera-se que os resultados desta pesquisa ofereçam reflexões no que se refere a políticas públicas educacionais, pontuando sobre como a análises do desempenho da educação contribui para reduzir desigualdades e melhorar a infraestrutura e os recursos disponíveis para o desenvolvimento educacional.
2 CONTEXTUALIZAÇÃO TEÓRICA
A educação e o desenvolvimento estão intrinsecamente ligados, configurando uma relação simbiótica que molda o futuro das sociedades. Ao longo da história, a educação tem sido uma ferramenta vital para a transformação social, capacitando indivíduos e promovendo avanços econômicos e sociais. Assim, a educação pode se apresentar como uma estratégia para o desenvolvimento sustentável das cidades e para o bem-estar de suas populações.
2.1 CONCEITOS E DEFINIÇÕES DO ASSUNTO
A educação é um conceito que engloba diversas dimensões e perspectivas. Ela pode ser vista como um processo de transmissão de conhecimentos, habilidades, valores e atitudes ao indivíduo, assim como uma ferramenta de desenvolvimento pessoal, desempenhando um papel importante na formação de indivíduos conscientes e capacitados para participar ativamente na sociedade.
A educação também pode ser dividida em formal, não formal e informal, cada uma desempenhando papéis distintos na formação dos indivíduos. A educação formal refere-se ao sistema estruturado de ensino fornecido por escolas e instituições de ensino superior, enquanto a educação não formal abrange programas de treinamento e capacitação que ocorrem fora do sistema escolar formal. Por fim, a educação informal ocorre através das interações diárias e experiências vividas, sendo um processo contínuo e dinâmico que se estende ao longo da vida.
A educação é um processo deliberado e orientado que visa a transmissão de conhecimentos, o desenvolvimento de habilidades cognitivas e a formação de valores e atitudes. Esse processo ocorre predominantemente em instituições educacionais, como escolas, faculdades e universidades, onde currículos estruturados e programas de estudo são implementados para garantir uma formação abrangente e de qualidade. Além disso, “É preciso pensar as ações em âmbito das políticas públicas para a educação e no seu interior, refletir sobre aquelas que estão voltadas para a formação de professores” (Santos, 2020, p. 45-46).
A educação formal é caracterizada por um currículo definido, avaliações sistemáticas e um corpo docente qualificado, cujo objetivo é promover o desenvolvimento intelectual e profissional dos estudantes. A educação também é vista como um meio para alcançar a equidade social e econômica, uma vez que “A função do fenômeno educativo é constituir o ser social visando a manutenção e a reprodução da ordem social” (Durkheim apud Santos, 2020, p. 45). Dessa forma, a educação não é apenas uma preparação para a vida, mas uma parte integral do desenvolvimento contínuo e do empoderamento dos indivíduos, permitindo-lhes participar plenamente na vida cívica e econômica de suas comunidades e na sociedade em geral.
O desenvolvimento da educação ao longo da história reflete as mudanças sociais, culturais, econômicas e políticas das sociedades. Na Antiguidade, por exemplo, as civilizações egípcia e mesopotâmica desenvolveram escolas para ensinar escrita e matemática, habilidades essenciais para a administração dos estados e o comércio. Na Grécia Antiga, filósofos como Sócrates, Platão e Aristóteles contribuíram significativamente para a educação, enfatizando a importância do pensamento crítico e da busca pelo conhecimento.
Durante a Idade Média, a educação foi predominantemente controlada pela Igreja, com mosteiros e catedrais atuando como centros de aprendizado. No Renascimento, a redescoberta dos textos clássicos e o surgimento das universidades promoveram uma nova era de pensamento crítico e científico. A Revolução Industrial trouxe a necessidade de uma força de trabalho educada, levando à expansão da educação pública e obrigatória.
Ao longo do século XXI, a educação continuou a evoluir, com um foco crescente na inclusão, equidade e direitos humanos, refletindo as mudanças nas demandas sociais e econômicas e sua importância crescente para o desenvolvimento sustentável. “Historicamente, o momento de virada de uma onda é uma surpresa” (Anderson, 1995 apud Santos, 2020, p. 46). Então, ao longo da história, o ponto de virada de uma civilização evidenciou-se como o resultado da importância dada à educação.
2.1.1 Interdependência entre Educação e Desenvolvimento das Cidades
A educação desempenha um importante papel na capacitação na sociedade, permitindo aos cidadãos adquirir conhecimentos, habilidades e competências necessárias para contribuir de forma significativa para seu grupo social. “Portanto, sem ações mais amplas e efetivas que foquem logo de imediato na formação do professor e definição do que se almeja com a educação, (…) parece ser distante falar em revolução na educação pós-pandemia” (Santos, 2020, p. 46).
A educação pode melhorar a qualidade de vida, pode também aumentar as oportunidades de emprego e reduzir a pobreza. Cidades com altos índices de educação tendem a apresentar maior prosperidade econômica, melhores indicadores de saúde e maior coesão social. Ela também fomenta a inovação e a criatividade, essenciais para o desenvolvimento das cidades.
As cidades inteligentes representam uma forma de promoção de vida digna aos seus moradores, pois elas adquirem essa denominação em razão do atendimento de protocolos que visam à obtenção de mobilidade, de utilização de tecnologia e energia limpa, de realização de ações que promovem o desenvolvimento social e econômico de forma justa, de urbanismo, de governança, entre outros (Carli; Ribas, 2021, p. 131).
Uma população educada é mais propensa a participar ativamente nos processos democráticos e na governança, promovendo a estabilidade política e a paz social. Dessa forma, investir em educação não é apenas uma questão de justiça social, mas também uma estratégia essencial para o desenvolvimento econômico de uma sociedade, pois ela desempenha um papel essencial na capacitação da sociedade, permitindo que os cidadãos adquiram conhecimentos, habilidades e competências necessárias para transformar o meio em que vivem (Carli; Ribas, 2021).
Ainda conforme Carli e Ribas (2021), educação é fundamental para o desenvolvimento de uma comunidade. Cidades que priorizam a educação tendem a ser mais prósperas e inovadoras, refletindo uma sociedade que valoriza o conhecimento e o desenvolvimento humano. Com isso, é possível criar um ciclo virtuoso de progresso e bem-estar, onde a educação contínua alimenta o desenvolvimento sustentável e vice-versa.
2.1.2 Teorias e Modelos Educacionais
A educação inclusiva e equitativa é um princípio que visa garantir que todos os indivíduos, independentemente de suas características pessoais ou circunstâncias, tenham acesso a uma educação de qualidade. Este conceito é baseado na premissa de que a educação é um direito humano básico e deve ser acessível a todos, sem discriminação. “O desenvolvimento sustentável (…) une os conceitos desenvolvimento e respeito ao meio ambiente, garantindo-se, assim, o respeito ao direito humano daqueles que vivem principalmente em centros urbanos (Carli; Ribas, 2021, p. 133, grifos dos autores).
A educação inclusiva pode integrar todos os estudantes, incluindo aqueles com necessidades especiais, em ambientes educacionais regulares, oferecendo suporte e adaptações necessárias para que todos possam aprender e participar plenamente. A equidade na educação, por sua vez, pode proporcionar igualdade de oportunidades aos estudantes, disponibilizando recursos e apoio para que alcancem seu potencial, de modo que, quando todos os indivíduos têm acesso a uma educação de qualidade, a sociedade poderá se beneficiar cada vez mais, resultando, assim, em maior bem-estar social para todos. De acordo com Ramos (2002, p. 12), “É preciso que existam oportunidades justas para que todas as crianças e adolescentes possam realizar seu potencial e participar plenamente na sociedade brasileira”.
A importância da educação inclusiva e equitativa está relacionada ao seu papel na promoção da justiça social, na redução das desigualdades e na construção de uma sociedade mais coesa e democrática. “A erradicação da extrema pobreza e a redução da pobreza não se dará apenas com programas de transferência de renda” (Ramos, 2022, p. 11).
Diversas teorias e modelos educacionais foram desenvolvidos para promover uma educação inclusiva e equitativa. A Teoria da Pedagogia Crítica, proposta por Paulo Freire, destaca a necessidade de uma educação que emancipe e capacite os indivíduos, promovendo a consciência crítica e a capacidade de transformar a realidade social.
Outro modelo significativo é a Educação Humanista, que coloca o estudante no centro do processo educativo e valoriza o desenvolvimento emocional e social tanto quanto o acadêmico. Carl Rogers, defensor dessa abordagem, enfatiza a importância de um ambiente de aprendizado onde os estudantes possam explorar seu potencial em um ritmo que lhes seja confortável, em suas palavras, deve-se falar sobre APRENDIZAGEM com letras maiúsculas – aquela insaciável curiosidade que leva o adolescente a absorver tudo o que pode ver, ouvir ou ler (Rogers, 2010).
A Teoria da Educação Multicultural, defendida por autores como James Banks, busca reconhecer e valorizar a diversidade cultural nas salas de aula, integrando perspectivas e conteúdos diversos no currículo para promover uma maior compreensão e respeito entre os estudantes. A educação multicultural trata-se de um conceito, um movimento de reforma educacional e um processo que visa garantir a todos os alunos, independentemente de suas características, uma oportunidade igual de aprendizagem (Banks, 2014).
Esses modelos e teorias oferecem diferentes abordagens para a criação de ambientes educacionais inclusivos e equitativos, cada um com suas próprias metodologias e práticas recomendadas. Existem vários exemplos de estudos de caso que ilustram a aplicação bem-sucedida de teorias e modelos educacionais inclusivos e equitativos. Um destes exemplos utilizou ciência de dados para a educação, com evidências empíricas sobre como a educação superior pode impulsionar o crescimento econômico nos países do BRICS (Mussaiyib; Pradhan, 2024).
Este estudo examina a conexão entre a educação superior e o desenvolvimento econômico nos países do BRICS. Este estudo utilizou o índice de matrícula bruta (GER) para medir o nível de educação superior nos países do BRICS, enquanto o produto interno bruto (PIB) foi usado para estimar o crescimento econômico (Mussaiyib; Pradhan, 2024, p.1)3.
De acordo com o artigo, a educação superior contribui para o desenvolvimento econômico ao aumentar a produtividade e a eficiência do capital humano, promovendo a inovação e a geração de conhecimento (Mussaiyib; Pradhan, 2024). A pesquisa ainda destaca a importância da educação superior para o crescimento econômico dos países do BRICS, uma vez que contribui para o desenvolvimento econômico ao aumentar a produtividade e a eficiência do capital humano, promovendo a inovação e a geração de conhecimento. A educação superior é essencial para gerar ideias e construir uma base de conhecimento, ambas contribuem para a prosperidade econômica. A iniciativa de investigar essa conexão vital no contexto dos países do BRICS expande significativamente o corpo de pesquisa existente (Mussaiyib; Pradhan, 2024)4.
O estudo destacou, então, que as implicações para políticas educacionais se relacionam com: o aumento do investimento em educação superior, ou seja, políticas que incentivem o aumento das matrículas no ensino superior podem levar a um crescimento econômico sustentável; foco em inovação e desenvolvimento, investimentos em pesquisa e desenvolvimento dentro das instituições de ensino superior são fundamentais para o progresso econômico; inclusão e acesso que visa, ampliar o acesso à educação superior, especialmente para grupos subrepresentados, pode promover um crescimento mais inclusivo.
Portanto, o estudo chegou à conclusão que decisões informadas sobre alocação de recursos e desenvolvimento de políticas educacionais podem favorecer o fortalecimento da economia. Ao focar na educação superior, esses países podem melhorar significativamente suas taxas de crescimento econômico e promover um desenvolvimento sustentável a longo prazo, no entanto, tal crescimento só será possivel com investimentos adequados no ensino superior (Mussaiyib; Pradhan, 2024).
Outro exemplo de destaque foi o estudo que explora a complexa relação entre as tecnologias de informação e comunicação (TICs) e as características socioeconômicas no Brasil (Herrera et al., 2023). Utilizando uma abordagem avançada de machine learning, conhecida como valores SHAP, para interpretar modelos de XGBoost e redes neurais, os autores investigaram as interações não lineares no conjunto de dados e obtiveram conclusões para a formulação de políticas públicas personalizadas. A aplicação de algoritmos de aprendizado de máquina combinados com a metodologia SHAP revela relações não lineares complexas nos dados e resultados importantes para orientar a formulação de políticas personalizadas (Herrera et al., 2023, tradução nossa)5.
Explicando o XGBoost (Extreme Gradient Boosting), trata-se de um algoritmo de machine learning baseado em árvores de decisão que otimiza o processo de aumento, criando uma série de árvores que aprendem a partir dos erros das árvores anteriores. O Gradient Boosting, é uma biblioteca popular juntamente com o scikit-learn, cria uma árvore fraca e aprimora as árvores subsequentes por meio de boosting, visando reduzir os erros residuais e tratar padrões até que se tornem aleatórios (Harrison, 2020).
Quanto aos Valores SHAP (SHapley Additive exPlanation), estes são uma abordagem de interpretação de modelos de machine learning baseada na teoria dos jogos cooperativos. Eles fornecem uma medida da importância de cada característica para a previsão do modelo, explicando como a presença ou ausência de cada característica impacta a previsão. Isso ajuda a entender as interações não lineares e a importância relativa das variáveis no modelo (Herrera et al., 2023). No estudo, foi utilizada uma rede neural com duas camadas ocultas, cada uma contendo 50 neurônios, e a função de ativação ReLU (Rectified Linear Unit). Um algoritmo de otimização foi utilizado para ajustar os pesos das conexões durante o treinamento (Herrera et al., 2023).
Primeiramente, o estudo evidencia que o nível de educação é um dos fatores mais relevantes na previsão da renda dos indivíduos. Utilizando técnicas avançadas de machine learning, como XGBoost e redes neurais artificiais, os autores descobriram que o impacto da educação na renda não é apenas linear, mas envolve relações complexas que métodos tradicionais de regressão linear não conseguem capturar adequadamente (Herrera et al., 2023).
As análises com valores SHAP revelaram que a educação tem um papel relevante na melhoria das oportunidades de renda, demonstrando que indivíduos com níveis mais altos de educação tendem a ter rendas significativamente maiores.
Nossos resultados sugerem que há uma interação entre educação e TICs que contribui para a previsão da renda. Além disso, o nível de escolaridade e a idade estão positivamente associados à renda, enquanto o gênero apresenta uma relação negativa; ou seja, as mulheres ganham menos que os homens em média (Herrera et al., 2023, p.1, tradução nossa)6.
Em segundo lugar, o artigo destaca a importância da inclusão digital como um fator complementar à educação para a melhoria das condições socioeconômicas. A análise mostrou que o acesso à internet através de dispositivos como computadores, tablets e smart TVs está positivamente correlacionado com a renda. Isso sugere que a inclusão digital é um facilitador importante para a utilização de oportunidades econômicas proporcionadas pela educação (Herrera et al., 2023).
A análise de valores SHAP mostrou que a influência das TICs na renda é particularmente evidenciada quando combinada com altos níveis de educação, sugerindo que políticas públicas devem focar não apenas em melhorar o acesso à educação, mas também em garantir que todos tenham acesso às tecnologias digitais e saibam como utilizá-las efetivamente (Herrera et al., 2023).
Finalmente, o artigo sugere que a combinação de educação e TICs pode ter um impacto substancial na promoção do desenvolvimento socioeconômico sustentável. A educação fornece a base para que os indivíduos adquiram habilidades essenciais, enquanto as TICs ampliam essas habilidades e abrem novas oportunidades econômicas. Para maximizar o impacto positivo dessas duas áreas, é necessário que políticas públicas promovam a integração das TICs nos currículos educacionais desde os níveis mais básicos até o ensino superior. Ademais, deve-se garantir que todos os segmentos da população, independentemente de gênero ou localização geográfica, tenham acesso igualitário a recursos educacionais e tecnológicos (Herrera et al., 2023).
O estudo conclui, portanto, que o uso de métodos avançados de ciência de dados, como machine learning e valores SHAP, não só oferece uma compreensão mais profunda das relações complexas entre educação, TICs e renda, mas também fornece uma base sólida para a formulação de políticas públicas mais eficazes e direcionadas para promover a inclusão digital e educacional no Brasil (Herrera et al., 2023).
Este estudo destaca a necessidade de políticas públicas mais eficientes para combater a desigualdade de gênero no Brasil. Também é importante introduzir políticas que promovam a educação de qualidade e o ensino de habilidades relacionadas à tecnologia e digitalização para preparar os indivíduos para as mudanças no mercado de trabalho e evitar a exclusão digital e o aumento da desigualdade social (Herrera et al., 2023, n.p, tradução nossa)7. Ratifica-se, assim, a importância de se analisar os impactos da oferta de uma educação de qualidade, desde os níveis mais básicos até o ensino superior, sobre a economia dos países, lançando mão de metodologias que possibilitem mensurar tais impactos.
3 METODOLOGIA
A investigação científica depende de um “conjunto de procedimentos intelectuais e técnicos adotados para se atingir o conhecimento” (Gil, 2008, p. 8). A metodologia adotada nesta pesquisa é centrada na análise qualitativa por meio de uma revisão bibliográfica. A metodologia foi dividida em três partes: o contexto de pesquisa, trazendo uma visão ampliada do tema a coleta de dados e a análise de dados por meio de trabalhos publicados anteriormente.
A análise de dados na educação tem incorporado novas técnicas avançadas de ciência de dados, que oferece inúmeras oportunidades para melhorar a qualidade e a eficácia dos sistemas educacionais. Com o avanço da tecnologia e a disponibilidade crescente de dados, as instituições educacionais têm acesso a uma vasta quantidade de informações que podem ser utilizadas para fundamentar decisões estratégicas. Esse processo possibilita uma abordagem clara, permitindo ajustes estratégicos antes que problemas se tornem críticos. A análise de dados também pode contribuir para a personalização do ensino, oportunizando que as necessidades específicas dos alunos e das instituições sejam atendidas de maneira mais objetiva.
Os benefícios da análise de dados para a gestão educacional são diversos e impactam diretamente a eficiência das políticas educacionais. Através dessa análise, escolas podem monitorar e avaliar continuamente o desempenho dos alunos, bem como identificar áreas de dificuldade e ajustar estratégias pedagógicas conforme necessário.
Ferramentas avançadas de análise já conseguem prever tendências futuras e auxiliar no planejamento estratégico a longo prazo. No tópico a seguir descreve-se como a análise de dados pode contribuir para a formulação e avaliação de programas educacionais, garantindo que as decisões sejam baseadas em informações concretas.
4 RESULTADOS E DISCUSSÃO
4.1 Estudos de caso relacionados à redução das desigualdades para a Inclusão Educacional
A redução das desigualdades e a promoção da inclusão educacional são fatores fundamentais das políticas educacionais de uma cidade. Um dos estudos que concluiu que o contexto escolar, incluindo qualidade dos professores, suporte emocional e motivacional dos alunos, atividades extracurriculares criativas e um ambiente escolar favorável, está diretamente relacionado a melhores resultados em alfabetização científica nos Estados Unidos (Ding, 2022).
O referido artigo utilizou técnicas de ciência de dados, especificamente análises visuais e aprendizado de máquina, para investigar o contexto escolar que leva a melhores resultados em alfabetização científica nas escolas dos EUA. A pesquisa baseou-se em dados do PISA 2015 e utilizou 49 variáveis relatadas por estudantes, professores e diretores, abrangendo recursos escolares, características do corpo docente e disposições dos alunos em relação ao aprendizado de ciências.
O principal objetivo deste estudo foi usar análises visuais para entender melhor como os resultados de aprendizado em alfabetização científica são alcançados nas escolas dos EUA. Isso foi feito examinando 49 variáveis em nível escolar derivadas dos questionários de estudantes, professores e diretores […] usando […] o Programa para Avaliação Internacional de Estudantes (PISA) de 2015 (Ding, 2022, tradução nossa)8.
Os dados de alunos e professores foram agregados no nível escolar para fornecer uma visão abrangente de como cada componente do ambiente escolar contribui para os resultados educacionais. A análise identificou que escolas com características específicas, como maior proporção de professores qualificados e atividades extracurriculares de ciências, tendem a ter melhores resultados em ciências. Isso sugere que políticas educacionais focadas nessas áreas podem ser eficazes para melhorar a alfabetização científica (Ding, 2022).
O artigo usou, para isso, Análises Visuais e Machine Learning, como a análise Multidimensional de Preferências (MDS): Usando análises visuais da análise de preferências MDS como uma abordagem de aprendizado de máquina não supervisionada, investigamos o contexto no qual as escolas podem alcançar melhores resultados em alfabetização científica. Metodologicamente, é uma aplicação inovadora da modelagem MDS dos resultados da educação científica escolar baseada em dados de alta dimensão (Ding, 2022, n.p, tradução nossa)9.
A pesquisa empregou a MDS como ferramenta de visualização para explorar relações entre variáveis e diferenças entre escolas (Ding, 2022). A Análise Multidimensional de Preferências (MDS) é uma ferramenta para a visualização de dados complexos, proporcionando uma maneira intuitiva de explorar e interpretar as relações entre variáveis em um conjunto de dados. Ela utiliza, dentre outros: a Redução de Dimensionalidade, que transforma dados de alta dimensão em um espaço de baixa dimensão, geralmente 2D ou 3D, facilitando a visualização e interpretação dos dados; Representação Gráfica, em que as variáveis são representadas como pontos em um gráfico, cuja distância entre os pontos reflete a similaridade ou dissimilaridade entre as variáveis; Análise de Preferências, que é usada para investigar padrões em dados, mapeando essas preferências em um espaço visual; e também a Visualização de Relacionamentos, técnica que ajuda a identificar e interpretar padrões complexos nas relações entre variáveis, facilitando a compreensão de como essas variáveis interagem entre si (Ding, 2022).
A MDS ajudou a identificar padrões complexos e fornece uma representação visual das interações entre variáveis, facilitando a interpretação dos dados e a tomada de decisões, o que permitiu a compreensão das relações entre as variáveis, identificando padrões que puderam orientar intervenções positivas e práticas de ensino eficazes (Ding, 2022).
Como conclusão, o estudo destacou a importância da integração de métodos avançados de ciência de dados, como aprendizado de máquina e visualização de dados, na pesquisa educacional. Esses métodos permitem uma compreensão mais profunda dos fatores que influenciam os resultados educacionais e oferecem opções para a formulação de políticas e práticas educacionais baseadas nos resultados obtidos na pesquisa, pois, segundo Ding (2022) examinar as relações entre a alfabetização científica escolar e o contexto escolar, avaliadas por diversos fatores relacionados a estudantes, professores e administradores, pode revelar como essas variáveis estão associadas e operam como um sistema para que as escolas possam alcançar melhores resultados (Ding, 2022, tradução nossa)10.
Outro estudo nessa mesma linha de pensamento pesquisou a influência dos sistemas de ensino superior: “Higher Education Systems“ – HESs, no desenvolvimento econômico regional na Europa, utilizando uma abordagem combinada de técnicas estatísticas e de machine learning para analisar dados de 649 regiões NUTS-3, em 29 países europeus, entre 2014 e 2016 (Bertoletti; Berbegal-Mirabent; Agasisti, 2022).
Os autores desenvolveram um dataset original, integrando dados de várias fontes, incluindo ETER, InCites, Eurostat e OECD Regional Database. Eles utilizaram 15 indicadores para caracterizar a diversidade dos HESs, como o tamanho dos sistemas de ensino superior, a internacionalização dos alunos e a produtividade em pesquisa. O modelo de random forest foi utilizado para lidar com a alta dimensionalidade e a colinearidade dos dados, permitindo identificar as variáveis mais importantes que afetam o desenvolvimento econômico regional.
O estudo demonstrou que características específicas dos HESs, como o tamanho, a internacionalização e a produtividade em pesquisa, têm um influência no desenvolvimento econômico das regiões. Os resultados empíricos demonstraram a importância de modelar de forma abrangente a diversidade dos HES, já que características e desempenhos distintos podem contribuir de maneira diferente para a economia das regiões (Bertoletti; Berbegal-Mirabent; Agasisti, 2022, tradução nossa)11.
Isso destaca a importância de investir em sistemas de ensino superior diversificados e de alta qualidade para promover o crescimento econômico. A pesquisa também abordou a heterogeneidade dos HESs e suas diferentes contribuições para o desenvolvimento regional, o que pode ajudar a entender e mitigar desigualdades regionais, uma vez que buscou demonstrar a heterogeneidade entre os HESs nas regiões pesquisadas (Bertoletti; Berbegal-Mirabent; Agasisti, 2022). Desse modo, regiões com HESs mais diversificados tendem a apresentar um desempenho econômico melhor, sugerindo a necessidade de políticas que incentivem o fortalecimento das instituições de ensino superior em regiões menos desenvolvidas.
Portanto, o artigo exemplifica, pela perspectiva da ciência de dados, como métodos avançados de análise de dados podem ser aplicados para entender a complexidade das relações entre educação e desenvolvimento econômico e concluiu que a relevância do estudo para a educação está na identificação de fatores críticos dentro dos sistemas de ensino superior que podem ser alavancados para promover o crescimento econômico regional, oferecendo um caminho para a formulação de políticas educacionais mais eficazes. Uma dessas estratégias é a distribuição equitativa de recursos, garantindo que escolas em áreas mais carentes recebam os investimentos necessários para melhorar suas infraestruturas e seus recursos pedagógicos, pois, conforme os autores, “os fatores mais importantes para o desenvolvimento econômico regional são o tamanho dos HES, a internacionalização dos alunos e a produtividade em pesquisa” (Bertoletti; Berbegal-Mirabent; Agasisti, 2022, tradução nossa)12.
Outro elemento na redução das desigualdades é a implementação de programas de apoio socioeducativo, que oferecem suporte adicional para estudantes em situação de vulnerabilidade. Esses programas incluem reforço escolar, acompanhamento psicopedagógico e assistência social, visando atender às necessidades específicas de cada aluno e garantir seu sucesso acadêmico. Além disso, políticas de alimentação escolar e transporte gratuito têm sido fortalecidas para eliminar barreiras que possam impedir a frequência regular às aulas.
4.2 Importância da Análise de Dados na Educação
A análise de dados na educação permite que gestores educacionais, professores e formuladores de políticas identifiquem padrões, tendências e áreas que necessitam de melhorias, baseando-se em evidências concretas. Esse modelo de análise deve evidenciar “ as relações existentes entre os dados obtidos e os fenômenos estudados, enquanto a interpretação é uma atividade que leva o pesquisador a dar um significado mais amplo às resposta”s (Barth, 2003, p. 199).
Além disso, a análise de dados pode contribuir para a personalização do ensino, de uma maneira a melhor atender às necessidades da instituição. Em suma, a capacidade de coletar, analisar e interpretar dados educacionais de maneira eficaz é uma alternativa que pode promover uma educação de alta qualidade e alcançar melhores resultados para todos os alunos. Isso permite um acompanhamento mais proativo, em vez de reativo, apenas baseando-se em suposições. Ferramentas de análise avançada, como o aprendizado de máquina e a inteligência artificial, também podem prever tendências futuras e auxiliar no planejamento estratégico a longo prazo. Segundo Barth (2003),
As pesquisas de natureza tipicamente qualitativa geram um enorme volume de dados que precisam ser organizados e compreendidos, requerendo assim um processo continuado em que se procura identificar dimensões, categorias, tendências, padrões, desvendando-lhes o significado (p. 194).
Em termos de políticas públicas, a análise de dados fornece uma base estável para a formulação e avaliação de programas educacionais, garantindo que as decisões sejam informadas por evidências concretas e não por intuições ou pressões políticas. Assim, a integração da análise de dados na gestão educacional não só melhora a tomada de decisões, mas também promove uma cultura de transparência, responsabilidade e melhoria contínua.
Os métodos de coleta e análise de dados educacionais podem ser divididos em quantitativos e qualitativos, cada um oferecendo perspectivas valiosas para a compreensão dos fenômenos educacionais.
No tocante aos métodos quantitativos, estes envolvem a coleta de dados numéricos, que podem ser analisados estatisticamente para identificar padrões e tendências. Exemplos incluem testes padronizados, taxas de matrícula, índices de abandono escolar e dados demográficos dos alunos. Esses métodos permitem uma análise objetiva e comparações entre diferentes grupos e períodos de tempo.
Proveniente das ciências naturais, a pesquisa quantitativa se baseia em variáveis objetivas e numéricas. Nesse contexto, as variáveis são vistas como objetivas e passíveis de replicação, sem debate sobre sua qualidade, e medições numéricas são preferidas por sua adequação à análise estatística. Na ciência da computação, a pesquisa quantitativa busca comparar a eficácia de novos sistemas com as alternativas existentes (Wainer, 2007).
Na análise de dados, as técnicas estatísticas, como regressão e análise de variância, são aplicadas a métodos quantitativos. De acordo com Nascimento e Cavalcante (2018, p. 253), “A pesquisa voltada para a abordagem quantitativa é sequencial e comprobatória, isso significa que uma fase acontece depois da outra e que internamente em cada fase se avalia o processo. Além disso, conteúdo, análise de discurso e codificação temática são frequentemente usadas para analisar dados qualitativos. Como pontuam Nascimento e Cavalcante (2018, p. 257), “Os instrumentos têm caráter de medição e devem representar fielmente as variáveis da pesquisa, tendo como requisitos a confiabilidade, validade e objetividade”.
Assim, a escolha das ferramentas e técnicas deve ser guiada pelos objetivos da análise, a natureza dos dados disponíveis e os recursos à disposição dos pesquisadores. As principais ferramentas de ciência de dados aplicadas à educação incluem softwares e plataformas que permitem a coleta, análise e visualização de dados de forma eficiente e eficaz. Entre as ferramentas mais utilizadas estão o R e o Python, duas linguagens de programação poderosas que oferecem uma ampla gama de bibliotecas e pacotes específicos para a análise de dados educacionais. Segundo Harrison (2020), o aprendizado de máquina (machine learning) e a ciência de dados (data science) são áreas que também oferecem suporte a esse tipo de análise, e ambos passam por grande evolução no presente.
Além disso, plataformas de aprendizado de máquina como TensorFlow e Scikit-Learn permitem a aplicação de técnicas avançadas de análise preditiva e modelagem, ajudando a identificar padrões ocultos e tendências futuras. O Scikit-Learn é uma ferramenta de fácil utilização que implementa muitos algoritmos de Aprendizado de Máquinas de maneira eficiente, já o A biblioteca TensorFlow emprega grafos de fluxo de dados para realizar cálculos numéricos distribuídos (Geron, 2019).
O uso de ferramentas de ciência de dados não apenas pode melhorar a precisão e a velocidade da análise, mas também pode ajudar gestores a tomar decisões baseadas em dados com maior confiança a partir dos resultados obtidos. Aplicações práticas da ciência de dados na educação são vastas e diversificadas. Uma aplicação comum é a análise de desempenho dos alunos, em que dados sobre notas e frequência são analisados para identificar alunos em risco de reprovação ou de abandono escolar. Assim,
[…] as pesquisas quantitativas em Educação possibilitam testar hipóteses, analisar a realidade de forma objetiva e generalizar os resultados pesquisados por meio de procedimentos estatísticos, avaliando os dados obtidos no processo da investigação, bem como utilizar recursos tecnológicos (computadores, softwares, planilhas eletrônicas) para auxiliar o pesquisador na descrição, análise, interpretação e apresentação dos resultados da pesquisa (Nascimento; Cavalcante, 2018, p. 252).
Essa análise pode permitir a implementação de intervenções para monitorar o desempenho de alunos, bem como a otimização da alocação de recursos, em que dados sobre a utilização de recursos escolares e resultados educacionais são utilizados para tomar decisões. A regressão linear é um recurso muito utilizado em modelos estatísticos (Darlington; Hayes, 2016). Além disso, ela é amplamente utilizada em análise de dados e para prever a direção das tendências dos índices, por isso foi utilizada nesta dissertação na análise do método EXD.
O coeficiente de correlação de Pearson também foi usado neste trabalho e tem sua origem no trabalho conjunto de Karl Pearson e Francis Galton (Stanton, 2001). Então, a correlação indica a direção e o grau da relação linear entre duas variáveis quantitativas (Moore, 2007). O coeficiente de correlação de Pearson é uma medida de associação linear entre variáveis. Desse modo, várias ferramentas auxiliam na detecção de padrões e tendências, como também são usadas na ciência de dados para avaliar a eficácia de programas educacionais e políticas públicas, além disso, a análise de dados pode ajudar a identificar desigualdades educacionais, permitindo a criação de políticas mais equitativas e inclusivas.
Em suma, a ciência de dados pode oferecer ferramentas e técnicas usadas para transformar a forma como a educação é planejada, implementada e avaliada, podendo promover uma educação de qualidade para todos. Ainda, a integração da análise de dados na educação não só pode oferecer uma compreensão mais profunda dos desafios e oportunidades, mas também criar ambientes de aprendizado mais equitativos a partir da apresentação de resultados sobre esse tema e é isso que este estudo pretende acrescentar ao debate.
4.3 Previsão de tendências e padrões educacionais
Métodos de previsão de tendências podem antecipar necessidades futuras, melhorando o planejamento estratégico e, neste estudo, pretende-se utilizá-los no campo educacional. Entre os métodos mais utilizados estão a análise de séries temporais, modelos de regressão e algoritmos de aprendizado de máquina. Os modelos de regressão, como a regressão linear e logística, são usados para analisar a relação entre diferentes variáveis educacionais e prever resultados com base nessas relações. Algoritmos de aprendizado de máquina, como redes neurais e árvores de decisão, oferecem abordagens avançadas para identificar padrões complexos nos dados e realizar previsões precisas. Um modelo de regressão básico serve como referência para comparar outros modelos. No sklearn, o método .score retorna o coeficiente de determinação (R²), que indica a porcentagem de variação dos dados de entrada explicada pela predição. Geralmente, o valor varia entre 0 e 1, podendo ser negativo em casos de modelos muito inadequados (Harrison, 2020).
Esses métodos podem ser aplicados também para a educação e este estudo utiliza-se destes recursos para se chegar aos resultados propostos, uma vez que a previsão de tendências pode permitir a tomada de decisões alinhadas com o propósito das instituições, a partir de resultados obtidos pela ciência de dados, podendo ajudar a promover políticas educacionais adequadas às necessidades futuras.
Do ponto de vista da ciência de dados, vários artigos se destacam por conter informações relevantes para este estudo. Um deles é o estudo que descreveu o projeto de redesign dos dados de educação primária e secundária conduzido pelo National Center for Education Statistics (NCES) dos Estados Unidos, que, em 1985 fez uma revisão dos programas de coleta de dados sobre a educação (Silverman; Taeuber, 1985).
O estudo foi iniciado para melhorar a coleta, a qualidade e a utilidade dos dados educacionais em nível nacional, abordando questões de adequação, escopo, confiabilidade e atualidade dos dados, e aborda muitos aspectos pertinentes à temática desta pesquisa. Segundo Silverman e Taeuber (1985, p. 4), esse processo de revisão objetivava “[…] uma diversidade de ideias que serviriam para estimular um diálogo; não houve intenção de refletir posições conhecidas nem para fornecer uma representação equilibrada de respostas em qualquer setor da comunidade educacional” (tradução nossa)13.
Na parte inicial, o projeto enfatizou a necessidade de uma coleta de dados abrangente e sistemática. Isso incluía a implementação de um sistema que coletasse informações detalhadas e precisas sobre escolas, professores e alunos. Com relação à qualidade dos dados, um dos objetivos principais do projeto foi melhorar a qualidade técnica dos dados, garantindo sua validade, confiabilidade e utilidade. Isso é essencial na ciência de dados, uma vez que a análise de dados de baixa qualidade pode levar a conclusões incorretas (Taeuber, 1987).
Já na área de processamento e análise de dados a abordagem de redesign incluiu a síntese de documentos e a preparação de um plano conceitual para um programa nacional de coleta de dados, o que envolve o uso de metodologias de ciência de dados para organizar, processar e analisar grandes volumes de dados, permitindo insights significativos sobre o sistema educacional (Taeuber, 1987).
Na utilização de dados o projeto destacou a importância de dados acessíveis e úteis para formuladores de políticas, administradores educacionais e o público em geral. “Ele foi projetado para ser um processo aberto, público e contínuo para obter e discutir ideias sobre a natureza e o conteúdo do sistema nacional de dados educacionais” (Taeuber, 1987, p. 393, tradução nossa)14. Portanto, o processo de redesign foi concebido como um diálogo contínuo com a comunidade educacional e outros interessados. O autor ainda pontua que “Este novo sistema melhoraria a entrega das informações necessárias sobre escolas públicas e privadas, professores e alunos ao público, aos formuladores de políticas e à comunidade educacional” (Taeuber, 1987, p. 393, tradução nossa)15.
No referido estudo, os resultados, as informações obtidas através da ciência de dados, foram importantes para refinar modelos e melhorar a relevância das análises, e, com um sistema de dados aprimorado, foi possível monitorar e avaliar continuamente a eficácia dos programas e intervenções educacionais, promovendo uma melhoria contínua na qualidade do ensino nos EUA (Taeuber, 1987).
O artigo destacou ainda a importância de uma abordagem sistemática e bem planejada para a coleta e análise de dados educacionais, fundamental para a ciência de dados e para o desenvolvimento de políticas educacionais eficazes e equitativas. Em resumo, as conclusões do estudo destacam a importância de um sistema de dados educacionais robusto e adaptável, capaz de fornecer informações precisas e úteis para melhorar a educação nos Estados Unidos. A metodologia empregada e as etapas seguidas no projeto forneceram um modelo para esforços semelhantes em outras áreas e contextos (Taeuber, 1987).
Outro estudo demonstrou o sucesso da aplicação de Machine Learning, ou seja, aprendizado de máquina, na educação no Canadá, em que foram feitas análises de dados avançadas explorando a utilização de técnicas de aprendizado de máquina para prever o desempenho futuro das universidades canadenses, com foco na previsão de seus rankings, e sua relevância foi perceptível pela perspectiva da ciência de dados (Wardley et al., 2024). Os modelos de aprendizado de máquina possuem a capacidade de analisar dados históricos, fornecer valiosas contribuições e prever rankings […] auxiliando os estudantes a escolher a instituição desejada, mas também podem ajudar as universidades a identificar áreas que precisam de revisão para que possam permanecer competitivas16.
O estudo começou coletando dados de 49 universidades canadenses entre 2017 e 2021, categorizadas em três grupos: universidades essencialmente de graduação, universidades abrangentes e universidades médicas/doutorais, para a análise na Modelagem de Dados. Diversos modelos de aprendizado de máquina foram utilizados, incluindo Árvores de Decisão, Random Forest, gradient boosting, voting classifiers. Cada modelo foi avaliado com base em métricas de precisão, recall, pontuação F1 e acurácia (Wardley et al., 2024).
Essas Métricas de Precisão, Recall, Pontuação F1 e Acurácia estão entre as métricas mais importantes para essa avaliação, pois cada uma delas oferece uma perspectiva única sobre o desempenho do modelo, e entender suas diferenças e aplicabilidades é essencial para a análise correta dos resultados (Wardley et al., 2024). A métrica da precisão é a proporção de verdadeiros positivos (TP) em relação ao total de previsões positivas feitas pelo modelo (TP + FP, onde FP são os falsos positivos).
O Recall, também conhecido como sensibilidade ou taxa de detecção, é a proporção de verdadeiros positivos em relação ao total de verdadeiros positivos e falsos negativos (TP / (TP + FN), onde FN são os falsos negativos). O Recall, ou sensibilidade, é a porcentagem de valores positivos corretamente classificados, refletindo quantos resultados relevantes são retornados (Harrison, 2020). A Pontuação F1 é a média harmônica da precisão e do Recall (Harrison, 2020), proporcionando um balanço entre os dois. A fórmula é dada por 2 * Precisão * Recall) / (Precisão + Recall). A pontuação F1 é útil quando se deseja um equilíbrio entre precisão e recall, especialmente em cenários com classes desbalanceadas.
E a acurácia (Accuracy) é a proporção de todas as previsões corretas (Harrison, 2020) (verdadeiros positivos e verdadeiros negativos) em relação ao total de previsões feitas ((TP + TN) / (TP + TN + FP + FN)). Em resumo, enquanto a precisão, recall, pontuação F1 e acurácia são todas métricas valiosas, cada uma delas é mais adequada para diferentes contextos e objetivos de análise. A escolha da métrica depende da natureza do problema, das consequências de falsos positivos e falsos negativos, e da necessidade de um equilíbrio entre precisão e recall.
Como Resultados, foram escolhidos os melhores modelos para cada categoria de universidade, quais sejam: Random Forest para universidades essencialmente de graduação, voting classifier para universidades abrangentes, e gradient boosting para universidades médicas/doutorais. As avaliações foram feitas utilizando técnicas de oversampling para lidar com classes desequilibradas e validação cruzada (Wardley et al., 2024).
A técnica Random Forest utiliza um conjunto de árvores de decisão para melhorar a precisão. Cada árvore na floresta é construída a partir de uma amostra aleatória com reposição do conjunto de dados original, e cada divisão de nó é baseada em uma amostra aleatória de recursos. O modelo final faz previsões com base na média ou na votação majoritária das previsões de todas as árvores. A floresta aleatória oferece um modelo eficiente para regressão, com a vantagem de suportar a importância dos atributos, porém sem uma única árvore de decisão para percorrer. Além disso, evita super adequação com mais árvores (Harrison, 2020).
Por sua vez, o voting classifier é uma técnica que combina as previsões de vários modelos de aprendizado de máquina para melhorar a performance preditiva. Nestes modelos, cada um deles faz uma previsão e a classe com mais votos é escolhida como a previsão final, ou então o modelo fornece uma probabilidade para cada classe, e a classe com a maior probabilidade média é selecionada. Quando comparado aos classificadores individuais, o voting classifier tende a ter um desempenho ligeiramente melhor. Este método utiliza a média das probabili- dades estimadas por todos os classificadores para prever a classe mais provável (Geron, 2019).
O Gradient Boosting, já citado acima, é outra técnica que constrói o modelo final de forma sequencial, em que cada novo modelo tenta corrigir os erros do modelo anterior, ou seja, o Gradient Boosting treina modelos adicionais que complementam os modelos anteriores ao focar nos exemplos mal classificados, e cada novo modelo é treinado para prever os erros do conjunto de modelos anterior, e suas previsões são combinadas para formar a previsão final.
O oversampling é usado para lidar com conjuntos de dados em que uma ou mais classes são mais ou menos menos representadas, o que cria novas instâncias sintéticas da classe minoritária combinando os dados existentes. É feita a seleção de um dos k vizinhos mais próximos, uma linha é conectada a esse vizinho, e um ponto é escolhido ao longo dessa linha (Harrison, 2020). Ao aumentar o número de exemplos da classe minoritária, o oversampling ajuda os algoritmos de aprendizado de máquina a aprender padrões mais gerais e evita que o modelo seja tendencioso em favor da classe majoritária.
Por fim, a Validação Cruzada é uma técnica estatística usada para avaliar a eficácia de um modelo de aprendizado de máquina, e, em vez de usar uma única divisão treino-teste, a validação cruzada divide o conjunto de dados em k partes (ou folds) aproximadamente iguais. Segundo Geron (2019), “A técnica de validação cruzada permite a comparação e ajuste de modelos e hiper-parâmetros sem exigir um conjunto de validação separado, ajudando a conservar dados importantes para o treinamento”.
O modelo é treinado k vezes, cada vez usando k-1 partes para treinar e uma parte diferente para testar. A performance do modelo é então avaliada pela média das k iterações. Em conjunto, essas técnicas formam a base de muitas abordagens modernas de aprendizado de máquina, permitindo a construção de modelos capazes de lidar com a variabilidade e os desafios apresentados por conjuntos de dados do mundo real.
Em resumo, o artigo demonstra como as técnicas de machine learning, ou seja, o aprendizado de máquina, podem ser aplicadas de maneira eficaz para prever o desempenho das universidades, oferecendo uma ferramenta valiosa tanto para estudantes quanto para instituições e formuladores de políticas educacionais.
Concluindo este capítulo, a análise de dados na educação tem a capacidade de ser uma poderosa ferramenta para promover a eficiência no sistema educacional. A previsão de tendências e a identificação de padrões podem proporcionar uma alternativa para que gestores tomem decisões informadas, antecipando necessidades futuras e adaptando-se a mudanças. Então, ao compreender e aplicar as melhores práticas de análise de dados, pode se posicionar como uma cidade que valoriza a tomada de decisões fundamentada em dados e reconhece seu papel fundamental para propor soluções para o desenvolvimento sustentável e bem-estar social de nossa cidade, além de estar na vanguarda, melhorando cada vez mais os seus processos decisórios para a construção de um futuro cada vez melhor para todos.
5 CONSIDERAÇÕES FINAIS
Este trabalho apresentou uma análise relacionando educação e desenvolvimento com foco no indicador educacional, enfatizando a utilização do método EXD para identificação de padrões e tendências que destacaram o papel central da educação como um vetor de transformação social e econômica.
A aplicação de técnicas de ciência de dados permite uma visão sobre como os indicadores se comportam na análise reforçando a necessidade de políticas educacionais fundamentadas em dados, garantindo uma abordagem mais estratégica e eficiente. Os resultados reforçaram que os índices analisados refletem uma iniciativa inovadora trazida com o método EXD, de unir na mesma análise áreas estratégicas utilizando uma metodologia simples, possibilitando pesquisas acessíveis e contribuindo para o incentivo à democratização de uma área tão importante que é o desenvolvimento sustentável. Ao atingir os objetivos traçados, foi possível demonstrar que a análise feita pode contribuir diretamente para o crescimento econômico e a inclusão social pela visualização de fatores que influenciam a tomada de decisões num âmbito de suma importância para o planejamento das cidades, fortalecendo o impacto das políticas públicas.
As conclusões obtidas demonstram a viabilidade de unir ciência de dados, educação e desenvolvimento econômico e social, para promover o desenvolvimento sustentável, beneficiando diretamente a sociedade. Ao fornecer subsídios valiosos para pesquisadores nas mais diversas áreas de conhecimento, gestores e formuladores de políticas públicas em Fortaleza, o método fomenta o conhecimento e a pesquisa.
Sugere-se que pesquisas futuras explorem a integração de novas tecnologias, como inteligência artificial e aprendizado de máquina, para aprofundar a análise de dados educacionais. Também é importante expandir o horizonte temporal da pesquisa, incluindo dados mais recentes, e ampliar o escopo para abranger outras regiões do Brasil. Estudos comparativos podem trazer mais subsídios sobre as melhores práticas em políticas educacionais.
3 “This study examines the connection between higher education and economic growth in the BRICS countries. This study used the gross enrolment ratio (GER) to gauge the extent of higher education in the BRICS countries, while gross domestic product (GDP) was used to estimate economic growth”.
4 “Higher education is essential for generating ideas and building a knowledge base, both of which contribute to economic prosperity. The initiative to investigate this vital connection within the context of the BRICS countries greatly expands the existing body of research”.
5 “The application of machine learning algorithms combined with the SHAP methodology reveals complex nonlinear relationships in the data and important insights to guide tailored policy-making”.
6 “Our results suggest that there is an interaction between education and ICTs that contributes to income prediction. Furthermore, level of education and age are found to be positively associated with income, while gender presents a negative relationship; that is, women earn less than men on average”.
7 “This study highlights the need for more efficient public policies to fight gender inequality in Brazil. It is also important to introduce policies that promote quality education and the teaching of skills related to technology and digitalization to prepare individuals for changes in the job market and avoid the digital divide and increasing social inequality”.
8 “The primary purpose of this study was to use visual analytics to examine the context in which U.S. schools can excel concerning science literacy. The school context was assessed using 49 various student-, teacher-, and principal- […] Using […] the Program for International Student Assessment in 2015”.
9 “Using visual analytics of MDS preference analysis as an unsupervised machine learning approach, we investigated the context in which schools can achieve better science literacy outcomes. Methodologically, it is a novel application of MDS modeling of school science education outcomes based on high-dimensional data”.
10 “Examining the relationships between school science literacy and school context as assessed by various factors related to students, teachers, and administrators can reveal how these variables are associated and operate as a system for schools to achieve better”.
11 “[…] the empirical results demonstrate the importance of comprehensively modelling the diversity of HESs, since distinct characteristics and performance can contribute differently to the economy of the regions”.
12 “the most important factors for regional economic development are the size of HESs, the internationalisation of the students and research productivity”.
13 “[…] a diversity of ideas to stimulate a dialogue; there was no intent to represent known positions or to provide balanced representation across sectors of the education community”.
14 “It was designed to be an open, public, continuing process to elicit and discuss ideas for the nature and the content of the national education data system”.
15 “This new system would improve the delivery of needed information about public and private schools, teachers, and students to the public, policymakers, and the education community”.
16 “Machine learning models possess the capability to analyse historical data, provide beneficial insights and predict ranking […] assist students in choosing their desired institution but it can also help universities identify areas in need of review so they can remain competitive”.
REFERÊNCIAS
BANKS, J. A. An Introduction to Multicultural Education. London, UK: Pearson Education, 2014.
BARTH, E. T. A Análise de Dados na Pesquisa Científica. Importância e desafios em estudos organizacionais. Desenvolvimento em questão, v. 1, n. 2, p. 177-201, 2003. Disponível em: https://www.revistas.unijui.edu.br/index.php/desenvolvimentoemquestao/article/view/84. Acesso em: 10 mar. 2025.
BERTOLETTI, A.; BERBEGAL-MIRABENT, J.; AGASISTI, T. Higher Education Systemsand Regional Economic Development in Europe: A Combined Approach Using Econometric and Machine Learning Methods. Socio-Economic Planning Sciences, v. 82, part A, august 2022. Available at: https://www.sciencedirect.com/science/article/abs/pii/S003801212200009X. Accessed on: 20 jan. 2025.
CARLI, F. G. de; RIBAS, L. M. Smart Cities: extrafiscalidade como indutora do desenvolvimento de cidades inteligentes. Interações, Campo Grande, v. 22, n. 1, p. 131-150, jan./mar. 2021. Disponível em: https://www.scielo.br/j/inter/a/9gBHZytZKHybVVSpXtKF7Dx/?lang=pt&format=pdf. Acesso em: 14 mar. 2025.
CLARO, P. B. D. O.; CLARO, D. P.; AMANCIO, R. Entendendo o conceito de sustentabilidade nas organizações. Revista de Administração-RAUSP, v. 43, n. 4, p. 289-300, 2008. Disponível em: https://www.revistas.usp.br/rausp/article/view/44483/48103. Acesso em: mar. 2025.
DARLINGTON, R. B.; HAYES, A. F. Regression Analysis and Linear Models: Concepts, Applications, and Implementation. New York; London: Guilford Publications, 2016. Disponível em: https://books.google.com.br/books/about/Regression_Analysis_and_Linear_Models.html?id=YDgoDAAAQBAJ&redir_esc=y. Acesso em: 10 maio 2025.
DING, C. Examining the context of better science literacy outcomes among U.S. schools using visual analytics: A machine learning approach. International Journal of Educational Research Open, v. 3, 2022. Available at: https://www.sciencedirect.com/science/article/pii/S266637402200067X. Accessed on: Feb. 2025.
FLORIANI, D. Obstáculos e potencialidades para a construção de uma sociedade sustentável, na perspectiva da Educação e da prática sócio-ambientais. REMEA-Revista Eletrônica do Mestrado em Educação Ambiental, v. esp., dez. 2008. Disponível em: https://periodicos.furg.br/remea/article/view/3390/2036. Acesso em: 05 abr. 2025.
GERON, A. Mãos à obra: aprendizado de máquina com Scikit-learn, Keras & TensorFlow.Conceitos, ferramentas e técnicas para a construção de sistemas inteligentes.Rio de Janeiro: Alta Books, 2019.
GIL, A. C. Métodos e técnicas de pesquisa social. São Paulo: Editora Atlas SA, 2008.
HARRISON, M. Machine Learning – Guia de Referência Rápida. São Paulo: Novatec, 2020.
HERRERA, G. P. et al. The use of ICTs and income distribution in Brazil: A machine learning explanation using SHAP values. Telecommunications Policy, v. 47, n. 8, September 2023. Available at: https://www.sciencedirect.com/science/article/pii/S030859612300109X. Accessed on: 15 Fev. 2025.
JACOBI, P. Meio ambiente e sustentabilidade. O Município no século XXI: cenários e perspectivas.São Paulo: CEPAM, 1999. p. 175-183.
MOORE, D. S. The Basic Practice of Statistics. New York: Freeman, 2007.
MUSSAIYIB, A. M.; PRADHAN, K. C. An empirical analysis of causal nexus between higher education and economic growth in BRICS countries. Transnational Corporations Review, v. 16, n. 3, sept. 2024. Available at: https://www.sciencedirect.com/science/article/pii/S1925209924005837?via%3Dihub. Accessed on: February 1st, 2025.
NASCIMENTO, L. F. D.; CAVALCANTE, M. M. D. Abordagem quantitativa na pesquisa em educação: investigações no cotidiano escolar. Revista Tempos e Espaços em Educação, v. 11, n. 25, p. 25-262, abr./jun. 2018. Disponível em: https://periodicos.ufs.br/revtee/article/view/7075/pdf. Acesso em: 07 maio 2025.
RAMOS, A. M. F. ODS 1 – Acabar com a pobreza em todas as suas formas, em todos os lugares. In: RAMOS, A. M. F. et al. Um retrato da infância e adolescência no Brasil: programa presidente amigo da criança.1 ed.São Paulo:FGV EAESP; Fundação Abrinq,2022. p. 10-25. Disponível em: https://repositorio.fgv.br/server/api/core/bitstreams/d8d398f4-fe34-4933-80b8-3bac26f55394/content. Acesso em: 10 fev. 2025.
ROGERS, C. Liberdade de aprender em nossa década. Recife: Editora Massangana, 2010.
SANTOS, C. S. Educação escolar no contexto de pandemia. Revista Gestão & Tecnologia, v. 1, n. 30, p. 44-47, 2020. Disponível em: https://www.faculdadedelta.edu.br/revistas3/index.php/gt/article/view/52/41. Acesso em: 20 mar. 2025.
SILVERMAN, L. J.; TAEUBER, R. C. (Eds.). Synthesis of Invited Papers: Elementary/Secondary Education Data Redesign Project. A Public Discussion Draft. Washington, DC: National Center for Education Statistics, 1985. Available at: https://files.eric.ed.gov/fulltext/ED272575.pdf. Accessed on: January 15, 2025.
STANTON, J. M. Galton, Pearson, and the peas: A brief history of linear regression for statistics instructors. Journal of Statistical Education, v. 9, n. 3, p. 1-13, 2001. Available at: https://www.tandfonline.com/doi/full/10.1080/10691898.2001.11910537. Accessed on: May 7, 2025.
TAEUBER, R. C. Introduction to the elementary/secondary education data redesign project of the National Center for Education Statistics. International Journal of Educational Research, v. 11, n. 4, p. 393-396, 1987. Available at: https://www.sciencedirect.com/science/article/abs/pii/0883035587900206. Accessed on: January 15, 2025.
WAINER, J. et al. Métodos de pesquisa quantitativa e qualitativa para a Ciência da Computação. Atualização em informática, v. 1, n. 221-262, p. 32-33, 2007. Disponível em: https://www.ic.unicamp.br/~wainer/cursos/1s2018/metodologia/Metodos_de_pesquisa_quantitativa_e_qualitativa_par.pdf. Acesso em: 10 abr. 2025.
WARDLEY, L. J. et al. A machine learning approach feature to forecast the future performance of the universities in Canada. Machine Learning with Applications, v. 16, jun. 2024. Available at: https://www.sciencedirect.com/science/article/pii/S2666827024000240. Accesed on: 12 abr. 2025.
1 Mestra do em Informática Aplicada da Universidade de Fortaleza e-mail: deborapgrad@gmail.com
2 Docente do Curso de Pós-graduação em Informática Aplicada do Programa de Pós-graduação em Informática Aplicada da Universidade de Fortaleza. Doutor em Física pela Universidade Federal do Ceará. e-mail: furlan@unifor.br