REGISTRO DOI: 10.69849/revistaft/fa10202502251834
Emerson Lino da Silva1
Marcus Vinicius Gomes Pestana2
Mônica Ximenes Carneiro da Cunha3
Abstract. The growing volume of data generated by user interactions, advertising platforms, and transactional systems reinforces the need for the effective use of data analytics to extract insights and support strategic decision-making in digital marketing. This article presents a systematic literature review (SLR) conducted based on PRISMA guidelines, aiming to investigate the main strategies and tools used for data integration, centralization, organization, and analysis in this context. A search in the IEEE Xplore and Google Scholar databases resulted in the identification of 90 articles. After applying inclusion and exclusion criteria, 4 articles were selected for analysis. The results highlight tools and strategies related to ETL, data storage, and reporting, as well as industry best practices and emerging developments. It is concluded that the use of data analytics tools and strategies contributes to increased productivity and accuracy of information, positively impacting insight generation and the decision-making process in the context of digital marketing.
Resumo. O volume crescente de dados gerados por interações de usuários, plataformas de anúncios e sistemas transacionais reforça a necessidade do uso eficaz de data analytics para a extração de insights e a tomada de decisões estratégicas no marketing digital. Este artigo apresenta uma revisão sistemática da literatura (RSL) conduzida com base nas diretrizes do PRISMA, com o objetivo de investigar as principais estratégias e ferramentas utilizadas para a integração, centralização, organização e análise de dados nesse contexto. A busca nas bases de dados IEEE Xplore e Google Scholar resultou na identificação de 90 artigos. Após a aplicação dos critérios de inclusão e exclusão, foram selecionados 4 artigos para análise. Os resultados destacam ferramentas e estratégias de ETL, armazenamento de dados e produção de relatórios, bem como boas práticas da indústria e novos desenvolvimentos. Conclui-se que a utilização de ferramentas e estratégias de data analytics contribui para o aumento da produtividade e da precisão das informações, impactando de forma positiva a geração de insights e o processo de tomada de decisão no contexto do marketing digital.
Palavras-chave: Data Analytics, ETL, Business Intelligence, Data Warehousing, Marketing Digital.
1. Introdução
O marketing digital consolidou-se como uma ferramenta fundamental para as organizações que buscam alcançar vantagem competitiva na era digital, ao integrar estratégias voltadas à ampliação da visibilidade da marca, ao engajamento do consumidor e ao aumento das vendas (Oliveira, Vasconcelos e Pinheiro, 2024). A eficácia do marketing digital está em sua capacidade de personalizar estratégias com base em dados, tornando as campanhas mais direcionadas e impactantes (Oliveira e Vasconcelos, 2024). Essa abordagem não apenas amplia o alcance, mas também fortalece os relacionamentos com os consumidores, um aspecto crucial para o sucesso empresarial no mercado atual.
Com o avanço das tecnologias digitais, o uso de dados tornou-se um elemento essencial nas estratégias de marketing digital, permitindo uma compreensão mais precisa do comportamento do consumidor, a personalização de campanhas e a ampliação da competitividade organizacional no ambiente digital (Syarif, Nurhidayah e Kamarudin, 2024). Estudos indicam que o uso de data analytics no marketing digital é essencial para o crescimento sustentável, pois permite a segmentação precisa de clientes e a aplicação de análises preditivas, otimizando estratégias de negócio e promovendo respostas proativas a tendências de mercado (Hanadi e Salhab, 2024). Essa integração possibilita campanhas direcionadas e transforma dados em insights acionáveis, contribuindo para vantagens competitivas duradouras.
A análise de dados no marketing digital também desempenha um papel crucial na compreensão do comportamento do consumidor, segmentação de público-alvo e medição da eficácia de campanhas, identificando áreas de melhoria para otimizar resultados (Willian et al, 2023). Além disso, a utilização de big data analytics transforma a compreensão do consumidor, permitindo estratégias de marketing mais personalizadas e melhorando a satisfação e o engajamento do cliente (Leonidas e Theodoropoulou, 2023).
O data analytics no marketing digital também estimula a inovação ao possibilitar que organizações coletem e analisem dados de consumidores para criar estratégias sob medida, aumentar o engajamento do cliente e impulsionar a competitividade em um mercado digital dinâmico (Aarcha et al, 2024).
Este artigo apresenta uma revisão sistemática da literatura sobre as estratégias e ferramentas aplicadas no data analytics no marketing digital, explorando como essas práticas podem potencializar os resultados e melhorar a eficiência das ações de marketing.
A metodologia utilizada para realizar a revisão da literatura é detalhada, incluindo os critérios de seleção de estudos, os métodos de análise de dados e as ferramentas utilizadas. Os resultados da revisão da literatura destacam as principais ferramentas e estratégias de data analytics no marketing digital, suas características e as abordagens adotadas, discutindo esses resultados à luz da literatura existente e das práticas atuais do mercado.
O objetivo principal do artigo é fornecer um panorama abrangente das ferramentas e estratégias de data analytics no marketing digital, catalogando suas características e abordagens adotadas. Ao oferecer uma visão geral do estado da arte nessa área, o artigo visa auxiliar profissionais de marketing e gestores de empresas na tomada de decisões informadas sobre a implementação de soluções de data analytics para otimizar suas estratégias de marketing digital.
O restante do artigo está estruturado da seguinte forma: na seção 2 são apresentados conceitos relevantes sobre marketing digital, data analytics e ETL; na seção 3 está descrita a metodologia adotada para a presente pesquisa; na seção 4, por sua vez, estão exibidos os resultados e, por fim, na seção 5 estão as considerações finais.
2. Fundamentação Teórica
Esta seção apresenta os conceitos relevantes sobre marketing digital, data analytics e ETL.
2.1 Marketing digital
O Marketing Digital se consolidou como uma ferramenta crucial para profissionais e empresas que desejam se destacar no cenário competitivo atual. Por meio da utilização estratégica de canais digitais, como websites, mídias sociais, email marketing e mecanismos de busca, é possível alcançar um público amplo e engajado, construir relacionamentos duradouros e impulsionar resultados de forma mensurável (Chaffey e Ellis-Chadwick, 2019).
O Marketing Digital se caracteriza por um conjunto de técnicas e estratégias voltadas para promover produtos, serviços, marcas e ideias através da internet e de dispositivos digitais. Essa modalidade de marketing se diferencia do marketing tradicional por sua natureza interativa, direcionada e mensurável (Kotler, 2021). Ela se manifesta através de diversos canais, cada um com suas próprias características e potencialidades. Entre os principais canais estão os websites, que funcionam como a “casa virtual” da empresa, apresentando seus produtos, serviços e valores ao público-alvo (Porto, 2019). As mídias sociais também desempenham um papel crucial, permitindo a interação direta com o público, a construção de comunidades engajadas e a disseminação de conteúdo relevante (Adolpho, 2020).
O Marketing Digital oferece diversos benefícios para empresas e profissionais. Ele permite um alcance amplo, alcançando um público global sem restrições geográficas (Kotler, 2021). A segmentação precisa possibilita direcionar ações para públicos específicos, baseando-se em interesses, comportamentos e dados demográficos (Adolpho, 2020). A interatividade promove a interação direta com o público, permitindo a construção de relacionamentos duradouros (Gabriel, 2018). A mensurabilidade, por sua vez, fornece dados precisos sobre o desempenho das campanhas, permitindo ajustes e otimizações constantes (Peçanha, 2017). Além disso, o Marketing Digital é mais custo-eficiente do que o marketing tradicional, sendo especialmente acessível para pequenas e médias empresas (Aarcha et al, 2024).
2.2 Data Analytics
O Data Analytics envolve diferentes formas de análise de dados com aplicações específicas. A análise descritiva resume informações para oferecer uma visão geral (Pulizzi, 2016). A análise diagnóstica busca compreender as causas de determinados eventos (Hanadi e Salhab, 2024). A análise preditiva utiliza algoritmos para prever tendências futuras (Kotler, 2021). Por fim, a análise prescritiva recomenda ações específicas para otimizar resultados (Adolpho, 2020). Juntas, essas abordagens permitem uma gestão mais eficiente e fundamentada por dados.
A implementação do Data Analytics nas organizações tem se mostrado fundamental para garantir a competitividade em um mercado cada vez mais dinâmico. Ao analisar grandes volumes de dados, as empresas podem tomar decisões mais assertivas, baseadas em evidências concretas, o que lhes permite adaptar-se rapidamente às mudanças do mercado e superar seus concorrentes (Gabriel, 2018).
Um dos principais benefícios do Data Analytics é a otimização de recursos, uma vez que permite identificar áreas de desperdício e ineficiência, possibilitando a redução de custos operacionais (Peçanha, 2017). Além disso, ao fornecer dados precisos e insights acionáveis, o Data Analytics auxilia na tomada de decisões estratégicas, reduzindo a incerteza e aumentando as chances de sucesso (Godin, 2018).
Outro aspecto relevante é o estímulo à inovação. Ao analisar os dados, as empresas podem identificar novas oportunidades de mercado e desenvolver produtos e serviços que atendam às necessidades específicas dos clientes, impulsionando o crescimento e a diferenciação (Pulizzi, 2016). Por fim, o Data Analytics contribui para a construção de relacionamentos mais fortes com os clientes. Ao personalizar a experiência do cliente com base em dados, as empresas aumentam a satisfação e a fidelidade, tornando os consumidores mais propensos a realizar novas compras e recomendar a marca para outros (Hanadi e Salhab, 2024).
O Data Analytics se apoia em diversas ferramentas e tecnologias para realizar sua função, como bases de dados, que armazenam e organizam grandes volumes de dados, permitindo o acesso e a manipulação dos mesmos (Kotler, 2021); e ferramentas de BI (Business Intelligence), que fornecem recursos para visualização de dados, criação de relatórios e dashboards, facilitando a compreensão dos dados (Adolpho, 2020). Em um mundo inundado por dados, o Data Analytics surge como uma ferramenta crucial para empresas e profissionais que desejam navegar na incerteza e tomar decisões estratégicas com base em informações sólidas. Através da análise de grandes conjuntos de dados, o Data Analytics permite extrair insights valiosos, identificar padrões ocultos, prever tendências e otimizar processos, impulsionando o sucesso em diversos setores.
O Data Analytics se caracteriza por um conjunto de técnicas e metodologias que visam coletar, organizar, processar, analisar e interpretar grandes volumes de dados, sejam eles estruturados, semi estruturados ou não estruturados. Através da aplicação de técnicas estatísticas, algoritmos de aprendizado de máquina e ferramentas de visualização, o Data Analytics transforma dados brutos em informações acionáveis que podem ser utilizadas para descobrir novos insights e padrões, identificando relações e tendências que antes eram invisíveis e permitindo uma compreensão mais profunda do negócio e dos clientes (Kotler, 2021). Além disso, permite tomar decisões mais informadas, baseando-se em evidências concretas e dados confiáveis, reduzindo a incerteza e aumentando as chances de sucesso (Adolpho, 2020). Também otimiza processos e operações ao identificar áreas de ineficiência e gargalos, possibilitando a otimização de processos e a redução de custos (Gabriel, 2018).
2.3 Insights de Data Analytics
Insights são descobertas valiosas e significativas extraídas da análise de dados (Daly et al,. 2014). Eles fornecem uma compreensão profunda dos dados que pode levar a melhores decisões de negócios. No contexto de Data Analytics, insights são a chave para transformar dados brutos em informações acionáveis .
Insights são descobertas valiosas e significativas extraídas da análise de dados, que fornecem uma compreensão profunda e orientam decisões estratégicas (Provost e Fawcett, 2013). No contexto de Data Analytics , esses insights são fundamentais para transformar dados brutos em informações acionáveis, permitindo que as empresas tomem decisões baseadas em evidências (Davenport e Harris, 2007).
Exemplos de insights valiosos incluem a identificação de tendências de mercado e preferências do consumidor, a detecção de oportunidades de negócios não exploradas, a otimização de estratégias de marketing e vendas, a previsão de demanda e planejamento de estoque, a detecção precoce de problemas operacionais e a personalização de produtos e serviços (Lavalle et al, 2011). Esses exemplos demonstram como os insights podem impactar diretamente a eficiência operacional e o crescimento organizacional.
Para extrair insights significativos, os dados precisam passar por um processo analítico estruturado. Esse processo envolve a coleta e limpeza de dados de diversas fontes, o processamento e armazenamento em estruturas adequadas, a aplicação de técnicas analíticas como estatística, machine learning e visualização, e a interpretação dos resultados para identificar padrões e tendências (Chen, Chiang e Storey, 2012). Ferramentas como SQL, Hadoop, Spark e linguagens de programação como Python e R são amplamente utilizadas para automatizar e escalar esse processo (Manyika et al, 2011).
Em resumo, insights são a essência do Data Analytics , transformando dados em conhecimento acionável que impulsiona melhores decisões de negócios. Empresas que conseguem extrair insights valiosos de seus dados estão em melhor posição para inovar, otimizar operações e obter vantagem competitiva (Davenport e Harris, 2007).
2.4 ETL (Extract, Transform, Load)
O processo ETL (Extract, Transform, Load) tem sido amplamente reconhecido como uma técnica essencial para integração de dados em projetos de inteligência de negócios, análise de dados e Big Data, permitindo a coleta, transformação e carga de dados em sistemas como data warehouses e data lakes (Seenivasan, 2023, p. 40) . De acordo com Gama e Abreu (2008), o ETL é responsável por reunir informações provenientes de diferentes fontes, padronizá-las e torná-las disponíveis para análise, o que é fundamental em áreas como o marketing digital, onde a geração de insights depende da integração de dados de sistemas diversos.
Seenivasan (2023) explica que o ETL realiza três funções principais: a extração de dados de fontes heterogêneas, a transformação, que envolve o tratamento, limpeza, normalização e aplicação de regras de negócio, e a carga, que deposita os dados transformados em repositórios analíticos, como data lakes. Esse processo é imprescindível para garantir a consistência, integridade e usabilidade dos dados no contexto analítico (Seenivasan, 2023, p. 41–42) .
Nwokeji et al. (2018), por meio de uma revisão sistemática de 97 estudos, destacam que o ETL é uma das soluções mais adotadas para lidar com os desafios de integração de dados em ambientes de Big Data. Segundo os autores, ele possibilita o tratamento de dados provenientes de fontes como redes sociais, bancos de dados transacionais e sensores IoT, contribuindo diretamente para a geração de conhecimento e suporte à decisão (Nwokeji et al., 2018, p. 1–2) .
Ainda segundo Nwokeji et al. (2018), a abordagem mais frequente para a implementação de ETL é baseada em modelagem conceitual, como UML e BPMN, sendo também observadas outras estratégias como arquiteturas orientadas a serviços (SOA), paralelização com MapReduce e uso de metadados. No entanto, os autores alertam para o uso limitado de tecnologias emergentes como aprendizado de máquina e inteligência artificial, que poderiam agregar maior automação e escalabilidade ao processo (Nwokeji et al., 2018, p. 3–4) .
Para Gama e Abreu (2008), a etapa de transformação é geralmente considerada a mais complexa, pois envolve garantir que os dados oriundos de múltiplas origens se tornem compatíveis, íntegros e prontos para uso em modelos analíticos. Além disso, a carga eficiente dos dados transformados é determinante para o desempenho e confiabilidade dos sistemas analíticos utilizados pelas organizações.
Seenivasan (2023) complementa que a qualidade dos dados, aliada à segurança e à auditoria do processo ETL, são práticas recomendadas para garantir o sucesso da operação. Técnicas como particionamento, indexação, paralelismo e automação também são amplamente utilizadas para aumentar a performance das cargas e permitir que grandes volumes de dados sejam processados de forma eficiente (Seenivasan, 2023, p. 42–44) .
O processo de ETL é particularmente relevante para o marketing digital, onde a coleta e integração de dados de diversas plataformas (como websites, e-mails e redes sociais) permitem que as organizações desenvolvam campanhas mais personalizadas e baseadas em dados concretos. O uso adequado de ETL não apenas melhora a eficiência operacional, mas também maximiza o impacto das campanhas de marketing ao fornecer insights baseados em dados consistentes e confiáveis (Manninen, 2019) .
Em síntese, o ETL é um componente crítico dentro da arquitetura de Data Analytics, pois permite transformar dados brutos em informações valiosas que alimentam as decisões baseadas em dados, potencializando a competitividade das empresas, especialmente no campo do marketing digital (Fayyad et al., 1996; Sharda et al., 2019)
2.5 Contexto
No campo do marketing digital, data-driven advertising é a utilização dos dados provenientes da jornada do cliente, como websites, ações em e-mails e aplicativos móveis para a definição de segmentação de audiência, especificando exatamente quais os perfis de clientes vão ser impactados pelos anúncios (Desai et al., 2019). Ou seja, é possível se ter um vasta gama de fontes de dados heterogêneas que alimentam métricas específicas da área de marketing digital, o que dificulta uma geração de insights de forma mais geral. Por exemplo: os dados provenientes de sistemas de relação com o cliente são diferentes dos dados provenientes da performance de anúncios de marketing, mas dentro da jornada do cliente, tudo pode começar em uma visualização de um anúncio e passar para um atendimento direto com o cliente.
Dessa forma, o emprego de data analytics no marketing digital é necessário para a geração de informação valiosa com o objetivo da tomada de decisão. É possível encontrar diversas usabilidades direcionadas para o data analytics de modo geral, o que nos leva a pergunta de pesquisa deste artigo: Como e quais ferramentas e estratégias de data analytics estão sendo empregadas no marketing digital?
3. Metodologia
O objetivo desta revisão sistemática de literatura (RSL) é identificar e analisar as principais estratégias e ferramentas utilizadas para data analytics no marketing digital. Para orientar a investigação, foram definidas questões de pesquisa com base na estrutura PICO (população, intervenção, comparação e resultados) conforme Kitchenham e Charters (2007).
Estrutura PICO:
- Population: marketing digital
- Intervention: estratégias, métodos, abordagens e ferramentas
- Outcome: processos, modelos, arquiteturas, técnicas
- Context: data analytics
As questões de pesquisa que norteiam este estudo são:
Q1 – Quais ferramentas e estratégias de data analytics estão sendo empregados no marketing digital?
Q2 – Quais as funcionalidades, usabilidade e custo das soluções propostas?
Q3 – Quais os impactos na geração de insights após a implementação de data analytics nos dados?
Com o intuito de identificar ferramentas e estratégias, foi necessário estipular critérios para identificar publicações recentes discorrendo sobre o emprego de data analytics em fontes de dados heterogêneos, detalhando o processo de manuseio de dados. Os critérios de inclusão e exclusão para os artigos analisados foram:
Inclusão:
- Publicações entre 2019 e 2024.
- Artigos que discorrem sobre processos de extração, transformação e carregamento de dados.
- Artigos que lidam com dados provenientes de campanhas em mídias sociais.
- Artigos que trabalham com dados de mais de uma fonte de dados heterogênea.
Exclusão:
- Artigos que não abordam data analytics no contexto do marketing digital.
- Estudos que não especificam detalhes suficientes sobre ferramentas ou estratégias utilizadas.
Além disso, foram definidas 4 perguntas para analisar a qualidade dos estudos selecionados:
- O estudo explicitamente descreve as estratégias e/ou ferramentas utilizadas?
- O estudo apresenta um emprego das estratégias/ferramentas em uma situação real?
- O estudo apresenta métricas concretas do resultado do emprego de sua solução?
- O estudo discorre sobre dados de performance de campanhas de marketing digital?
As perguntas supracitadas refletem a necessidade de analisar quantitativamente e qualitativamente as ferramentas e estratégias citadas. Cada pergunta vale um total de 1 ponto (Equivalente a resposta “Sim”), em caso da resposta ser “Parcialmente”: 0,5 pontos, e por fim 0 pontos caso a resposta seja “Não”. Com a nota de corte sendo 2 pontos é possível levar em conta estudos que respondem completamente pelo menos 50% dos critérios de qualidade.
A seleção dos artigos foi realizada por meio de buscas nas bases de dados acadêmicas: Google Scholar e IEEE Xplore. Palavras-chave utilizadas incluíram “data analytics”, “digital marketing”, “data warehouse”, e principais fontes de marketing digital em mídias sociais (Facebook e Google). As strings de busca aplicadas nas bases selecionadas estão exibidas no quadro 1. Uma decisão dos autores foi a utilização de palavras-chave apenas em inglês, e como resultado: a seleção apenas de estudos em inglês. Esta decisão foi tomada pelo fato da Língua Inglesa ser considerada a Língua Franca da Ciência, pois a maioria das publicações científicas de alto impacto são publicadas em inglês, tornando-o essencial para acessar as descobertas mais recentes e relevantes.
Quadro 1. Strings de busca utilizadas na pesquisa.
A etapa de seleção resultou em 58 estudos no Google Scholar e 32 no IEEE Xplore, totalizando 90 estudos. Sendo que 17 artigos da base do Google Scholar tinham sua data de publicação anterior a 2019 e foram descartados e 15 artigos da base IEEExplore foram descartados pelo mesmo critério. Os 58 artigos selecionados foram lidos parcialmente e 53 foram descartados por não atenderem os critérios de inclusão, resultando em um total de 5 estudos que foram lidos na íntegra. Apenas 4 dos 5 estudos passaram pelos critérios de qualidade (Quadro 2).
Quadro 2 – Etapas de seleção.
Um resumo deste processo de seleção é apresentado na Figura 1.
Por sua vez, no quadro 3 estão descritos os trabalhos que compõem a amostra final desta pesquisa.
Quadro 3 – Artigos selecionados
4. Resultados e Discussões
Nesta seção, os resultados obtidos a partir desta revisão sistemática de literatura são apresentados e discutidos em relação às perguntas de pesquisa formuladas. Os artigos selecionados forneceram insights valiosos sobre as ferramentas e estratégias de data analytics no marketing digital, que foram organizados em categorias para facilitar a compreensão.
4.1 Ferramentas e Estratégias de Data Analytics no Marketing Digital (Q1)
A primeira pergunta de pesquisa investigou as ferramentas e estratégias de data analytics utilizadas no marketing digital. A análise revelou a utilização de 11 ferramentas principais, distribuídas em seis categorias (Quadro 4): Data Warehouse, ETL (Extract, Transform, Load), Orquestração, Web Scrapers, Linguagem de programação e Visualização.
Quadro 4 – Principais ferramentas utilizadas.
Os artigos discutiram extensivamente o papel dos data warehouses, que são essenciais para o armazenamento centralizado dos dados após o processo de ETL. Por exemplo, Borzi (2023) propôs a estratégia de inversão do processo tradicional de ETL para ELT (Extract, Load, Transform), o que melhora a eficiência na etapa de carregamento dos dados e integra uma camada de machine learning para auxiliar na interpretação dos dados. Já Duong Hai (2019) defendeu a adoção de data warehouses em cloud computing, destacando a escalabilidade e a eficiência na gestão de grandes volumes de dados.
Por sua vez, as ferramentas de ETL são cruciais para a preparação dos dados antes de serem armazenados nos data warehouses. O estudo de Claudio (2019) destacou a importância de escolher uma infraestrutura de ETL adequada à complexidade e ao volume dos dados, enquanto Manninen (2019) recomendou o uso de ferramentas de orquestração como o Apache Airflow, combinadas com scripts em Python, para automatizar processos de ETL e garantir a atualização contínua dos dados.
No que se refere à orquestração de dados, Manninen (2019) enfatizou a necessidade de definir fluxos de trabalho automatizados utilizando ferramentas como Apache Airflow. Essa abordagem permite a geração automática de relatórios e a atualização constante dos dados, facilitando a tomada de decisões em tempo real.
A visualização dos dados, por sua vez, é essencial para transformar os dados em informações compreensíveis. Ferramentas como Power BI e Voluum (Figura 2) foram mencionadas nos trabalhos selecionados como fundamentais para a criação de relatórios visualmente ricos e informativos, permitindo que os tomadores de decisão identifiquem tendências e insights relevantes com facilidade.
Entre as ferramentas mais citadas, destacam-se o Google BigQuery, Python e Power BI, cada uma referenciada em três estudos. Essas ferramentas representam soluções amplamente utilizadas devido às suas capacidades robustas de processamento, automação e visualização de dados. O Google BigQuery é particularmente valorizado por sua escalabilidade e eficiência em consultas em tempo real, enquanto o Python oferece flexibilidade e suporte para análises avançadas. O Power BI, por sua vez, é amplamente reconhecido por sua interface intuitiva e diversificada gama de visualizações.
As demais ferramentas, embora menos citadas, desempenham papéis críticos em cenários específicos. Por exemplo, o SnowFlake e o Microsoft Azure SQL destacam-se por suas funcionalidades em armazenamento e integração de dados, enquanto ferramentas de ETL como Stitch Data e Pentaho são cruciais para transformar e integrar dados heterogêneos. A orquestração automatizada proporcionada pelo Apache Airflow e a coleta de dados com Selenium são também essenciais em processos de automação e extração de informações de fontes diversas.
A análise dos artigos selecionados identificou seis estratégias fundamentais de data analytics aplicadas ao marketing digital (Quadro 5), cada uma contribuindo para a eficiência e precisão no uso de dados em campanhas de marketing. Essas estratégias foram distribuídas entre os estudos analisados e refletem abordagens que otimizam processos e oferecem vantagem competitiva.
Quadro 5 – Estratégias de data analytics utilizadas.
Automatização da Coleta de Dados: Presente em todos os artigos analisados (A1, A2, A3, A4), essa estratégia demonstra a importância de substituir processos manuais por soluções automatizadas, garantindo maior eficiência e precisão na extração de dados. A automatização elimina redundâncias e erros humanos, além de permitir um fluxo contínuo de informações atualizadas para análise.
Unificação de Fontes de Dados: Também abordada em todos os artigos (A1, A2, A3, A4), essa estratégia destaca a necessidade de integrar dados provenientes de diferentes fontes. A unificação é essencial para construir uma visão holística do comportamento do consumidor e otimizar a personalização das campanhas.
Uso de Modelos de Aprendizado de Máquina: Identificado no artigo A1, o uso de algoritmos de aprendizado de máquina permite análises avançadas, como predições de tendências de mercado e segmentação de público. Essa abordagem contribui para a tomada de decisões mais assertivas, com base em padrões e insights derivados de grandes volumes de dados.
Data Warehouse em Nuvem: Citada no artigo A3, o uso de data warehouses na nuvem oferece escalabilidade e flexibilidade para o armazenamento e processamento de grandes volumes de dados. Essa estratégia reduz custos operacionais e facilita o acesso a informações em tempo real.
Modelagem de Data Warehouse com Base em KPIs de Marketing: O artigo A2 destaca a importância de projetar modelos de data warehouse que incorporem indicadores-chave de desempenho (KPIs) específicos do marketing. Essa abordagem garante que as análises sejam direcionadas às métricas mais relevantes para a avaliação de campanhas.
Pré-processamento de Dados e Agendamento de Tarefas: Mencionados no artigo A4, o pré-processamento de dados combinado com agendamento automatizado é crucial para garantir que os dados estejam prontos para análise em intervalos regulares. Essa estratégia melhora a qualidade das análises e reduz atrasos no fluxo de trabalho.
A divisão do processo de data analytics em etapas distintas permite uma compreensão mais aprofundada de cada fase, facilitando a identificação de possíveis gargalos e oportunidades de melhoria. Além disso, essa abordagem estruturada facilita a comparação entre diferentes estudos e metodologias, permitindo a identificação de tendências e boas práticas na área.
No quadro 6 é apresentada uma comparação entre as etapas identificadas nos artigos A1, A2, A3 e A4, a saber: definição de objetivos e métricas, coleta de dados, processamento e análise de dados, visualização de dados e tomada de decisão.
Quadro 6 – Implementação por etapa
4.2 Funcionalidades, Usabilidade e Custo das Soluções de Data Analytics (Q2)
Nesta seção, são analisadas as funcionalidades, usabilidade e custos das soluções de data analytics identificadas nos estudos revisados (Quadro 7). compreensão dessas características é crucial para determinar a adequação das ferramentas a diferentes cenários de aplicação.
4.2.1 Data Warehouses
Azure SQL integra-se de maneira eficiente com outros serviços da Microsoft, oferecendo suporte ao SQL padrão e recursos avançados de segurança, o que o torna uma escolha familiar para desenvolvedores acostumados com o SQL Server. Entretanto, seu custo, baseado em DTUs ou vCores, pode se tornar elevado em aplicações de larga escala (Duonghai, 2021).
Snowflake destaca-se por separar armazenamento e computação, suportando dados semi-estruturados e oferecendo funcionalidades como Time Travel. É uma solução de fácil uso e configuração, com preços baseados no consumo real, proporcionando flexibilidade econômica (Ly, 2020).
Google BigQuery oferece capacidades avançadas de processamento em tempo real e uma forte integração com o Google Cloud. Embora tenha uma curva de aprendizado, é uma solução flexível e eficiente para grandes volumes de dados, com custo calculado por consulta e armazenamento. É uma escolha econômica para consultas esporádicas, mas pode se tornar cara para consultas frequentes (Manninen, 2019).
4.2.2 Ferramentas de ETL e Orquestração
Pentaho é uma ferramenta de ETL amplamente reconhecida por sua interface gráfica amigável, que facilita a criação de jobs complexos. Sendo uma solução de código aberto, é uma opção econômica (Manninen, 2019).
Stitch Data é conhecida pela simplicidade e rapidez na integração de dados, ideal para pequenas e médias empresas. Seu modelo de preços é baseado no volume de dados, o que pode ser vantajoso para organizações com volumes variáveis (Duonghai, 2021).
Apache Airflow é uma plataforma robusta para a orquestração de workflows, com uma interface intuitiva e suporte para múltiplos plugins. Sendo de código aberto, elimina custos de licença, embora possa incorrer em custos de manutenção (Borzi, 2020).
Selenium é utilizada para a automação de navegadores, permitindo a extração de dados de fontes que não possuem APIs dedicadas. Apesar de ser flexível e de código aberto, exige um esforço considerável de desenvolvimento (Borzi, 2020).
Python, com suas bibliotecas como Pandas e NumPy, oferece grande flexibilidade e poder de processamento para ETL e análises avançadas. Como uma linguagem de código aberto, é uma opção econômica, embora requeira um conhecimento técnico significativo (Borzi, 2020).
4.2.3 Ferramentas de Visualização de Dados
Voluum é amplamente utilizado para o rastreamento de campanhas de marketing, oferecendo uma interface amigável e recursos robustos de visualização de dados. No entanto, o estudo não forneceu detalhes específicos sobre os custos ou comparações diretas com outras ferramentas de visualização (Duonghai, 2021).
Power BI é uma ferramenta altamente funcional e diversificada para visualização de dados, capaz de lidar com grandes conjuntos de dados. Apesar de suas limitações na quantidade de dados que pode processar simultaneamente, é amplamente utilizada por profissionais devido à sua familiaridade e à diversidade de recursos gráficos. Contudo, seu custo pode ser significativo, especialmente em aplicações que exigem a execução de consultas em grandes volumes de dados, exigindo um planejamento cuidadoso para ser rentável (Manninen, 2019).
S3 é utilizado principalmente para armazenamento de dados em nuvem e integração com outras ferramentas de análise e visualização. Embora seja eficiente em termos de custo para armazenamento, sua funcionalidade de visualização é limitada, necessitando de integração com outras ferramentas para a criação de relatórios visuais compreensíveis (Borzi, 2020).
Quadro 7 – Comparação entre funcionalidades, usabilidade e custos das soluções de data analytics.
Ferramenta Categoria Funcionalidades Usabilidade Custo Azure SQL Data Warehouse Integração com serviços Microsoft, suporte a SQL padrão, segurança avançada. Familiar para desenvolvedores SQL Server. Baseado em DTUs ou vCores; pode ser caro em grande escala. Snowflake Data Warehouse Separação de armazenamento e computação, suporte a dados semi-estruturados , Time Travel. Fácil de usar e configurar, flexível. Preço baseado no consumo real, oferece flexibilidade econômica. Google BigQuery Data Warehouse Processamento em tempo real, integração com Google Cloud, SQL padrão. Flexível e eficiente, curva de aprendizado inicial. Custo por consulta e armazenamento; econômico para consultas esporádicas, caro para frequentes. Pentaho ETL Interface gráfica amigável, facilita criação de jobs complexos. Fácil de usar, especialmente para quem busca soluções de código aberto. Código aberto, custo baixo. Stitch Data ETL Simplicidade e rapidez na integração de dados. Ideal para pequenas e médias empresas. Preço baseado no volume de dados, vantajoso para volumes variáveis. Apache Airflow Orquestração Plataforma robusta para orquestração de workflows, suporte a múltiplos plugins. Interface intuitiva, ampla comunidade de suporte. Código aberto; custos de manutenção podem existir. Selenium Automação Automação de navegadores, extração de dados de fontes sem APIs dedicadas. Flexível, requer desenvolvimento. Código aberto; custo de desenvolvimento. Python (Pandas/NumPy) ETL e Análise Flexibilidade e poder de processamento para ETL e análises avançadas. Requer conhecimento técnico, mas oferece grande flexibilidade. Código aberto, econômico, mas exige expertise técnica. Voluum Visualização Rastreamento de campanhas de marketing, interface amigável, visualização robusta. Fácil de usar para marketing, mas detalhes sobre custos não especificados. Não especificado. Power BI Visualização Visualização diversificada, capaz de lidar com grandes conjuntos de dados. Ampla adoção, familiaridade no setor, recursos gráficos avançados. Pode ser caro para grandes volumes de dados; exige planejamento cuidadoso. S3 Armazenamento/Vis. Armazenamento de dados em nuvem, integração com outras ferramentas de análise e visualização. Eficiente para armazenamento, funcionalidade de visualização limitada. Custo eficiente para armazenamento; requer integração para visualização completa.
4.3 Impactos na Geração de Insights com a Implementação de Data Analytics (Q3)
A implementação de data analytics nos dados gera impactos significativos na geração de insights, conforme abordado nos estudos analisados. Estes impactos são diversos e abrangem desde a melhoria dos processos de medição de desempenho até a otimização das estratégias de marketing.
4.3.1 Automatização e Eficiência na Coleta de Dados
Manninen (2019) destacou que a coleta automatizada de dados, proveniente de diversas fontes como Google Analytics, AppNexus e Chartbeat, eliminou processos manuais, aumentando a eficiência e a precisão das informações obtidas. Esta automatização permitiu a criação de novos indicadores e relatórios abrangentes, facilitando a identificação de oportunidades de otimização.
4.3.2 Análise Data-Driven e Compreensão do Comportamento do Consumidor
A abordagem data-driven introduzida por Cioffi (2019) teve um impacto substancial na capacidade das empresas de gerar insights relevantes. Esta metodologia possibilitou uma análise mais aprofundada do comportamento do consumidor, das tendências de mercado e das oportunidades de crescimento. A coleta e análise de dados provenientes de múltiplas fontes permitiram uma compreensão mais abrangente do cenário de negócios, o que, por sua vez, levou a decisões de marketing mais fundamentadas e eficazes.
4.3.3 Integração de Dados e Visualização Simplificada
Borzi (2023) apresentou uma implementação robusta de integração de dados, que possibilitou uma visualização simplificada do desempenho das campanhas de marketing em redes sociais. A utilização de técnicas de machine learning supervisionadas e não supervisionadas facilitou a clusterização dos dados em grupos significativos, permitindo uma análise mais profunda e enriquecida. Além disso, a criação de um Data Warehouse centralizado no Google BigQuery viabilizou consultas complexas e análises adicionais, resultando em insights mais precisos e decisões mais bem informadas.
4.3.4 Escalabilidade e Consolidação de Dados na Nuvem
A solução proposta por Ly (2019), que implementou um data warehouse na nuvem utilizando o Snowflake, teve um impacto significativo ao permitir a consolidação e análise de dados de diferentes fontes. Esta abordagem escalável proporcionou à empresa uma base sólida para a obtenção contínua de insights acionáveis, contribuindo para a melhoria do desempenho e da competitividade no mercado.
4.3.5 Impactos identificados
Os impactos da implementação de data analytics são vastos e incluem:
- Automatização e Eficiência: A coleta automatizada de dados eliminou processos manuais, aumentando a eficiência e a precisão das informações (A1).
- Consistência e Coerência dos Dados: A integração de dados de múltiplas fontes garantiu a consistência e coerência, facilitando análises mais precisas (A1).
- Enriquecimento e Análise dos Dados: Atribuição de rótulos e uso de técnicas de machine learning enriqueceram os dados e permitiram análises mais profundas (A1).
- Visualização e Monitoramento em Tempo Real: O armazenamento em data warehouses e a visualização em painéis de controle permitiram monitoramento em tempo real e melhor análise das campanhas (A1 e A3).
- Compreensão do Público-Alvo e Segmentação: A análise detalhada dos dados proporcionou uma compreensão mais clara do público-alvo e permitiu segmentação eficaz dos usuários (A2 e A4).
- Identificação de Tendências e Padrões: A análise dos dados revelou tendências e padrões de comportamento dos clientes, ajudando a ajustar estratégias de marketing (A2, A3 e A4).
- Otimização de Campanhas: Insights baseados em dados permitiram otimizar campanhas de marketing em tempo real para maximizar resultados (A2 e A4).
- Melhoria na Tomada de Decisão: Dados precisos e atualizados contribuíram para decisões mais embasadas e estratégicas (A3 e A4).
- Maior Eficiência Operacional: Estratégias orientadas por dados resultaram em maior eficiência operacional e melhor alocação de recursos (A2).
- Personalização de Experiências: Insights gerados facilitaram a personalização das experiências dos clientes, aumentando satisfação e fidelidade (A2).
Na figura 3 é apresentada uma sumarização dos impactos na implementação de data analytics mencionados nos trabalhos selecionados, agrupados em quatro categorias: ganho de eficiência, diminuição de erros, melhoria na tomada de decisões e automatização do processo.
No quadro 8, por sua vez, é apresentada uma visão detalhada sobre a menção expressa a cada impacto na implementação de data analytics nos trabalhos selecionados nesta pesquisa.
5. Conclusão
Esta revisão sistemática da literatura explorou as principais ferramentas e estratégias de data analytics aplicadas ao marketing digital, destacando tendências e desafios do setor. A pesquisa, baseada nas diretrizes PRISMA, analisou 4 estudos selecionados entre 90 artigos identificados nas bases IEEE Xplore e Google Scholar.
Em relação à primeira questão (Q1 – Quais ferramentas e estratégias de data analytics estão sendo empregadas no marketing digital?), ferramentas como Google BigQuery, Python e Power BI foram identificadas como as mais recorrentes, destacando-se por sua escalabilidade, flexibilidade e capacidade de visualização. Outras soluções, como Pentaho (ETL), Apache Airflow (orquestração) e Selenium (web scraping), complementam o ecossistema. As estratégias mais relevantes incluem a automatização da coleta de dados, a unificação de fontes heterogêneas e o uso de machine learning, evidenciando uma tendência de integrar tecnologias avançadas para otimizar processos e análises no marketing digital.
Quanto à segunda questão (Q2 – Quais as funcionalidades, usabilidade e custo das soluções propostas?), os achados mostram uma diversidade de opções. Ferramentas como Google BigQuery e Snowflake oferecem processamento em tempo real e escalabilidade na nuvem, com custos baseados em consumo, enquanto soluções de código aberto, como Pentaho e Python, destacam-se pela acessibilidade e flexibilidade, embora exijam maior expertise técnica. Power BI é amplamente adotado por sua usabilidade e visualizações robustas, mas pode ser caro em cenários de alto volume de dados. Essas características demonstram a diversidade de soluções disponíveis e sua influência direta na eficiência e nos resultados das campanhas de marketing.
Por fim, a terceira questão (Q3 – Quais os impactos na geração de insights após a implementação de data analytics nos dados?) revelou impactos significativos, como maior eficiência operacional, melhoria na tomada de decisão e personalização de campanhas. A automatização eliminou processos manuais, a integração de dados gerou consistência e a aplicação de machine learning enriqueceu as análises, permitindo segmentação precisa e identificação de tendências. Esses benefícios transformam dados brutos em insights acionáveis, fortalecendo a competitividade no mercado digital.
Apesar da amostra limitada a 4 artigos e da ausência de estudos do IEEE Xplore na seleção final, esta revisão cumpre seu objetivo de catalogar ferramentas e estratégias, demonstrando como o data analytics potencializa o marketing digital. Os resultados evidenciam que a integração de tecnologias escaláveis, automação e análises avançadas é essencial para transformar grandes volumes de dados em insights estratégicos. A crescente complexidade do marketing digital reforça a necessidade de pesquisas contínuas sobre a evolução das ferramentas e metodologias de data analytics, garantindo que empresas possam tomar decisões mais embasadas e competitivas.
Referências
Aarcha, J.; Sasikala, M.; Merccy, M. T. Harnessing Business Data Analytics for Competitive Advantage in the Digital Era. mLAC Journal for Arts Commerce and Sciences (m-JACS), v. 2, n. 3, 2024. Disponível em: https://doi.org/10.59415/mjacs.v2i3.175. Acesso em: 22 dez. 2024.
Adolpho, C. Os 8 Ps do Marketing Digital: O Guia Estratégico de Marketing Digital. São Paulo: Novatec Editora, 2020.
Bitar, M. Google Analytics: Insights into user engagement for strategy refinement. Journal of Marketing Technologies, v. 18, n. 5, 2023.
Borzi, M. Automated data integration and machine learning for enhanced social media marketing analysis. 2023. Dissertação (Mestrado) – Politecnico di Torino.
Chaffey, D.; Ellis-Chadwick, F. Digital Marketing: Strategy, Implementation and Practice. 7. ed. Harlow: Pearson Education Limited, 2019.
Chen, H.; Chiang, R. H. L.; Storey, V. C. Business Intelligence and Analytics: From Big Data to Big Impact. MIS Quarterly, v. 36, n. 4, p. 1165–1188, 2012.
Cioffi, R. Data-driven marketing: strategies, metrics and infrastructures to optimize marketing performances. 2019. Dissertação (Mestrado) – Politecnico di Torino.
Davenport, T. H.; Harris, J. G. Competing on Analytics: The New Science of Winning. Boston: Harvard Business Review Press, 2007.
Desai, V.; Vidyapeeth, B. Digital marketing: a review. International Journal of Trend in Scientific Research and Development, v. 5, n. 5, p. 196–200, 2019.
Fayyad, U.; Piatetsky-Shapiro, G.; Smyth, P. From Data Mining to Knowledge Discovery in Databases. AI Magazine, 1996.
Gama, F. S.; Abreu, G. K. K. Desmistificando o conceito de ETL. Revista de Sistemas de Informação, v. 2, p. 1–10, jul./dez. 2008. Disponível em: https://www.fsma.edu.br/si/Artigos/V2_Artigo1.pdf. Acesso em: 25 jan. 2025.
Hanadi, A.; Salhab, S. The use of data analytics in digital marketing for sustainable business growth. Journal of Infrastructure, Policy and Development, v. 8, n. 8, 2024. Disponível em: https://doi.org/10.24294/jipd.v8i8.4894. Acesso em: 22 fev. 2025.
Kotler, P.; Kartajaya, H.; Setiawan, I. Marketing 5.0: Tecnologia para a humanidade. São Paulo: Pearson Education, 2021.
Lavalle, S. et al. Big Data, Analytics and the Path from Insights to Value. MIT Sloan Management Review, v. 52, n. 2, p. 21–32, 2011.
Leonidas, T.; Theodoropoulou, A. Leveraging Big Data Analytics for Understanding Consumer Behavior in Digital Marketing: A Systematic Review. Human Behavior and Emerging Technologies, 2023. Disponível em: https://doi.org/10.1155/2024/3641502. Acesso em: 22 fev. 2025.
Ly, D. H. Data analytics in cloud data warehousing: case company. 2019. Trabalho de Conclusão de Curso (Bacharelado) – Metropolia University of Applied Sciences.
Manninen, L. Improving content marketing performance measurement. 2019. Dissertação (Mestrado) – Lappeenranta University of Technology, School of Engineering Science.
Manyika, J. et al. Big Data: The Next Frontier for Innovation, Competition, and Productivity. McKinsey Global Institute, 2011.
Nwokeji, J. C. et al. Big Data ETL Implementation Approaches: A Systematic Literature Review. In: 30th International Conference on Software Engineering and Knowledge Engineering (SEKE), 2018. p. 1–6.
Porto, J. Marketing Digital: Estratégias e Ferramentas. Coimbra: Editora da Universidade de Coimbra, 2019.
Provost, F.; Fawcett, T. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. Sebastopol: O’Reilly Media, 2013.
Seenivasan, D. ETL (Extract, Transform, Load) Best Practices. International Journal of Computer Trends and Technology, v. 71, n. 1, p. 40–44, 2023.
Sharda, R.; Delen, D.; Turban, E. Business Intelligence, Analytics, and Data Science: A Managerial Perspective. Boston: Pearson, 2019.
William, R.; Feitosa, S. O marketing na era digital: análise de dados no foco. GeSec, v. 14, n. 5, 2023. Disponível em: https://doi.org/10.7769/gesec.v14i5.2126. Acesso em: 22 fev. 2025.
Zarate, G. et al. Evolution of Extract-Transform-Load (ETL) processes towards data product pipelines. In: 4th Eclipse Security, AI, Architecture and Modelling Conference on Data Space (eSAAM 2024), Mainz, Germany. New York: ACM, 2024. p. 1–8.
1Discente do Bacharelado em Sistemas de Informação do Instituto Federal de Alagoas (IFAL) – Campus Maceió. Contato: els1@aluno.ifal.edu.br
2Discente do Bacharelado em Sistemas de Informação do Instituto Federal de Alagoas (IFAL) – Campus Maceió. Contato: mvgp1@aluno.ifal.edu.br
3Docente do Bacharelado em Sistemas de Informação do Instituto Federal de Alagoas (IFAL) – Campus Maceió. Contato: monica@ifal.edu.br