REGISTRO DOI: 10.69849/revistaft/fa10202502251834
Emerson Lino da Silva,
Marcus Vinicius Gomes Pestana
ABSTRACT
This systematic literature review aims to investigate the main strategies and tools available for integrating, centralizing, organizing, and analyzing digital marketing data. The increasing volume of data generated by user behavior and profile, digital advertising platforms, and transactional system data has highlighted the importance of using data analytics techniques and tools effectively to extract valuable insights and make informed decisions. The review covers ETL tools and strategies, data storage, and report generation, and also highlights best practices and advances in the field over the past 5 years.
RESUMO
Este artigo de revisão sistemática de literatura visa investigar as principais estratégias e ferramentas disponíveis para a integração, centralização, organização e análise dos dados de marketing digital. O crescente volume de dados gerados por comportamento e perfil de usuários, plataformas de anúncios de publicidade digital, dados de sistemas transacionais têm destacado a importância do uso eficaz de técnicas e ferramentas de data analytics para extrair insights valiosos e tomar decisões embasadas. A revisão abrange ferramentas e estratégias de ETL, armazenamentos de dados, e geração de relatórios, além de destacar as melhores práticas e avanços na área nos últimos 5 anos.
Palavras-chave: Data Analytics, Marketing Digital, ETL, Business Intelligence, Data Warehousing.
1. Introdução
O marketing digital tornou-se uma ferramenta essencial para empresas que buscam obter vantagem competitiva na era digital. Ele engloba uma ampla gama de estratégias e ferramentas projetadas para aumentar a visibilidade da marca, promover o engajamento do consumidor e impulsionar as vendas. A eficácia do marketing digital está em sua capacidade de personalizar estratégias com base em dados, tornando as campanhas mais direcionadas e impactantes (Oliveira & Vasconcelos, 2024). Essa abordagem não apenas amplia o alcance, mas também fortalece os relacionamentos com os consumidores, um aspecto crucial para o sucesso empresarial no mercado atual.
Com o avanço das tecnologias, o data analytics emergiu como um componente indispensável do marketing digital, proporcionando uma compreensão aprofundada do comportamento do consumidor, otimização de campanhas e crescimento sustentável das organizações. Estudos indicam que o uso de data analytics no marketing digital é essencial para o crescimento sustentável, pois permite a segmentação precisa de clientes e a aplicação de análises preditivas, otimizando estratégias de negócio e promovendo respostas proativas a tendências de mercado (Hanadi & Salhab, 2024). Essa integração possibilita campanhas direcionadas e transforma dados em insights acionáveis, contribuindo para vantagens competitivas duradouras.
A análise de dados no marketing digital também desempenha um papel crucial na compreensão do comportamento do consumidor, segmentação de público-alvo e medição da eficácia de campanhas, identificando áreas de melhoria para otimizar resultados (Wilian et al., 2023). Além disso, a utilização de big data analytics transforma a compreensão do consumidor, permitindo estratégias de marketing mais personalizadas e melhorando a satisfação e o engajamento do cliente (Leonidas & Theodoropoulou, 2023).
O data analytics no marketing digital também estimula a inovação ao possibilitar que organizações coletem e analisem dados de consumidores para criar estratégias sob medida, aumentar o engajamento do cliente e impulsionar a competitividade em um mercado digital dinâmico (Aarcha et al., 2024).
Este artigo propõe uma revisão sistemática da literatura sobre as estratégias e ferramentas aplicadas no data analytics no marketing digital, explorando como essas práticas podem potencializar os resultados e melhorar a eficiência das ações de marketing. A revisão abrangente da literatura sobre data analytics e marketing apresenta conceitos-chave e discute trabalhos relevantes na área, definindo um panorama do estado atual do conhecimento.
A metodologia utilizada para realizar a revisão da literatura é detalhada, incluindo os critérios de seleção de estudos, os métodos de análise de dados e as ferramentas utilizadas. Os resultados da revisão da literatura destacam as principais ferramentas e estratégias de data analytics no marketing digital, suas características e as abordagens adotadas, discutindo esses resultados à luz da literatura existente e das práticas atuais do mercado.
As considerações finais do artigo discutem as implicações dos resultados para a prática. O objetivo principal do artigo é fornecer um panorama abrangente das ferramentas e estratégias de data analytics no marketing digital, catalogando suas características e abordagens adotadas. Ao oferecer uma visão geral do estado da arte nessa área, o artigo visa auxiliar profissionais de marketing e gestores de empresas na tomada de decisões informadas sobre a implementação de soluções de data analytics para otimizar suas estratégias de marketing digital.
2. Fundamentação Teórica
2.1 Marketing digital
O Marketing Digital se consolidou como uma ferramenta crucial para profissionais e empresas que desejam se destacar no cenário competitivo atual. Através da utilização estratégica de canais digitais, como websites, mídias sociais, email marketing e mecanismos de busca, o Marketing Digital permite alcançar um público amplo e engajado, construir relacionamentos duradouros e impulsionar resultados de forma mensurável.
O Marketing Digital se caracteriza por um conjunto de técnicas e estratégias voltadas para promover produtos, serviços, marcas e ideias através da internet e de dispositivos digitais. Essa modalidade de marketing se diferencia do marketing tradicional por sua natureza interativa, direcionada e mensurável (Kotler, 2021). Ela se manifesta através de diversos canais, cada um com suas próprias características e potencialidades. Entre os principais canais estão os websites, que funcionam como a “casa virtual” da empresa, apresentando seus produtos, serviços e valores ao público-alvo (Porto, 2019). As mídias sociais também desempenham um papel crucial, permitindo a interação direta com o público, a construção de comunidades engajadas e a disseminação de conteúdo relevante (Adolpho, 2020).
Além disso, o email marketing se destaca como uma ferramenta eficaz para nutrir leads, fidelizar clientes e realizar ações de venda (Gabriel, 2018). Os mecanismos de busca, tanto SEO quanto SEM, são essenciais para otimizar a visibilidade do site nos resultados de pesquisa, atraindo tráfego orgânico e pago (Peçanha, 2017). O marketing de conteúdo, que envolve a criação e distribuição de material informativo, educativo e relevante, visa atrair e engajar o público-alvo (Godin, 2018). O marketing de afiliados, por sua vez, estabelece parcerias com influenciadores e outros profissionais para promover produtos ou serviços ao seu público (Pulizzi, 2016). Por fim, o marketing de influência utiliza a credibilidade e o alcance de influenciadores digitais para alcançar um público específico (Hanadi & Salhab, 2024).
O Marketing Digital oferece diversos benefícios para empresas e profissionais. Ele permite um alcance amplo, alcançando um público global sem restrições geográficas (Kotler, 2021). A segmentação precisa possibilita direcionar ações para públicos específicos, baseando-se em interesses, comportamentos e dados demográficos (Adolpho, 2020). A interatividade promove a interação direta com o público, permitindo a construção de relacionamentos duradouros (Gabriel, 2018). A mensurabilidade, por sua vez, fornece dados precisos sobre o desempenho das campanhas, permitindo ajustes e otimizações constantes (Peçanha, 2017). Além disso, o Marketing Digital é mais custo-eficiente do que o marketing tradicional, sendo especialmente acessível para pequenas e médias empresas (Aarcha et al., 2024).
2.2 Data Analytics
O Data Analytics se manifesta em diversas formas, cada uma com seus objetivos e aplicações específicas. Entre os principais tipos, podemos destacar: Análise Descritiva, que foca em resumir e descrever os dados, fornecendo uma visão geral do conjunto de dados (Pulizzi, 2016); Análise Diagnóstica, que investiga as causas por trás de eventos ou resultados específicos, buscando entender o “porquê” das coisas (Rock Content, 2023); Análise Preditiva, que utiliza técnicas de aprendizado de máquina para prever eventos futuros com base em dados históricos e padrões identificados (Kotler, 2021); e Análise Prescritiva, que vai além da previsão, recomendando ações e estratégias a serem tomadas para alcançar resultados específicos (Adolpho, 2020).
A implementação do Data Analytics nas organizações tem se mostrado fundamental para garantir a competitividade em um mercado cada vez mais dinâmico. Ao analisar grandes volumes de dados, as empresas podem tomar decisões mais assertivas, baseadas em evidências concretas, o que lhes permite adaptar-se rapidamente às mudanças do mercado e superar seus concorrentes (Gabriel, 2018).
Um dos principais benefícios do Data Analytics é a otimização de recursos, uma vez que permite identificar áreas de desperdício e ineficiência, possibilitando a redução de custos operacionais (Peçanha, 2017). Além disso, ao fornecer dados precisos e insights acionáveis, o Data Analytics auxilia na tomada de decisões estratégicas, reduzindo a incerteza e aumentando as chances de sucesso (Godin, 2018).
Outro aspecto relevante é o estímulo à inovação. Ao analisar os dados, as empresas podem identificar novas oportunidades de mercado e desenvolver produtos e serviços que atendam às necessidades específicas dos clientes, impulsionando o crescimento e a diferenciação (Pulizzi, 2016). Por fim, o Data Analytics contribui para a construção de relacionamentos mais fortes com os clientes. Ao personalizar a experiência do cliente com base em seus dados, as empresas aumentam a satisfação e a fidelidade, tornando-os mais propensos a realizar novas compras e recomendar a marca para outros (Rock Content, 2023).
O Data Analytics se apoia em diversas ferramentas e tecnologias para realizar sua função, como bases de dados, que armazenam e organizam grandes volumes de dados, permitindo o acesso e a manipulação dos mesmos (Kotler, 2021); e ferramentas de BI (Business Intelligence), que fornecem recursos para visualização de dados, criação de relatórios e dashboards, facilitando a compreensão dos dados (Adolpho, 2020). Em um mundo inundado por dados, o Data Analytics surge como uma ferramenta crucial para empresas e profissionais que desejam navegar na incerteza e tomar decisões estratégicas com base em informações sólidas. Através da análise de grandes conjuntos de dados, o Data Analytics permite extrair insights valiosos, identificar padrões ocultos, prever tendências e otimizar processos, impulsionando o sucesso em diversos setores.
O Data Analytics se caracteriza por um conjunto de técnicas e metodologias que visam coletar, organizar, processar, analisar e interpretar grandes volumes de dados, sejam eles estruturados, semi estruturados ou não estruturados. Através da aplicação de técnicas estatísticas, algoritmos de aprendizado de máquina e ferramentas de visualização, o Data Analytics transforma dados brutos em informações acionáveis que podem ser utilizadas para descobrir novos insights e
padrões, identificando relações e tendências que antes eram invisíveis e permitindo uma compreensão mais profunda do negócio e dos clientes (Kotler, 2021). Além disso, permite tomar decisões mais informadas, baseando-se em evidências concretas e dados confiáveis, reduzindo a incerteza e aumentando as chances de sucesso (Adolpho, 2020). Também otimiza processos e operações ao identificar áreas de ineficiência e gargalos, possibilitando a otimização de processos e a redução de custos (Gabriel, 2018).
2.3 Insights de Data Analytics
Insights são descobertas valiosas e significativas extraídas da análise de dados (Daly et al. ,2014). Eles fornecem uma compreensão profunda dos dados que pode levar a melhores decisões de negócios. No contexto de Data Analytics, insights são a chave para transformar dados brutos em informações acionáveis .
Exemplos de insights valiosos que podem ser obtidos através da análise de dados incluem a identificação de tendências de mercado e preferências do consumidor, a detecção de oportunidades de negócios não exploradas, a otimização de estratégias de marketing e vendas, a previsão de demanda e planejamento de estoque, a detecção precoce de problemas operacionais e a personalização de produtos e serviços .
Para extrair insights significativos, os dados precisam passar por um processo de análise que envolve a coleta e limpeza dos dados de diversas fontes, o processamento e armazenamento dos dados em estruturas adequadas, a aplicação de técnicas analíticas como estatística, machine learning e visualização, e a interpretação dos resultados para identificar padrões, tendências e insights .
Ferramentas de Data Analytics como SQL, Hadoop, Spark e linguagens de programação como Python e R são usadas para automatizar e escalar esse processo de extração de insights .
Em resumo, insights são a essência do Data Analytics, transformando dados em conhecimento acionável que impulsiona melhores decisões de negócios. Empresas que conseguem extrair insights valiosos de seus dados estão em melhor posição para inovar, otimizar operações e obter vantagem competitiva.
2.4 ETL (Extract, Transform, Load)
ETL (Extract, Transform, Load) é um processo fundamental em Data Analytics que envolve a extração de dados de diferentes fontes, sua transformação para um formato adequado e o carregamento desses dados em um sistema de destino, como um data warehouse ou data lake.
O processo ETL é uma das fases mais críticas na construção de sistemas de Data Warehouse, pois é nesta etapa que grandes volumes de dados são processados (FERREIRA et al., 2010). Ele permite a ingestão rápida e confiável de dados em data lakes para ciência de dados e análise, criando modelos de alta qualidade.
As principais etapas do processo ETL são:
- Extração: Coleta de dados de diversas fontes, como bancos de dados, planilhas, arquivos de texto, etc.
- Transformação: Aplicação de regras de negócio e limpeza dos dados para adequá-los ao modelo de destino.
- Carga: Carregamento dos dados transformados no sistema de destino, como um data warehouse ou data lake.
O ETL é essencial para a construção de data warehouses, a migração de dados entre sistemas e a preparação de dados para análises avançadas e modelagem preditiva. Ele permite que empresas de diversos setores, como serviços financeiros, petróleo e gás e automotivo, obtenham insights acionáveis, tomem decisões rápidas e aumentem a eficiência operacional.
Em resumo, o processo ETL é um componente crítico da arquitetura de Data Analytics, responsável por transformar dados brutos em informações valiosas para a tomada de decisão orientada por dados (FAYYAD et al., 1996; SHARDA et al., 2019).
2.5 Contexto
No campo do marketing digital, data-driven advertising é a utilização dos dados provenientes da jornada do cliente, como websites, ações em e-mails e aplicativos móveis para a definição de segmentação de audiência, especificando exatamente quais os perfis de clientes vão ser impactados pelos anúncios (Desai et al., 2019). Ou seja, é possível se ter um vasta gama de fontes de dados heterogêneas que alimentam métricas específicas da área de marketing digital, o que dificulta uma geração de insights de forma mais geral. Por exemplo: os dados provenientes de sistemas de relação com o cliente são diferentes dos dados provenientes da performance de anúncios de marketing, mas dentro da jornada do cliente, tudo pode começar em uma visualização de um anúncio e passar para um atendimento direto com o cliente.
Dessa forma, o emprego de data analytics no marketing digital é necessário para a geração de informação valiosa com o objetivo da tomada de decisão. É possível encontrar diversas usabilidades direcionadas para o data analytics de modo geral, o que nos leva a pergunta de pesquisa deste artigo: Como e quais ferramentas e estratégias de data analytics estão sendo empregados no marketing digital?
3. Revisão Sistemática
3.1 Objetivo
O objetivo desta revisão é identificar e analisar as principais estratégias e ferramentas utilizadas para data analytics no marketing digital. Para orientar a investigação, foram definidas questões de pesquisa com base na estrutura PICO (população, intervenção, comparação e resultados) de Kitchenham e Charters (2007).
PICOC:
- Population: marketing digital
- Intervention: estratégias, metódos, abordagens e ferramentas
- Outcome: processos, modelos, arquiteturas, técnicas
- Context: data analytics
As questões de pesquisa que orientam este estudo são:
3.2 Perguntas de Pesquisa
- Q1 – Quais ferramentas e estratégias de data analytics estão sendo empregados no marketing digital?
- Q2 – Quais as funcionalidades, usabilidade e custo das soluções propostas?
- Q3 – Quais os impactos na geração de insights após a implementação de data analytics nos dados?
3.3 Critérios
Com o nosso foco nas ferramentas e estratégias em estado da arte, é necessário estipular critérios que espelham isso. Publicações recentes discorrendo sobre o emprego de data analytics em fontes de dados heterogêneos, detalhando o processo de manuseio de dados. Os critérios de inclusão para os artigos analisados foram:
- Publicações entre 2019 e 2024.
- Artigos que discorrem sobre processos de extração, transformação e carregamento de dados
- Artigos que lidam com dados provenientes de campanhas em mídias sociais
- Artigos que trabalham com dados de mais de uma fonte de dados heterogênea
3.4 Qualidade
Foram definidas 4 perguntas para analisar a qualidade dos estudos selecionados:
- O estudo explicitamente descreve as estratégias e/ou ferramentas utilizadas?
- O estudo apresenta um emprego das estratégias/ferramentas em uma situação real?
- O estudo apresenta métricas concretas do resultado do emprego de sua solução?
- O estudo discorre sobre dados de performance de campanhas de marketing digital?
Elas refletem a necessidade de analisar quantitativamente e qualitativamente as ferramentas e estratégias citadas. Cada pergunta vale um total de 1 ponto (Equivalente a resposta “Sim”), em caso da resposta ser “Parcialmente”: 0,5 pontos, e por fim 0 pontos caso a resposta seja “Não”. Com a nota de corte sendo 2 pontos é possível levar em conta estudos que respondem completamente pelo menos 50% do nosso objetivo.
3.5 Seleção
A seleção dos artigos foi realizada por meio de buscas nas bases de dados acadêmicas: Google Scholar e IEEE Xplore. Palavras-chave utilizadas incluíram “data analytics”, “digital marketing”, “data warehouse”, e principais fontes de marketing digital em mídias sociais (Facebook e Google). Uma decisão dos autores foi a utilização de palavras-chave apenas em inglês, e como resultado: a seleção apenas de estudos em inglês. Esta decisão foi tomada pelo fato da Língua Inglesa ser considerada a Língua Franca da Ciência, pois a maioria das publicações científicas de alto impacto são publicadas em inglês, tornando-o essencial para acessar as descobertas mais recentes e relevantes.
Query Base de dados (“Data analytics”) AND ((“google ads”) OR (“facebook ads”) OR (“ads performance”)) AND (“data warehousing”) AND (“marketing”) Google Scholar (“data analytics”) AND (“marketing”) AND (“social media”) AND (“advertising”) IEEE Xplore
3.6 Execução da pesquisa
A execução das queries de pesquisa resultaram em 58 estudos no Google Scholar e 32 no IEEE Xplore, totalizando 90 estudos. 17 artigos da base do Google Scholar tinham sua data de criação priori à 2019 e foram descartados e 15 artigos da base IEEExplore foram descartados pelo critério da data. 58 artigos foram lidos parcialmente e 53 foram descartados por não atenderem os critérios de seleção, resultando em um total de 5 estudos que foram lidos na íntegra. 4 dos 5 estudos passaram pelos critérios de qualidade. Como demonstrado na tabela a seguir:
Tabela 01 – Etapas de seleção
Etapa Base Nº de Artigos Pesquisa Google Acadêmico 58 Pesquisa IEEExplore 32 Critério de seleção Google Acadêmico 4 Critério de seleção IEEExplore 1 Critério de qualidade Google Acadêmico 4 Critério de qualidade IEEExplore 0
3.7 Artigos Selecionados
Tabela 02 – Artigos selecionados
ID ARTIGO ANO BASE DE DADOS A1 Automated Data Integration and Machine Learning for Enhanced Social Media Marketing Analysis 2023 Google Scholar A2 DATA-DRIVEN MARKETING: Strategies, metrics and infrastructures to optimize the marketing performances 2019 Google Scholar A3 Data analytics in cloud data warehousing, case company 2019 Google Scholar A4 Improving content marketing performance measurement 2019 Google Scholar
4. Resultados e Discussões
Nesta seção, os resultados obtidos a partir da revisão sistemática da literatura são apresentados e discutidos em relação às perguntas de pesquisa formuladas. Os artigos selecionados forneceram insights valiosos sobre as ferramentas e estratégias de data analytics no marketing digital, que foram organizados em categorias para facilitar a compreensão.
4.1 Ferramentas e Estratégias de Data Analytics no Marketing Digital (Q1)
A primeira pergunta de pesquisa investiga as ferramentas e estratégias de data analytics utilizadas no marketing digital. A análise revelou a utilização de 11 ferramentas principais, distribuídas em seis categorias: Data Warehouse, ETL (Extract, Transform, Load), Orquestração, Web Scrapers, Linguagem de programação e Visualização.
Tabela 03 – Ferramentas utilizadas
Categoria Ferramenta Artigo Data Warehouse Enterprise Data A2 S3 da Amazon Web Service A3 Microsoft Azure SQL A3 Google BigQuery A1, A3, A4 ETL Stitch Data A3 Pentaho A1 Orquestração Apache Airflow A4 Web Scrapers Selenium A1 Linguagem de Programação Python A1, A3, A4 Visualização Voluum A2 Power BI A1
4.1.1 Data Warehouses
Os artigos discutiram extensivamente o papel dos data warehouses, que são essenciais para o armazenamento centralizado dos dados após o processo de ETL. Por exemplo, Borzi (2023) propôs a estratégia de inversão do processo tradicional de ETL para ELT (Extract, Load, Transform), o que melhora a eficiência na etapa de carregamento dos dados e integra uma camada de machine learning para auxiliar na interpretação dos dados. Já Duong Hai (2019) defende a adoção de data warehouses em cloud computing, destacando a escalabilidade e a eficiência na gestão de grandes volumes de dados.
4.1.2 Ferramentas de ETL
As ferramentas de ETL são cruciais para a preparação dos dados antes de serem armazenados nos data warehouses. O estudo de Claudio (2019) destaca a importância de escolher uma infraestrutura de ETL adequada à complexidade e ao volume dos dados, enquanto Manninen (2019) recomenda o uso de ferramentas de orquestração como o Apache Airflow, combinadas com scripts em Python, para automatizar processos de ETL e garantir a atualização contínua dos dados.
4.1.3 Orquestração e Automação
No que se refere à orquestração de dados, Manninen (2019) enfatiza a necessidade de definir fluxos de trabalho automatizados utilizando ferramentas como Apache Airflow. Essa abordagem permite a geração automática de relatórios e a atualização constante dos dados, facilitando a tomada de decisões em tempo real.
4.1.4 Visualização de Dados
A visualização dos dados é essencial para transformar os dados em informações compreensíveis. Ferramentas como Power BI e Voluum foram mencionadas nos artigos revisados como fundamentais para a criação de relatórios visualmente ricos e informativos, permitindo que os tomadores de decisão identifiquem tendências e insights relevantes com facilidade.
Entre as ferramentas mais citadas, destacam-se o Google BigQuery, Python e Power BI, cada uma referenciada em três estudos. Essas ferramentas representam soluções amplamente utilizadas devido às suas capacidades robustas de processamento, automação e visualização de dados. O Google BigQuery é particularmente valorizado por sua escalabilidade e eficiência em consultas em tempo real, enquanto o Python oferece flexibilidade e suporte para análises avançadas. O Power BI, por sua vez, é amplamente reconhecido por sua interface intuitiva e diversificada gama de visualizações.
As demais ferramentas, embora menos citadas, desempenham papéis críticos em cenários específicos. Por exemplo, o SnowFlake e o Microsoft Azure SQL destacam-se por suas funcionalidades em armazenamento e integração de dados, enquanto ferramentas de ETL como Stitch Data e Pentaho são cruciais para transformar e integrar dados heterogêneos. A orquestração automatizada proporcionada pelo Apache Airflow e a coleta de dados com Selenium são também essenciais em processos de automação e extração de informações de fontes diversas.
A análise dos artigos selecionados identificou seis estratégias fundamentais de data analytics aplicadas ao marketing digital, cada uma contribuindo para a eficiência e precisão no uso de dados em campanhas de marketing. Essas estratégias foram distribuídas entre os estudos analisados e refletem abordagens que otimizam processos e oferecem vantagem competitiva.
Tabela 04 – Estratégias utilizadas
Estratégia Artigo Automatizar coleta de dados (A1, A2, A3, A4) Unificar diversas fontes de dados (A1, A2, A3, A4) Uso de modelos de aprendizado de máquina A1 Data Warehouse em Nuvem A3 Modelagem DW a partir dos KPIs de marketing A2 Pré-processamento dos dados e agendamento de tarefas A4
Automatização da Coleta de Dados: Presente em todos os artigos analisados (A1, A2, A3, A4), essa estratégia demonstra a importância de substituir processos manuais por soluções automatizadas, garantindo maior eficiência e precisão na extração de dados. A automatização elimina redundâncias e erros humanos, além de permitir um fluxo contínuo de informações atualizadas para análise.
Unificação de Fontes de Dados: Também abordada em todos os artigos (A1, A2, A3, A4), essa estratégia destaca a necessidade de integrar dados provenientes de diferentes fontes. A unificação é essencial para construir uma visão holística do comportamento do consumidor e otimizar a personalização das campanhas.
Uso de Modelos de Aprendizado de Máquina: Identificado no artigo A1, o uso de algoritmos de aprendizado de máquina permite análises avançadas, como predições de tendências de mercado e segmentação de público. Essa abordagem contribui para a tomada de decisões mais assertivas, com base em padrões e insights derivados de grandes volumes de dados.
Data Warehouse em Nuvem: Citado no artigo A3, o uso de data warehouses na nuvem oferece escalabilidade e flexibilidade para o armazenamento e processamento de grandes volumes de dados. Essa estratégia reduz custos operacionais e facilita o acesso a informações em tempo real.
Modelagem de Data Warehouse com Base em KPIs de Marketing: O artigo A2 destaca a importância de projetar modelos de data warehouse que incorporem indicadores-chave de desempenho (KPIs) específicos do marketing. Essa abordagem garante que as análises sejam direcionadas às métricas mais relevantes para a avaliação de campanhas.
Pré-processamento de Dados e Agendamento de Tarefas: Mencionado no artigo A4, o pré-processamento de dados combinado com agendamento automatizado é crucial para garantir que os dados estejam prontos para análise em intervalos regulares. Essa estratégia melhora a qualidade das análises e reduz atrasos no fluxo de trabalho.
A divisão do processo de data analytics em etapas distintas permite uma compreensão mais aprofundada de cada fase, facilitando a identificação de possíveis gargalos e oportunidades de melhoria. Além disso, essa abordagem estruturada facilita a comparação entre diferentes estudos e metodologias, permitindo a identificação de tendências e boas práticas na área.
Será apresentada uma revisão detalhada das etapas identificadas nos artigos A1, A2, A3 e A4, a saber: definição de objetivos e métricas, coleta de dados, processamento e análise de dados, visualização de dados e tomada de decisão. Para facilitar a compreensão, será apresentada uma tabela comparativa que demonstra a aplicação de cada etapa em cada um dos artigos analisados.
Tabela 05 – Implementação por etapa
ARTIGO DEFINIÇÃO DE OBJETIVOS E MÉTRICAS COLETA DE DADOS PROCESSAMENTO E ANÁLISE VISUALIZAÇÃO TOMADA DE DECISÃO A1 Otimizar a análise de desempenho de campanhas em mídias sociais. APIs: Youtube e web scraping: Linkedin Machine Learning (supervisionado e não supervisionado), clustering, classificação Automação de dashboard com Microsoft BI Integração automatizada de dados e aprendizado de máquina para obter insights A2 Aborda a estratégia geral de marketing orientado por dados, incluindo métricas e otimização de performance. APIs: Google e Facebook Rastreamento e análise de desempenho de campanhas com Voluum IA Extração de Planilhas Criação de audiência identificar padrões, tendências para otimizar as campanhas e maior eficácia no investimento A3 Analisar dados de plataformas como Google Ads e Facebook Ads para otimizar campanhas de marketing. APIs: Google Facebook Utiliza data warehouse em nuvem para armazenar e analisar grandes volumes de dados. Arquivos JSON armazenados no S3 da Amazon Web Service Criação de 5 tipos de objetivos – “success rate” que os dados devem responder A4 Se concentra especificamente na medição de desempenho do marketing de conteúdo em artigos APIs: Google Analytics, AppNexus e Chartbeat Criação de novos indicadores e valores no processo de ETL e Apache Airflow para agendamento de tratamento de dados Automação de dashboard com Microsoft BI Medir qualidade do conteúdo com base em métricas por ID de conteúdo: tempo total de leitura, tempo médio de leitura, segmentação de usuários, informações regionais, ID do anunciante, tipo de dispositivo
4.2 Funcionalidades, Usabilidade e Custo das Soluções de Data Analytics (Q2)
Nesta seção, são analisadas as funcionalidades, usabilidade e custos das soluções de data analytics identificadas nos estudos revisados. A compreensão dessas características é crucial para determinar a adequação das ferramentas a diferentes cenários de aplicação.
4.2.1 Data Warehouses
Azure SQL integra-se de maneira eficiente com outros serviços da Microsoft, oferecendo suporte ao SQL padrão e recursos avançados de segurança, o que o torna uma escolha familiar para desenvolvedores acostumados com o SQL Server. Entretanto, seu custo, baseado em DTUs ou vCores, pode se tornar elevado em aplicações de larga escala (DUONGHAI, 2021).
Snowflake destaca-se por separar armazenamento e computação, suportando dados semi-estruturados e oferecendo funcionalidades como Time Travel. É uma solução de fácil uso e configuração, com preços baseados no consumo real, proporcionando flexibilidade econômica (LY, 2020).
Google BigQuery oferece capacidades avançadas de processamento em tempo real e uma forte integração com o Google Cloud. Embora tenha uma curva de aprendizado, é uma solução flexível e eficiente para grandes volumes de dados, com custo calculado por consulta e armazenamento. É uma escolha econômica para consultas esporádicas, mas pode se tornar cara para consultas frequentes (MANNINEN, 2019).
4.2.2 Ferramentas de ETL e Orquestração
Pentaho é uma ferramenta de ETL amplamente reconhecida por sua interface gráfica amigável, que facilita a criação de jobs complexos. Sendo uma solução de código aberto, é uma opção econômica (MANNINEN, 2019).
Stitch Data é conhecida pela simplicidade e rapidez na integração de dados, ideal para pequenas e médias empresas. Seu modelo de preços é baseado no volume de dados, o que pode ser vantajoso para organizações com volumes variáveis (DUONGHAI, 2021).
Apache Airflow é uma plataforma robusta para a orquestração de workflows, com uma interface intuitiva e suporte para múltiplos plugins. Sendo de código aberto, elimina custos de licença, embora possa incorrer em custos de manutenção (BORZI, 2020).
Selenium é utilizada para a automação de navegadores, permitindo a extração de dados de fontes que não possuem APIs dedicadas. Apesar de ser flexível e de código aberto, exige um esforço considerável de desenvolvimento (BORZI, 2020).
Python, com suas bibliotecas como Pandas e NumPy, oferece grande flexibilidade e poder de processamento para ETL e análises avançadas. Como uma linguagem de código aberto, é uma opção econômica, embora requeira um conhecimento técnico significativo (BORZI, 2020).
4.2.3 Ferramentas de Visualização de Dados
Voluum é amplamente utilizado para o rastreamento de campanhas de marketing, oferecendo uma interface amigável e recursos robustos de visualização de dados. No entanto, o estudo não forneceu detalhes específicos sobre os custos ou comparações diretas com outras ferramentas de visualização (DUONGHAI, 2021).
Power BI é uma ferramenta altamente funcional e diversificada para visualização de dados, capaz de lidar com grandes conjuntos de dados. Apesar de suas limitações na quantidade de dados que pode processar simultaneamente, é amplamente utilizada por profissionais devido à sua familiaridade e à diversidade de recursos gráficos. Contudo, seu custo pode ser significativo, especialmente em aplicações que exigem a execução de consultas em grandes volumes de dados, exigindo um planejamento cuidadoso para ser rentável (MANNINEN, 2019).
S3 é utilizado principalmente para armazenamento de dados em nuvem e integração com outras ferramentas de análise e visualização. Embora seja eficiente em termos de custo para armazenamento, sua funcionalidade de visualização é limitada, necessitando de integração com outras ferramentas para a criação de relatórios visuais compreensíveis (BORZI, 2020).
Ferramenta Categoria Funcionalidades Principais Usabilidade Custo Azure SQL Data Warehouse Integração com serviços Microsoft, suporte a SQL padrão, segurança avançada.WS Familiar para desenvolvedores SQL Server. Baseado em DTUs ou vCores; pode ser caro em grande escala. Snowflake Data Warehouse Separação de armazenamento e computação, suporte a dados semi-estruturados, Time Travel. Fácil de usar e configurar, flexível. Preço baseado no consumo real, oferece flexibilidade econômica. Google BigQuery Data Warehouse Processamento em tempo real, integração com Google Cloud, SQL padrão. Flexível e eficiente, curva de aprendizado inicial. Custo por consulta e armazenamento; econômico para consultas esporádicas, caro para frequentes. Pentaho ETL Interface gráfica amigável, facilita criação de jobs complexos. Fácil de usar, especialmente para quem busca soluções de código aberto. Código aberto, custo baixo. Stitch Data ETL Simplicidade e rapidez na integração de dados. Ideal para pequenas e médias empresas. Preço baseado no volume de dados, vantajoso para volumes variáveis. Apache Airflow Orquestração Plataforma robusta para orquestração de workflows, suporte a múltiplos plugins. Interface intuitiva, ampla comunidade de suporte. Código aberto; custos de manutenção podem existir. Selenium Automação Automação de navegadores, extração de dados de fontes sem APIs dedicadas. Flexível, requer desenvolvimento. Código aberto; custo de desenvolvimento. Python (Pandas/Num Py) ETL e Análise Flexibilidade e poder de processamento para ETL e análises avançadas. Requer conhecimento técnico, mas oferece grande flexibilidade. Código aberto, econômico, mas exige expertise técnica. Voluum Visualização Rastreamento de campanhas de marketing, interface amigável, visualização robusta. Fácil de usar para marketing, mas detalhes sobre custos não especificados. Não especificado. Power BI Visualização Visualização diversificada, capaz de lidar com grandes conjuntos de dados. Ampla adoção, familiaridade no setor, recursos gráficos avançados. Pode ser caro para grandes volumes de dados; exige planejamento cuidadoso S3 Armazenamento/ Vis. Armazenamento de dados em nuvem, integração com outras ferramentas de análise e visualização. Eficiente para armazenamento, funcionalidade de visualização limitada. Custo eficiente para armazenamento; requer integração para visualização completa
4.3 Impactos na Geração de Insights com a Implementação de Data Analytics (Q3)
A implementação de data analytics nos dados teve impactos significativos na geração de insights, conforme abordado nos estudos analisados. Estes impactos são diversos e abrangem desde a melhoria dos processos de medição de desempenho até a otimização das estratégias de marketing.
4.3.1 Automatização e Eficiência na Coleta de Dados
Manninen (2019) destaca que a coleta automatizada de dados, proveniente de diversas fontes como Google Analytics, AppNexus e Chartbeat, eliminou processos manuais, aumentando a eficiência e a precisão das informações obtidas. Esta automatização permitiu a criação de novos indicadores e relatórios abrangentes, facilitando a identificação de oportunidades de otimização.
4.3.2 Análise Data-Driven e Compreensão do Comportamento do Consumidor
A abordagem data-driven introduzida por Cioffi (2019) teve um impacto substancial na capacidade das empresas de gerar insights relevantes. Esta metodologia possibilitou uma análise mais aprofundada do comportamento do consumidor, das tendências de mercado e das oportunidades de crescimento. A coleta e análise de dados provenientes de múltiplas fontes permitiram uma compreensão mais abrangente do cenário de negócios, o que, por sua vez, levou a decisões de marketing mais fundamentadas e eficazes.
4.3.3 Integração de Dados e Visualização Simplificada
Borzi (2023) apresentou uma implementação robusta de integração de dados, que possibilitou uma visualização simplificada do desempenho das campanhas de marketing em redes sociais. A utilização de técnicas de machine learning supervisionadas e não supervisionadas facilitou a clusterização dos dados em grupos significativos, permitindo uma análise mais profunda e enriquecida. Além disso, a criação de um Data Warehouse centralizado no Google BigQuery viabilizou consultas complexas e análises adicionais, resultando em insights mais precisos e decisões mais bem informadas.
4.3.4 Escalabilidade e Consolidação de Dados na Nuvem
A solução proposta por Ly (2019), que implementou um data warehouse na nuvem utilizando o Snowflake, teve um impacto significativo ao permitir a consolidação e análise de dados de diferentes fontes. Esta abordagem escalável proporcionou à empresa uma base sólida para a obtenção contínua de insights acionáveis, contribuindo para a melhoria do desempenho e da competitividade no mercado.
4.3.5 Impactos Específicos Identificados
Os impactos da implementação de data analytics são vastos e incluem:
- Automatização e Eficiência: A coleta automatizada de dados eliminou processos manuais, aumentando a eficiência e a precisão das informações (A1).
- Consistência e Coerência dos Dados: A integração de dados de múltiplas fontes garantiu a consistência e coerência, facilitando análises mais precisas (A1).
- Enriquecimento e Análise dos Dados: Atribuição de rótulos e uso de técnicas de machine learning enriqueceram os dados e permitiram análises mais profundas (A1).
- Visualização e Monitoramento em Tempo Real: O armazenamento em data warehouses e a visualização em painéis de controle permitiram monitoramento em tempo real e melhor análise das campanhas (A1 e A3).
- Compreensão do Público-Alvo e Segmentação: A análise detalhada dos dados proporcionou uma compreensão mais clara do público-alvo e permitiu segmentação eficaz dos usuários (A2 e A4).
- Identificação de Tendências e Padrões: A análise dos dados revelou tendências e padrões de comportamento dos clientes, ajudando a ajustar estratégias de marketing (A2, A3 e A4).
- Otimização de Campanhas: Insights baseados em dados permitiram otimizar campanhas de marketing em tempo real para maximizar resultados (A2 e A4).
- Melhoria na Tomada de Decisão: Dados precisos e atualizados contribuíram para decisões mais embasadas e estratégicas (A3 e A4).
- Maior Eficiência Operacional: Estratégias orientadas por dados resultaram em maior eficiência operacional e melhor alocação de recursos (A2).
- Personalização de Experiências: Insights gerados facilitaram a personalização das experiências dos clientes, aumentando satisfação e fidelidade (A2).



5. CONCLUSÃO
A revisão sistemática de literatura explorou de forma abrangente as estratégias e ferramentas de data analytics aplicadas no marketing digital. Destaco que as ferramentas de data analytics, como Google BigQuery, Microsoft Azure SQL e Snowflake, são fundamentais para lidar com grandes volumes de dados, proporcionando escalabilidade, flexibilidade e segurança. Ferramentas de ETL, como Stitch Data e Pentaho, desempenham um papel crucial na preparação dos dados para análises detalhadas.
Este estudo contribuirá para a área de data analytics ao fornecer uma análise comparativa das principais ferramentas disponíveis, auxiliando pesquisadores e profissionais a tomar decisões mais informadas. Além disso, a pesquisa poderá identificar lacunas na literatura e sugerir novas direções para futuras pesquisas.
A integração de data warehouses e ferramentas de ETL centraliza dados de diversas fontes, possibilitando análises profundas e a geração de insights valiosos. A análise de dados centralizados permite às empresas identificar padrões de comportamento do consumidor, otimizar campanhas publicitárias e tomar decisões estratégicas mais informadas. A adoção de data warehouses na nuvem não apenas facilita a escalabilidade e a flexibilidade dos recursos, mas também reduz custos operacionais e melhora a eficiência dos processos.
Os conceitos apresentados em A1 e A2 podem ser utilizados para aprimorar os processos abordados em A3 e A4. Por exemplo, A1 poderia ser utilizado para automatizar a coleta de dados de marketing de mídia social para análise em um data warehouse em nuvem (A3) e A2 poderia fornecer uma estrutura para definir KPIs e métricas para medir o desempenho do marketing de conteúdo (A4).
Em resumo, a implementação de estratégias de data analytics no marketing digital é crucial para transformar dados em informações acionáveis, melhorando a eficácia das estratégias de marketing, a experiência do cliente e a vantagem competitiva das empresas no mercado digital. Esta revisão oferece uma base sólida para profissionais e gestores tomarem decisões embasadas na implementação de soluções de data analytics, contribuindo para o alcance de melhores resultados de negócios.
REFERÊNCIAS
Aarcha, J., Sasikala, M., & Merccy, M. T. (2024). Harnessing Business Data Analytics for Competitive Advantage in the Digital Era. mLAC Journal for Arts Commerce and Sciences (m-JACS), 2(3). https://doi.org/10.59415/mjacs.v2i3.175
Bitar, M. (2023). Google Analytics: Insights into user engagement for strategy refinement. Journal of Marketing Technologies, 18(5).
Hanadi, A., & Salhab, S. (2024). The use of data analytics in digital marketing for sustainable business growth. Journal of Infrastructure, Policy and Development, 8(8). https://doi.org/10.24294/jipd.v8i8.4894
Leonidas, T., & Theodoropoulou, A. (2023). Leveraging Big Data Analytics for Understanding Consumer Behavior in Digital Marketing: A Systematic Review.
Human Behavior and Emerging Technologies. https://doi.org/10.1155/2024/3641502
Wilian, R., & Feitosa, S. (2023). O marketing na era digital: análise de dados no foco. GeSec, 14(5). https://doi.org/10.7769/gesec.v14i5.2126
DESAI, Vaibhava; VIDYAPEETH, B. Digital marketing: a review. International Journal of Trend in Scientific Research and Development, [s.l.], v. 5, n. 5, p. 196-200, 2019.
LY, Duong Hai. Data analytics in cloud data warehousing: case company. 2019. 52 f. Tese (Bacharelado em Engenharia da Informação) – Metropolia University of Applied Sciences, 28 fev. 2019.
CIOFFI, Roberto. Data-driven marketing: strategies, metrics and infrastructures to optimize the marketing performances. 2019. 64 f. Tese (Mestrado em Engenharia e Gestão) – Politecnico di Torino, Rel. Claudio Giovanni Demartini, 2019. Publicação eletrônica.
BORZI, Matteo. Automated data integration and machine learning for enhanced social media marketing analysis. 2023. 88 f. Tese (Mestrado em Engenharia da Computação) – Politecnico di Torino, Rel. Daniele Apiletti, 2023. Publicação eletrônica.
MANNINEN, Laura. Improving content marketing performance measurement. 2019. 83 f. Tese (Mestrado em Engenharia Industrial e Gestão) – Lappeenranta University of Technology, School of Engineering Science, 1 nov. 2019. Examinadores: Professor Pasi Luukka, Mariia Kozlova. Instrutores: Mariia Kozlova, Kimmo Katajamäki, case company.
Kotler, P., Kartajaya, H., & Setiawan, I. (2021). Marketing 5.0: Tecnologia para a humanidade. Pearson Education.
Porto, J. (2019). Marketing Digital: Estratégias e Ferramentas. Editora da Universidade de Coimbra.
Adolpho, C. (2020). Os 8 Ps do Marketing Digital: O Guia Estratégico de Marketing Digital. Novatec Editora.
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases. AI magazine.
Sharda, R., Delen, D., & Turban, E. (2019). Business Intelligence, Analytics, and Data Science: A Managerial Perspective. Pearson.