OTIMIZAÇÃO DA OBTENÇÃO DE DADOS PARA A ÁREA DE CONTROLADORIA UTILIZANDO A FERRAMENTA KNIME

REGISTRO DOI: 10.5281/zenodo.11114289


Priscila Maria Leandrin Spaolonzi


RESUMO

Os dados passaram a ser uma ferramenta de fundamental importância para orientação de tomadas de decisões de maneira assertiva e com maior confiabilidade em grandes corporações, devido ao avanço da tecnologia, onde esse tipo de informação é gerada em grande escala e em tempo hábil para utilização. (Economist, 2017). Diante desse cenário, ferramentas caracterizadas como “open source”, tornam-se essencial e facilmente aplicadas em áreas administrativas, como a controladoria, pois são capazes de organizar os dados de forma clara e estruturadas para orientar a organização gerando alta eficiência na elaboração e fluxo da informação, como por exemplo o software KNIME utilizado nessa pesquisa. Portanto o objetivo do presente trabalho foi elaborar por meio da ferramenta KNIME um procedimento de programação automatizado a fim de otimizar o tempo e confiabilidade na obtenção de dados para a tomada de decisão dos stakeholders.  Os resultados mostraram que a ferramenta foi capaz de gerar informações como EBITDA, margem de EBITDA, índice de liquidez e índice de endividamento de forma automática sem necessidade de intervenção manual. Além de gerar diferentes visualizações dos dados calculados facilitando a absorção dos interessados. Este estudo conclui que a adoção de ferramentas de código aberto nos departamentos administrativos pode agregar valor à empresa, resultando em maior eficiência, redução de custos com pessoal, maior confiabilidade nos dados e melhor capacidade de lidar com demandas crescentes, contribuindo para uma tomada de decisão mais eficaz.

Palavras-chave: “open source”; contabilidade; índices financeiros; decisão.

ABSTRACT

Data has become a crucial tool for guiding decision-making in large corporations, with advances in technology enabling the generation of vast amounts of information in a timely manner, thus enhancing reliability (Economist, 2017). In this context, tools characterized as “open source” are essential and easily applicable in administrative areas such as controllership, as they can organize data in a clear and structured manner to guide the organization, resulting in high efficiency in information processing and flow. One example of such software utilized in this research is KNIME. Therefore, the aim of this study was to develop, through the KNIME tool, an automated programming procedure to optimize time and reliability in obtaining data for stakeholder decision-making. The results demonstrated that the tool was able to generate information such as EBITDA, EBITDA margin, liquidity ratio, and debt ratio automatically, without the need for manual intervention. Additionally, it produced various data visualizations, facilitating comprehension for stakeholders. This study concludes that the adoption of open-source tools in administrative departments can add value to the company, resulting in increased efficiency, reduced personnel costs, greater data reliability, and better ability to handle growing demands, contributing to more effective decision-making

Keywords: “open source”; accounting; financial ratios; decision-making.

INTRODUÇÃO

Em virtude do avanço da tecnologia decorrente do advento de computadores e da internet, o volume de dados que transitam pela sociedade se expandiu de forma exponencial. Desse modo, hodiernamente, o cenário econômico e, consequentemente, os modelos de negócios e estruturas organizacionais necessitam ser capazes de acompanhar um mercado extremamente dinâmico. (FILHO, Maurício Prates de Campos, 1994).      

Nessa linha, os dados passaram a exercer um papel de fundamental importância dentro das organizações, visto que são produzidos em larga escala e em ritmo acelerado, sendo capazes de orientar, se utilizados corretamente, de maneira assertiva e com maior confiabilidade as tomadas de decisões em grandes corporações (Economist, 2017).

Logo, a implementação de ferramentas de Data Science nas companhias, tornaram-se fundamentais devido a demanda de tempo envolvida na obtenção e análise de todo esse conteúdo.Assim, soluções “open source”, definidas como ferramentas que tem como objetivo organizar os dados de forma clara , transformando-as em informações capazes de orientar as organizações (METELO MARCELO,  2021) são importantes para a avaliação e solução da problemática evidenciada. Exemplos frequentemente encontrados na literatura são: Orange, Tanagra, RapidMiner e o KNIME que será o instrumento desse trabalho.

O KNIME (Konstanz Information Miner) é uma plataforma open source de análise de dados que oferece desde a criação de modelos analíticos à sua implementação e compartilhamento de fluxos dentro da organização, passando por aplicações e serviços de dados. Ainda, possui aplicabilidade não apenas em âmbitos diretamente ligados ao produto principal, mas também em áreas de suporte, como por exemplo, a área de Controladoria, responsável pelas finanças da entidade.

Em base disso, torna-se pertinente destacar a área de Controladoria onde a ferramenta será aplicada, sendo definida, segundo BORINELLI (2006) como um conjunto de conhecimentos que se constituem em bases teóricas e conceituais de ordem operacional, econômica, financeira e patrimonial, relativas ao controle do processo de gestão organizacional. Para Catelli (apud PADOVEZE, 2004), tem como objeto de estudo a identificação, mensuração, comunicação e decisão relativas aos eventos econômicos, sendo concluído por BORINELLI (2006) como o responsável pelo processo de formação de resultados da entidade.

Isto posto, apresentado o âmbito de aplicação, destaca-se com mais detalhes as vantagens no uso de softwares de “open source” em departamentos administrativos, como por exemplo: ganho de eficiência em tempo na execução de atividades anteriormente executadas manualmente, diminuição de custo com pessoal, maior confiabilidade nos números e maior escalabilidade de demandas que corroboram para uma tomada de decisão eficaz.

Nesse contexto, o propósito do trabalho é elaborar um fluxo automatizado, via KNIME, capaz de gerar, dentro de uma área de controladoria, uma revisão analítica, definida pelo Conselho Federal de Contabilidade (2003) como a verificação do comportamento de valores significativos, mediante índices, quocientes, quantidades absolutas ou outros meios, com vistas à identificação de situação ou tendências atípicas de forma automática. Por se tratar de uma atividade constantemente demandada pela área de controladoria, identifica-se como uma excelente oportunidade de geração de valor utilizando Data Science para otimização do processo.

Fundamentação Teórica

O presente estudo é definido como exploratório quanto ao objetivo, conforme citação de Araújo e Oliveira (1997) onde é explicado que estudos exploratórios tem como intuito o desenvolvimento, esclarecimento e a modificação de conceitos e ideias bases. A fim de demonstrar por meio de um fluxo automatizado, utilizando o software KNIME, como é possível o ganho de eficiência na elaboração de revisões analíticas na área de controladoria.

Base de dados

Quanto ao delineamento, a pesquisa se caracteriza por utilizar dados quantitativos, tendo como base as demonstrações financeiras do grupo Natura & Co Holding S.A, responsável por desenvolver suas atividades principais no setor de cosméticos, fragrâncias e higiene pessoal, por meio de fabricação, distribuição e comercialização de seus produtos. (Grupo Natura: Demonstrações Financeiras Individuais e Consolidadas 2022)

A companhia tem capital aberto na Bovespa, ou seja, tem ações listadas na bolsa de valores, portanto possuem a obrigatoriedade de divulgação das demonstrações financeiras de acordo com a lei das S.A’s 6.404/76, tornando os dados utilizados no presente trabalho públicos.

As marcas sob gestão da Companhia incluem “Natura”, “Avon”, “The Body Shop” e “Aesop”, portanto será utilizado como base os números consolidados do grupo, ou seja, considerando todas as empresas da Companhia nos anos de 2021 e 2022.

Sendo por meio dessa base de dados a elaboração de uma revisão analítica com foco nos nas seguintes informações:

  • Análise da variação dos saldos do período: Cálculo afim de identificar as contas que mais variaram no período com o intuito de mitigar possíveis riscos que venham afetar a Companhia.
    • EBITIDA/Margem Ebitda: A sigla significa “Earnings before interest, taxes, depreciation and amortization”, ou seja, “Lucro antes dos juros, impostos, depreciação e amortização”. O intuito é demonstrar ao investidor se a companhia é capaz de gerar dinheiro com sua atividade fim.
    • Índice de Liquidez Corrente: Avalia o nível de eficiência que a companhia possui para arcar com suas obrigações financeiras a curto prazo.
    • Índice de endividamento geral: Trata-se do cálculo que resulta no grau de endividamento em comparação ao ativo total do negócio.

    Ferramenta KNIME

    O KNIME Analytics Platform é um software de código aberto que permite aos usuários acessar, misturar, analisar e visualizar dados de diversas formas.

    A versão utilizada para o presente trabalho é a n° 4.7.7, conforme informado pelo site (KNIME, 2023) essa versão gratuita é para uso em análise de dados com módulos pré-existentes/pré-construídos. Além disso, por se tratar de um software estrangeiro, desenvolvido na Califórnia, Estados Unidos, todo idioma do programa está em inglês.           

    Conforme demonstrado na imagem abaixo, os fluxos são criados a partir de “nós” pré-configurados oferecidos pelo software:

    Figura 1 – Layout da plataforma KNIME
    Fonte: KNIME (2023)

    No KNIME as tarefas individuais são representadas por “nodes” (nós), onde ocorre a leitura de três tipos de dados, sendo eles: string (dados qualitativos, ou seja, não somáveis), numeric (números que podem ser úteis com contas matemáticas) e date & time (Data e Hora ou Data ou Hora).

    Para a execução da primeira etapa de automatização das tarefas de análise de variação utilizamos os seguintes nodes (Figura 2):

    • “String Manipulation” (manipulação de dados qualitativos): Semelhante a barra de fórmula do Excel, utilizado para manipulação de texto. No fluxo desenvolvido foi utilizado para identificação de quais linhas tratavam-se de contas sintéticas e analíticas.
    • Column Resorter” (reorganizador de coluna) Utilizado para reorganizar a ordem das colunas apresentadas.
    • “Number to String” (conversor de dados numéricos para dados qualitativos): Durante a elaboração do fluxo o sistema leu a coluna conta como um dado numérico, foi utilizado essa função para converter em dados strings
    • “String Replace” (substituidor de dados qualitativos): Tem a função de substituir algum caractere string, usado para substituir as contas identificadas como sintéticas ou analíticas pelo próprio texto.
    • “Math Formula” (ferramenta para fórmulas matemáticas): Semelhante a barra de fórmula do Excel, utilizado para manipulação de número. Utilizado para cálculo das variações em reais e percentual.
    • “Row Filter” (filtro de linhas): Utilizado para filtrar linhas.
    • “Round Double” (arredondador de casas): Utilizado para arredondar casas decimais.
    • “Rule Engine” (criador de condicionais): Utilizado para filtrar todas as contas que tiveram variações no período acima de 70%.
    • “Concatenate” (concatenação): Junção de colunas ou tabelas.
    • “Duplicate Row Filter” (filtro de linhas duplicadas): Limpar linhas com valores duplicados.
    • “Cross joiner” (junção cruzada): que se trata de um nó que executa uma junção cruzada de duas tabelas, onde cada linha da tabela superior é unida a cada linha da tabela inferior
    • “Excel Writer” (saída do excel): Saída para exportar os dados gerados em formato de Excel.
    • “Bar Chart” (gerador de gráfico em barras): Utilizado para gerar gráficos de barras como visualização.

    A ferramenta foi escolhida por ser um software sem qualquer codificação, facilitando a implementação em departamentos administrativos como a controladoria. Sua interface de “low-cod” (sem códigos) fornece uma introdução fácil para iniciantes e um conjunto avançado de ferramentas de ciência de dados para usuários experientes (KNIME 2023).

    Metodologia

    Para esse fim, o fluxo foi iniciado com a construção da etapa de tratamento das informações obtidas por meio do node “Excel Reader (XLS)”, cujo a função é ler uma única planilha de um arquivo Excel, onde é definido o caminho do arquivo. Em seguida, é selecionada a planilha. As opções de configuração adicionais permitem definir se a tabela possui cabeçalhos de coluna e/ou IDs de linha, além de especificar qual parte da planilha que é necessária (KNIME 2023).

    • Revisão Analítica

    O primeiro nó utilizado é o de “string manipulation” a foi utilizado para identificação de quais linhas tratavam-se de contas sintéticas e analíticas. Em seguida foi reorganizado a ordem de colunas apresentadas por meio da função “column resorter”.

    Durante a elaboração do fluxo o sistema leu a coluna conta como um dado numérico, foi utilizado essa função “number to string” para converter em dados “strings”.

    Após conversão renomeamos os dados identificados anteriormente como contas sintéticas e analíticas pelo próprio texto, utilizando o nó “string replacer”.

    Com isso, foi elaborado o cálculo da variação em R$ e em percentual com a ferramenta “math formula” e arredondando as casas decimais com o node “round double”.

    A fim de otimizar a apresentação das análises foi definido como premissa todas as contas que tiveram variação no período base acima de 70%, sendo utilizado o node “rule engine” para criar a condicional.

    Com isso, foi formalizado o resultado para melhor visualização, utilizando as funções: “concatenate” para junção de colunas, “duplicate rowfilter” para limpar linhas com valores duplicados e “excel writer” para exportar os dados gerados em formato de excel.

    Além disso, a função “bar chart” foi usada para demonstrar os dados elaborados em formato de gráfico de barras.

    Figura 2 – Fluxo de revisão analítica automática
    Fonte: Resultados originais da pesquisa

    • EBITDA/Margem EBITDA

    Os nós utilizados para cálculo do EBITDA e Margem EBITDA foram: “row filter”, “concatenate” e “math formula” (Figura 3 e Figura 4).

    Figura 3 – Fluxo do cálculo do EBITDA Consolidado
    Fonte: Resultados originais da pesquisa

    Figura 4 – Fluxo do cálculo do Margem EBITDA Consolidado
    Fonte: Resultados originais da pesquisa

    • Índice de Liquidez Corrente

    Os nodes utilizados para cálculo do índice de liquidez corrente foram: “row filter”, “math formula” e “cross joiner”. Esse nó foi utilizado para unir as informações de ativo circulante e passivo circulante (Figura 5).

    Figura 5 – Fluxo do cálculo do índice de liquidez corrente
    Fonte: Resultados originais da pesquisa

    • Índice de endividamento geral

    Os nodes utilizados para cálculo do índice de liquidez corrente foram: “row filter”, “math formula”, “cross joiner” e “concatenate”. (Figura 6).

    Figura 6 – Fluxo do cálculo do índice de endividamento
    Fonte: Resultados originais da pesquisa

    Resultados

    Utilizando como base de dados iniciais do relatório balancete em formato de xlsx, esse relatório é composto por contas contábeis sintéticas e analíticas onde é agrupado por natureza cada direito ou dever da empresa em um período específico. As informações foram extraídas das demonstrações financeiras consolidadas da Companhia Natura & CO Holding S.A de 2022 e 2021.

    • Resultado Revisão Analítica

    Os resultados do fluxo demonstrado na imagem anterior são dados organizados, com informações claras e estruturadas para análise e tomada de decisões, sendo o primeiro um arquivo xlsx, onde é possível identificar as contas consideradas atípicas (high-line), ou seja, tiveram uma alta variação no período avaliado comparado aos demais grupos, juntamente com o saldo em 2022 e 2021 e cálculo da variação em reais e porcentagem (Figura 7).

    Figura 7 – Compilado de contas que tiveram altas variações no período via planilha xlsx
    Fonte: Resultados originais da pesquisa

    Com isso, a figura 7 direciona ao saldos que precisam ser investigados e analisados com mais criticidade afim de instruir e mitigar possíveis riscos na operação

    Já o segundo resultado da primeira etapa do fluxo automatizado são as informações citadas acima demonstradas no gráfico de barras, onde é possível visualizar os grupos contábeis que tiveram variações (em R$ e percentual) relevantes acima de 70% (Figura 8).

    Figura 8 – Compilado de contas que tiveram altas variações no período via gráfico de barras
    Fonte: Resultados originais da pesquisa

    A figura 8 traz de maneira visual os grupos que tiveram grande variação, facilitando o entendimento e assimilação dos stakeholders.

    • Resultado EBITDA/Margem EBITDA

    Aonde chegamos nos totais de um EBITDA de R$ 2.134.073,00 e Margem de 5,87%:

    Figura 9 – Resultado do cálculo do EBITDA e Margem EBITDA Consolidado
    Fonte: Resultados originais da pesquisa

    A figura 9demonstra que o grupo Natura é capaz de gerar lucro mesmo com despesas financeiras e fiscais de modo que o seu crescimento ocorra de forma sólida.

    • Resultado Índice de Liquidez Corrente

    O fluxo demonstrado resulta em um índice de liquidez corrente igual a 1,21%.

    Figura 10 – Resultado do cálculo do índice de liquidez corrente
    Fonte: Resultados originais da pesquisa

    O resultado da figura 10 significa que o grupo Natura possui capacidade para arcar com todas as dívidas realizadas a curto prazo.

    • Resultado Índice de endividamento geral

    O fluxo resulta em um índice de 59%:

    Figura 11 – Resultado do cálculo do índice de endividamento
    Fonte: Resultados originais da pesquisa

    Isso significa, que a figura 11 demonstra que o grupo Natura possui capacidade para arcar com todas as dívidas realizadas a curto prazo.

    Abaixo foi demonstrado o fluxo automatizado completo, onde todas as informações fornecidas anteriormente são capazes de gerar de forma automática levando apenas alguns segundos para estarem disponíveis para análise:

    Figura 12 – Fluxo de automatização completo
    Fonte: Resultados originais da pesquisa

    A figura 12 demonstra a importância de fluxo de dados automatizado para fins de atividades de rotina e como esse tipo de atividade é uma excelente oportunidade para agregar valor e eficiência em departamentos administrativos.

    CONSIDERAÇÕES FINAIS

    O objetivo do presente trabalho foi elaborar por meio da ferramenta KNIME um procedimento de programação automatizado a fim de otimizar o tempo e gerar confiabilidade na obtenção de dados para a tomada de decisão dos stakeholders.

    De acordo com o objetivo deste trabalho, foi possível a elaboração de um fluxo automatizado, utilizando como base inicial o relatório balancete em formato xlsx da empresa Natura & CO Holding S.A no período de 2022 e 2021.O fluxo realizou a leitura dos dados em segundos, não sendo necessário nenhum tipo de intervenção manual (Figura 11).

    Os resultados mostraram que a ferramenta foi capaz de gerar informações como EBITDA, margem de EBITDA, índice de liquidez e índice de endividamento. Além de gerar diferentes visualizações dos dados calculados, facilitando o entendimento dos interessados.

    Portanto o presente trabalho conclui que ferramentas “open source” podem ser utilizadas por departamentos administrativos como uma forma de agregar valor a companhia, produzindo ganho de eficiência em tempo na execução de atividades anteriormente executadas manualmente, diminuição de custo com pessoal, maior confiabilidade nos números e maior escalabilidade de demandas que corroboram para uma tomada de decisão eficaz.

    REFERÊNCIAS

    BORINELLI, Márcio Luiz. Estrutura conceitual básica de controladoria: sistematização à luz da teoria e da práxis. 2006. Tese (Doutorado) – Faculdade de Economia, Administração e Contabilidade, Universidade de São Paulo, São Paulo 2006.

    PADOVEZE, Clóvis Luís. Controladoria básica. São Paulo: Pioneira Thomson Learning, 2004.

    KNIME Analytics Platform – KNIME. Disponível em: https://www.knime.com/knime-analytics-platform. Acesso em: 22 fev.2023

    ARAÚJO, Aneide Oliveira; OLIVEIRA, Marcelle Colares. Tipos de pesquisa. São Paulo, 1997. Conselho Federal de Contabilidade. (2003). Resolução CFC Nº 953/03.

    METELO, Marcelo; Bernardino Jorge, Pedrosa Isabel. Avaliação de ferramentas open source para Data Science usando Metodologia OSSpal. São Paulo. 2021

    The Economist. Disponível em: https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data. Acesso em: 21fev.2023

    FILHO, Maurício Prates de Campos. Os sistemas de informação e as modernas tendências da tecnologia e dos negócios. São Paulo. 1994