Impacts of Artificial Intelligence on animations, images andaudio
REGISTRO DOI:10.5281/zenodo.10501300
Felipe Jiarun Chen; Felippe Perini; Julio Cesar Martins da Silva; Lucas Vidal Ovidio;Isabel Jin
Orientador: Gustavo Caravita de Andrade
Resumo: Foi escolhido o tema Inteligência Artificial, pois trata de uma área com destaque no cenário atual, evidenciando a importância de sua compreensão devido a crescente necessidade de ferramentas que auxiliem na tomada de decisões, assim como, o alcance de melhores e desejados resultados, além do mais, o tema que envolve Inteligência Artificial está relacionado com a grade curricular acadêmica. Nesse artigo, a escolha é de compartilhar com leitores os Impactos da Inteligência Artificial em animações, imagens e áudios. Com os resultados obtidos, constatou-se que se trata de uma tecnologia em expansão, cuja aplicação vem se mostrando essencial em diversas atividades da sociedade contemporânea.
Palavras-chave: Artigo, Inteligência Artificial, Impactos.
Abstract: The theme Artificial Intelligence was chosen because it is an area that stands out in the current scenario, highlighting the importance of understanding it due to the growing need for tools that help in decision making, as well as achieving better and desired results, in addition , the topic involving Artificial Intelligence is related to academic curriculum. In this article, the choice is to share with readers the Impacts of Artificial Intelligence on animations, images and audio. With the results obtained, it was found that this is an expanding technology, whose application has proven to be essential in various activities in contemporary society.
Keywords: Article, Artificial Intelligence, Impacts.
1. Introdução
A inteligência artificial (IA) incorpora um conjunto de códigos, técnicas, algoritmos e dados que permitem a um sistema informático desenvolver e emular comportamento semelhante ao humano (RUSSEL, NORVIG 2020). Segundo Correia (2020), a IA é um sistema (software) que pode ser aplicado a uma máquina (hardware), em que, por meio do processo de aprendizagem e resolução de problemas, simula atividades humanas.
A aprendizagem estatística também depende de dados, mas depende de uma programação baseada em regras (JAMES et al. 2013). A IA simbólica destina-se a produzir inteligência geral, semelhante à humana, numa máquina (HONAVAR,1995), enquanto a maior parte da investigação moderna é dirigida a subproblemas específicos.
Gribincea (2020), define o processo de aprendizagem na seguinte maneira:
Por meio da coleta de informações e do aprendizado gradual a partir do acúmulo de dados adquiridos, são formados os algoritmos para que a IA forneça à máquina a capacidade de executar tarefas e resolver problemas que exigem o uso do que é considerado inteligência.
A Inteligência Artificial, segue quatro linhas de pensamentos:
Segundo Haugeland (1985), “O novo e interessante esforço para fazer os computadores pensarem… máquinas com mentes, no sentido total e literal”.
Segundo Kurzweil (1990), “A arte de criar máquinas que executam funções que exigem inteligência quando executadas por pessoas.”
Segundo Charniak; McDermott (1985), “O estudo das faculdades mentais pelo seu uso de modelos computacionais.”
Segundo Poole et al. (1998) “A Inteligência Computacional é o estudo do projeto de agentes inteligentes.”
No geral, as linhas de pensamento I e III referem-se ao processo de pensamento e raciocínio, enquanto as II e IV ao comportamento. Além disso, as linhas de pensamento I e II medem o sucesso em termos de fidelidade ao desempenho humano, enquanto na III e IV medem o sucesso comparando-o a um conceito ideal que de inteligência, que se chamará de racionalidade. Um sistema é racional se “faz tudo certo”, com os dados que tem (RUSSELL; NORVIG, 2004).
O artigo apresenta: uma seção introdutória, contendo contextualização, justificativa e objetivos; a seção de uso dessa tecnologia; a seção de revisão bibliográfica; a seção de metodologia; a seção de resultados; a seção de considerações finais; a seção de referência bibliográfica.
1.1 Justificativa
A inteligência artificial é uma das tecnologias mais influentes e revolucionárias dos últimos anos. Sua capacidade de automatizar tarefas, aprender com dados e tomar decisões inteligentes está transformando profundamente várias indústrias, incluindo a produção de mídia e entretenimento, impulsionando a eficiência na produção de animações, imagens e áudios. Isso significa que as empresas podem criar conteúdo mais rapidamente e a um custo potencialmente menor, ao mesmo tempo em que abrem espaço para a inovação em termos de qualidade e criatividade. Com a constante inovação, é importante entender como essa tecnologia está moldando o mundo e como é possível aproveitar seu potencial de maneira responsável.
A escolha deste tema é justificada pela sua relevância cultural, tecnológica e social, bem como pela sua capacidade de despertar interesse e reflexão sobre como a IA está transformando profundamente a forma de criar, consumir e interagir com mídias visuais e sonoras, permitindo explorar como a IA está moldando essas formas de mídia por meio de avanços tecnológicos, abrindo espaço para a inovação e aprimoramento contínuos.
A IA está desempenhando um papel crucial na indústria criativa, afetando diretamente a produção de animações, imagens e áudios. Ela está sendo usada para automatizar tarefas, gerar conteúdo original, melhorar a qualidade e personalizar a experiência do usuário. Ao investigar esses impactos, este tema permitiu entender como a criatividade humana e a tecnologia interagem e se complementam.
1.2 Objetivos (Geral e específicos)
Analisar como a inteligência artificial está sendo utilizada em animações, imagens e áudios e como isso está afetando a indústria de entretenimento, abordando questões de qualidade visual, eficiência de produção e impacto na experiência do espectador.
2. Revisão Bibliográfica
Tem havido muitos estudos ao longo de várias décadas sobre a possibilidade de aplicação da IA no setor criativo. Uma das limitações no passado era a prontidão da própria tecnologia, e outra era a crença de que a IA poderia tentar replicar o comportamento criativo humano (ROWE; PARTRIDGE,1993). Uma pesquisa recente da Adobe revelou que três quartos dos artistas nos EUA, Reino Unido, Alemanha e Japão considerariam a utilização de ferramentas de IA como assistentes, em áreas como pesquisa de imagens, edição e outras tarefas “não criativas”. Isto indica uma aceitação geral da IA como ferramenta em toda a comunidade e reflete uma consciência geral do estado da arte, uma vez que a maioria das tecnologias de IA foram desenvolvidas para operar em domínios fechados onde podem ajudar e apoiar os seres humanos em vez de os substituir. Uma melhor colaboração entre humanos e tecnologias de IA pode, assim, maximizar os benefícios da sinergia.
2.1 Uso da inteligência artificial em animações
Tal como acontece com a maioria das indústrias onde a inteligência artificial está a ganhar terreno, também na animação o principal objetivo da integração da IA é simplificar e automatizar procedimentos trabalhosos e repetitivos, acelerar o tempo de design e desenvolvimento, oferecendo aos animadores imagens diversas e vívidas que podem estimular ainda mais sua criatividade, melhorando assim o calibre das animações. Hodgings (1995, p.71-78) define a animação da seguinte forma:
Animar uma figura humana sintética no computador (humanoide), no entanto, não consiste simplesmente na definição de sua trajetória ao longo do tempo, tendo em vista a incrível capacidade que os humanos apresentam em perceber falhas e imperfeições nas animações (Hodgins, 1995, p.71-78)
A IA também tem sido empregada para renderizar objetos e cenas. Isto inclui a síntese de visualizações 3D a partir de captura de movimento ou de câmeras monoculares, sombreamento (NALBACH et al. 2017) e síntese de textura dinâmica (TESFALDET et al. 2018). A criação de iluminação realista em animação e efeitos visuais também se beneficiou da combinação da visão computacional geométrica tradicional com abordagens de Machine Learning aprimoradas e vários sensores de profundidade (GUO et al. 2019). A animação não é importante apenas na indústria cinematográfica; também desempenha um papel importante na indústria de jogos, responsável pela representação de movimentos e comportamentos. Animar personagens, incluindo seus rostos e posturas, é um componente chave em um mecanismo de jogo. As tecnologias baseadas em IA permitiram que personagens e públicos digitais coexistissem e interagissem. A criação de avatares também tem sido empregada para aprimorar assistentes virtuais, por exemplo, usando tecnologia proprietária de síntese facial de IA fotorreal (NAGANO et al. 2018). Nas figuras 1 e 2 uma animação criada pelo canal Corridor. Enquanto na figura 3 uma imagem dos personagens de Harry Potter e em seguida na figura 4 a animação criada por inteligência artificial que envolvem esse universo.
A criação de avatares também tem sido empregada para aprimorar assistentes virtuais, por exemplo, usando tecnologia proprietária de síntese facial de IA fotorreal (NAGANO et al. 2018).
O Facebook Reality Labs empregou técnicas de Machine Learning e IA para animar humanos digitais realistas, chamados Codec Avatars, em tempo real usando transferência de estilo baseada em GAN e usando um VAE para extrair parâmetros de avatar (WEI et al. 2019), como demonstrado na figura 5 a seguir:
Kumar (2023) define GAN e VAE da seguinte forma:
Tabela 1 – GAN e VAE
Tópicos | Redes Adversariais Gerativas (GANs) | Autoencodificadores Variacionais (VAEs) |
Funcionalidade | Composto por dois modelos (um gerador e um discriminador) que competem entre si. O gerador cria amostras falsas e o discriminador tenta distinguir entre amostras reais e falsas. | Composto por um codificador e um decodificador. O codificador mapeia as entradas para um espaço latente e o decodificador mapeia os pontos do espaço latente de volta para o espaço de entrada. |
Qualidade de saída | Pode gerar resultados realistas e de alta qualidade. Conhecido por gerar imagens difíceis de distinguir das reais. | Geralmente produz imagens menos nítidas ou ligeiramente mais desfocadas em comparação com GANs. No entanto, isso pode depender da implementação específica e do domínio do problema. |
Espaço Latente | Muitas vezes carece de estrutura, dificultando o controle ou interpretação das características das amostras geradas. | Cria um espaço latente estruturado que pode ser mais facilmente interpretado e manipulado. |
Estabilidade de treinamento | O treinamento de GANs pode ser desafiador e instável, devido à perda adversária usada no treinamento. | Geralmente mais fáceis e estáveis de treinar porque usam uma função objetivo baseada em probabilidade. |
Casos de uso | Ótimo para gerar conteúdo novo e criativo. Frequentemente usado em tarefas como geração de imagens, síntese de texto para imagem e transferência de estilo. | Útil quando há necessidade de compreender o processo de geração de dados ou controlar os atributos dos resultados gerados. Frequentemente usado em tarefas como detecção de anomalias, eliminação de ruído ou sistemas de recomendação. |
Fonte: VitalFlux (2023)
Na figura 6 a seguir, uma representação realizada por Kumar (2023) de como funcionam a GAN e VAE:
2.2 Uso da inteligência artificial em imagens
A IA pode ser usada para criar automaticamente imagens digitais ou formas de arte, com base em conjuntos de dados de treinamento selecionados, por exemplo, novos exemplos de quartos (RADFORD et al. 2016), personagens de desenhos animados (JIN et al. 2017), fotos de celebridades (KARRAS et al. 2017).
Algumas aplicações produzem uma nova imagem condicionada à imagem de entrada, referida como tradução de imagem para imagem ou ‘ transferência de estilo ‘. É chamado de tradução ou transferência, porque a saída da imagem tem uma aparência diferente da entrada, mas com conteúdo semântico semelhante. Ou seja, os algoritmos aprendem o mapeamento entre uma imagem de entrada e uma imagem de saída. Por exemplo, tons de escala de cinza podem ser convertidos em cores naturais (ZHANG et al. 2016).
2.2.1 Prompts na criação de imagens com IA
Os prompts funcionam como o coração do processo de geração de imagens com IA. A eficácia de um prompt depende de sua clareza, detalhamento e criatividade. (LAMIM, 2019). Lamim (2019) define um prompt da seguinte forma:
Um prompt bem formulado pode resultar em imagens surpreendentemente precisas e detalhadas, enquanto prompts vagos ou mal estruturados podem levar a resultados imprecisos ou incoerentes. A arte de criar um bom prompt envolve um equilíbrio entre especificidade e criatividade. É essencial ser claro e detalhado sobre o que se deseja visualizar, incluindo elementos como cenário, objetos, cores, estilo e atmosfera. Ao mesmo tempo, é importante deixar espaço para a criatividade da IA permitindo que ela traga sua própria interpretação e nuances únicas para a imagem final.
A seguir uma imagem criada a partir da ferramenta de prompt chamada Tess Al:
2.2.2 Classificação de imagens
Utilizando modelos de aprendizado de máquina e aprendizado profundo para classificar imagens ou rótulos. Isso permite aplicações como classificação automatizada, reconhecimento e compreensão de cena (YAMADA, 2023). A escolha da técnica ou modelo depende do contexto específico da aplicação, do tamanho e da natureza do conjunto de dados, bem como dos recursos computacionais disponíveis (YAMADA, 2023). Dentre as técnicas é possível destacar:
– Redes neurais convolucionais (CNNs): são uma classe de RNA feed-forward profundo. Eles compreendem uma série de camadas convolucionais projetadas para aproveitar estruturas 2D, como as encontradas em imagens (TREVISAN, 2021). Estes empregam camadas conectadas localmente que aplicam operações de convolução entre um kernel de tamanho predefinido e um sinal interno; a saída de cada camada convolucional é o sinal de entrada modificado por um filtro de convolução (TREVISAN, 2021). Os pesos do filtro são ajustados de acordo com uma função de perda que avalia a incompatibilidade (durante o treinamento) entre a saída da rede e os valores ou rótulos verdadeiros. Na figura 8 a seguir, a representação de Kernel.
Funções de perda comumente usadas e perda perceptual (JOHNSON et al. 2016 ). Esses erros são então retro propagados por meio de múltiplas iterações para frente e para trás e os pesos do filtro são ajustados com base nos gradientes estimados da superfície de erro local. Isso, por sua vez, orienta quais recursos são detectados, associando-os às características dos dados de treinamento. As primeiras camadas de uma CNN extraem características de baixo nível conceitualmente semelhantes às funções de base visual encontradas no córtex visual primário (MATSUGU et al. 2003). Outro estágio nas camadas convolucionais de uma CNN é a aplicação da operação de agrupamento (do inglês, pooling) (NIELSEN, 2015). A técnica pooling é importante para tornar os dados invariantes a pequenas translações da entrada, isto é relevante para que a rede neural consiga reconhecer padrões das imagens em diferentes posições (AGGARWAL et al. 2018);
– Aprendizado por Máquina (Machine Learning): a Inteligência Artificial visa o entendimento da inteligência humana para realizar sua reprodução na computação (ENDERLE; BRONZINO, 2012). O aprendizado de máquina é uma forma de IA onde um algoritmo computacional constrói, a partir de dados, modelos de aprendizado para a resolução de problemas (MEHTA, 2017).
Há três paradigmas principais no aprendizado de máquina, que são o aprendizado supervisionado, o aprendizado não-supervisionado e o aprendizado por reforço (HAYKIN, 2007). De maneira geral, o algoritmo constrói um classificador para classificar exemplos ainda não rotulados, por exemplo, ensinar uma rede a reconhecer gatos, alimentando-a com imagens rotuladas previamente como “gatos”, a fim reconhecer gatos em imagens que não teve acesso durante o treinamento (MONARD; BARANAUSKAS,2003). Enquanto isso, o aprendizado não-supervisionado é aquele em que o algoritmo analisa exemplos fornecidos, sem rótulos, e tenta identificar um ou mais padrões que agrupem os dados de alguma maneira, formando agrupamentos (MONARD; BARANAUSKAS, 2003). Após o agrupamento é comum que se analise o resultado para determinar se cada grupo parece coerente dentro do contexto/domínio do problema. Finalmente, o aprendizado por reforço é aquele em que o modelo de aprendizado consiste em um agente que interaja com o ambiente, a fim de ajustar seus pesos de avaliação para aprender as características necessárias. Também pode ser chamado de aprendizado semi-supervisionado (MONARD; BARANAUSKAS, 2003).
2.2.3 Detecção de objetos
A detecção de objetos tem sido um dos alvos mais comuns da IA nos últimos anos, impulsionado pela complexidade da tarefa, mas também pela enorme quantidade de imagens rotuladas disponíveis para treinar redes profundas. O desempenho em termos de precisão média média (mAP) para detecção de 200 classes aumentou mais de 300% nos últimos 5 anos (LIU et al. 2020 ). A abordagem Mask R-CNN (HE et al. 2017 ) ganhou popularidade devido à sua capacidade de separar diferentes objetos em uma imagem ou vídeo, fornecendo suas caixas delimitadoras, classes e máscaras de nível de pixel, conforme demonstrado por (REN et al. 2017 ). Feature Pyramid Network (FPN) também é um backbone popular para detecção de objetos (LIN et al. 2017 ).
YOLO e suas variantes representam o estado da arte atual em detecção e rastreamento de objetos em tempo real (REDMON et al. 2016 ). Um sistema de detecção de objetos em tempo real de última geração, You Only Look Once (YOLO), funciona quadro a quadro e é rápido o suficiente para processar em taxas de vídeo típicas (atualmente relatadas até 55 fps ). YOLO divide uma imagem em regiões e prevê caixas delimitadoras usando uma abordagem multiescala e fornece probabilidades para cada região. O modelo mais recente, YOLOv4, (BOCHKOVSKIY et al. 2020 ), na figura 9 a seguir, o YOLO é um exemplo de como a inteligência artificial, especialmente o aprendizado profundo, é aplicada com sucesso para realizar tarefas complexas de visão computacional, como a detecção de objetos em tempo real.
2.2.4 Desfocagem
As imagens podem ficar distorcidas por desfoque, devido ao mau foco da câmera ou ao movimento da câmera ou do assunto. A remoção de desfoque é um problema mal colocado representado por uma função de dispersão de pontos (PSF) h , que geralmente é desconhecida. Os métodos de desfoque tornam a imagem mais nítida para aumentar a qualidade subjetiva e também para auxiliar operações subsequentes, como reconhecimento óptico de caracteres (HRADIS et al. 2015) e detecção de objetos (KUPYN et al. 2018 ). Os primeiros trabalhos nesta área analisaram as estatísticas da imagem e tentaram modelar a imagem física e as propriedades da câmera (BIEMOND et al. 1990 ). Algoritmos mais sofisticados, como a deconvolução cega, tentam restaurar a imagem e o PSF simultaneamente (KRISHNAN et al. 2011 ). Esses métodos, entretanto, assumem um PSF invariante no espaço e o processo geralmente envolve várias iterações. Conforme descrito pelo modelo de degradação de imagem, o PSF ( h ) está relacionado à imagem alvo através de uma operação de convolução. As CNNs são, portanto, inerentemente aplicáveis para resolver problemas de desfoque (Schuler et al. 2016). Técnicas de desfoque baseadas em CNNs (NAH et al. 2017 ) e GANs (KUPYN et al. 2018) geralmente empregam blocos residuais, onde conexões de salto são inseridas a cada duas camadas de convolução (HE et al. 2016). Desfocar uma imagem de escalas grossas para finas é proposto em (TAO et al. 2018), onde as saídas são aumentadas e realimentadas para a estrutura codificador-decodificador. Os recursos de alto nível de cada iteração são vinculados de maneira recorrente, levando a um processo recursivo de aprendizagem de imagens nítidas a partir de imagens desfocadas.
2.2.4 Aprimoramento de imagem
O sistema visual humano emprega muitos processos oponentes, tanto na retina quanto no córtex visual, que dependem fortemente de diferenças de cor, luminância ou movimento para desencadear reações salientes (BULL; ZHANG, 2021) . Contraste é a diferença de luminância e/ou cor que torna um objeto distinguível e é um fator importante em qualquer avaliação subjetiva da qualidade da imagem. Imagens de baixo contraste exibem uma gama estreita de tons e podem, portanto, parecer planas ou opacas. Métodos não paramétricos para melhoria de contraste envolvem equalização de histograma que abrange a intensidade de uma imagem entre seus limites de profundidade de bits de 0 a um valor máximo (por exemplo, 255 para 8 bits/pixel). A equalização adaptativa do histograma com contraste limitado (CLAHE) é um exemplo comumente usado para ajustar um histograma e reduzir a amplificação de ruído (PIZER et al. 1987). Os métodos modernos ampliaram ainda mais o desempenho ao explorar as redes neurais convolucionais e codificadores automáticos (LORE et al. 2017), módulos iniciais e aprendizagem residual (TAO et al. 2017 ). Redes Adversariais Gerativas Condicionais de Aprimoramento de Imagem (IE-CGANs) projetadas para processar imagens visíveis e infravermelhas foram propostas por (KUANG et al. 2019). O aprimoramento de contraste, junto com outros métodos a serem discutidos posteriormente, sofre de uma falta fundamental de dados para treinamento supervisionado porque pares de imagens reais com baixo e alto contraste não estão disponíveis (JIANG et al. 2021).
Camadas convolucionais para converter uma imagem em tons de cinza em valores de crominância e os refinaram com filtros bilaterais para gerar uma imagem colorida natural (CHENG et al. 2015) . Uma rede mais profunda, mas ainda com apenas oito camadas convolucionais dilatadas, foi proposta um ano depois (ZHANG et al. 2016). Essa rede cap- turou melhor semântica, resultando em uma melhoria nas imagens com objetos distintos em primeiro plano. Redes codificador-decodificador são empregadas (XU et al. 2020).
A colorização continua a ser um problema desafiador para a IA, conforme reconhecido no recente Challenge in Computer Vision and Pattern Recognition Workshops (CVPRW) (NAH et al. 2019). Seis equipes competiram e todas empregaram métodos de aprendiza- gem profunda. A maioria dos métodos adotou um codificador-decodificador ou uma estru- tura baseada em U-Net (RONNEBERGER et al. 2015). A arquitetura de rede residual pro- funda (NesNet) (HE et al. 2016) e a arquitetura de rede densa (DenseNet) (HUANG et al. 2017) demonstraram conversão eficaz de escala de cinza em imagens coloridas de aparência natural. Na figura 10, abaixo a inteligência artificial (IA) tem sido amplamente utilizada para aprimorar imagens.
2.2.5 Detecção de anomalias
A Inteligência Artificial (IA) na medicina tem sido muito requisitada, pois ela ajuda na detecção de doenças, prognósticos e tomadas de decisão clínica (HOUSSAMI et al. 2019). A IA auxilia no diagnóstico junto com o relatório do médico no encaminhamento de pacientes que apresentam risco de câncer, podendo ter seus dados utilizados em terapias personalizadas, através de informações genéticas do paciente (DLAMINI et al. 2020). Dessa forma, na área oncológica a Inteligência Artificial, através da análise de grandes volumes de dados e reconhecimento de padrões (SANTOS; BAEBLER, 2018), a tecnologia vem sendo utilizada para prevenção de doenças, diagnósticos precoces, tratamentos e suporte/monitoramento dos pacientes (TOMÁS et al. 2020). Por consequência, essa tecnologia também é utilizada em exames clínicos, sendo estes a base fundamental para que a mamografia, ultrassom ou raio-x (exames feitos para detectar câncer de mama) possam ser realizados (BERNARDES et al. 2019) e, dessa forma, obter parâmetros que possam ser utilizados em relatórios e para auxiliar o médico na tomada de decisão. O artigo Artificial intelligence (AI) and big data in cancer and precision oncology (DLAMINI et al. 2020) mostra que a Inteligência Artificial (IA) e o aprendizado de máquina influenciam significativamente a área da saúde, como no auxílio do diagnóstico precoce para intervenções, através do Sequenciamento de Nova Geração (NGS), que gera grandes conjuntos de dados que demandam recursos especializados em bioinformática para analisar os dados relevantes e clinicamente significativos. Na figura 11 a seguir, uma representação da IA empregada na detecção de anomalias:
2.2.6 Criação de artes
Segundo o Coletivo Obvious (2018) são cinco passos para criação das obras utilizando IA:
Selecionar o assunto: Primeiro é escolhido um assunto. Então a pesquisa é feita para reunir informações sobre o tema na internet, em livros e com especialistas no assunto. Quando há material suficiente, cria-se a base de dados , que irá, mais tarde, alimentar o algoritmo;
Curadoria de dados: É iniciada a construção de um banco de dados de imagens – com imagens da internet disponibilizadas de forma gratuita e com imagens adquiridas com parcerias com instituições. Essas imagens devem ser muito semelhantes e em quantidade suficiente para que, quando forem inseridas no algoritmo, ele se aprofunde em um tema e entenda o que precisa ser criado – nesse caso, algo com características semelhantes ao que lhe foi apresentado;
Construir o algoritmo: A partir de coleta de dados, é possível definir qual tecnologia será usada para construir o algoritmo. Como poucos algoritmos são escritos do zero, são usadas partes de códigos já existentes e feita uma compilação para que ele possa servir da melhor maneira possível. Uma vez definido o algoritmo, ―brinca-se‖ com o conjunto de dados até obter um resultado ideal. O processo é repetido diversas vezes até chegar em um resultado satisfatório;
Selecionar o output: Uma vez que o algoritmo é treinado de forma otimizada no conjunto de dados certo, é capaz de criar um grande número de imagens. No output, que é a saída dos dados, os artistas selecionam as imagens que mais consideram adequadas para transmitir sua intenção – que, nesse caso, segundo o coletivo, é a criação de um retrato;
Selecionar a mídia: Para o coletivo Obvious, uma obra de arte deve ser mais do que um arquivo de computador. Quando torna a arte física, permite-se um novo nível de conexão entre a obra de arte e o espectador. No caso do retrato de ―Edmond de Belamy‖, eles optaram por imprimir em tela e exibi-lo com uma moldura de madeira dourada, com a intenção de ter um formato semelhante ao modo mais clássico de exibir obras de arte. A partir desses cinco passos para criação, identifica-se que mesmo que a máquina tenha certa autonomia, ela ainda necessita da ajuda humana na maioria das etapas do processo.
Afinal, máquinas e programas são criações da inteligência do homem, materializações de um processo mental, um pensamento que tomou corpo (MACHADO, 2001). Daria então para identificar de imediato que as obras de arte produzidas com o auxílio de IA ainda não ameaçam substituir o ser humano nesta tarefa, como colocam em discussão alguns críticos, pois dependem dele para operar. Entretanto, tentar dar à máquina a tarefa de produzir algo relacionado ao modo como acontece a subjetividade humana – que é onde opera a arte – é motivo para repensar a relação, de longa data, entre arte e tecnologia. Para Machado (2001), é uma tarefa difícil para a crítica de arte julgar um trabalho a partir do momento em que a tecnologia invade cada vez mais o processo de criação dele. Isso acontece porque não temos critérios suficientemente maduros para avaliar a contribuição de um artista ou de uma equipe de realizadores. Como consequência, a sensibilidade pouco a pouco torna-se embotada, perde-se o rigor do julgamento e qualquer bobagem nos excita, desde que pareça estar up to date com o atual estágio da corrida tecnológica (MACHADO, 2005).
2.3 Uso da inteligência artificial em áudios
A aplicação da inteligência artificial no processamento de áudio tem se mostrado extremamente promissora (AWARI, 2023). Diversas tecnologias e técnicas estão sendo desenvolvidas e aprimoradas para melhorar a qualidade do som, facilitar a edição e mixagem, além de potencializar a interação entre o usuário e os dispositivos de áudio (AWARI, 2023).
2.3.1 Melhoria na qualidade
A técnica de redução de ruído mais simples é a média ponderada, realizada espacialmente e/ou temporalmente como uma janela deslizante, também conhecida como filtro de média móvel (YAHYA et al. 2016). Representado na figura 12 a seguir:
Métodos mais sofisticados, entretanto, apresentam desempenho significativamente melhor e são capazes de se adaptar às mudanças nas estatísticas de ruído. Isso inclui suavização espaço-temporal adaptativa por meio de filtragem anisotrópica (MALM et al. 2007). Como representado na figura 13 a seguir:
Filtragem de grupo de domínio de transformação não local (MAGGIONI et al. 2012). Representado na figura 14 a seguir:
Modelo de mistura bilateral de Kalman (ZUO et al. 2013). Representado na figura 15 a seguir:
2.3.2 Composição de música e áudio
As primeiras tentativas de música gerada por computador apareceram na década de 1950 com foco na criação de música algorítmica (PORTO, 2023). O advento da música gerada por computador por pioneiros como Alan Turing com o computador Manchester Mark II abriu múltiplas possibilidades de pesquisa em inteligência musical onde sistemas computacionais poderiam reconhecer, criar e analisar música.
Através do uso de modelos matemáticos e algoritmos, Lejaren Hiller (um compositor americano) e Leonard Isaacson (um compositor e matemático americano) criaram Illiac Suite, a primeira peça original composta por um computador (PORTO, 2023). Para conseguir essa façanha, eles usaram um algoritmo de Monte Carlo que gerava números aleatórios que correspondiam a certas características musicais como tom ou ritmo. (PORTO, 2023). Usando um conjunto de restrições, essas características aleatórias foram limitadas a elementos que seriam musicalmente ‘legais’ conforme definido pelas regras da teoria musical tradicional, probabilidades estatísticas.
Outro inovador neste campo foi Iannis Xenakis, um compositor e engenheiro, que usou probabilidades estocásticas para auxiliar na criação de sua música. (PORTO, 2023).
Atualmente, vários sistemas de composição musical assistidos por IA suportam a criação musical. Dentre esses é possível citar: Amper Music, AIVA, Soundful, Mubert, etc. (CARVALHO, 2023).
2.3.3 Tradução Automática
A IA pode ajudar a quebrar barreiras entre diferentes idiomas com a tradução automática (BAHDANAU,2015). Um GAN condicionado com arquitetura RNN foi proposto para tradução de idiomas por (SUBRAMANIAN et al. 2018). Foi usado para a difícil tarefa de gerar frases em inglês a partir de poemas chineses; cria texto compreensível, mas às vezes com erros gramaticais. As arquiteturas CNN e RNN são empregadas para traduzir vídeos em sentenças de linguagem natural (VENUGOPALAN et al. 2015).
De fato, a IA aparece verdadeiramente no domínio da tradução em 2017 com o DeepL. Este software de tradução neuronal assenta em dados do sítio Web de tradução Linguee, um dicionário multilingue que compara traduções em cerca de 20 línguas. (IBANEZ, 2023)
Trata-se do início da tradução automática neuronal (TAN). Esta tecnologia inteligente, que funciona a partir de neurónios artificiais, leva em conta o conjunto do texto e o seu contexto (IBANEZ, 2023).
2.3.4 O reconhecimento da fala e da música
Aplicativos de celular que capturam alguns segundos de som ou música, como Shazam caracterizam músicas com base em uma impressão digital de áudio usando um espectrograma (um gráfico de tempo-frequência) que é usado para procurar uma impressão digital correspondente em um banco de dados. Houndify por SoundHound explora o reconhecimento de fala e pesquisa conteúdo na Internet. Essa tecnologia também fornece interação de voz para sistemas automotivos. O Google propôs um sistema completo de reconhecimento visual de fala que mapeia vídeos de lábios em sequências de palavras usando CNNs espaçotemporais e LSTMs (SHILLINGFORD et al. 2019).
2.3.5 Assistentes de voz
A Siri da Apple, a Alexa da Amazon e o Google Assistant, os assistentes inteligentes mencionados, empregam uma combinação de ferramentas de IA, na forma de um agente de software que pode executar tarefas ou serviços para um indivíduo (XU et al. 2017). Estes agentes virtuais podem aceder à informação através de canais digitais para responder a questões relacionadas, por exemplo, com previsões meteorológicas, notícias ou consultas enciclopédicas. Eles podem recomendar músicas, filmes e lugares, além de sugerir roteiros. Eles também podem gerenciar agendas pessoais, e-mails e lembretes. A comunicação pode ser na forma de texto ou voz. As tecnologias de IA por trás dos assistentes inteligentes são baseadas em métodos sofisticados de Machine Learning e
Programação neurolinguística. Da mesma forma, chatbots e outros tipos de assistentes virtuais são usados para marketing, atendimento ao cliente, busca de conteúdo específico e coleta de informações (XU et al. 2017).
2.4 Riscos da inteligência artificial
Há uma infinidade de riscos relacionados à IA com os quais se lidam hoje. Alguns dos maiores riscos atuais incluem coisas como privacidade do consumidor, programação tendenciosa, perigo para os seres humanos e regulamentação legal pouco clara.
Uma das maiores preocupações citadas pelos especialistas diz respeito à privacidade, segurança e IA dos dados do consumidor, muitas empresas já evitam violações de privacidade de dados com suas práticas de coleta e uso, e os especialistas temem que isso possa aumentar à medida que começarmos a utilizar mais IA.
Outra grande preocupação é que existem atualmente poucas regulamentações sobre IA (em geral, ou em torno da privacidade de dados) a nível nacional ou internacional. A UE introduziu a “Lei da IA” em abril de 2021 para regular os sistemas de IA considerados de risco; no entanto, a lei ainda não foi aprovada.
Uma das preocupações mais comuns relacionadas ao uso da IA na criação de arte é a possibilidade de que isso leve à padronização e homogeneização da arte.
A IA é baseada em algoritmos e modelos de treinamento. Dessa forma, ela pode levar a uma produção em massa de arte, em que as obras geradas são todas muito semelhantes umas às outras. Isso pode reduzir a originalidade e a diversidade da arte, tornando-a menos interessante e menos valiosa para o público em geral.
À medida que sistemas de IA se tornam mais avançados, existe o temor de que empregos humanos sejam substituídos, resultando em uma crescente disparidade econômica. Setores inteiros da economia podem ser reestruturados, resultando em desemprego tecnológico para trabalhadores que possuem habilidades que agora podem ser executadas de forma mais eficiente por máquinas. Isso pode criar uma divisão entre aqueles com habilidades altamente especializadas necessárias para projetar, programar e manter sistemas de IA e aqueles cujas habilidades são facilmente replicadas pela tecnologia.
A capacidade de criar informações falsas convincentes, conhecidas como deepfakes, representa outro risco significativo. A disseminação de desinformação pode minar a confiança pública em instituições e na mídia. Essa técnica avançada permite que rostos e vozes sejam manipulados de forma convincente, levantando preocupações sobre a disseminação de informações falsas e manipulação de identidade. Deepfakes têm o potencial de minar a confiança pública, aumentar a disseminação de notícias falsas e comprometer a integridade das mídias digitais. O combate a essa ameaça requer vigilância tecnológica, educação pública e desenvolvimento contínuo de ferramentas de detecção para proteger a autenticidade das informações online.
Com a tecnologia atual, a IA não pode realmente oferecer contexto, emoção ou relacionamento social amplos. No entanto, pode afetar a vida humana moderna cultural e socialmente. A UNESCO comentou especificamente sobre o impacto potencial da IA na cultura, na educação, no conhecimento científico, na comunicação e no fornecimento de informações, particularmente relacionadas com os problemas da exclusão digital. A inteligência artificial parece ampliar o fosso entre aqueles que podem e aqueles que não podem utilizar as novas tecnologias digitais, conduzindo a uma crescente desigualdade no acesso à informação. No contexto das indústrias criativas, a UNESCO menciona que a colaboração entre algoritmos inteligentes e a criatividade humana pode eventualmente trazer desafios importantes para os direitos dos artistas.
O surgimento da superinteligência levanta questões filosóficas e éticas. Caso a IA ultrapasse a inteligência humana, quem controlaria essas superinteligências? Como seria garantido que agiriam em conformidade com os valores éticos e morais?
A falta de regulamentação e padrões éticos claros em torno da IA é uma preocupação persistente. A ausência de responsabilidade definida pode levar a decisões injustas ou prejudiciais, sem que haja prestação de contas adequada.
Por fim, a IA não apenas tem implicações tecnológicas, mas também sociais e culturais. Mudanças significativas na forma de trabalhar, aprender e interagir socialmente são inevitáveis, o que requer uma adaptação social complexa.
Em resposta a esses desafios, é crucial um esforço global para desenvolver políticas, regulamentações e padrões éticos. Envolvendo governos, empresas, pesquisadores e a sociedade civil, onde pode-se moldar um futuro em que a IA é uma força positiva, beneficiando a humanidade de maneira responsável e ética.
3. Metodologia
O artigo trata da inteligência artificial (IA) no contexto de impactos dessa tecnologia. O objetivo principal dessa seção, foi apresentar aos leitores a metodologia utilizada. A revisão sistemática, foi considerada a abordagem mais apropriada para o estudo, dada a natureza do objetivo: identificar os principais resultados das pesquisas atuais e, ao mesmo tempo, oferecer insights valiosos para pesquisas futuras.
Para compreender o impacto da IA, foi conduzida uma pesquisa interativa envolvendo cinco perguntas relacionadas ao tema e a seleção das imagens que os participantes acreditam que foram criadas por inteligência artificial. A intenção ao fazer isso foi: primeiro, entender a percepção do público, segundo expor os respondentes a exemplos concretos de obras de arte geradas por IA. Através de um formulário online, foi buscado capturar diferentes perspectivas e opiniões sobre essa interseção entre tecnologia e criatividade, como propósito central criar um espaço para reflexão, diálogo e entendimento compartilhado sobre uma tecnologia que está moldando o presente e futuro. Ao coletar uma gama diversificada de opiniões e preocupações, o objetivo é contribuir para um desenvolvimento ético, responsável e inclusivo da inteligência artificial, garantindo que seus benefícios sejam acessíveis a todos e que seus desafios sejam enfrentados de maneira colaborativa e informada.
Ao questionar o público sobre sua visão a respeito da IA nas artes, foi pretendido aumentar a conscientização sobre as capacidades criativas dessa tecnologia. Ao apresentar obras de arte criadas exclusivamente por algoritmos de IA como parte do questionário, o objetivo foi contextualizar as discussões. Foi notado que uma parte dos participantes considerou a maior preocupação ética associando a inteligência artificial com a substituição dos empregos dos profissionais da área na questão da indústria criativa. Abaixo o formulário e as perguntas elaboradas na primeira parte da pesquisa e logo em seguida as imagens artísticas que foram compartilhadas com o público.
Formulário utilizado na pesquisa:
https://docs.google.com/forms/d/e/1FAIpQLSeCbW1cus1WbORzOdzoVnRHqIXziYrkYbIC TpfthXIYLrEv7Q/formResponse?pli=1
- Qual seu nível de conhecimento sobre TI? (baixo, médio ou alto)
- Você já utilizou ferramentas de IA para criar ou aprimorar objetos de mídia, como imagens, animações ou áudios?
- Qual o maior benefício da IA na criação de objetos artísticos? (Imagens, Áudio, Animações)
- Qual a maior preocupação ética que você associa ao uso da inteligência artificial na criação de objetos de mídia?
- Na sua opinião, qual é o potencial da IA para revolucionar a indústria de entretenimento nos próximos anos?
- Selecione as imagens que considera terem sido geradas por Inteligência Artificial, as figuras 16 a 25, representam as figuras colocadas no formulário.
Figura 25 – Anatomy Lesson of Dr. Algorithm
Fonte: Hanginginvestments (2023)
4. Resultados e Discussão
As respostas dos participantes demonstradas abaixo, foram analisadas em relação ao uso da inteligência artificial e como essa tecnologia é aplicada em obras de arte mostradas que permitiu entender melhor como a percepção pública é influenciada por exemplos tangíveis, contribuindo significativamente para o entendimento geral dos impactos da IA e fornecendo uma base sólida para o estudo, as figuras 26 a 31 mostram os resultados obtido pelo formulário, que serão discutidos.
Figura 26 – Respostas coletadas na primeira pergunta
Com base na primeira pergunta, foi iniciado o estudo com uma análise do nível de conhecimento em tecnologia da população participante.
Entender o grau de familiaridade com conceitos tecnológicos fundamentais é, portanto, uma peça-chave para decifrar as respostas coletadas. Foi dividido o grupo de respondentes em três categorias distintas – ‘Baixo’, ‘Médio’ e ‘Alto’ – com o intuito de capturar a diversidade de conhecimento que permeia a amostra. Esta abordagem permite uma análise mais refinada das respostas, considerando a gama variada de perspectivas que podem surgir com diferentes níveis de entendimento tecnológico.
Uma pergunta inicial para estabelecer o conhecimento de TI da população que vai responder ao questionário, isso é vital para saber segregar e entender como diferentes níveis de entendimento da área de tecnologia pode entender a IA. Essa categorização proporciona uma estrutura clara para a análise subsequente das respostas.
Foi reconhecido que o nível de conhecimento pode desempenhar um papel significativo nas percepções da IA. Respondentes com conhecimento mais alto podem oferecer insights mais detalhados e críticos, enquanto aqueles com conhecimento mais baixo podem apresentar perspectivas mais intuitivas e menos informadas. Essa variação é fundamental para uma análise abrangente das respostas obtidas.
Com relação a resposta da segunda pergunta, a análise do gráfico de porcentagem revela uma distribuição equilibrada entre os respondentes que afirmaram ter utilizado ferramentas de IA para criar ou aprimorar objetos de mídia (50%) e aqueles que não o fizeram (50%). Esse equilíbrio sugere uma diversidade significativa na experiência prática da amostra em relação à aplicação da IA na criação de mídia.
A análise das respostas à pergunta sobre os benefícios da IA na criação de objetos artísticos destaca o ‘Aumento na produtividade’ como o benefício mais significativo, com uma porcentagem notável de 50%. Isso sugere que uma parcela significativa dos respondentes valoriza a capacidade da IA de acelerar e facilitar o processo criativo.
É interessante notar que, embora a eficiência seja fortemente valorizada, outras respostas também oferecem insights valiosos. Por exemplo, os 19,2% que indicaram ‘Redução dos custos’ podem associar a IA a benefícios financeiros, enquanto os 15,4% que escolheram ‘Redução da necessidade de designers humanos’ podem estar refletindo sobre implicações mais amplas da automação.
A resposta ‘Maior criatividade’, apesar de ter uma porcentagem menor (11,5%), destaca a importância da inovação e sugere que uma parte da amostra percebe a IA não apenas como uma ferramenta eficiente, mas como uma fonte de inspiração e criatividade.
A opção ‘Nenhum benefício’, escolhida por 3,8%, indica uma minoria que não percebe benefícios tangíveis da IA na criação artística. Essa perspectiva pode revelar preocupações ou ceticismos sobre a adoção da IA neste contexto específico.
A análise das respostas à quarta pergunta, sobre as maiores preocupações éticas relacionadas ao uso da inteligência artificial na criação de objetos de mídia destaca a ‘Substituição de empregos de profissionais da área’ como a maior inquietação, representando 34,6%. Isso reflete uma apreensão considerável sobre o impacto da IA nas oportunidades de emprego dentro da indústria criativa.
Além disso, é notável que questões de autenticidade e plágio, com ‘Plágio e uso não autorizado de conteúdo’ (19,2%), bem como preocupações sobre a ‘Despersonalização da arte e cultura’ (19,2%), foram citadas em proporções semelhantes. Essas respostas indicam uma sensibilidade ética para a preservação da autenticidade e da singularidade na criação de mídia.
Já a preocupação com a ‘Proliferação de “deepfakes” enganosos’ (19,2%) destaca a consciência das implicações negativas associadas à manipulação digital e à disseminação de conteúdo enganoso.
Curiosamente, a opção ‘Nenhuma preocupação ética’, foi escolhida por apenas 7,7% dos participantes. Investigar as razões subjacentes para essa falta de preocupação pode fornecer insights adicionais sobre as atitudes em relação ao uso ético da inteligência artificial na criação de objetos de mídia.
Com base na resposta do público referente a quinta pergunta, a avaliação do potencial da Inteligência Artificial (IA) para revolucionar a indústria de entretenimento nos próximos anos revela uma perspectiva geralmente otimista, com metade dos participantes (50%) acreditando em um ‘Alto potencial para transformar a forma como consumimos mídia’. Isso reflete um entusiasmo significativo sobre o papel transformador da IA na experiência de entretenimento. É interessante observar que, embora o otimismo seja predominante, 38,5% dos respondentes expressaram uma visão mais equilibrada, indicando que há ‘Algum potencial, mas as contribuições humanas ainda serão essenciais’. Isso destaca o reconhecimento da importância contínua da criatividade humana em conjunto com a IA.
Por outro lado, respostas mais conservadoras também estão presentes, com 7,7% indicando que a IA ‘Vai continuar apenas como ferramenta de trabalho’, e 3,8% expressando a opinião de que ‘Não acredito que a IA terá um impacto significativo na indústria de entretenimento’. Essas visões sugerem uma cautela em relação à capacidade da IA de revolucionar profundamente a indústria. É notável que a opção ‘Potencial limitado, com impactos mais sutis na indústria’ obteve 0%, indicando que a maioria dos participantes não compartilha da crença de que a IA terá apenas impactos limitados na indústria de entretenimento.
A análise das respostas à identificação de imagens geradas por IA revela um resultado notável – nenhum dos participantes conseguiu identificar corretamente que todas as 10 imagens foram geradas por IA. Isso ressalta a dificuldade de discernir visualmente entre criações humanas e aquelas produzidas por algoritmos.
A análise detalhada das respostas específicas para cada imagem revelou uma variação notável nas taxas de identificação. Um caso intrigante é a imagem 5, que obteve uma taxa de identificação significativa de 96,2%. Essa imagem foi especialmente selecionada para criar a impressão de ser gerada por IA alinhando-se às expectativas comuns sobre como uma criação desse tipo deve se parecer. A alta porcentagem de identificação sugere que as pessoas basearam suas escolhas na conformidade da imagem com a percebida estética associada à inteligência artificial.
Por outro lado, a imagem 8, que apresentava características visuais mais ‘desleixadas’ e menos finalizadas, contrariou as expectativas populacionais. Essa imagem recebeu uma taxa de identificação mais baixa, apenas 15,4%. A diferença nas taxas de identificação entre a imagem 5 e a imagem 8 indica que certas características visuais desempenharam um papel significativo nas escolhas dos participantes.
Esses resultados destacam a influência poderosa das expectativas prévias na percepção visual. A imagem 5, com seu design voltado para evocar a estética de IA, evidencia como as preconcepções sobre como a IA se manifesta visualmente podem impactar fortemente as decisões dos observadores. Ao mesmo tempo, a imagem 8 demonstra como a divergência em relação a essas expectativas pode resultar em uma identificação mais baixa. A análise mais profunda reforça a compreensão de que a identificação visual de obras geradas por IA é complexa e muitas vezes depende não apenas das características intrínsecas das imagens, mas também das expectativas e interpretações subjetivas dos observadores.
A falha generalizada na identificação sugere uma falta de confiança na capacidade de distinguir entre criações humanas e aquelas geradas por IA apenas com base na observação visual. Esse resultado levanta questões fascinantes sobre as nuances envolvidas na percepção visual e destaca o desafio intrínseco de identificar com precisão a autoria em um contexto em que a IA produz resultados visualmente indistinguíveis das criações humanas. Essa constatação pode servir como ponto de partida para discussões mais amplas sobre as implicações éticas, sociais e artísticas associadas ao uso da IA na criação de conteúdo visual, e sobre como as tecnologias emergentes estão desafiando as percepções tradicionais de autoria e criatividade.
5. Considerações Finais/Conclusões
Ao compartilhar através desse artigo, a integração da inteligência artificial (IA) em imagens, animações e áudios revolucionou profundamente as indústrias criativas, levando a uma série de impactos significativos e transformadores. O papel da IA em imagens é marcado por avanços notáveis, desde o reconhecimento de objetos até a geração de imagens realistas, ampliando as possibilidades em campos tão diversos quanto medicina, vigilância e design. Em animações, a IA não apenas aprimorou a qualidade visual, mas também trouxe personagens animados à vida com movimentos faciais autênticos e comportamentos naturais, redefinindo o realismo nas narrativas visuais.
Na esfera do áudio, a IA revolucionou a produção musical, criando composições originais e síntese de voz que desafiam a distinção entre criação humana e artificial. Além disso, a capacidade da IA de personalizar interações em tempo real, permitindo que os espectadores influenciem narrativas e experiências visuais, está redefinindo o engajamento do público e elevando a interatividade para níveis sem precedentes.
Entretanto, essa revolução não vem sem desafios. A ética na IA, especialmente em relação ao viés algorítmico e à privacidade, emerge como uma preocupação significativa. O equilíbrio entre a criatividade humana e a automação da IA torna-se uma linha tênue a ser navegada, preservando a autenticidade artística enquanto aproveita os benefícios da tecnologia. É crucial adotar práticas e políticas que garantam que a inovação tecnológica seja acompanhada por considerações éticas, assegurando que o progresso beneficie a sociedade como um todo.
Em suma, a inteligência artificial não apenas aprimorou a qualidade e a eficiência em imagens, animações e áudios, mas também desencadeou uma revolução criativa, redefinindo os padrões de excelência e proporcionando experiências únicas aos espectadores. À medida que a tecnologia continua a evoluir, a reflexão ética e a consideração cuidadosa de seu impacto na sociedade são essenciais para moldar um futuro em que a inteligência artificial e a criatividade humana coexistam harmoniosamente, impulsionando a inovação e inspirando gerações futuras.
6. Referências Bibliográficas
AGGARWAL, C. C. et al. Neural networks and deep learning. [S.l.]: Springer, 2018.
ALVES, Gabriel. Detecção de Objetos com YOLO – Uma abordagem moderna. Disponível em: <https:/iaexpert.academy/2020/10/13/deteccao-de-objetos-com- yolo-uma-abordagem-moderna/?doingwp.cron=1695991133.1193430423736572265625> Acesso em: 27 ago.2023.
ANANTRASIRICHAI, N. Bull, David. Artificial intelligence in the creative industries: a review. Disponível em: <https://link.springer.com/article/10.1007/s10462-021-10039- 7#Fn25> Acesso em: 06 agosto. 23.
ATTARD, Joe. The death of the artist? A Marxist perspective on AI-generated art. Disponível em: <https://www.marxist.com/the-death-of-the-artist-a-marxist-perspective-on- ai-generated-art.htm> Acesso em: 01 nov. 2023.
ÁVILA, Tomás. et al.“La inteligencia artificial y sus aplicaciones en medicina II: importancia actual y aplicaciones prácticas”. Disponível em:<https://www.sciencedirect.com/science/article/pii/S0212656720301463> Acesso em: 10 nov. 2023.
AWARI. Inteligência Artificial Áudio: Como a IA Está Transformando a Experiência Sonora. Disponível em: <https://awari.com.br/inteligencia-artificial-audio-como-a-ia-esta- transformando-a-experiencia-sonora/> Acesso em: 10 nov. 2023.
BAHDANAU, D. et al. Neural Machine Translation by Jointly Learning to Align and Translate. Disponível em:<https://www.researchgate.net/publication/265252627_Neural_Machine_Translation_by_J ointly_Learning_to_Align_and_Translate> Acesso em: 09 nov. 2023
BARR, E , A. Feigenbaum. The Handbook of Artificial Intelligence, volume I-II. William KaufmannInc., Los Altos, California, 1981.
BERNARDES, N. et al. “Câncer de Mama X Diagnóstico”. Disponível em: < https://idonline.emnuvens.com.br/id/article/view/1636> Acesso em 9 nov. 2023.
BIEMOND, J. et al. Iterative methods for image deblurring. Proc IEEE 78(5):856–883, 1990.
BOCHKOVSKIY, A .et al. YOLOv4: optimal speed and accuracy of object detection. 2020.
BOSTROM, N. Superintelligence. Oxford University Press, 2014.
BOSTROM, N; YUDKOWSKY E. The ethics of artificial intelligence. In: In Cambridge handbook of artificial intelligence, 2014.
BUADES, A ; DURAN, J. CFA video denoising and demosaicking chain via spatio- temporal patch-based filtering. IEEE Trans Circ Syst Video Tech 30(11):1, 2019.
BULL, D; ZHANG, F. Intelligent image and video compression: communicating pictures, 2nd edn. Elsevier, New York, 2021.
CARMINATO, Isabella. ElevenLabs: IA para criação de vozes lança sua plataforma beta com suporte para mais de 30 idiomas. Disponível em:<https://curtonews.com/newsverso/eleventabs-ia-para-criacao-de-vozes-lanca-sua plataforma-beta-com-suporte-para-mais-de-30-idiomas/> Acesso em: 19 ago. 2023.
CARVALHO, Rafael. 6 ferramentas de IA para criar música. Disponível em: < https://herospark.com/blog/ia-para-criar-musica/> Acesso em: 12 nov. 2023.
CASCONE, Sarah. A Neuroscientist and a Physicist Used A.I. to Recreate a Lost Painting Buried Under a Beloved Picasso Canvas. Disponível em:<https://news.artnet.com/art-world/lost-painting-under-picasso-masterpiece-recreated-as- an-nft-1957407> Acesso em: 29 out. 2023.
CHU, Mandy. 17 Best AI Art Pieces: Mind-Blowing Artwork & Artists. Disponível em:<https://hanginginvestments.com/best-ai-art/> Acesso em: 29 out. 2023.
COLIN, J. Fleming. AI Made This. Will It Remake the Future of Art, Too?. Disponível em: <https://www.rom.on.ca/en/collections-research/magazine/ai-made-this-will-it-remake- the-future-of-art-too> Acesso em: 28 out. 2023.
CORREIA, Catarina Camacho. Inteligência Artificial e Propriedade Intelectual. p. 23, 2020. Disponível em: https://portal.issn.org/resource/ISSN/2184-5549. Acesso em 10 nov 2023.
CORRIDOR Digital Drops VFX Reveal of Anime Rock, Paper,Scissors. Foxrenderfarm, 2023. Disponível em: <https://www.foxrenderfarm.com/news/corridor-digital-drops-víx- reveal-of-anime-rock-paper-scissors/> Acesso em: 19 ago. 2023.
CREATIVITY and technology in the age of AI. The Pfeiffer Report, 2018. Disponível em:<https://www.pfeifferreport.com/wp-content/uploads/2018/10/Creativity-and-technology-in- the-age-of-AI.pdf>. Acesso em 10 ago. 2023.DARKOTRON. Moses Cohen. Disponível em:<https://www.artaigallery.com/products/moses-cohen> Acesso em: 28 out. 2023.
DLAMINI, Z. et al. “Artificial intelligence (AI) and big data in cancer and precision oncology”. Disponível em:<https://www.sciencedirect.com/science/article/pii/S200103702030372X> Acesso em: 11 nov. 2023.
EYEDEA paintings made with Midjourney AI imagine program. Reddit, 2022. Disponível em:<https://www.reddit.com/r/eyedea/comments/weko9f/eyedea_paintings_made_with_mi djourney_ai_imagine/> Acesso em: 10 ago. 2023.
FRANÇA, Rodrigo. Operações locais (pixels vizinhos) . Disponível em: < https://commons.wikimedia.org/wiki/File:Operacao_local.jpg> Acesso em: 10 dez. 2023.
FURTADO; Maria Inês. Redes Neurais e Artificiais: Uma abordagem para sala de aula.1. ed. [S.l.]: atena, 2019. p. 1-105.
GANESH, Raju. Meta’s Codec Avatars: Bridging the Real and Virtual Like Never Before. Disponível em <https://www.linkedin.com/pulse/metas-codec-avatars-bridging- real-virtual-like-never-before> Acesso em: 10 dez. 2023.
GOMES, Dennis. Inteligência Artificial: Conceitos e Aplicações. Revista Olhar Científico – Faculdades Associadas de Ariquemes – V. 01, n.2, Ago./Dez. 2010.
GRIBINCEA, A. Intellectual property rights to an artificial intelligence product. Journal of the National Academy of Legal Sciences of Ukraine, v. 27, n. 4, p. 231–241, 2020. Disponível em: http://visnyk.kh.ua/en/article/pravo-intelektualnoyi-vlasnosti-na- produkt-shtuchnogo-intelektu. Acesso em: 10 nov. 2023.
GUO, K. et al. The relightables: volumetric performance capture of humans with realistic relighting. In: ACM SIGGRAPH Asia, 2019.
HAUGELAND, John. Artificial Intelligence: The Very Idea. Massachusetts: The MIT Press, 1985.
HAYKIN, S. Redes neurais: princípios e prática. [S.l.]: Bookman Editora, 2007.
HE, K. et al. Mask r-CNN. In: IEEE international conference on computer vision (ICCV), pp 2980–2988, 2017.
HE, K. et al. Deep residual learning for image recognition. In: IEEE conference on computer vision and pattern recognition (CVPR), pp 770–778, 2016.
HODGINS, Jessica. et al. “Animating Human Athletics”. Proceedings of Computer Graphics (SIGGRAPH’95), pp. 71-78, 1995.
HOUSSAMI, N; HAYES, D. “Review of Preoperative Magnetic Resonance Imaging (MRI) in Breast Cancer”. Disponível em:<https://acsjournals.onlinelibrary.wiley.com/doi/epdf/10.3322/caac.20028> Acesso em: 11 nov. 2023.
HUANG, G. et al. Densely connected convolutional networks. In: IEEE conference on computer vision and pattern recognition (CVPR), pp 2261–2269, 2017.
HUI, J. Convolutional neural networks (CNN) tutorial. 2017. Disponível em: < https://jhui.github.io/2017/03/16/CNN-Convolutional-neural-network/> Acesso em: 10 nov. 2023.
HONAVAR. Symbolic artificial intelligence and numeric artificial neural networks: towards a resolution of the dichotomy. Springer, Boston, pp 351–388, 1995.
HRADIS, M. et al. Convolutional neural networks for direct text deblurring. In: Proceedings of the British machine vision conference (BMVC), pp 6.1–6.13, 2015.
IBANEZ, Fréderic. O impacto da inteligência artificial no futuro da tradução. Disponível em: <https://www.alphatrad.pt/noticias/impacto-inteligencia-artificial-traducao> Acesso em: 12 nov. 2023.
INTELIGÊNCIA Artificial: Como a IA Está Mudando a Arte. Editorial Aela, 2023. Disponível em: < https://aelaschool.com/pt/arte/inteligencia-artificial-como-a-ia-esta- mudando-a-arte/> Acesso em: 03 nov. 2023.
JANECZKO, Cesar. Filtros Digitais. Disponível em: <https://docplayer.com.br/2295874- Filtros-digitais-capitulo-6-0-pds-prof-cesar-janeczko-2-o-semestre-2009-10- a.html#google_vignette> Acesso em: 10 dez. 2023.
JIANG, Y. et al. Enlightengan: deep light enhancement without paired supervision. IEEE Trans Image Process 30:2340–2349, 2021.
JIN, Y. et al. Towards the automatic anime characters creation with generative adversarial networks, 2017.
JOHNSON, J. et al. Perceptual losses for real-time style transfer and super- resolution. In: European conference on computer vision, 2016.
JUNIOR, Jose. Filtro de Kalman. Disponível em: <https://medium.com/@web2ajax/filtro- de-kalman-6e84f82993fc> Acesso em: 10 dez. 2023.
KARRAS, T. et al. Progressive growing of GANs for improved quality, stability, and variation. In: International conference on learning representations (ICLR), 2017.
KERNER, M. Sean. AI art (artificial intelligence art). Disponível em:<https://www.techtarget.com/searchenterpriseai/definition/AI-art-artificial-intelligence-art> Acesso em: 06 ago. 2023.
KRISHNAN, D. et al. Blind deconvolution using a normalized sparsity measure. CVPR 2011:233–240, 2011.
KUANG, X. et al. Single infrared image enhancement using a deep convolutional neural network. Neurocomputing 332:119–128, 2019.
KUMAR, Ajitesh. GAN vs VAE: Differences, Similarities, Examples. Disponível em:<https://vitalflux.com/gan-vs-vae-differences-similarities-examples/> Acesso em: 10 dez. 2023.
KUPYN, O. et al. DeblurGAN: Blind motion deblurring using conditional adversarial networks. In: The IEEE conference on computer vision and pattern recognition (CVPR), 2018.
KURZWEIL, Ray. The Age of Spiritual Machines. Massachusetts: The MIT Press, 1990.
LAMIM, Jonathan. Como criar prompts para geração de imagens com IA. Disponível em: <https://designcomcafe.com.br/como-criar-prompts-para-geracao-de-imagens-com- ia/amp/> Acesso em: 05 nov. 2023.
LEIYING, Zhou. et al. Neural Machine Translation with Soft Reordering Knowledge Disponível em <https://link.springer.com/chapter/10.1007/978-3-030-63820-7_79> Acesso em: 10 dez. 2023.
LIN, T. et al. Feature pyramid networks for object detection. In: IEEE conference on computer vision and pattern recognition (CVPR), pp 936–944, 2017.
LISBOA, Alveni. IA impressiona ao melhorar imagens desfocadas ou em baixa resolução. Disponível em: <https://canaltech.com.br/inteligencia-artificial/ia- impressiona-ao-melhorar-imagens-desfocadas-ou-em-baixa-resolucao-204936/> Acesso em: 27 ago. 2023.
LIU, L. et al. Deep learning for generic object detection: a survey. Int J Comput Vis 128:261–318, 2020
LOCH, Carolina. A obra de arte na era da inteligência artificial. Curitiba, 106 p, 2021. Dissertação (Pós-Graduação) – Universidade Federal do Paraná.
LORE, KG. et al. Linet: a deep autoencoder approach to natural low-light image enhancement. Pattern Recogn 61:650–662, 2017.
MACHADO, Arlindo. Máquina e imaginário: o desafio das poéticas tecnológicas. São Paulo: Edusp, 2001.
MACHADO, Arlindo. O quarto iconoclasmo. Rio de Janeiro: Contra capa, 2001.
MACHADO, Arlindo. Tecnologia e Arte Contemporânea: Como politizar o debate. Revistade Estudios Sociales [Online], 22 | Dezembro 2005, Disponível em:<http://journals.openedition.org/revestudsoc/22781> Acesso em: 12 nov. 2023.
MAGGIONI, M. et al. Nonlocal transform-domain filter for volumetric data denoising and reconstruction. IEEE Trans Image Process 22(1):119–133, 2012.
MALM, H. et al. Adaptive enhancement and noise reduction in very low light-level video. In: IEEE ICCV, pp 1–8, 2007.
MATSUGU. M. et al. Subject independent facial expression recognition with robust face detection using a convolutional neural network. Neural Netw 16(5–6):555–559, 2003.
MEHTA, R. Big Data Analytics with Java. Birmingham: Packt Publishing Ltd, 2017. MITCHELL, T. M. Machine Learning. 1. ed. New York City: McGraw-Hill, 1997.
MCNEMAR, Erin. Artificial Intelligence Works To Identify How Diseases Alter The Body. Disponível em: <https://healthitanalytics.com/news/artificial- intelligence-works-to-identify-how-diseases-alter-the-body.> Acesso em: 27 ago. 2023.
MOLLOY, Parker. This art was made by a computer. Disponível em: < https://www.readtpa.com/p/midjourney-ai-art-tool> Acesso em: 10 ago. 2023.
MONARD, M. C.; BARANAUSKAS, J. A. Conceitos sobre aprendizado de máquina. Sistemas inteligentes-Fundamentos e aplicações, v. 1, n. 1, p. 32, 2003
NAGANO, K, Seo J. et al. Avatares em tempo real usando texturas dinâmicas.
Disponível em: <https://doi.org/10.1145/3272127.3275075>. Acesso em: 02 set. 2023.
NAH, S. et al. Deep multi-scale convolutional neural network for dynamic scene deblurring. In: The IEEE conference on computer vision and pattern recognition (CVPR), 2017.
NAH, S. et al. Recurrent neural networks with intra-frame iterations for video deblurring. In: The IEEE conference on computer vision and pattern recognition (CVPR), 2019.
NALBACH, O. et.al . Deep shading: convolutional neural networks for screen space shading. Comput Graph Forum 36(4):65–78, 2017.
NIELSEN, M. Neural Networks and Deep Learning. Disponível em: < https://jingyuexing.github.io/Ebook/Machine_Learning/Neural%20Networks%20and%20De ep%20Learning-eng.pdf> Acesso em: 10 nov. 2023.
PERERA, A. What is Padding in Convolutional Neural Network’s(CNN’s) padding. 2018. Disponível em: <https://ayeshmanthaperera.medium.com/what-is-padding-in-cnns> Acesso em: 10 nov. 2023.
PIZER, SM. et al. Adaptive histogram equalization and its variations. Comput Vis, Graph, Image Process 39(3):355–368, 1987
POOLE, D. et al. Computational Intelligence: A Logical Approach. Oxford: Oxford University, 1998.
PORTO, Marlon. Inteligência artificial na música: recortes, fatos e análises. Disponível em: <https://musicaemercado.org/inteligencia-artificial-na-musica/> Acesso em: 12 nov. 2023.
RAMOS, Guilherme. Harry Potter ganha versão em anime feita com IA;. Disponível em: <https://www.techtudo.com.br/fotos/2023/01/harry-potter-ganha-versao-em- anime-feita-com-ia-veja-fotos.ghtml> Acesso em: 26 ago. 2023.
RADFORD, A. et al. Unsupervised representation learning with deep convolutional generative adversarial networks. In: International conference on learning representations, 2016.
RECOMENDAÇÃO sobre a Ética da Inteligência Artificial. Unesco, 2021. Disponível em:<https://unesdoc.unesco.org/ark:/48223/pf0000381137_por> Acesso em: 21 out. 2023.
REDMON, J. et al. You only look once: unified, real-time object detection. In: IEEE conference on computer vision and pattern recognition (CVPR), pp 779–788, 2016.
RIBEIRO, Leonardo. O que são Redes Neurais Convolucionais?. Disponível em:<https://www.youtube.com/watch?v=sgt_67zNDrI> Acesso em: 10 dez. 2023.
ROCHA, B. Uelisson. Uso da Inteligência Artificial: avanços, riscos e desafios relacionados á propriedade intelectual. Disponível em:<https://www.nucleodoconhecimento.com.br/administracao/riscos-e-desafios> Acesso em: 12 ago. 2023
RONNEBERGER, O. et al. U-net: convolutional networks for biomedical image segmentation. In: International conference on medical image computing and computer- assisted intervention. Springer, pp 234–241, 2015.
ROOSE, Kevin. An A.I.-Generated Picture Won an Art Prize. Artists Aren’t Happy. Disponível em: < https://www.nytimes.com/2022/09/02/technology/ai-artificial-intelligence- artists.html>RUSSEL, Stuart; NORVIG, Peter. Inteligência Artificial. 2. Ed.2004.
RUSSELL, Stuart; NORVIG, Peter. Artificial intelligence: a modern approach. 3 Ed. Upper Saddle River: Pearson Education Limited. 2010.
SANTOS; BAEBLER. Big Data. Disponível em: < https://www.coursehero.com/file/177312532/Big-Data-partial-workdocx/> Acesso em : 10 nov. 2023.
SCHULER, CJ. et al. Learning to deblur. IEEE Trans Pattern Anal Mach Intell 38(7):1439–1451, 2016.
SHILLINGFORD, B. et al. Large-scale visual speech recognition. In: INTERSPEECH, 2019.
SINGH, Yash. Harry potter how much money did the film series make?. Disponível em:< https://firstcuriosity.com/movies/harry-potter-how-much-money-did-the-film-series- make/>. Acesso em: 10 dez. 2023.
SUBRAMANIAN, S. et al. Towards text generation with adversarially learned neural outlines. In: NeurIPS, 2018
TANCRED, L, JO. A.I.-Generated Versions of Art-Historic Paintings Are Littering Google’s Top Search Results. Disponível em: < https://news.artnet.com/art-world/ai- versions-of-art-historically-significant-paintings-flood-google-top-results-2313747> Acesso em: 02 set. 2023.
TAO, L. et al. Llcnn: a convolutional neural network for low-light image enhancement. In: IEEE visual communications and image processing (VCIP), pp 1–4, 2017.
TAO, X. et al. Scale-recurrent network for deep image deblurring. In: IEEE/CVF conference on computer vision and pattern recognition, pp 8174–8182, 2018.
TESFALDET, M. et al. Two-stream convolutional networks for dynamic texture synthesis. In: The IEEE conference on computer vision and pattern recognition (CVPR), 2018
TREVISAN, Vinicius. Como funcionam as Redes Neurais Convolucionais (CNNs). Disponível em: < https://medium.com/data-hackers/como-funcionam-as-redes-neurais- convolucionais-cnns- 71978185c1> Acesso em: 12 nov. 2023.
VEGAVID. The Power of Al in Image Processing: A Comprehensive Guide. Disponível em <https://vegavid.com/blog/power-of-ai-in-image-processing/> Acesso em: 19 ago. 2023.
VENUGOPALA, S. et al. Translating videos to natural language using deep recurrent neural networks. In: Conference of the North American chapter of the association for computational linguistics—human language technologies, 2015.
WEI, Se. et al. Vr facial animation via multiview image translation. ACM Trans Graph 38(4):1–16, 2019.
XU, A. et al. A new chatbot for customer service on social media. In: Proceedings of the 2017 CHI conference on human factors in computing systems, association for computing machinery, New York, NY, USA, CHI ’17, pp 3506–3510, 2017.
YAHYA, AA. et al. Video denoising based on spatial-temporal filtering. In: 6th intern. conf. on digital home, pp 34–37, 2016.
YAMADA, Mariana. Inteligência Artificial – Explorando o poder das imagens com IA. Disponível em: <https://awari.com.br/inteligencia-artificial-explorando-o-poder-das- imagens-com-ia/>. Acesso em: 11 nov. 2023.
ZHANG, R. et al. Colorful image colorization. In: The European conference on computer vision (ECCV), pp 649–666, 2016.
ZODWA, Dlamini. Artificial intelligence (AI) and big data in cancer and precision oncology. Disponível em: <https://ncbi.nlm.nih.gov/pmc/articles/PMC7490765/>. Acesso em: 10 dez. 2023.
ZUO, C. et al. Video denoising based on a spatiotemporal Kalman-bilateral mixture model, pp 80 – 89, 2013.