THE VOICE AND THE MACHINE: THE LEGAL PROTECTION TO THE VOICE CLONED BY ARTIFICIAL INTELLIGENCE
REGISTRO DOI: 10.69849/revistaft/cl10202410311113
Luiz Renato Dantas de Almeida1
Karoline Lins Câmara Marinho de Souza2
RESUMO
A inteligência artificial tem sido utilizada para recriar vozes conhecidas pelo público com extrema verossimilhança. Essas vozes são utilizadas em músicas, produções audiovisuais, até em propaganda comercial e também fortemente difundidas e utilizadas para fins econômicos no espaço virtual. Esse tipo de inovação viola algum direito do titular da voz? Seja no âmbito do direito autoral, ou do direito da personalidade ou ainda no âmbito da concorrência desleal? São essas questões que o artigo procura explorar, através de pesquisa bibliográfica multidisciplinar, legal e jurisprudencial, utilizando-se de casos reais para analisar possíveis tutelas. E que conclui apontando possível tutela através dos direitos da personalidade e da responsabilidade civil.
Palavras-chave: Inteligência artificial, direito da personalidade, voz humana, intérprete.
ABSTRACT
The artificial intelligence has been used to recreate known voices recognized by the public due to its incredible resemblance. These voices are used in musics, movies, even in commercial advertisements and also strongly defunded and used for economical endings through all the virtual space. Does this kind of innovation violate any right of the voice owner? Wherever in the author rights’ scope, or publicity rights, or even an unfair competition? These are some questions that this article intents to explore, through bibliographic, legal and jurisprudential researches, using real cases to analyze possible protections. And it concludes indicating the possibility of protection through the personality rights and civil liability.
Key Words: Artificial Intelligence, publicity rights, human voice, interpreter.
1. INTRODUÇÃO
A voz sempre teve papel fundamental nas relações humanas, seja na comunicação rotineira nos diversos grupos sociais, seja na difusão do conhecimento (por quantos séculos a voz foi a única forma de transmissão do conhecimento entre as gerações), seja na arte (que nos digam os castrati italianos, mutilados desde cedo para atingir timbres específicos de voz). Mas também a voz tem a capacidade de integrar a imagem de um indivíduo, de fazer parte de sua própria personalidade. As pessoas podem ser reconhecidas pela voz, quase tanto quanto pela sua feição.
A tecnologia, que tem diariamente adentrado espaços antes reservados exclusivamente aos seres vivos, traz um novo capítulo para a utilização da voz, especialmente, no campo das artes e entretenimento. Vemos máquinas a contar piadas, criar fotos e imagens incríveis, fazer descrições de imagens, ler livros e aprender a voz de outras pessoas. Nos últimos anos presenciamos um avanço fenomenal, e, porque não, assustador das potencialidades da inteligência artificial, como na operação do direito e no campo das artes, onde a excepcionalidade de suas intervenções tem chamado atenção do público e de especialistas. Indiferente às discussões se a inteligência artificial (AI, do inglês) um dia será capaz de ter consciência própria – e isso nos ser um risco -, ela segue ganhando espaço no nosso dia a dia.
A indústria do entretenimento acumula controvérsias: banimento de músicas fakes por inteligência artificial1, oportunidade de negócios como faz a cantora Grimes, que permite a utilização de sua voz em composição de outras pessoas desde que haja a repartição do resultado com ela2, composição de músicas em estilo de antigos compositores clássicos e populares, ou do dublador de Darth Vader, que autorizou o uso de sua voz gerada por AI em produções futuras3, dentre outras situações inusitadas.
A série Diários de Andy Warhol utilizou a inteligência artificial para recriar a voz de Warhol recitando frases retiradas dos diários do próprio artista nos episódios. A banda Breezer utilizou a voz do cantor Liam Gallagher aprendida por inteligência artificial para cantar suas músicas no estilo Oasis. Elis Regina aparece num comercial de veículos cantando com sua filha. Além das tantas deepfakes que se têm notícias, capazes, inclusive, de influenciar o resultado de eleições mundo afora.
Mas é o uso da voz aprendida por AI que motivou o presente estudo. O caso da banda britânica Breezer, citada acima, que compôs um álbum inteiro (AIsis) utilizando, sem autorização, a voz do cantor Liam Gallagher na intenção de emular um último possível disco da banda Oasis. Apesar de não ter havido a autorização prévia, não houve qualquer ação por parte do autor para impedir, mesmo que a posteriori a utilização.
Hoje uma rápida busca em qualquer mecanismo na internet, te devolve links para diversos algoritmos de clonagem de voz.
Assim, o presente artigo busca, através de pesquisas bibliográfica multidisciplinar, legal e jurisprudencial investigar se o uso sem autorização de vozes humanas aprendidas por inteligência artificial, mas que possuem um emissor reconhecível, fere algum preceito do ordenamento jurídico. Estaria o emissor original, o titular da voz, de alguma maneira protegido? Seria essa voz um desdobramento da personalidade do emissor original? Ou esse novo objeto-voz, no domínio digital, é de livre uso?
2. O INTÉRPRETE E A TUTELA PELO O DIREITO AUTORAL
A lei brasileira de direitos autorais estende a tutela do direito autoral, no que couber, aos intérpretes. A mesma lei, em consonância com a Convenção de Roma de 1961, define intérprete como “todos os atores, cantores, músicos, bailarinos ou outras pessoas que representem um papel, cantem, recitem, declamem, interpretem ou executem em qualquer forma obras literárias ou artísticas ou expressões do folclore”.
E prescreve que é direito do intérprete proibir a fixação de suas interpretações, a reprodução e execução pública delas, assim como a disposição de suas interpretações ao público.
Os direitos conexos surgiram quando a tecnologia possibilitou a fixação daquela interpretação, antes efémera, que desaparecia ao final da apresentação, tornando-a permanente e disponível todo tempo ao público. Baseiam-se no princípio que as obras não chegariam ao público sem a atuação do intérprete, que, portanto, deve ser protegido como o autor. E é esse princípio que a lei consagra – o intérprete necessariamente como uma pessoa natural que atuou na execução de determinada obra artística.
Porém, essa proteção ao intérprete no âmbito do direito autoral está circunscrita à atuação, digamos, física do intérprete naquela determinada peça, uma vez que, até pouco tempo atrás, o intérprete era fundamental em qualquer fonograma ou apresentação musical cantada. Esse era o cenário na época que a lei de direitos autorais foi gestada: não havia voz sem uma pessoa que a tivesse emitido, seja ao vivo, seja em gravações feitas anteriormente. Algo indissociável do seu titular era a voz.
Mas essa realidade mudou, e continua mudando, de forma drástica com a chegada da AI no mundo criativo da indústria musical. Hoje, a AI é capaz de aprender, com base em uma larguíssima quantidade de dados disponíveis na internet, nos mínimos detalhes, qualquer voz com extrema verossimilhança sob todos os aspectos, seja timbre, entonação, afinação, etc. A voz eletrônica é idêntica, ao menos para o público em geral, à voz do emissor. Assim, qualquer voz de qualquer pessoa pode entoar qualquer música a qualquer tempo, dissociando a voz de seu dono.
Desta forma, a lei de direitos autorais, isoladamente, não tem instrumentos mínimos para a proteção do intérprete que tem sua voz clonada – uma vez que simplesmente não existia e não estava no horizonte existir em 1998. Ou seja, à luz do direito autoral brasileiro, nada pode fazer o emissor reconhecido daquela voz, se quisesse, para impedir que sua voz cantasse essas canções ou que fosse financeiramente recompensado por sua utilização.
3. A VOZ E A TUTELA PELOS DIREITOS DE PERSONALIDADE
A voz é um dos principais atributos de identificação da pessoa humana. Sendo capaz de preencher ambientes, atravessar espaços minúsculos, frestas mínimas, a voz, muitas vezes, é a primeira forma de percepção da presença de alguém, antes mesmo da imagem física. Muitas vezes, a depender do receptor, a voz pode ser a única forma de reconhecer alguém. É neste sentido que se pode afirmar que a voz é a extensão sonora da personalidade humana (EDUARDO, 2015, p.1.920). Diversas são as vozes inesquecíveis que nos levam diretamente à imagem de seu emissor – cantores, atores, locutores, etc. Diversas também são as formas de exploração econômica da voz.
Tamanha a importância da voz na vida cotidiana e nas relações humanas, que o constituinte brasileiro trouxe sua proteção de forma expressa na carta, dentro do rol dos direitos fundamentais:
Art. 5º Todos são iguais perante a lei, sem distinção de qualquer natureza, garantindo-se aos brasileiros e aos estrangeiros residentes no País a inviolabilidade do direito à vida, à liberdade, à igualdade, à segurança e à propriedade, nos termos seguintes:
XXVIII – são assegurados, nos termos da lei:
a) a proteção às participações individuais em obras coletivas e à reprodução da imagem e voz humanas, inclusive nas atividades desportivas;
Sendo a tutela da voz um direito fundamental, é importante explorar a natureza desse bem jurídico – a voz – e as premissas e bases para tutelá-lo adequadamente.
Expressões da cláusula geral de tutela da pessoa humana, conforme Enunciado n. 274 CFJ/STJ4, os direitos de personalidade “têm por objeto os modos de ser, físicos ou morais do indivíduo e o que se busca proteger com eles são, exatamente, os atributos específicos da personalidade” (TARTUCE, 2019, p. 229). Mas quais atributos do indivíduo esses direitos de personalidade protegem? O próprio Tartuce (2019, p. 229) elenca alguns: vida e integridade físico-psíquica, nome da pessoa natural, imagem, honra e a inviolável intimidade.
Sendo esse rol, obviamente, informativo, o STJ já firmou tese que a voz humana, independentemente se como direito autônomo ou abarcada pelo direito de imagem, encontra tutela nos direitos da personalidade (STJ, 2019, p. 2). Ou seja, sendo direito autônomo ou integrante do direito de imagem, a voz é um dos atributos de reconhecimento do indivíduo frente a seus pares em sociedade, integrando, portanto, o campo de proteção dos direitos de personalidade. Neste sentido, é lógico que o preceito constitucional presente no inciso ‘a’ transcrito acima equipare à tutela da voz e da imagem, como expressamente o fez.
A citada tese do STJ, onde os julgados tratavam do uso comercial de gravação da voz, firma, ainda, que a disposição da voz é possível, desde que dentro de determinados limites e devidamente autorizada pelo titular – o dono da voz.
Porém, os direitos de personalidade devem ir tomando contornos diferentes, uma vez que cada vez mais, numa sociedade exibicionista e fortemente conectada às redes sociais, os aspectos da personalidade, especialmente os ligados à imagem, adquirem aspectos patrimoniais (EDUARDO, 2015, p.1.915-1.916).
3.1. O que é a voz
Não será escopo deste artigo trazer uma conceituação definitiva de voz. O dicionário on-line Houaiss5 traz que voz é “som musical produzido por vibrações das pregas vocais, no ser humano e em muitos mamíferos que também as possuem, e que é usado como meio de comunicação e expressão de emoções, no riso, no choro, na fala, no canto etc”.
A voz resulta da formação corpórea do indivíduo, da anatomia, e dessa forma é indissociável dele. Souza traz que a voz humana é resultado de complexo processo que envolve uma “combinação de múltiplos fatores anatômicos, psíquicos e socioeducacionais, a fala é veículo – embora não seja o único – de manifestação da pessoa, individualmente considerada; uma espécie de assinatura, impressão digital, particular portanto” (SOUZA, 2022, p. 69). É dessa complexa combinação de diversos parâmetros que nasce a singularidade da voz de cada pessoa humana. É essa singularidade que localiza a voz como atributo da própria imagem do indivíduo, ou seja, é um dos fatores de reconhecimento da pessoa frente à sociedade, integra, portanto, sua personalidade.
Se a voz já é indissociável do seu emissor, o canto, ou seja, a utilização musical dessa voz eleva essa conexão a outro patamar, uma vez que junto a essa voz há o raríssimo dom de cantar, além, claro, de anos de prática e estudo, ou seja, de trabalho intenso.
Segundo Pinto (2012, p.6) a voz cantada possui quatro principais parâmetros objetivos para sua caracterização – além das características mais gerais do som -, são eles: a frequência fundamental; as medidas de perturbação da frequência; medidas da perturbação da amplitude; e, as medidas de ruído.
Toda essa conceituação nos leva a concluir que não há voz sem um sujeito a quem ela pertença. É essa afirmação, aparentemente óbvia, que a AI tem colocado em suspeição quando se torna capaz de medir, aprender e reproduzir todos esses parâmetros mensuráveis da voz, criando assim vozes de extrema verossimilhança com as vozes naturais.
Sabendo que os atributos da voz clonada são também resultados de fisiologia e técnica do emissor original da voz, essa voz eletrônica permaneceria autônoma com relação ao emissor original? Ou restaria algum vínculo jurídico com o emissor original?
3.2. As diversas formas de emissão de voz
A tutela da voz no ordenamento jurídico nacional está encapsulada pela forma tradicional – natural, até – da emissão da voz. Ou seja, um indivíduo qualquer emitindo presencialmente a própria voz que pode vir a ser capturada por um equipamento e utilizada economicamente a qualquer tempo. Entretanto a emissão da voz, com a revolução que a AI vem trazendo, não se limita mais a essa forma.
Aliás, como já dito, a preocupação com a tutela da voz iniciou-se em decorrência de uma outra evolução tecnológica, quando a gravação da voz trouxe uma espécie de materialidade a aquele atributo antes totalmente efêmero. Uma vez a voz gravada (e transmitida) aquele bem passou a ter utilidade econômica e sua consequente exploração. Num passo evolutivo, agora mais largo, a voz além de material pode ser dissociada de qualquer emissor. Nesse sentido, as vozes utilizadas nas músicas podem ter conteúdo e origem diversas.
A primeira forma é quando a voz é emitida autenticamente por um indivíduo interpretando uma música, uma melodia. É sobre essa forma de voz gravada que se debruçou nosso ordenamento jurídico, em especial nos direitos conexos aos do autor. Essa limitação de tutela é compreensível uma vez que ao tempo da legislação era a única forma tecnicamente viável de gravação e posterior reprodução da voz.
Outra forma de emissão de voz são as vozes robóticas, emitidas através de sintetizadores ou equipamentos similares, mas que são facilmente reconhecíveis como tal, ou seja, não se relacionam diretamente com um emissor. Esse tipo de emissão, em si, não é relevante frente ao ordenamento jurídico uma vez que não há relação jurídica com qualquer pessoa.
Mais recentemente, a AI, trouxe a figura da clonagem da voz, ou seja, neste caso a voz apesar de emitida originalmente por uma máquina, não há uma gravação humana por trás, ela é idêntica à voz de um indivíduo, normalmente público. Assim, a emissão dessa voz por AI remete imediatamente a uma pessoa física – neste estudo, um cantor conhecido – trazendo à tona afetos e conflitos como se este cantor estivesse, ele mesmo, interpretando aquela peça artística – independentemente de sua vontade ou concessão.
É justamente essa ruptura entre o emissor e a voz emitida – aliada à rápida difusão que o meio virtual propicia – que ainda não foi tratada adequadamente pelo ordenamento jurídico nacional.
3.3. A voz clonada por AI e os direitos autorais
A lei de direitos autorais (Lei 9.610/98), no parágrafo segundo do seu art. 90, traz uma proteção, ainda que restrita, da voz associada às suas atuações. A lei tem como objeto principal de tutela obra artística, da criação do espírito, ou seja, a voz como coisa imaterial, sem uma obra artística correlata em que atue o intérprete, não é objeto de tutela do direito autoral nacional.
O Superior Tribunal de Justiça (STJ) já firmou entendimento que o artista intérprete tem direitos conexos aos do autor, mas, apesar de autônomos, esses direitos conexos são indissociáveis à uma determinada obra autoral, devendo sua existência à existência dessa obra (STJ RESp. 1.630.851/SP). Em outras palavras, o STJ firma a tese que a voz em si, sem uma conexão direta com uma obra artística que o intérprete a ser protegido tenha registrado (fixado em alguma mídia) não é objeto de proteção dos direitos autorais.
Outra forma de se observar a incidência dos direitos autorais, no âmbito musical, relaciona-se ao uso econômico de uma determinada interpretação feita por aquela pessoa – então, para haver sua incidência, deverá haver um intérprete a ser protegido.
Assim, o uso isolado da voz clonada, na forma como hoje rege a Lei dos Direitos Autorais, está fora do escopo da tutela desta lei.
3.4. A voz clonada por AI e os direitos de personalidade
É justamente no campo dos direitos da personalidade que esses novos desafios trazidos pela AI se mostram latentes, destacadamente na tutela da voz e da imagem. Atributos que há pouquíssimo tempo eram indissociáveis do titular (a imagem e a voz dependiam da captura da presença física do titular para existir), hoje já não o são. Imagens e vozes de extrema verossimilhança são geradas independente da presença ou emissão do dono daquela imagem e daquela voz. A voz, portanto, hoje, passa a ser autônoma, quase um objeto que se possa manusear de diversas formas. Mas algumas dessas vozes são – apesar de emitidas por uma máquina – de origem estritamente humana, uma vez que essas AIs têm a capacidade de aprender e imitá-las à perfeição.
Como já ressaltado anteriormente, os institutos jurídicos que hoje tutelam a voz estão embebidos da aplicação da voz que tínhamos há muito pouco tempo, quando necessariamente havia um emissor humano que poderia ou não autorizar o uso daquela voz em determinadas circunstâncias comerciais. Esse era, até então, o paradigma do uso da voz. Esse paradigma foi quebrado quando a voz reconhecidamente de alguém prescinde de seu emissor. Assim, permanece no rol dos direitos de personalidade a voz clonada por AI de um indivíduo reconhecível?
Num estudo ainda anterior às potencialidades da inteligência artificial aflorarem, Loureiro afirma que a imagem para o Direito não se trata apenas da percepção visual, mas irá incluir também a percepção sonora e também a dinâmica corporal daquele indivíduo (LOUREIRO, 2005, p. 50). Ou seja, a ciência do direito já discute a amplitude do direito da imagem, absorvendo diversas acepções do que seja imagem, incluindo, claro, a voz.
Por outro laudo, com a evolução tecnológica e as diversas possibilidades, sobretudo econômicas, da utilização da imagem, esse atributo antes extrapatrimonial, ganha forte conotação patrimonial, produtos que podem, ainda que de forma mais restrita, ser negociados pelo seu proprietário. E a voz, utilizada frequentemente em comerciais, também absorve esse caráter patrimonial. A utilização, por exemplo, da voz de alguém público pode incutir no produto anunciado, algum nível de confiança, ainda que subliminar, que uma voz desconhecida seria incapaz de fazer (EDUARDO, 2015, p.1.944).
Neste sentido, as representações da imagem do indivíduo também devem estar submetidas ao direito de imagem do titular e por consequência a sua autorização para uso, conforme Código Civil de 2002, em seu art. 20, que prevê que na ausência dessa autorização a exposição da imagem, portanto da voz como um atributo dela, poderá ser proibida.
Não resta dúvida, então, que a voz deve ser tutelada pelos direitos da personalidade, mas novamente a AI nos impõe reflexões que, em decorrência de sua novidade, ultrapassam a jurisprudência e o direito positivado. Alerta Souza (2022, p. 108), estudando a ressurreição digital através da voz, que esta situação posta pela AI tem levado juristas a buscar respostas satisfatórias para esses novos paradigmas.
Uma vez que a personalidade projetada é real, que o mundo virtual é verdadeiro, embora imaterial, essa projeção encontra-se desamparada e vulnerável (…) reafirma-se, pode ocorrer o desdobramento dessa personalidade e a formação de uma outra, muitas vezes sem que o próprio indivíduo tenha consciência dessa nova condição vulnerável a que está exposto (SIQUEIRA; MORAIS; TENA, 2022, p. 165).
Se os direitos da personalidade se relacionam com a identidade do indivíduo na sociedade e com a execução dessa voz pela AI nos faz reconhecê-lo, nos remetendo à sua imagem, então a execução dessa uma voz previamente aprendida por inteligência artificial é manifestação digital da personalidade humana, capaz de gerar afetividades em quem escuta. Essas afetividades, obviamente, não se relacionam com a máquina que a gerou, mas com o emissor original da voz aprendida. Se não fosse a voz de Liam – no caso da AIsis – a repercussão dessas músicas não seria tamanha, seria apenas mais uma banda imitando o estilo Oasis de compor. Porém, Liam optou por não mais gravar canções, não mais provocar essas afetividades que uma máquina através de sua voz, o força a se envolver novamente, trazendo incontestáveis e inexoráveis impactos na sua vida íntima.
Estando, portanto, dentro do escopo dos direitos da personalidade, deverá essa voz ser tutelada com os mecanismos que se relacionam com a tutela desses direitos. Godinho e Guerra elencam três linhas básicas de tutela desses direitos disponíveis no ordenamento jurídico: uma de caráter inibitório, cujo objetivo é evitar uma possível lesão ao direito, preventivo, portanto; uma outra busca a atenuação dos danos que já ocorreram com a violação indevida dos direitos, como a paralisação do uso e bloqueio do acesso; e, a última busca a responsabilização civil, pela via pecuniária, em razão dos danos ocorridos.
Em regra, no ordenamento nacional, o parâmetro fundamental é o consentimento, nos moldes do previsto nos arts. 12 e 20 do Código Civil brasileiro. Esse preceito é decorrência automática da natureza do direito da personalidade, uma vez que representam a pessoa, assim só esta tem o poder de autorizar sua utilização, independentemente se para fins comerciais ou não – poucas são as situações excepcionais que o uso da imagem prescinde de autorização. Sinal de mudança paradigmática ocorreu quando James Earl Jones, conhecido dublador de Darth Vader da franquia Star Wars cedeu os direitos de sua voz para ser gerada por AI, autorizando sua utilização nos próximos filmes da série. Neste acordo, reconhece portanto, que a voz, apesar de ser gerada por uma máquina, faz parte do patrimônio do seu emissor original.
Há, portanto, mecanismos de inibição e responsabilização civil quando a esfera dos direitos de personalidade é invadida. Porém, as disruptivas inovações que a AI traz na vida social, e suas consequências na individualidade, trazem vários e complexos desafios ao sistema jurídico nacional, não havendo ainda jurisprudência consolidada, nem mesmo doutrina suficiente para orientar os operadores do direito (menos ainda legislação adequada).
A tutela através dos direitos da personalidade é uma possibilidade ao indivíduo que se sente lesado pela utilização de sua voz ou de sua imagem criadas por AI, mas há ainda muito entendimento a se cristalizar.
3.5. A voz clonada e a responsabilidade civil
O art. 186 do Código Civil nacional define ato ilícito como a violação, por ação ou omissão, de um direito. O código também prevê que quem comete ato ilícito torna-se obrigado a reparar todos os danos advindos deste ato previamente praticado.
O ambiente virtual é o ambiente onde boa parte das relações humanas atualmente se desenrolam, inclusive, e sobretudo, os conflitos derivados dessas interações. Inicialmente espaço de liberdade irrestrita, espaço de recusa à intervenção estatal, com a migração das relações humanas para ele, houve a natural demanda pela, ainda que paulatina, presença estatal (COLOMBO; NETO, 2017, p. 220-221). Neste ambiente bens jurídicos fundamentais podem ser violados causando danos na vida física. Assim, apesar da virtualidade do ambiente, ele produz efeitos reais e relevantes à luz da ciência do direito, havendo assim a mesma incidência do direito nos fatos ocorridos em sua esfera.
Neste sentido prescreve o Marco Regulatório da Internet (lei 12.965/2014) quando em seu artigo 3º inciso VI prevê como princípio da disciplina da internet a responsabilização dos seus agentes nos termos da lei, não excluindo outras previsões legais do ordenamento pátrio (§1º).
Se atendo ao caso da utilização de voz clonada, que como já vimos está no escopo dos direitos de personalidade emissor original, sem a prévia autorização desse emissor, é possível perceber de imediato possibilidade de danos tanto na esfera moral (extrapatrimonial) quanto na esfera patrimonial, uma vez que vimos anteriormente que o atributo da voz, na sociedade atual, pode ter caráter fortemente patrimonial para quem a utiliza de forma profissional ou que ao menos lhe dá utilidade econômica.
Há de se destacar que no âmbito da responsabilidade civil, os provedores de aplicação (aqueles que oferecem funcionalidades aos usuários, como as redes sociais, os provedores de e-mail, etc) possuem responsabilidade solidária no caso de proliferação de uma possível música com voz clonada sem autorização. Já é o entendimento consolidado pelo STJ (COLOMBO, 2017, p. 228).
Assim, a responsabilização civil pode ser meio, ainda que para reparação, de proteção ao emissor original de uma voz reproduzida por AI sem autorização prévia.
4. A VOZ ELETRÔNICA E A TUTELA PELA CONCORRÊNCIA DESLEAL
Neste capítulo analisaremos com mais detalhe o caso específico da banda virtual AIsis, que utilizou-se da voz de Liam Gallagher, da banda Oasis, nas novas composições da banda num álbum que pretendeu ser o álbum que o Oasis faria se tivessem continuado. Todos os timbres, linhas melódicas e percussivas, assim como o estilo musical fazem lembrar o Oasis. A voz do próprio Liam gerada por AI fecha a ideia com maestria. Se as músicas tivessem sido interpretadas pelo cantor da banda Breezer provavelmente passariam despercebidas do grande público. Mas a voz de Liam Gallagher entoando aquelas notas e versos acionou afetividades de uma massa de fãs já constituída pela banda Oasis – e neste caso, uma massa sedenta pelo retorno da banda – e as músicas imediatamente ganharam notoriedade nas redes sociais.
Está claro que no âmbito puramente do direito autoral não haveria, aos olhos da legislação brasileira, nenhum ilícito em utilizar a voz emulada de Liam em composições que parecem do Oasis. Porém ao fazer isso a banda se utiliza de algo fundamental à uma banda de sucesso: uma massa constituída de fãs. Entretanto, essa massa de fãs não foi constituída pela banda Breezer, mas por outra banda, pelo trabalho de outras pessoas.
Posicionando a produção musical para além da criação de espírito, mas compondo uma verdadeira indústria do entretenimento, considerando a forma dessa apropriação dos fãs da banda Oasis, estaria a Breezer atuando de forma desleal quando traz o elemento voz que não lhes pertence para tocar afetivamente um público não constituído por eles?
À primeira vista, a percepção que o comportamento da banda fere o princípio da própria prestação (o uso do próprio esforço na disputa concorrencial) quando usa o subterfúgio do uso voz de uma voz conhecida para conquistar a massa de fãs, utilizando-se assim de prática concorrencial desleal.
Pela complexidade e variedade dos atos de comércio, assim como a rápida absorção das ferramentas digitais e novos paradigmas da sociedade informacional, a delimitação do que se configura como concorrência desleal tem se tornado mais sutil e difícil. Ascenção alerta que “a essência está nas situações em que alguém procura vencer no mercado, não pela sua própria contribuição, mas explorando as contribuições alheias” (ASCENÇÃO citado por JUNIOR, 2016, p. 62).
A disputa por uma determinada clientela é o cerne da concorrência. Porém essa disputa deve ser travada utilizando-se de ferramentas lícitas e leais. A convenção de Paris, em seu art. 10 bis, já expressava a preocupação com a concorrência desleal. Já a Lei da Propriedade Industrial (Lei 9.279/96) define a concorrência desleal através dos atos que ela computa como crimes em seu artigo 195.
Uma característica constante nos crimes contra a propriedade industrial é a intenção de confundir o cliente, utilizando-se dos atos tipificados em lei. Porém, ainda há a possibilidade de configuração de concorrência desleal com imitação não confusiva em casos específicos, já tipificados em legislação estrangeira, como a espanhola, quando, por exemplo, ocorre imitação de elementos não necessários ou quando a imitação procura prejudicar a fixação do concorrente no mercado (JÚNIOR, 2016,p. 66).
Um exemplo no mercado artístico: a série Dalva e Herivelton, sobre a vida de Dalva de Oliveira, quando as gravações originais feitas por Dalva precisaram ser mixadas com a voz de outra cantora, com timbre muito parecido – uma vez que as gravações originais estavam parcialmente danificadas – optou-se por não haver o lançamento comercial da trilha6 sonora, uma vez que essa levaria o público à confusão entre as intérpretes.
O caso da banda AIsis é bem diferente. A banda em nenhum momento toma a posição da Oasis, nem tenta, de qualquer forma, ludibriar os fãs como se fosse realmente Liam cantando, não se vende, portanto, como se Oasis fossem: “se não existe patente ou outro direito exclusivo – o réu pode copiar os bens do autor até o mínimo detalhe – mas não pode criar confusão na percepção do público quanto à origem dos bens” (O´CONNOR citado por BARBOSA, 2012, p. 23). O modo que buscaram o reconhecimento do público foi a capacidade de trazer a voz alheia através de AI, foi essa novidade que chamou a atenção e a curiosidade do público. E não um falso novo lançamento do Oasis: a novidade foi a novidade.
Ou seja, não há, numa análise mais apurada, desrespeito ao princípio da própria prestação, uma vez que houve empreendimento e esforço próprios no desenvolvimento dessa voz em AI, não caracterizando ato de concorrência desleal.
Indo além, cabe discutir se o produto artístico se insere na mesma lógica concorrencial do produto comercial material, ou seja, a lógica da substituição (quando se deixa de comprar um produto para comprar outro que o substitua).
Há concorrência quando agentes econômicos disputam um determinado nicho de mercado em que os bens podem ser, para o uso do consumidor, substituídos entre si (BARBOSA, 2012, p. 22). Entretanto os bens culturais, em particular as músicas – imateriais e únicas -, não aderem a lógica da substituição – não se deixa de escutar uma música porque escutou outra. Não raro o efeito é justamente o inverso, o de multiplicação, um determinado produto cultural que obteve o reconhecimento lança luz no conjunto de obras de estilo e estética parecida ou relacionada, multiplicando a quantidade de obras e formando público que as aprecie.
Portanto, se não há no mercado cultural a tradicional forma de concorrência pela substituição, ou seja, não há uma concorrência nos moldes tradicionais. Não havendo concorrência não há o que se falar em deslealdade.
Isso não exclui, por certo, a proteção que deve receber o consumidor nos casos em que haja uma intenção (ou uma possibilidade) de causar confusão, como o caso da minissérie citada acima. Mas como dito, a proteção nesse caso não é da voz clonada em si, mas a proteção da relação de consumo, do direito à informação e da presunção de confiança que o consumidor deve depositar no fornecedor.
5. CONCLUSÃO
Os novos dilemas e inovações que a AI vem trazendo no dia a dia da sociedade informacional trazem desafios ao Direito e à sua aplicação na proteção de bens jurídicos relevantes nas relações sociais. O uso de uma voz gerada por AI, mas idêntica à de um indivíduo conhecido, em obras inéditas, desafia a tutela do dono da voz, que, de uma forma ou de outra, é afetado pela exploração comercial de sua voz, ainda que não emitida diretamente por ele.
O artigo demonstrou que a legislação vigente atualmente no âmbito do direito autoral e da propriedade intelectual não dispõe de ferramentas suficientes para enfrentar esses novos paradigmas que a AI nos traz. Através das pesquisas relacionadas no artigo, conclui-se que a voz clonada, ou seja, a voz humana, a natural, que foi aprendida, não possui amparo protetivo na lei de direitos autorais, uma vez que essa lei tem como objeto de tutela, no âmbito dos direitos conexos, a interpretação realizada pelo intérprete pessoalmente. Essa situação disruptiva, da clonagem de voz, não foi abarcada – e não tinha como ser – pela lei dos direitos autorais. Ou seja, faz-se necessária atualização legislativa capaz de lidar com as nuances dessa nova sociedade informacional movida à AI.
Demonstrou-se ainda que não há requisitos mínimos, no caso específico da banda Brezzer e seu álbum AIsis, para que se configure a situação como concorrência desleal: primeiro porque a banda não induziu a confusão de identidade entre ela e a Oasis no ouvinte; depois porque a lógica concorrencial de substituição dos bens materiais não se aplica diretamente aos bens culturais imateriais. Isso, por si, não exclui a possibilidade, em outros casos, de atribuir-se uma concorrência desleal, mas a tutela em si não seria da voz clonada, mas dos consumidores que, porventura, tenham sido levados à confusão com a utilização da voz clonada.
Por fim, demonstrou-se que no ordenamento jurídico brasileiro a voz encontra tutela como direito de personalidade, podendo o titular dispor economicamente dentro de certos limites. Arguiu-se ainda que, mesmo tendo sido a voz emitida por uma máquina, ela ainda assim tem um titular, um dono, aquele cuja voz foi aprendida pela AI. Assim, a voz pertence ao acervo de direitos de personalidade desse emissor original, devendo, portanto, ser tutelada, de forma idêntica à imagem, por exemplo – onde o pressuposto fundamental de utilização seja o consentimento.
Neste sentido, a responsabilização civil torna-se ferramenta fundamental nos possíveis danos – patrimoniais, uma vez que a voz é também produto, e extrapatrimoniais – causados pela utilização da voz clonada sem a devida autorização.
Ao fim, fica claro que o legislador deve enfrentar os paradigmas trazidos pela utilização da AI, uma vez que esta tem adentrado profundamente nas relações humanas, gerado conflitos e afetado direitos individuais de forma relevante.
1https://www.axios.com/2023/04/19/ai-fake-drake-weeknd-song-streaming-services-removed
2https://www.forbes.com/sites/antoniopequenoiv/2023/06/12/grimes-helps-artists-distribute-songs- using-her-ai-voice–if-they-pay-royalties-heres-how-it-works/?sh=4afedda949ae
4Os direitos da personalidade, regulados de maneira não exaustiva pelo Código Civil, são expressões da cláusula geral de tutela da pessoa humana, contida no art. 1.º, III, da Constituição Federal (princípio da dignidade da pessoa humana).
5www.houaiss.uol.com.br
6https://www.estadao.com.br/cultura/globo-desiste-de-lancar-trilha-sonora-de-minisserie
6. REFERÊNCIAS BIBLIOGRÁFICAS
BARBOSA, Denis Borges. A Concorrência Desleal e sua Vertente Parasitária. Revista da ABPI – nº 116 – Jan/Fev 2012. Disponível em <https://www.dbba.com.br/wp-content/ uploads/concorrencia_desleal_vertente_parasitaria.pdf> Acesso em 22 set 2023.
COLOMBO, Cristiano; NETO, Eugênio Facchini. Ciberespaço e conteúdo ofensivo gerado por terceiros: a proteção dos direitos de personalidade e a responsabilização civil dos provedores de aplicação, à luz da jurisprudência do Superior Tribunal de Justiça. Revista Brasileira de Políticas Públicas, v. 7, n. 3, p. 217-237, 2017. Disponível em <https://www.publicacoes.uniceub.br/RBPP/issue/view/292 > Acesso em 22 mar 2024.
EDUARDO, Thales José Pitombeira. O conteúdo patrimonial do direito à voz no contexto da proteção da personalidade. Revista Jurídica Luso-Brasileira, Lisboa, n. 1, p. 1911-1958, 2015. Disponível em: <http://cidp.pt/revistas/rjlb/rjlb-2015-01> Acesso em 19 mar 2024.
JÚNIOR, José Roberto de Almeida. Concorrência desleal: atos de imitação não confusivos. Revista de Direito, Inovação, Propriedade Intelectual e Concorrência, v. 2, n. 1, p. 59 – 76, Jan/Jun. 2016. Disponível em <https://www.indexlaw.org/index.php/revistadipic/ article /view/920> Acesso em 17 set 2023.
LOUREIRO, Henrique Vergueiro. Direito à imagem. Dissertação (Mestrado em Direito) – Pontifícia Universidade de São Paulo. São Paulo, 2005.
PINTO, António Miguel Teixeira Marques. A Voz Cantada: Estudo Temático e sua Repercussão Artística. Mestrado Integrado em Medicina. Universidade do Porto, 2012. Disponível em < https://repositorio-aberto.up.pt/bitstream/10216/71904/2/29306.pdf > Acesso em 24 mai 2023.
SIQUEIRA, Dirceu Pereira. MORAIS, Fausto Santos. TENA, Lucimara Plaza. Voz reproduzida por IA acelera reflexões sobre a necessidade da proteção da personalidade em ambiente virtual. Direito e Desenvolvimento, João Pessoa, v. 13, n. 2, p. 155-169, jul./dez. 2022. Disponível em <https://periodicos.unipe.br/index.php/direitoedesenvolvimento /article /download/1481/799/> Acesso em 29 set 2023.
SOUZA, Gabriele Aparecida de Souza e. ‘‘Quando eu soltar a minha voz por favor entenda que palavra por palavra eis aqui uma pessoa se entregando’’: da ressurreição digital da personalidade humana e a tutela póstuma da voz sob o prisma do direito à privacidade. Dissertação de Mestrado. Universidade Federal de Santa Catarina, Florianópolis, 2022. Disponível em < https://repositorio.ufsc.br/ bitstream/handle/123456789/243729/ PDPC1634-D.pdf? sequence=1 &isAllowed=y > Acesso em 24 mai 2023.
SUPERIOR TRIBUNAL DE JUSTIÇA. Dos Direitos da Personalidade II. Jurisprudência em Teses ed. 138. Brasília, 2019. Disponível em < https://www.stj.jus.br/publicacaoinstitucional/ index.php/JuriTeses/article/view/11398/11527 > Acesso em 24 mai 2023.
TARTUCE, Flávio. Direito Civil – Lei de Introdução e Parte Geral, 15a ed. Rio de Janeiro, Forense, 2019.
1Discente em Direito pela Universidade Federal do Rio Grande do Norte.
2Professora Doutora da Universidade Federal do Rio Grande do Norte.