REGISTRO DOI: 10.69849/revistaft/pa10202505251658
Manoela Volpon Barci 1
Ana Laura Posata 2
RESUMO
O presente estudo tem como objetivo geral analisar os impactos da utilização da voz de dubladores por ferramentas de inteligência artificial (IA) sem a devida autorização, discutindo as implicações legais, éticas e profissionais dessa prática. Como objetivos específicos, busca-se: investigar os mecanismos tecnológicos que permitem a reprodução de vozes por meio de IA; identificar os aspectos éticos da relação da IA com a dublagem; analisar a legislação vigente no Brasil e em outros países sobre direitos de voz e imagem. A questão norteadora do estudo é: Quais são os impactos jurídicos, éticos e profissionais do uso não autorizado da voz de dubladores por sistemas de inteligência artificial? A hipótese levantada é que a ausência de regulamentação específica permite a violação dos direitos de propriedade vocal dos dubladores, comprometendo suas condições de trabalho e abrindo precedentes para usos abusivos de sua identidade sonora. A justificativa da pesquisa reside na crescente adoção de tecnologias de IA no mercado audiovisual e na urgência de discutir a proteção dos profissionais da voz frente às novas formas de reprodução digital. A metodologia utilizada será de caráter qualitativo, com revisão bibliográfica e documental, utilizando artigos acadêmicos retirados da base de dados do Google Acadêmico e Scielo. A conclusão aponta que, embora a IA represente avanços significativos para a indústria do entretenimento, seu uso sem o consentimento dos dubladores caracteriza uma violação de direitos fundamentais, exigindo a criação de políticas públicas e regulamentações específicas para garantir a proteção da identidade vocal como um bem jurídico tutelável. A valorização e a preservação do trabalho humano na era da inteligência artificial são essenciais para assegurar a justiça e a equidade nas relações profissionais e contratuais.
Palavras-chave: Direitos autorais. Dubladores. Ética. Inteligência artificial. Voz.
ABSTRACT
The present study aims to analyze the impacts of using voice actors’ voices by artificial intelligence (AI) tools without proper authorization, discussing the legal, ethical, and professional implications of this practice. The specific objectives are: to investigate the technological mechanisms that enable voice reproduction through AI; to identify the ethical aspects of the relationship between AI and dubbing; and to analyze the current legislation in Brazil and other countries regarding voice and image rights. The guiding question of the study is: What are the legal, ethical, and professional impacts of the unauthorized use of voice actors’ voices by artificial intelligence systems? The hypothesis proposed is that the absence of specific regulation allows the violation of voice property rights of dubbing professionals, compromising their working conditions and opening precedents for abusive uses of their vocal identity. The justification for this research lies in the growing adoption of AI technologies in the audiovisual market and the urgency of discussing the protection of voice professionals in light of new forms of digital reproduction. The methodology adopted is qualitative in nature, involving bibliographic and documentary review, using academic articles sourced from Google Scholar and SciELO databases. The conclusion points out that although AI represents significant advances for the entertainment industry, its use without the consent of voice actors constitutes a violation of fundamental rights, demanding the creation of public policies and specific regulations to ensure the protection of vocal identity as a legally safeguarded asset. Valuing and preserving human labor in the age of artificial intelligence is essential to ensure justice and equity in professional and contractual relationships.
Keywords: Copyright. Voice actors. Ethics. Artificial Intelligence. Voice.
1. INTRODUÇÃO
O desenvolvimento de tecnologias baseadas em inteligência artificial voltadas à reprodução sintética da voz humana tem redefinido as dinâmicas comunicacionais mediadas por máquinas. Atualmente, os sistemas de síntese vocal alcançam altos níveis de fidelidade acústica e prosódica, aproximando-se cada vez mais da fala natural. Essa evolução resulta da aplicação de modelos avançados de redes neurais profundas no campo do processamento de linguagem natural, o que tem permitido a incorporação dessas vozes artificiais em diversas soluções tecnológicas, como agentes conversacionais, softwares de acessibilidade e interfaces embarcadas em veículos inteligentes (Hu et al., 2023).
A aplicação de inteligência artificial na síntese vocal está diretamente relacionada à necessidade de tornar a interação entre seres humanos e sistemas computacionais mais fluida e orgânica. Com o crescente protagonismo de tecnologias inteligentes em contextos domésticos, profissionais e de mobilidade, há uma demanda cada vez maior por interfaces que simulem a comunicação humana de forma eficiente. A capacidade da IA de interpretar e reproduzir a linguagem falada com elevado grau de naturalidade contribui para o aprimoramento da experiência do usuário, possibilitando interações mais dinâmicas, acessíveis e contextualizadas (Sahu et al., 2022).
A tecnologia de síntese vocal baseada em inteligência artificial tem se mostrado um recurso estratégico para promover a acessibilidade comunicacional e a inclusão digital de grupos historicamente marginalizados no acesso às tecnologias da informação. Indivíduos com deficiência visual, dislexia ou outras barreiras relacionadas à leitura se beneficiam diretamente de interfaces auditivas capazes de converter texto em fala com entonação e clareza próximas à linguagem humana natural. Dessa forma, a IA contribui para a democratização do conhecimento e para o fortalecimento da autonomia desses usuários em ambientes digitais diversos (Guha et al., 2023).
No campo da mídia e do entretenimento, a incorporação da inteligência artificial à geração de vozes tem ampliado significativamente os horizontes criativos na construção de experiências narrativas. A possibilidade de sintetizar vozes com características humanas verossímeis oferece aos produtores de conteúdo ferramentas inovadoras para a criação de personagens digitais e para a adaptação linguística em obras audiovisuais. Esse avanço técnico facilita não apenas o processo de dublagem em múltiplos idiomas, como também promove a personalização de experiências sonoras, contribuindo para a internacionalização de produções culturais e a diversificação de estilos expressivos no audiovisual (Kaloudi & Li, 2020).
Com o avanço das tecnologias de inteligência artificial (IA), tornou-se possível replicar vozes humanas com impressionante fidelidade, por meio de ferramentas de clonagem vocal e síntese de fala. Essa inovação, embora represente um marco no campo da automação e da criação digital, tem gerado sérias preocupações no setor de dublagem, especialmente no que diz respeito à utilização não autorizada da voz de profissionais. Nesse contexto, este trabalho propõe uma reflexão crítica sobre os impactos jurídicos, éticos e profissionais relacionados ao uso indevido da voz de dubladores por meio de IA.
O objetivo geral deste estudo é analisar os efeitos da utilização da voz de dubladores sem autorização por ferramentas de IA abordando as implicações legais e a necessidade de regulamentação. Entre os objetivos específicos, destacam-se: investigar como funcionam os sistemas de IA que replicam vozes humanas; identificar os aspectos éticos da relação da IA com a dublagem; examinar a legislação brasileira e internacional aplicável à proteção da voz como direito autoral e de personalidade.
A questão norteadora que orienta esta pesquisa é: Quais são os impactos jurídicos, éticos e profissionais do uso não autorizado da voz de dubladores por sistemas de inteligência artificial? A hipótese que se levanta é que a ausência de normas específicas sobre o uso da voz por IA permite a exploração indevida do trabalho dos dubladores, comprometendo sua autonomia e seus direitos autorais e de imagem.
Justifica-se a escolha do tema pela crescente utilização de tecnologias de inteligência artificial na reprodução de vozes humanas, especialmente no setor audiovisual, tem provocado intensos debates sobre os limites éticos e legais dessa prática. Dentre os profissionais diretamente impactados, os dubladores figuram como uma das categorias mais vulneráveis, uma vez que sua principal ferramenta de trabalho – a voz – pode ser replicada e utilizada sem consentimento, resultando em prejuízos à sua autonomia, identidade e remuneração. A ausência de regulamentação específica sobre o uso de vozes por IA agrava ainda mais esse cenário, possibilitando práticas abusivas e ameaçando direitos de personalidade e autorais.
2. REFERENCIAL TEÓRICO
2.1 Mecanismos Tecnológicos de Clonagem Vocal por Inteligência Artificial
A reprodução artificial da voz humana tem avançado significativamente com o desenvolvimento de sistemas de síntese de voz baseados em inteligência artificial, especialmente os que utilizam redes neurais profundas. Dentre esses, destaca-se o modelo WaveNet, proposto pela DeepMind, que utiliza redes neurais convolucionais para gerar formas de onda de fala de maneira auto regressiva. Esse modelo revolucionou a síntese de voz ao produzir resultados significativamente mais naturais do que os métodos tradicionais de concatenação ou formantes. De acordo com Oord et al. (2016), o WaveNet consegue capturar as nuances prosódicas e temporais da fala, aproximando-se da naturalidade da voz humana real.
Outro avanço expressivo na clonagem vocal é representado pelo sistema Tacotron 2, desenvolvido pelo Google, que combina redes recorrentes com espectrogramas de Mel para gerar fala com elevada fidelidade. Esse sistema é capaz de converter texto em fala com entonação, pausas e variações tonais semelhantes às produzidas por humanos, o que amplia significativamente seu uso em assistentes virtuais, audiolivros e, mais recentemente, em dublagens automatizadas. Conforme demonstrado por Shen et al. (2018), o Tacotron 2, quando combinado com o WaveNet como vocoder, gera áudios que muitos ouvintes consideram indistinguíveis da voz natural, o que levanta debates sobre autenticidade, autoria e uso não autorizado da voz.
Além desses modelos, pesquisas recentes exploram a síntese zero-shot de voz, como no modelo YourTTS, que permite a clonagem vocal de um indivíduo com apenas uma amostra mínima de áudio, sem necessidade de reentreinamento do sistema. Segundo Casanova et al. (2022), o YourTTS é capaz de generalizar para novas vozes e novos idiomas a partir de poucos segundos de gravação, representando um salto tecnológico que reduz drasticamente as barreiras técnicas para replicar a identidade vocal de uma pessoa. Essa capacidade técnica, embora promissora para acessibilidade e inclusão digital, levanta preocupações sérias quanto à integridade da identidade vocal e à necessidade de proteção legal contra usos indevidos.
Também se destaca o modelo VALL-E, desenvolvido pela Microsoft, que propõe uma abordagem baseada em codificação neural para síntese de fala condicional, conseguindo preservar características emocionais, timbre e prosódia com fidelidade a partir de apenas três segundos de voz original. Segundo Wang et al. (2023), o VALL-E representa um novo paradigma na síntese de voz ao utilizar representações discretas e transformadores, permitindo uma reprodução vocal altamente personalizada e indistinguível da voz original. O uso dessa tecnologia sem autorização prévia representa risco substancial à proteção de dados biométricos vocais, categoria incluída entre os dados sensíveis pela legislação de proteção de dados como a LGPD brasileira e o GDPR europeu.
A evolução dessas tecnologias insere-se em um contexto mais amplo de debates sobre a ética da inteligência artificial, especialmente no que tange à identidade e à autoria. A clonagem vocal, ao replicar de forma verossímil a voz de uma pessoa, interfere diretamente em sua representação social, sua profissão e sua privacidade. Como advertem Matassoni et al. (2024), o uso indiscriminado dessas ferramentas pode comprometer não apenas a segurança informacional, mas também os direitos de personalidade, uma vez que a voz é elemento singular da identidade humana. Assim, o uso desses mecanismos tecnológicos exige o estabelecimento de limites legais e diretrizes éticas claras que assegurem a transparência, o consentimento e a justa remuneração dos indivíduos cujas vozes são reproduzidas por máquinas.
2.2 Dublagem e IA: aspectos profissionais e éticos
A expansão dos recursos proporcionados pela inteligência artificial tem impactado de forma expressiva a indústria audiovisual, especialmente no que se refere às práticas de dublagem. Tradicionalmente, esse processo exige a atuação de profissionais especializados que, por meio de sua interpretação vocal, adaptam o conteúdo original para diferentes línguas e contextos culturais, assegurando não apenas a tradução, mas também a preservação da expressividade e da intenção narrativa. No entanto, o avanço de sistemas de IA capazes de realizar síntese de voz com elevado grau de naturalidade e precisão sincronizada tem promovido transformações estruturais nesse segmento. Tais tecnologias propõem uma reconfiguração dos métodos convencionais de dublagem, oferecendo soluções automatizadas com potencial para reduzir custos e acelerar a produção, embora também suscitem debates éticos e profissionais significativos (Chiaro, 2021).
Segundo a concepção apresentada por Mark Coeckelbergh (2023), a Inteligência Artificial:
“A IA pode ser definida como inteligência exibida ou simulada por código (algoritmos) ou máquinas. Essa definição levanta a questão de como definir inteligência. Filosoficamente falando, é um conceito vago. (…) A IA pode ser definida tanto como ciência quanto como tecnologia. Seu objetivo pode ser uma melhor explicação científica da inteligência e das funções cognitivas mencionadas. Pode nos ajudar a entender melhor os seres humanos e outros seres que possuem inteligência natural. (…), mas a IA também pode ter como objetivo desenvolver tecnologias para diversos propósitos práticos, “para fazer coisas úteis” como Boden coloca: pode assumir a forma de ferramentas, projetadas por seres humanos, que criam a aparência de inteligência e comportamento inteligente para propósitos práticos” (Mark Coeckelbergh, 2023, p. 25).
A introdução da inteligência artificial nos processos de dublagem tem promovido uma série de transformações na dinâmica de produção e circulação de conteúdos audiovisuais. Entre os principais impactos observam-se a possibilidade de gerar locuções em múltiplos idiomas com maior agilidade, a diminuição de custos operacionais e a ampliação do alcance internacional das obras. Essas inovações tendem a remodelar significativamente os modelos tradicionais de criação e consumo de mídia. Entretanto, Neves (2020) aponta que o fascínio social por tais tecnologias pode ser acompanhado de uma tendência à antropomorfização das máquinas, o que compromete a compreensão crítica sobre seus limites e implicações. Essa percepção exageradamente humanizada das IAs pode gerar expectativas equivocadas e dificultar o debate sobre suas consequências éticas e profissionais.
A progressiva adoção de vozes sintéticas, geradas por inteligência artificial, em substituição às vozes humanas naturais, suscita relevantes debates de ordem ética e profissional. Um dos principais pontos de tensão reside na noção de autenticidade, já que, embora os sistemas de síntese vocal tenham alcançado impressionantes níveis de realismo, eles permanecem desprovidos da intencionalidade subjetiva e da expressividade emocional que caracterizam a fala humana. Esse distanciamento entre a performance artificial e a vivência do locutor levanta questionamentos sobre a legitimidade da substituição de profissionais da voz, como dubladores e locutores, por sistemas automatizados. Além disso, emerge uma preocupação crescente com o controle e a autorização do uso de vozes pessoais digitalizadas, o que exige marcos regulatórios mais claros e mecanismos que assegurem o respeito aos direitos de personalidade e à integridade profissional dos envolvidos.
A voz humana representa muito mais do que a mera articulação verbal; ela é um veículo complexo de emoções, memória cultural e identidade individual. Portanto, a substituição dessa voz por versões sintetizadas, especialmente em contextos como narrações documentais ou comerciais, pode resultar na diluição da autenticidade e na perda da carga afetiva inerente à comunicação humana. Essa transformação potencialmente reduz a profundidade da conexão emocional estabelecida entre o emissor e o receptor, evidenciando limitações importantes das tecnologias de síntese vocal frente à riqueza expressiva da voz natural.
Valenzuela et al. (2024) argumentam que, embora as tecnologias de inteligência artificial tenham avançado consideravelmente na reprodução da fala, elas ainda permanecem incapazes de capturar a complexidade da experiência humana expressa através da voz, especialmente no que tange aos aspectos culturais e emocionais. Mesmo que as vozes geradas artificialmente alcancem elevados níveis de clareza e precisão fonética, elas não conseguem incorporar a profundidade afetiva e simbólica que permeia a comunicação humana autêntica. Consequentemente, a adoção extensiva dessas vozes sintetizadas pode promover uma despersonalização na interação comunicativa, estabelecendo uma barreira emocional entre os interlocutores e enfraquecendo a dimensão relacional do discurso.
Um dos desafios éticos mais prementes reside nas implicações da inteligência artificial para os profissionais cuja atuação está intrinsecamente ligada ao uso da voz, incluindo locutores, dubladores, narradores, bem como docentes e palestrantes. Com o avanço das tecnologias capazes de gerar vozes sintéticas altamente realistas, surge uma ameaça concreta à sustentabilidade dessas carreiras, uma vez que tais sistemas podem ser adotados para substituir a mão de obra humana em diversas áreas. No âmbito da publicidade e do entretenimento, já se observa a utilização crescente dessas vozes artificiais em substituição aos profissionais tradicionais, provocando apreensão quanto ao impacto no mercado de trabalho. Conforme evidenciado por He et al. (2022), “a expansão do uso de vozes sintéticas em produções audiovisuais tende a diminuir substancialmente a necessidade de locutores e dubladores humanos, especialmente em segmentos que priorizam a automação e a contenção de despesas”.
No campo jurídico e regulatório, uma das questões éticas centrais refere-se ao consentimento e à titularidade dos direitos sobre vozes sintetizadas. A reprodução digital da voz humana, quando realizada a partir de gravações originais, provoca debates acerca da quem possui o direito legítimo de autorizar e controlar seu uso. Um exemplo emblemático desse impasse foi a utilização da voz e imagem da cantora Elis Regina em uma campanha publicitária da Volkswagen para celebrar o 70º aniversário da empresa, ocorrida em julho. A recriação da artista falecida por meio de inteligência artificial suscitou controvérsias significativas, evidenciando lacunas na legislação vigente e ressaltando a urgência de estabelecer normas que assegurem a proteção da identidade vocal e os direitos patrimoniais e morais dos indivíduos, mesmo após seu falecimento.
No contexto da inteligência artificial, a reprodução de vozes humanas a partir de amostras gravadas sem a obtenção de consentimento explícito configura uma grave transgressão ética e jurídica relacionada aos direitos de personalidade. Conforme destacam Ouchchy, Coin e Dubljević (2020), essa prática implica na apropriação indevida da identidade vocal do indivíduo, afetando sua integridade moral e patrimonial. A complexidade do tema se intensifica em casos de utilização pós-morte, como exemplificado pela controvérsia envolvendo a recriação digital da voz da cantora Elis Regina para fins comerciais, sem que seus herdeiros legais tivessem sido previamente informados ou autorizassem tal uso, o que evidencia a necessidade urgente de regulamentações específicas para proteger direitos após o falecimento.
2.3 A Voz como Expressão da Personalidade: Aspectos Jurídicos de sua Proteção
A voz constitui um elemento central da identidade individual, sendo frequentemente o primeiro sinal perceptível da presença de uma pessoa em um ambiente, mesmo antes de sua imagem física ser visualizada. Sua capacidade de atravessar barreiras físicas e de evocar reconhecimento imediato confere-lhe um papel singular na comunicação humana. Para determinados receptores, especialmente em contextos sensoriais específicos, a voz pode representar o único recurso de identificação pessoal. Nesse sentido, pode-se compreendê-la como uma projeção sonora da subjetividade e da personalidade humana (Eduardo, 2015, p. 1920). Vozerios emblemáticos – de cantores, atores, radialistas, entre outros – permanecem indissociáveis das figuras que os emitem, o que demonstra a potência da voz como marca individual. Não por acaso, a voz também se tornou um bem passível de exploração econômica, sendo amplamente utilizada em contextos publicitários, artísticos e institucionais.
Dada a relevância da voz como elemento constitutivo da identidade e das interações sociais, o legislador constituinte brasileiro reconheceu sua proteção no âmbito dos direitos fundamentais, conferindo-lhe status jurídico expresso na Constituição Federal. Tal reconhecimento reforça a compreensão da voz não apenas como um meio de comunicação, mas como uma manifestação da dignidade da pessoa humana, merecedora de tutela jurídica específica frente a usos indevidos ou não consentidos.
Art. 5º Todos são iguais perante a lei, sem distinção de qualquer natureza, garantindo-se aos brasileiros e aos estrangeiros residentes no País a inviolabilidade do direito à vida, à liberdade, à igualdade, à segurança e à propriedade, nos termos seguintes:
XXVIII – são assegurados, nos termos da lei:
a) a proteção às participações individuais em obras coletivas e à reprodução da imagem e voz humanas, inclusive nas atividades desportivas;
Considerando-se que a proteção da voz integra o conjunto de direitos fundamentais, torna-se essencial compreender sua natureza jurídica e os fundamentos que justificam sua tutela. A voz, enquanto expressão singular da personalidade humana, insere-se no escopo dos direitos da personalidade, os quais visam salvaguardar os aspectos físicos e morais inerentes ao indivíduo. De acordo com o Enunciado n. º 274 da IV Jornada de Direito Civil do CJF/STJ, tais direitos têm como objeto os modos de ser do sujeito, protegendo os atributos que compõem sua identidade pessoal. Nesse contexto, a preservação da voz transcende sua função comunicativa, assumindo um papel relevante na garantia da dignidade e da autonomia individual (Tartuce, 2019, p. 229).
É pertinente indagar quais aspectos da individualidade são resguardados pelos direitos da personalidade. Segundo Tartuce (2019, p. 229), tais direitos abrangem bens jurídicos como a vida, a integridade física e psíquica, o nome, a imagem, a honra e a intimidade, sendo esse elenco meramente exemplificativo. Em consonância com essa visão, o Superior Tribunal de Justiça (STJ) já consolidou entendimento no sentido de que a voz humana, seja considerada como direito autônomo ou inserida na proteção conferida ao direito à imagem, está contemplada no âmbito dos direitos da personalidade (STJ, 2019, p. 2). Isso significa que a voz, enquanto elemento identificador e singularizador do sujeito perante o corpo social, goza da proteção jurídica assegurada a bens personalíssimos. Tal compreensão é coerente com os princípios constitucionais que reconhecem, de forma expressa, a inviolabilidade da imagem e da voz, reafirmando a sua equivalência no contexto das garantias fundamentais.
A jurisprudência consolidada pelo Superior Tribunal de Justiça (STJ), ao analisar casos envolvendo o uso comercial de gravações vocais, estabelece que a utilização da voz de um indivíduo é juridicamente admissível, desde que haja autorização expressa do titular e que tal uso se mantenha dentro de limites previamente definidos. Contudo, é importante reconhecer que os direitos da personalidade, tradicionalmente considerados inalienáveis e extrapatrimoniais, vêm assumindo novas configurações diante do contexto contemporâneo. Em uma sociedade marcada pela hiperexposição e pela constante circulação de conteúdos nas redes sociais, atributos como a imagem e a voz passam a ser percebidos também sob uma perspectiva econômica, adquirindo valor comercial e potencial de exploração mercadológica. Nesse sentido, como observa Eduardo (2015, p. 1915–1916), há uma crescente patrimonialização de certos aspectos da personalidade, exigindo uma reinterpretação dos limites entre o direito à identidade pessoal e os interesses econômicos associados à sua representação.
2.4 A Dublagem e os Riscos do Uso Indevido por Inteligência Artificial
O uso não autorizado da voz de dubladores por sistemas de inteligência artificial (IA) levanta sérias implicações jurídicas, éticas e profissionais, exigindo uma análise multidisciplinar diante do avanço das tecnologias de clonagem vocal. Juridicamente, essa prática pode configurar violação de direitos autorais e de personalidade, especialmente o direito à imagem e à voz, que são protegidos pela Constituição Federal de 1988 (art. 5º, incisos V e X) e pelo Código Civil (arts. 11 a 21). A voz, assim como imagem, integra o rol de atributos da personalidade, sendo sua reprodução não autorizada passível de indenização por danos morais e materiais. Conforme observa Filho (2018), a utilização de IA para replicar vozes sem consentimento infringe diretamente o direito ao controle sobre os próprios atributos identitários, o que coloca em xeque os fundamentos do direito civil e da proteção à dignidade da pessoa humana.
Do ponto de vista ético, o uso não autorizado de vozes por IA compromete os princípios da autonomia e do consentimento informado. A ética profissional na dublagem envolve o respeito à integridade da atuação vocal, que é fruto de um trabalho artístico e interpretativo. A apropriação indevida da voz de um profissional por meio de IA não apenas desvaloriza seu trabalho como também rompe com o princípio da autoria e da autenticidade artística. De acordo com Floridi et al. (2018), sistemas de IA devem ser desenvolvidos e utilizados de forma ética, respeitando os direitos dos indivíduos e prevenindo formas de exploração, o que inclui o uso indevido de dados biométricos, como a voz.
No campo profissional, a reprodução automatizada de vozes por IA pode gerar consequências graves para o mercado de trabalho dos dubladores. A substituição de profissionais por tecnologias que imitam suas vozes ameaça não apenas a manutenção de postos de trabalho, mas também a valorização da interpretação humana, que carrega nuances emocionais e contextuais que ainda não são plenamente reproduzidas pelas máquinas. Segundo Arruda e Alves (2024), a crescente adoção de IA na indústria audiovisual demanda a criação de políticas públicas e normativas específicas que garantam a proteção dos profissionais da voz, resguardando seus direitos e reconhecendo seu papel insubstituível no processo criativo.
Além das questões já abordadas, o uso indevido da voz de dubladores por IA também suscita debates no campo dos direitos trabalhistas e da negociação coletiva. Muitos dubladores atuam como autônomos ou freelancers e, portanto, estão mais vulneráveis a práticas que os substituam sem negociação prévia ou compensação justa. A ausência de regulamentações específicas permite que empresas utilizem ferramentas de clonagem vocal para criar novos conteúdos com a voz do artista sem firmar novos contratos ou realizar pagamentos adicionais. Como apontam Medina e Farina (2021), a precarização do trabalho artístico tende a se intensificar diante do uso massivo da IA, o que demanda uma atuação mais efetiva dos sindicatos e da legislação laboral na defesa desses profissionais.
Adicionalmente, a reprodução da voz por IA sem consentimento pode gerar confusão na audiência e prejudicar a reputação do dublador. Caso a voz seja utilizada em contextos que contrariem os valores ou posicionamentos pessoais do profissional – como discursos ofensivos, campanhas ideológicas ou produtos que o dublador não endossaria – há uma potencial lesão à honra e à imagem. Nesse sentido, Souza Pinto e Oliveira (2023) destacam que o deepfake vocal pode ser uma ferramenta de manipulação, tornando-se um instrumento para disseminação de desinformação ou de apropriação indevida de credibilidade. Tal prática pode não apenas violar direitos individuais, mas também afetar o direito coletivo à informação autêntica e à integridade comunicacional.
Por outro lado, o avanço tecnológico traz à tona a necessidade urgente de estabelecer marcos regulatórios específicos sobre o uso de IA em produções culturais e comerciais. A ausência de um arcabouço normativo claro deixa brechas para a exploração e o uso abusivo de tecnologias emergentes, como a clonagem vocal. Nesse contexto, iniciativas como a proposta de regulação da inteligência artificial na União Europeia (AI Act) podem servir de modelo para o Brasil. Conforme analisa Cardoso e Melo (2024), é necessário criar diretrizes legais que exijam o consentimento expresso para o uso da voz, bem como mecanismos de rastreamento e transparência que permitam identificar quando uma voz é gerada por IA protegendo tanto os profissionais quanto os consumidores.
Por fim, a discussão também deve se expandir para a formação de uma cultura de responsabilidade digital e conscientização sobre os impactos da IA no campo artístico. O uso ético da tecnologia deve ser ensinado e incentivado desde os espaços acadêmicos até as empresas produtoras de conteúdo. O respeito à autoria vocal deve fazer parte de um compromisso coletivo com a justiça digital, garantindo que os benefícios da tecnologia sejam distribuídos de forma equitativa, sem comprometer a dignidade ou os direitos de artistas. Segundo Rossetti e Angeluci (2021), a ética na IA não se limita à programação de algoritmos, mas envolve a criação de um ecossistema onde os direitos culturais e profissionais sejam preservados mesmo em contextos altamente automatizados.
A utilização de vozes geradas por Inteligência Artificial (IA) tem se expandido de maneira significativa, ocupando um espaço cada vez mais relevante em áreas como comunicação, educação, saúde e entretenimento. Tais avanços têm modificado substancialmente as interações entre humanos e sistemas computacionais, oferecendo experiências mais dinâmicas e personalizadas. Segundo pesquisas clássicas como as de Klatt (1987) e estudos posteriores como os de Orynbay et al. (1987), o desenvolvimento de modelos computacionais capazes de sintetizar fala com entonação, ritmo e fluência semelhantes às vozes humanas representa um marco na evolução da interface homem-máquina, promovendo maior naturalidade nas interações e ampliando a aceitação social dessas tecnologias.
A introdução da inteligência artificial no setor da dublagem tem provocado uma transformação estrutural e conceitual nessa atividade profissional, tradicionalmente ancorada na expressividade e na interpretação humana. O desenvolvimento de sistemas capazes de reproduzir vozes com elevada fidelidade acústica e emocional suscita inquietações não apenas técnicas, mas também éticas e artísticas. Conforme argumenta Johnson (2023), essa transição tecnológica não se limita à otimização de processos, mas incide diretamente sobre os fundamentos simbólicos da dublagem, como a autenticidade vocal e a mediação afetiva entre personagem e público. Nesse contexto, a presença crescente da IA reconfigura os paradigmas de criação e consumo de conteúdo audiovisual, deslocando o protagonismo do dublador para modelos sintéticos, e abrindo espaço para um debate urgente sobre os limites entre inovação tecnológica e desumanização do trabalho criativo.
Os avanços contemporâneos nos campos da síntese vocal e do reconhecimento de padrões emocionais vêm ampliando de forma expressiva o potencial da inteligência artificial aplicada à dublagem audiovisual. Tecnologias fundamentadas em Processamento de Linguagem Natural (PLN) têm demonstrado elevada capacidade para interpretar nuances semânticas e prosódicas dos textos, permitindo a geração de falas sintéticas que simulam com notável fidelidade aspectos como entonação, ritmo e carga afetiva. Essa sofisticação técnica tem favorecido a incorporação de sistemas automatizados em ambientes de produção audiovisual, como videogames, animações e plataformas de streaming, onde a uniformidade da performance vocal e a verossimilhança emocional são exigências centrais para a imersão do público (Johnson, 2023).
CONCLUSÃO
Diante o exposto, é possível concluir que a análise crítica acerca da utilização de vozes de dubladores por meio de ferramentas de inteligência artificial (IA) sem a devida autorização revela um panorama complexo que demanda reflexões jurídicas, éticas e profissionais aprofundadas. A tecnologia, ao permitir a reprodução quase perfeita da voz humana, desafia conceitos fundamentais sobre identidade, autoria e controle de imagem sonora. A ausência de regulação clara sobre o uso da voz sintética expõe profissionais da dublagem a riscos de usurpação de seus atributos vocais e coloca em xeque os limites da inovação tecnológica diante da dignidade humana.
É evidente que a aplicação da IA no campo da dublagem pode trazer benefícios operacionais significativos, como a redução de custos e a otimização de processos em larga escala. No entanto, tais vantagens não podem se sobrepor aos direitos fundamentais das pessoas cuja voz representa, além de um instrumento de trabalho, uma manifestação subjetiva de sua individualidade. A utilização de vozes sem consentimento viola não apenas a propriedade vocal, mas também a dimensão moral dos direitos de personalidade, comprometendo a integridade e a autonomia dos profissionais envolvidos.
Do ponto de vista legal, o ordenamento jurídico brasileiro, embora reconheça a voz como atributo protegido pelos direitos da personalidade, ainda carece de mecanismos específicos que regulem seu uso em contextos tecnológicos emergentes. A lacuna normativa deixa margem para abusos e dificulta a responsabilização de práticas que violam o consentimento dos titulares da voz. Nesse sentido, torna-se urgente a formulação de políticas públicas e legislações que considerem os impactos da IA sobre a identidade vocal, com diretrizes claras quanto à autorização, remuneração e limites éticos de uso.
Do ponto de vista ético, a substituição da voz humana por modelos sintéticos impõe um desafio à autenticidade da comunicação e ao valor simbólico da voz como meio de expressão afetiva e cultural. A padronização imposta por algoritmos pode desumanizar a experiência comunicacional, ao suprimir a diversidade e a subjetividade inerentes à fala humana. Reconhecer a voz como um patrimônio imaterial implica respeitar sua função social e simbólica, algo que a tecnologia não pode replicar plenamente.
Portanto, conclui-se que o avanço da inteligência artificial no campo da dublagem deve caminhar lado a lado com a valorização do trabalho humano e com a construção de marcos regulatórios eficazes. A inovação tecnológica, para ser legítima, precisa estar comprometida com os princípios da justiça, da equidade e da proteção à dignidade humana. Proteger a voz dos dubladores diante do uso não autorizado por IA não é apenas uma questão de direito, mas um imperativo ético que reafirma o valor do humano em um mundo cada vez mais automatizado.
REFERÊNCIAS
ARRUDA, Felipe José Alves; ALVES, Kellyanne Carvalho. Dublagem 2.0: A Inteligência Artificial nos Bastidores do Áudio. Intercom– Sociedade Brasileira de Estudos Interdisciplinares da Comunicação 24º Congresso de Ciências da Comunicação na Região Nordeste- Natal/RN- 08 a 10/05/2024. Disponível em: https://sistemas.intercom.org.br/pdf/submissao/regional/12/1643/0328202423565366062df5d1c49.pdf
CARDOSO, Henrique Ribeiro; MELO, Bricio Luis da Anunciação. Regulação e responsabilidade civil por danos causados pela inteligência artificial. Rev. Direito Adm., Rio de Janeiro, v. 283, n. 3, p. 143-178, set./dez. 2024. Disponível em: https://periodicos.fgv.br/rda/article/view/91698/86741
CASANOVA, E. et al. YourTTS: Towards Zero-Shot Multi-Speaker TTS and Zero-Shot Voice Conversion for Everyone. In: Proceedings of Interspeech 2022. doi:10.21437/Interspeech.2022-10991. Disponível em: https://repositorio.usp.br/item/003114020
CHIARO, D. Dubbing is the New Black? Exploring the notion of voice. Giuliana Elena Garzone, Elena Liverani (Eds). Tradurre l’oralità. Aspetti pragmatici e culturali, mediAzioni n. 31, A121-A140, 2021. Disponível em: https://cris.unibo.it/bitstream/11585/858273/1/Dubbing_New_Black.pdf
COECKELBERG, Mark. Ética na inteligência artificial. Trad. Clarisse de Souza et. al. São Paulo/Rio de Janeiro: Ubu, Editora PUC-Rio, 2023, p. 25
EDUARDO, Thales José Pitombeira. O conteúdo patrimonial do direito à voz no contexto da proteção da personalidade. Revista Jurídica Luso-Brasileira, Lisboa, n. 1, p. 1911-1958, 2015. Disponível em: https://www.cidp.pt/revistas/rjlb/2015/1/2015_01_1911_1958.pdf
FILHO, Eduardo Tomasevicius. Inteligência Artificial E Direitos Da Personalidade: Uma Contradição Em Termos?. R. Fac. Dir. Univ. São Paulo v. 113 p. 133 – 149 jan./dez. 2018. Disponível em: https://revistas.usp.br/rfdusp/article/view/156553/152042
FLORIDI, Luciano et al. AI4People—An Ethical Framework for a Good AI Society: Opportunities, Risks, Principles, and Recommendations. Minds and Machines, v. 28, p. 689–707, 2018. Disponível em: https://link.springer.com/article/10.1007/s11023-018-9482-5
GUHA, A. et al. How artificiality and intelligence affect voice assistant evaluations. Journal of the Academy of Marketing Science, [S.I.] v. 51, n. 4, p. 843-866, 2023.
HE, Xiwei; LIU, Yutong; WUJI, Siguleng; LUO, Ran. The Impact of Artificial Intelligence Voice Assistants on Con sumer Experience Based on the Cognitive- Affective- Conative Model. 2022. Disponível em: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4017405
HU, P. et al. Speaking vs. listening? Balance conversation attributes of voice assistants for better voice marketing. International Journal of Research in Marketing, [S.I.] v. 40, n. 1, p. 109-127, 2023.
KALOUDI, Nektaria; LI, Jingyue. The ai-based cyber threat landscape: A survey. ACM Computing Surveys (CSUR), [S.I.] v. 53, n. 1, p. 1-34, 2020.
KLATT, D. H. Review of text- to- speech conversion for English. The Journal of the Acoustical Society of America, v. 82, n. 3, p. 737-793, 1987.
MATASSONI, M.; Fong, S.; Brutti, A. Speaker Anonymization:Disentangling Speaker Features from Pre-Trained Speech Embeddings forVoice Conversion. Appl. Sci. 2024,14,3876. Disponível em: https://www.researchgate.net/publication/380339633_Speaker_Anonymization_Disentangling_Speaker_Features_from_Pre-Trained_Speech_Embeddings_for_Voice_Conversion
MEDINA, Erik Nardini; FARINA, Mauricius Martins. Inteligência artificial aplicada à criação artística: a emergência do novo artífice. Manuscrítica§ n. 44• 2021. Disponível em: https://revistas.usp.br/manuscritica/article/view/185586/177613
NEVES, B. C. Inteligência artificial e computação cognitiva em unidades de informação: conceitos e experiências. Logeion: Filosofia da Informação, Rio de Janeiro, RJ, v. 7, n. 1, p. 186–205, 2020. DOI: 10.21728/logeion.2020v7n1.p186-205. https://revista.ibict.br/fiinf/article/view/5260. Disponível em: https://revista.ibict.br/fiinf/article/view/5260
OORD, A. Van Den et al. WaveNet: A Generative Model for Raw Audio. arXiv preprint arXiv:1609.03499, 2016. Disponível em: https://arxiv.org/pdf/1609.03499
ORYNBAY, L.; RAZAKHOVA, B.; PEER, P.; MEDEN, B.; EMERŠIć, Ž. Recent Advances in Synthesis and Interaction of Speech, Text, and Vision. Electronics, v. 13, p. 1726, 2024. Disponível em: https://www.mdpi.com/2079-9292/13/9/1726
OUCHCHY, L.; COIN, A.; DUBLJEVIć, V. AI in the headlines: the portrayal of the ethical issues of artificial intelligence in the media. AI & Society, v. 35, p. 927–936, 2020. Disponível em: https://link.springer.com/article/10.1007/s00146-020-00965-5
ROSSETTI, Regina; ANGELUCI, Alan. Ética Algorítmica: questões e desafios éticos do avanço tecnológico da sociedade da informação. Galáxia (São Paulo, online), ISSN: 1982-2553. Publicação Contínua. http://dx.doi.org/10.1590/1982-2553202150301. Nº 46, 2021, pp.1-18. Disponível em: https://www.scielo.br/j/gal/a/R9F45HyqFZMpQp9BGTfZnyr/?format=pdf&lang=pt
SAHU, A. et al. Voice Assistant Using Artificial Intelligence. In: Proceedings of the International Conference on Innovative Computing & Communication (ICICC). 2022.
SHEN, J. et al. (2018). Natural TTS synthesis by conditioning WaveNet on Mel spectrogram predictions. arXiv preprint arXiv:1712.05884. Disponível em: https://arxiv.org/pdf/1712.05884
SOUZA PINTO; Felipe Chiarello de; OLIVEIRA, Gabriela Franklin de. Não acredite em tudo que vê: deepfake pornography e responsabilidade civil no ordenamento jurídico brasileiro. Direito e Política, vol. 18, n. 2, 2023. Disponível em: https://pdfs.semanticscholar.org/9bcf/a6a55c64bfafc9854524e60141a641737403.pdf
SUPERIOR TRIBUNAL DE JUSTIÇA. Dos Direitos da Personalidade II. Jurisprudência em Teses ed. 138. Brasília, 2019. Disponível em: https://www.stj.jus.br/publicacaoinstitucional/index.php/JuriTeses/article/view/11398/11527
TARTUCE, Flávio. Direito Civil – Lei de Introdução e Parte Geral, 15a ed. Rio de Janeiro, Forense, 2019.
WANG, Y. et al. Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers. Microsoft Research, 2023. arXiv:2301.02111. Disponível em: https://arxiv.org/pdf/2301.02111
VALENZUELA, A.; Puntoni, S.; Hoffman, D.; Castelo, N.; De Freitas, J.; Dietvorst, B.; Hildebrand, C.; Huh, E.; Meyer, R.; Sweeney, M. E.; Talaifar, S.; Tomaino, G.; Wertenbroch, K. How Artificial Intelligence Constrains the Human Experience. Journal of the Association for Consumer Research, v. 9, n. 3, 2024. Disponível em: https://www.journals.uchicago.edu/doi/10.1086/730709
1 manoelabarci@uol.com.br
2 alpposata@gmail
Direito – Universidade Presbiteriana Mackenzie