DESSONORIZAÇÃO TERMINAL EM SEQUÊNCIAS DE CONSOANTE OCLUSIVA SEGUIDA DE SIBILANTE NO PORTUGUÊS BRASILEIRO E NO INGLÊS COMO SEGUNDA LÍNGUA -

REGISTRO DOI: 10.5281/zenodo.7925898

Wellington Mendes Junior
Adelino Pinheiro Silva
Águida Lyrio Brant
Mariana Souza Santos

RESUMO

Este estudo examina a dessonorização terminal no português brasileiro (PB) e no inglês como segunda língua (L2). Objetiva-se avaliar se uma mudança vozeada em curso relacionada ao desvozeamento de sequências finais na língua materna (L1) afeta a produção das formas da L2. Consideramos a produção de sufixos plurais compostos por uma sequência de (oclusiva + sibilante) (e.g. ringues [hĩgs] ~ [hĩks] no PB e bags [bæɡz] ~ [bæks] no inglês). Utilizou-se a razão harmônico-ruído (HNR) para aferir o grau de vozeamento da sibilante. Os resultados indicaram que a dessonorização terminal foi significativamente atestada em L1 e L2. Isso fornece evidências de que o desvozeamento de sequências finais, que se constitui como uma mudança sonora em curso na L1, afeta a produção de formas de plural da L2. Adicionalmente, foi atestado que o vozeamento da sibilante final no Inglês como L2 é influenciado pelo contexto fonológico seguinte, um padrão que também parece ser importado da L1. Demonstramos que não apenas segmentos, mas também o detalhe fonético fino é transferido para a L2, conforme sugerido pelo Modelo dos Exemplares.

Palavras-chave: Dessonorização terminal; Português Brasileiro; Inglês como L2; Modelo de Exemplares.

ABSTRACT

This study examines word-final devoicing in Brazilian Portuguese (BP) and L2 English. It aims at assessing whether an ongoing sound change related to devoicing in the L1 affects the production of L2 forms. We considered the production of plural suffixes comprised of a (stop + sibilant) cluster (e.g. ringues [hĩgs] ~ [hĩks] ‘rings’ in BP and bags [bæɡz] ~ [bæks] in English). Harmonics-to-noise ratio was used to measure the degree of sibilant voicing. Results showed that devoicing was significantly attested in both L1 and L2. This provides evidence that word-final devoicing, which is an ongoing sound change in the L1, affects the production of L2 forms. Moreover, L2 English sibilant voicing is influenced by the following phonological context, a pattern which also seems to be imported from the L1. We show that not only segments, but also fine phonetic detail is transferred to the L2 as suggested by Exemplars Model.

Keywords: Word-final devoicing; Brazilian Portuguese; L2 English; Exemplars Model.

1. INTRODUÇÃO

O fenômeno da dessonorização terminal é um processo fonológico que consiste na perda do traço de vozeamento em consoantes finais de palavras. Este artigo examina a dessonorização terminal (DT) no português brasileiro (e.g. ringues [hĩgs] ~ [hĩks]) e no inglês como segunda língua (e.g. bags ‘sacolas’ [bæɡz] ~ [bæks]). Pretende-se contribuir para o entendimento da fonologia da L2 examinando como os padrões sonoros emergentes da L1 são adotados na L2. A análise é fundamentada nas premissas do Modelo dos Exemplares, que propõe que o detalhe fonético fino faz parte das representações fonológicas (BYBEE, 2001, 2008; JOHNSON, 2007).

No PB, a dessonorização terminal tem sido associada a uma mudança sonora em curso que favorece a produção de consoantes desvozeadas em final de palavra (por exemplo, ringues [hĩgs] ~ [hĩks]). Este artigo pretende ser uma contribuição para examinar os estágios iniciais da DT na fonologia do PB, um fenômeno que ocorreu em várias línguas de matriz indo-europeia (cf. BROCKHAUS, 2012; HUTIN, 2020; JATTEAU, 2019; SIMON, 2010).

A literatura fonológica reportou recentemente que as vogais anteriores altas átonas do PB são enfraquecidas e perdidas quando flanqueadas entre uma consoante e uma sibilante de final de palavra, como ocorre em lápis [‘la.pɪs] > [laps] ‘lápis’ (SOARES, 2016). Esse padrão se aplica a formas plurais, como em ringues [‘hĩ.gɪs] > [hĩgs] ~ [hĩks] e cheques [‘ʃɛ.kɪs] > [ʃɛks]. A sibilante final de palavra é sempre desvozeada no PB, independentemente do traço de vozeamento da consoante precedente (cf. CRISTÓFARO-SILVA; MENDES-JR., 2022). Através de morfemas ou limites de palavras, uma regra de assimilação regressiva dita que a sibilante passa a ser vozeada quando é seguida por uma vogal ou consoante vozeada: [hĩgs] ringues > [hĩgz#a.ma.’ɾɛ.lʊs] ringues amarelos e [ʃɛks] cheques ‘cheques’ > [ʃɛkz#a.ma.’ɾɛ.lʊs] cheques amarelos.

Neste artigo, examinamos a mudança contínua de som no PB que está relacionada à alternância entre consoantes vozeadas e consoantes desvozeadas (por exemplo, [hĩgz#a.ma.’ɾɛ.lʊs] ~ [hĩks#a.ma.’ɾɛ.lʊs] ) e também consideramos se tal mudança vozeada influencia a produção de formas plurais do inglês L2 (e.g. bags [bæɡz] ~ [bæks], bags are [bæɡz#ar] ~ [bæks#ar]).

Em inglês, assume-se que o sufixo plural regular e o de 3ª pessoa do singular do presente é /z/ (HAYES, 2011). Uma regra de assimilação progressiva prevê que se uma vogal ou uma consoante vozeada preceder /z/, a forma de superfície é [z], como em dogs [dɔɡz], trees [triːz] e pies [paɪz]. Por outro lado, se uma consoante desvozeada preceder /z/, tal segmento é pronunciado como [s], como em cups [kʌps], cats [kæts] e ducks [dʌks]. Finalmente, se uma sibilante ou africada precede a sibilante, o resultado é [ɪz], como em buses [bʌsɪz], quizzes [‘kwɪz.ɪz] e watches [‘wɔtʃ.ɪz]. Enquanto no inglês as sibilantes são propensas à assimilação progressiva, no português brasileiro as sibilantes sofrem assimilação regressiva.

A principal questão que colocamos é se a DT em PB influencia a produção de formas plurais do inglês L2. Se for esse o caso, esperamos que as formas plurais do inglês produzidas por falantes do PB favoreçam as consoantes desvozeadas no final da palavra, pois é o padrão mais robusto na L1, inibindo a regra de assimilação progressiva do inglês que se aplica às formas plurais (por exemplo, [bæks] em vez de [bæɡz] para bags). Também postulamos que as sibilantes vozeadas serão favorecidas quando seguidas por uma vogal em início da palavra (por exemplo, [bæɡz#ar] bags are). Isso decorre da regra de assimilação regressiva do PB, que leva as sibilantes a serem vozeadas quando seguidas por uma vogal.

Em suma, investigaremos se o desvozeamento no final da palavra ocorre em ambas as línguas e se o desvozeamento da sibilante pode ser influenciada pelo contexto fonológico seguinte. Um experimento foi desenvolvido para testar a produção de sequências de (oclusiva + sibilante) em inglês por falantes brasileiros. A relação harmônico-ruído (HNR) foi utilizada para medir o grau de vozeamento sibilante, com o objetivo de oferecer uma avaliação precisa dos dados experimentais realizados pela análise acústica.

2. METODOLOGIA

Participou deste estudo um grupo de vinte brasileiros que estudam no Centro Federal de Educação Tecnológica de Minas Gerais. Todos os participantes eram alunos do ensino médio que frequentavam aulas de inglês como parte do currículo da escola há pelo menos um ano. Metade dos participantes apresentou níveis básicos de inglês L2 (A1 ou A2), enquanto a outra metade apresentou níveis pré-avançados (B2) a avançado (C1), de acordo com o Quadro Europeu Comum de Referência para Línguas.

Um conjunto de 36 substantivos plurais terminados em sequências de (oclusiva + sibilante) foi considerado no PB, por exemplo cheques [ʃɛks] e botes [bɔts]. Para o estudo de caso de inglês L2, outro conjunto de 36 palavras foi selecionado, por exemplo bags ‘bolsas’ [bæɡz] e boats ‘barcos’ [bəʊts].

O experimento foi composto por duas tarefas. A primeira tarefa envolveu a contagem de figuras, em que os participantes foram solicitados a contar e nomear os elementos exibidos em uma tela de computador. Isso levaria à produção das palavras-alvo em suas formas plurais (por exemplo, dois bolos). Em uma segunda aplicação da tarefa de contagem de figuras, os participantes foram solicitados a pronunciar uma frase-veículo curta após a sibilante (por exemplo, dois bolos são vistos). O objetivo foi avaliar como a sibilante final seria vozeada devido à presença de uma vogal inicial na palavra seguinte. A segunda tarefa envolveu a leitura de sentenças. O número de sílabas das frases, os padrões entoacionais e as classes gramaticais das palavras foram controlados. O estudo do PB ocorreu após o estudo do inglês L2 e considerou os mesmos ambientes fonológicos e tipos de tarefas.

Devido à pandemia de COVID-19, a coleta de dados foi realizada remotamente. Os experimentos foram gravados com o Open Broadcaster Software Studio a uma taxa de amostragem de 48 kHz. As gravações obtidas foram convertidas para o formato de áudio WAVEform pelo software Adobe Premiere 2020, que conseguiu manter a mesma taxa de amostragem dos arquivos originais. O tempo médio para completar o experimento foi de 1 hora e 20 minutos. Um total de 2.833 tokens foram considerados para o estudo de inglês L2. Para o estudo de BP, foram considerados 2831 tokens. As amostras foram editadas e anotadas manualmente usando TextGrids do software Praat (BOERSMA; WEENINK, 2020).

Esta pesquisa considerou principalmente a qualidade de vozeamento de sibilantes no final da palavra. No PB, apenas sibilantes desvozeadas ocorrem no final da palavra, a menos que uma vogal a sigla, da qual emerge uma sibilante vozeada. Em inglês, sibilantes tanto vozeadas quanto desvozeadas ocorrem no final da palavra. Quando uma vogal segue a sibilante, a qualidade do vozeamento permanece como era antes (ao invés de mudar como ocorre no PB). Assim, postulamos que as sibilantes desvozeadas no final da palavra seriam favorecidas na L2 do inglês, pois é o padrão mais robusto na L1. Também postulamos que as sibilantes vozeadas ocorrem em taxas mais altas quando seguidas por uma vogal inicial.

O vozeamento foi medido sob a relação Harmônicos-ruído, que representa o grau de periodicidade acústica. Cada dado foi extraído para um objeto de som separado e um objeto de harmonicidade foi criado, a partir do qual a harmonicidade média foi calculada, doravante o HNR. Os detalhes de seu cálculo podem ser encontrados em Boersma e Weenink (2020). Com base na discussão do manual de Praat (BOERSMA; WEENINK, 2020), valores mais altos de HNR devem corresponder a taxas de vozeamento mais altas. Isso é consistente com pesquisas anteriores que mostraram que as sibilantes intervocálicas desvozeadas em inglês ([s] e [ʃ]) normalmente têm valores de HNR abaixo de 5 dB, enquanto que as sibilantes vozeadas ([z] e [ʒ]) apresentam intervalo de 5-10 dB (MANIWA; JONGMAN; WADE, 2009).

3. RESULTADOS

Os resultados mostraram que os falantes do português brasileiro tendem a apresentar uma sibilante desvozeada no final da palavra [ʃɛks#], mesmo em contextos onde um correlato desvozeado seria esperado (e.g. cheques amarelos [ʃɛkz#amaɾɛlʊs]). Considere a Figura 1.

Figura 1: Vozeamento da sibilante por contexto fonológico seguinte no Português Brasileiro.

A Figura 1 apresenta as taxas de vozeamento da sibilante por ambiente fonológico seguinte. Esperava-se que sibilantes seguidas por uma pausa (boxplot de violino esquerdo) apresentassem taxas baixas de HNR e esperava-se que sibilantes seguidas de uma vogal (boxplot de violino direito) fossem vozeadas, exibindo assim taxas mais altas de HNR.

Como esperado, taxas de vozeamento mais baixas foram atestadas quando a sibilante foi seguida por uma pausa (ex. cheques amarelos [ʃɛkzamaɾɛlʊs], média = 7,9 dB). Os resultados do teste de Wilcoxon revelaram que esse fator é estatisticamente significativo (W = 340138, p-valor < 0,01). Destacamos que as sibilantes seguidas de vogais apresentaram variabilidade considerável, com desvio padrão de 4,5. Isso indica que tais sibilantes foram produzidas com graus variáveis de sonoridade, algumas delas com índices inesperadamente baixos de HNR, o que indica uma tendência à produção de [s]. A análise dos dados espectrográficos corrobora esta observação. Considere a Figura 2.

Figura 2: Análise espectrográfica da dessonorização terminal no PB.

A Figura 2 exibe o espectrograma da frase duas redes argentinas ‘duas redes argentinas’, produzida por um participante do sexo masculino de 17 anos. Uma sibilante vozeada era esperada, pois o contexto a seguir é uma vogal. No entanto, duas setas indicam ausência de vozeamento durante a produção da sequência (oclusiva + sibilante) na palavra-alvo. Se houvesse vozeamento, a parte inferior do espectrograma seria escura ao invés de clara.

Adicionalmente, a Figura 2 mostra que não apenas a sibilante permaneceu desvozeada, mas a oclusiva anterior – que antes era vozeada – também compartilhou a mesma propriedade, sendo desvozeada. Assim, [hets ah.ʒẽ.’tʃi.nəs] em vez de [hedz ah.ʒẽ.’tʃi.nəs] foi atestado. Nossos dados mostraram que o desvozeamento em final da palavra ocorreu com todos os tipos de sequência seguidas de vogais avaliadas neste estudo ([ps, ts, ks, bs, ds, gs]), apontando para uma mudança gradiente em curso no PB que desencadeia apenas consoantes desvozeadas em posição terminal. Essa tendência foi atestada no PB até mesmo em palavras cujo desvozeamento no final da palavra leva à perda de contraste: grades e grátis [gɾats], sedes e setes [sɛts], ringues e rinques [hĩks].

Parece que o desvozeamento em final da palavra no PB pode estar associada a uma tendência histórica de matriz indo-europeia, como observado em idiomas como holandês, alemão, francês e romeno (BROCKHAUS, 2012; HUTIN, 2020; JATTEAU, 2019; SIMON, 2010). Este estudo, portanto, contribui para examinar os estágios iniciais da dessonorização terminal no PB.

Examinemos, neste momento, a DT em inglês como L2. Uma questão importante que surge é se a mudança sonora em curso do PB, relacionada ao desvozeamento no final da palavra, influencia a produção de formas plurais do inglês como L2. Considere a Figura 3.

Figura 3: Vozeamento da sibilante por ambiente fonológico seguinte no inglês como L2.

A Figura 3 exibe as taxas de vozeamento da sibilante por ambiente fonológico seguinte em inglês como L2 por falantes do PB. Esperava-se que sibilantes seguidas por uma pausa (boxplot esquerdo) exibissem taxas de HNR mais baixas, e esperava-se que sibilantes seguidas por uma vogal (boxplot direito) fossem vozeadas, exibindo assim taxas mais altas de HNR. Os gráficos amarelos representam tokens cuja sibilante não vozeada [s] era esperada (por exemplo, cups [kʌps] e cats [kæts]), ao passo que os gráficos roxos representam tokens cuja sibilante vozeada [z] (por exemplo, jobs [dʒɔbz], beds [bɛdz]) era esperada . Os resultados mostram que, como hipotetizamos, foram atestados índices de vozeamento mais baixos quando a sibilante era seguida por uma pausa (e.g. cups, jobs) – com média de 3,0 dB – e isso ocorreu independentemente da consoante que precede a sibilante. Por outro lado, atesta-se maiores índices de vozeamento quando há uma vogal seguindo a sibilante (ex: cups are, jobs are) – com média de 4,3 dB. Os resultados do teste de Wilcoxon revelaram que o contexto fonológico seguinte é estatisticamente significativo no inglês como L2, tanto no grupo cuja sibilante [s] é esperada (W = 203088, p-value < 0, 01) quanto no grupo cuja sibilante [z] é esperada (W = 155599, p-valor < 0,01).

Observe que no inglês L2 as consoantes desvozeadas ocorrem independentemente do contexto fonológico precedente – que de fato é o que desencadeia o vozeamento no inglês como L1, devido à assimilação progressiva. A predominância de sequências desvozeadas no inglês como L2 aponta para a influência dos padrões sonoros da L1 para a construção das representações fonológicas da L2 (cf. FLEGE, BOHN, 2021). Além disso, ao comparar as Figuras 1 e 3, observamos que os aprendizes transferem um padrão alofônico do PB como L1 (isto é, assimilação regressiva) para a L2 do inglês.

Nossos resultados sugerem adicionalmente que os aprendizes de L2 não apenas importam padrões de sons alofônicos da L1 (ou seja, assimilação regressiva), mas também padrões de sonoros emergentes – ou seja, a dessonorização terminal. Mais uma vez, considere os dados representados em roxo na Fig. 3. Tais dados envolvem palavras cuja sibilante [z] era esperada (e.g. [bӕɡzɑːr] bags are), não apenas devido à assimilação progressiva atestada em inglês, mas também devido à assimilação regressiva potencialmente transferida do PB . Observe que, embora a maioria das sibilantes seguidas de vogal apresenta taxas mais altas de HNR, alguns tokens foram associadas a taxas baixas (desvio padrão = 3,5). Os dados do inglês como L2 em roxo correspondem aos dados do PB relatados na Figura 1: em ambas as línguas, a produção de sequências sonoras ocorre apenas parcialmente quando há uma vogal seguindo a sequência. Isso oferece evidências de que a dessonorização terminal, um fenômeno que ainda emerge no PB como L1, também é agregada no inglês como L2. Considere a Figura 4.

Figura 4: Análise espectrográfica da dessonorização terminal em inglês como L2.

A Figura 4 apresenta o espectrograma da frase “two bags are […]”, produzida pelo mesmo participante da Figura 2. As setas indicam a ausência de vozeamento no encontro consonantal final. Note que houve a produção de [bӕksɑːr] ao invés de [bӕɡzɑːr], em que tanto a oclusiva quanto a sibilante final de palavra foram atenuadas. Observe que a DT ocorreu com todos os tipos de sequências vozeadas avaliadas neste estudo (ou seja, [bz, dz, gz]), não apenas quando a sibilante era seguida por uma pausa (por exemplo, two labs [tuː læps]), mas também quando a sibilante era seguida por uma vogal (por exemplo, two labs are [tuː læps ɑːr]). Assim como em nossos dados de PB, isso foi atestado até mesmo em palavras cuja dessonorização terminal leva à perda de contraste: codes e coats [kəʊts], sides e sites [saɪts], labs e laps [læps], kids e kits [kɪts], pigs e pix [pɪks]. Isso sugere que não apenas segmentos, mas também detalhes fonéticos finos – associados a padrões fonológicos ainda emergentes na L1 – são transferidos para a L2.

4. CONCLUSÕES

Os resultados indicaram que a dessonorização terminal é amplamente atestada tanto no PB como L1 quanto no inglês como L2. Isso fornece evidências de que uma mudança sonora em curso na L1 afeta a produção das formas da L2. Também foi atestado que não são apenas as sibilantes finais que perdem o traço de vozeamento: o mesmo ocorre com as oclusivas precedentes. Adicionalmente, a dessonorização terminal do inglês como L2 é influenciada pelo contexto fonológico seguinte, um padrão que também parece ser importado da L1. Argumentamos que exemplares associados a um padrão sonoro alofônico (produção de sequências vozeadas seguidos de vogais) estão em competição com um padrão sonoro emergente (desvozeamento de encontros consonantais em finais de palavras). Isso oferece evidências de que o detalhe fonético fino faz parte das representações fonológicas, conforme proposto pelo Modelo dos Exemplares (BYBEE, 2001, 2008; JOHNSON, 2007). Tal modelo argumenta que, ao invés de ter um conjunto fixo de regras para gerar formas linguísticas, as pessoas armazenam exemplares de fala que são utilizados para produzir e compreender a linguagem. Tais exemplares vinculam informações de diferentes níveis de granularidade, desde informações abstratas de natureza categórica (como a estrutura silábica de uma palavra) até o detalhe fonético fino (como o grau de vozeamento de uma sibilante). O Modelo dos Exemplares também propõe que a variação na fala é um aspecto fundamental da linguagem, e as variações da L1 e da L2 são armazenadas como múltiplos exemplares na memória. Ao construir a Gramática Fonológica da L2, estabelece-se uma correspondência com formas pré-armazenadas na memória de experiências linguísticas de ambas as línguas. Em síntese, o fato de que a dessonorização terminal é um padrão emergente no português brasileiro pode levar os falantes brasileiros de inglês como segunda língua a produzir essa mesma dessonorização no inglês.

5. REFERÊNCIAS

BOERSMA, P.; WEENINK, D. Praat manual. Amsterdam: University of Amsterdam, Phonetic Sciences Department, 2020.

BROCKHAUS, W. Final devoicing in the phonology of German. In: BROCKHAUS, W. Final Devoicing in the Phonology of German. Max Niemeyer Verlag, 2012.

BYBEE, J. Frequency effects on French liaison. Typological Studies in Language, v. 45, p. 337-360, 2001.

BYBEE, J. Usage-based grammar and second language acquisition. In: ROBINSON, P.; ELLIS, N. (Eds.). Handbook of cognitive linguistics and second language acquisition. Routledge, 2008. p. 226-246.

CRISTÓFARO-SILVA, T.; MENDES-JR., W. Plural formation in English: a Brazilian Portuguese case study. In: Second Language Pronunciation: Different Approaches to Teaching and Training. De Gruyter Mouton, 2022.

FLEGE, J. E.; BOHN, O. S. The revised speech learning model (SLM-r). In: LEVINTHAL, T. (Ed.). Second language speech learning: Theoretical and empirical progress. John Benjamins Publishing Company, 2021. p. 3-83.

HAYES, B. Introductory phonology. John Wiley & Sons, 2011.

HUTIN, M. et al. Lenição e fortificação de stop codas em romeno. In: SLTU-CCURL, 2020.

JATTEAU, A. et al. “Gra[f]e!” Word-Final Devoicing of Obstruents in Standard French: An Acoustic Study Based on Large Corpora. In: INTERSPEECH, 2019. p. 1726-1730.

JOHNSON, K. Decisions and mechanisms in exemplar-based phonology. In: COHN, A. C.; FOUGERON, C.; HUFFMAN, M. K. (Eds.). Experimental approaches to phonology. Oxford University Press, 2007. p. 25-40.

SIMON, E. Phonological transfer of voicing and devoicing rules: evidence from L1 Dutch and L2 English conversational speech. Language Sciences, v. 32, n. 1, p. 63-86, 2010.

SOARES, V. H. M. Encontros consonantais em final de palavra no português brasileiro. Dissertação de mestrado, Universidade Federal de Minas Gerais, 2016.

MANIWA, K.; JONGMAN, A.; WADE, T. Acoustic characteristics of clearly spoken English fricatives. The Journal of the Acoustical Society of America, v. 125, n. 6, p. 3962-3973, 2009.