sitemap VIII Encontro de Linguística de Corpus
 
 
 

Um corpus do samba carioca para estudos lexicográficos e discursivos


Flávio de Aguiar Barbosa (PG/UERJ)


Este trabalho parte da percepção de que as obras lexicográficas que contemplam as variedades populares do português do Brasil devem se beneficiar de estudos baseados em corpus. Os dicionários elaborados conforme essas diretrizes tendem a ser mais consistentes, precisos e úteis do que os que seguem métodos lexicográficos tradicionais. Como contribuição para os estudos lexicais sobre essas variedades do português do Brasil, compôs-se um corpus de sambas de três compositores atuantes nas primeiras décadas do século XX, na cidade do Rio de Janeiro: Ismael Silva, Cartola e Paulo da Portela. Esses são compositores considerados modelares para o samba carioca do período, constituindo lideranças de três escolas de samba históricas do Rio de Janeiro: Deixa Falar, no Estácio, Mangueira e Portela, em Oswaldo Cruz.

Apesar de já haver corpora de referência para várias modalidades do português do Brasil — a norma urbana culta, a linguagem dos negócios, a de importantes escritores, a de usos do português escrito em textos jornalísticos, dramáticos, técnicos — os trabalhos lexicográficos ainda carecem de corpora de estudo para o português popular. Dicionários gerais da língua portuguesa preveem esse tipo de registro, mas, pela falta de embasamento em corpus, por vezes detectam-se problemas nas informações fornecidas; tais inconsistências podem ser omissões de verbetes, definições incompletas ou mesmo equivocadas.

O objetivo deste empreendimento foi, portanto, contribuir para o estudo do universo lexical mencionado, por meio da constituição de uma base documental sólida para a descrição do vocabulário do samba carioca no período delimitado; isso é fundamental, por exemplo, para o estabelecimento de verbetes, a delimitação de unidades lexicais plurivocabulares, a elaboração de definições acuradas e não preconceituosas, a observação de peculiaridades, como o vocabulário de especialidade do samba.

O estudo foi realizado com base nos princípios da Linguística de Corpus (Berber Sardinha, 2004 e Mike Scott, 2007), da Lexicografia (Biderman, 1998 e Borba, 2003), da Análise do Discurso (Charaudeau, 2008) e dos Estudos Culturais sobre o samba e o Rio de Janeiro (Roberto M. Moura, 2004, Carlos Sandroni, 2001). Instituições de referência, como o Museu da Imagem e do Som, a Biblioteca Nacional e o Instituto Moreira Salles foram visitadas na recolha das letras, que foram processadas a partir do software Wordsmith Tools. Depreenderam-se sete áreas temáticas principais das composições: relações amorosas; metalinguagem; cotidiano; reflexões existenciais; Brasil; natureza; religiosidade. Cada uma dessas áreas foi estudada em suas características discursivas, com anotação dos campos semânticos mais recorrentes.

O corpus constituído contém aproximadamente 300 letras, cujo processamento quali-quantitativo resultou na delimitação de uma nomenclatura de 289 verbetes, entre palavras-chave estatisticamente relevantes e outras unidades lexicais discursivamente importantes. Os verbetes foram estruturados a partir das ocorrências do corpus apresentadas em ordem conologicamente progressiva e analisadas em suas características léxico-discursivas; houve atenção especial para o registro de unidades lexicais plurivocabulares e para os usos que constituem vocabulário de especialidade do universo discursivo do samba.

Entre os eixos léxico-discursivos mais significativos detectados no corpus estão referências à roda de samba (batuque, gandaia, pagode); a canto e dança (requebrar, sambar, sapateado); às disputas de carnaval (avante, conquista, vitória); à educação formal e ao samba como saber legítimo (academia, doutor, professor); a sambistas de destaque (Cartola, Noel, Paulo); a bairros e localidades, principalmente do Rio de Janeiro (Oswaldo Cruz, Mangueira, Praça Onze); a aves canoras (canário, curió, rouxinol); a cores (anil, verde, negro), entre outros. Também há ocorrências que trazem carga semântica desviante do léxico comum (amizade, orgia, morro). Quanto ao vocabulário de especialidade do samba, há referências a instrumentos musicais (cavaquinho, cuíca, violão); à atuação do músico (artista, bis, plateia); ao samba e aos seus elementos musicais (cadência, marcação, samba de terreiro); à atividade de composição (inspiração, compositor, letra); à escola de samba (bateria, Portela, presidente); a elementos do desfile de carnaval (avenida, desfilar, harmonia). Também há ocorrências que são compartilhadas com os vocabulários de especialidade da música e da literatura (acorde, melodia, introdução; lira, musa, poema).

Com a constituição de um corpus de estudo e, a partir dele, de uma nomenclatura inicial, foi possível estabelecer uma base para a elaboração de um Dicionário histórico-enciclopédico do samba carioca, já com três centenas de verbetes redigidos, que servirão de modelo para a obra definitiva. Adicionalmente, apresenta-se o universo discursivo do samba, em suas práticas e valores, assim como as características textuais dos sambas do período.

Como focaliza a produção de compositores de uma geração específica, com datação tão exata quanto possível das composições analisadas, a presente inciativa também é relevante para estudos lexicais de perspectiva histórica — serve como base documental para estudos etimológicos, de cronologia lexical e de derivação semântica.

Finalmente, talvez a contribuição mais abrangente deste trabalho seja a própria documentação do repertório produzido no período em questão. Essa tarefa importa para o registro de um legado cultural amplamente difundido e frequentemente considerado como um elemento relevante na caracterização da identidade cultural carioca e até mesmo nacional.


Palavras-chave: Lexicografia; Corpus histórico dialetal, Samba urbano carioca, Análise do Discurso

 

Resumo