sitemap VIII Encontro de Linguística de Corpus
 
 
 

Uma análise contrastiva da linguagem jornalística popular e tradicional baseada em corpus


Márcia Regina Alves Ribeiro Oliveira (UERJ-PG)


Este trabalho pretende analisar de modo contrastivo as escolhas léxico-gramaticais utilizadas na redação de notícias de dois diários de grande circulação no Rio de Janeiro: o popular “O Dia Online” (

www.odia.com.br) e o tradicional “O Globo Online” (www.oglobo.com.br). Seu objetivo é identificar como as escolhas lexicais feitas por ambos transparecem suas diferenças de conteúdo e foco. Além disso, o estudo pretende definir as principais características e padrões linguísticos de ambos os jornais, assim como determinar o seu grau de conformidade em relação às regras canônicas já consolidadas no jornalismo, segundo propõe o “Manual de Redação da Folha de São Paulo” (1996). A pesquisa, que é de natureza indutiva, é baseada no suporte teórico e no ferramental da Linguística de Corpus, sendo, portanto, empírica e probabilística. O corpus de análise é formado por 4.812 notícias extraídas diretamente dos websites dos jornais durante o período de uma semana no ano de 2008, contabilizando um total de cerca de 1 milhão de palavras. Trata-se de um corpus de tamanho médio, de acordo com a classificação histórica proposta por Berber Sardinha (2004). Também foi utilizado um corpus de referência com notícias publicadas durante o período de um ano no jornal “Folha de São Paulo”, contendo, aproximadamente, 24 milhões de palavras. Três softwares tornaram possíveis a compilação dos corpora eletrônicos e o processamento dos dados linguísticos: um script desenvolvido na linguagem PERL, criado especialmente para este trabalho e voltado para coleta em massa de textos da Internet; o software Wordsmith Tools e suas ferramentas Wordlist, Keywords e Concord; e o etiquetador morfossintático (POS Tagger) online Tree-Tagger, que possibilitou determinar as classes gramaticais predominantes em cada publicação. A análise dos corpora se concentrou, basicamente, em quatro aspectos considerados altamente relevantes para o estudo da linguagem jornalística sob a ótica da Linguística: a Padronização Lexical, a Utilização de Verbos Dicendi (ou Declarativos), o emprego de Marcadores de Vagueza e das Classes Gramaticais mais recorrentes nos corpora. No estudo de Padronização Lexical, buscou-se determinar qual dos jornais demonstra maior criatividade na utilização do léxico da Língua Portuguesa através da razão forma/item expressa em porcentagens. Com diferenças percentuais que demonstraram densidades lexicais praticamente idênticas, verificou-se que, neste aspecto quantitativo, os jornais em questão praticamente não se diferenciam. Em relação à análise da frequência de uso de Verbos Dicendi, com foco nos verbos “dizer” e “afirmar”, percebeu-se que o jornal “O Globo Online” utiliza 18% mais o segundo, o que, possivelmente, ocorre na tentativa de transferir maior peso e responsabilidade das declarações publicadas a quem as proferiu (entrevistados ou fontes). Para a análise dos Marcadores de Vagueza (que são considerados desvios ao compromisso do jornalismo com a exatidão no relato dos fatos) foram selecionados os 50 trigramas (sequências fixas de três palavras) mais recorrentes de cada jornal. Não foram detectados marcadores de vagueza entre os trigramas do jornal “O Dia Online”, enquanto, no corpus do jornal “O Globo Online”,  foram encontradas 210 ocorrências de “Cerca de #” e 175 ocorrências de “Mais de #” (sendo que # o caractere representa um determinado número ou porcentagem publicado no jornal). No estudo das classes gramaticais, verificou-se, através da análise das frequências, o predomínio de substantivos nos dois periódicos (44,46% em “O Globo Online” e 37,5% em “O Dia Online”.). As diferenças percentuais entre eles, no entanto, ficaram por conta do maior emprego de adjetivos e advérbios por parte do jornal popular, o que sugere que “O Dia Online” deixa transparecer de maneira mais explícita a voz do jornalista/jornal em suas notícias. Assim, os resultados da pesquisa permitem dizer que as diferenças léxico-gramaticais entre os jornais estudados podem ser revelados tomando como base uma análise quantitativa dos corpora em questão. As constatações obtidas neste trabalho demonstram que a violação de algumas das regras canônicas do jornalismo (objetividade, imparcialidade, uso restrito de adjetivos e advérbios), conforme sugeridas pelo “Manual de Redação da Folha de São Paulo” (1996), são frequentemente infringidas tanto pelo jornalismo de referência quanto pelo de caráter popular. Além disso, de forma geral, pode-se dizer que o olhar microscópico sobre os dados proporcionado pela Linguística de Corpus permite uma observação mais apurada dos corpora, o que resulta em constatações mais precisas e em colaborações mais objetivas para o estudo da linguagem jornalística.

Palavras-chave: jornal popular, jornal tradicional, Linguística de Corpus, corpus digital



 

Resumo