sitemap VIII Encontro de Linguística de Corpus
 
 
 

Estruturas colocacionais em abstracts escritos por pós-graduandos brasileiros


Carmen Dayrell (USP)


Na área de Inglês para Fins Acadêmicos, a investigação de características lexicais e gramaticais do discurso acadêmico tem despertado o interesse de instrutores e pesquisadores, por ser de grande relevância tanto para a seleção do conteúdo programático de cursos quanto para a elaboração de material didático. Uma das perspectivas adotadas para este tipo de análise focaliza a linguagem produzida por falantes nativos e/ou proficientes, que é tratada como a linguagem almejada e considerada como aquela típica de falantes competentes. Nesse caso, alguns estudos contrastam o gênero acadêmico com outros gêneros textuais (Biber et al. 1999: 988-1036; Carter & McCarthy 2006: 267-294), outros investigam o mesmo gênero em diferentes áreas de estudo (Hyland 2000; Groom 2005 e Charles 2006, 2007) e há também aqueles que se concentram em partes específicas do texto (Gledhill 2000).

Embora reconheçam as valiosas contribuições e benefícios desses estudos, alguns autores (Granger, 2002; Nesselhauf 2004; Gilquin, Granger & Paquot, 2007) alertam para o fato de que a abordagem do ponto de vista único e exclusivamente do falante nativo não é suficiente para identificar as dificuldades encontradas por falantes não-nativos. A principal alegação é de que, embora compartilhem algumas dificuldades com falantes nativos inexperientes, não-nativos apresentam dificuldades que são específicas de falantes de língua estrangeira. O ideal é, portanto, combinar as informações fornecidas pelos corpora de textos produzidos por falantes nativos ou experientes com as informações extraídas de corpora de aprendizes, ou seja, corpora compostos de textos produzidos por aprendizes de língua estrangeira ou segunda língua (Granger 2002, Nesselhauf, 2004). Dentro dessa perspectiva, a grande maioria dos estudos concentra-se na comparação entre textos escritos por um ou mais grupos de falantes não-nativos e textos publicados (Hyland 2008a, 2008b; Hyland & Tse 2005; Hewings & Hewings 2002).

O presente trabalho adota essa segunda abordagem. O principal objetivo é comparar o uso da estrutura colocacional the ... of em resumos (abstracts) de artigos científicos em inglês escritos por pós-graduandos brasileiros (mestrandos e doutorandos) em relação a resumos de artigos científicos publicados das mesmas disciplinas. Por estruturas colocacionais (Renouf & Sinclair 1991), entende-se aqui as seqüências compostas por um ou mais itens gramaticais de alta freqüência, geralmente não contíguos, com uma lacuna a ser preenchida por um item lexical. A principal razão para a escolha de the ... of deve-se ao fato de esta ser a estrutura colocacional mais freqüente nos dois corpora investigados neste estudo.

Os dados são coletados a partir de dois corpora de resumos em inglês. Um corpus contempla 189 resumos escritos por pós-graduandos brasileiros (40.278 palavras) dos cursos de Física, Ciências Farmacêuticas e Computação. Tais resumos foram coletados em nove cursos de inglês acadêmico oferecidos entre 2004 e 2009 pelos respectivos departamentos da Universidade de São Paulo (USP). O outro corpus corresponde a uma seleção de 1.086 resumos (187,619 palavras) extraídos de artigos científicos publicados por periódicos de destaque nas três áreas analisadas. Para efeitos de estudo, utilizamos a sigla EST para se referir ao corpus de resumos dos alunos e PUB para o corpus de resumos publicados.

A extração e manipulação dos dados foi realizada de forma semi-automática, através do software WordSmith Tools 5.0 (Scott 2007). Foram identificados 310 ocorrências da estrutura colocacional the ... of no EST e 768 ocorrências no PUB. Nesse estudo, concentramo-nos na análise dos colocados que aparecem, no mínimo, uma vez em 10,000 palavras em, pelo menos, um dos corpora. Foram analisados 32 colocados, considerando-se quatro aspectos: (1) o número de colocados diferentes em cada corpus; (2) a freqüência relativa de cada colocado; (3) a proporção de ocorrência de cada colocado em relação ao número total em que o mesmo ocorre no corpus em questão; e (3) o contexto de uso de cada colocado.

Os resultados revelam diversas diferenças relevantes entre os dois corpora em relação aos quatro aspectos analisados. Em termos do número de colocados diferentes, observou-se que a proporção é mais alta nos resumos dos alunos (8%) que nos resumos publicados (2%). Ademais, para 50% dos colocados analisados, o número de ocorrências no EST é, pelo menos, o dobro do o número de ocorrências no PUB. Já o inverso, um maior número de ocorrências no PUB em relação ao EST é observado para apenas 12% dos colocados. Nota-se ainda que, para 44% dos colocados, a proporção em que o colocado aparece inserido na estrutura colocacional the ... of é, no mínimo, 10 pontos percentuais mais alta nos resumos dos alunos. Quanto ao contexto de uso, algumas diferenças importantes são observadas em relação aos itens na vizinhança da estrutura, sendo que tais diferenças estão muitas vezes associadas às estratégias discursivas empregadas. O estudo conclui com uma discussão sobre as implicações dos resultados para o ensino e as possíveis aplicações em sala de aula.

 

Resumo