Um dos principais dicionários de língua portuguesa disponíveis na internet traz 200 mil verbetes catalogados. Se para os nativos no idioma já seria uma tarefa árdua conhecer boa parte destas várias palavras, imagine para um estrangeiro. Muitas vezes, a complexidade de aprender uma nova língua está na dificuldade de criar relações e conexões entre os vocábulos.
Sob essa perspectiva, foi desenvolvido na Universidade de Brasília o Dicionário Analógico de Aprendizagem do Português do Brasil (DAAPB), que tem como diferencial disponibilizar dois tipos de consulta: analógica e alfabética. Resultado de um trabalho de dez anos de pesquisa, o material foi criado pela professora do Instituto de Letras (IL) Michelle Machado.
O trabalho teve início ainda no mestrado de Michelle, em 2007. Ela possui toda a sua formação acadêmica realizada na UnB – da graduação ao pós-doutorado. À época a pesquisadora estudava diferentes modelos de dicionários analógicos em todo o mundo. O trabalho desdobrou-se no doutorado, em 2011, e em 2017, durante o pós-doutorado, ela passou a dedicar-se com afinco ao desenvolvimento da ferramenta.
Voltado exclusivamente para estrangeiros, o DAAPB preenche uma demanda de mercado. “Enquanto professora da graduação de Português do Brasil como Segunda Língua, identifico como uma carência que tínhamos. Falta recurso didático destinado a esse público específico”, diagnostica. “De certa maneira, este produto representa uma dívida que eu tinha com a UnB, já que minha formação foi toda aqui”, complementa.
Para Michelle, no contexto atual em que o Brasil vive, com a chegada de imigrantes e a internacionalização do país, há necessidade de reforço da difusão da língua portuguesa e de materiais específicos. “É preciso facilitar o aprendizado da língua e disponibilizar um instrumento de qualidade e gratuito”, considera.
Orientada pela professora Enilde Faulstich, a pesquisa de Michelle está vinculada ao Centro de Estudos Lexicais e Terminológicos (Centro Lexterm). “Ela completou o ciclo ao ingressar como docente e concluir o pós-doutorado na instituição. O papel do centro é justamente o de formação de novos pesquisadores, em todos os níveis”, destaca a docente.
CONSULTA FLEXÍVEL – Ao fornecer duas formas distintas de pesquisa – analógica e alfabética –, a página amplia as possibilidades de busca pelo aprendiz do português. Um dicionário analógico reúne as palavras com base na afinidade de ideias. “Por ser organizado seguindo identidade de relações, é importante definir critérios, uma vez que as possibilidades de relacionar conceitos são praticamente infinitas”, expõe Michelle.
Após o desenvolvimento da seção analógica, veio a ideia de criar também as definições de acordo com as necessidades do seu público-alvo. “Os campos da parte analógica do dicionário contemplam o português básico, e além da possibilidade de consultar por relação semântica, também pode-se procurar palavras como dicionário de língua comum, em ordem alfabética como uma busca qualquer”, detalha.
Para entender o modo como as definições foram desenvolvidas com foco no público-alvo, a docente dá como exemplo a palavra arara. Para explicar o significado desse animal, a estratégia adotada foi a vulgarização dos termos, excluindo por exemplo expressões como aves psitaciformes, gênero Anodorhynchus, Ara e Cyanopsitta.
“Ao estrangeiro aprendiz de português do Brasil, que não é especialista em alguma área do saber, não há necessidade de conhecer uma terminologia técnica que muitas vezes nem mesmo nós – falantes de português como língua materna – compreendemos”, esclarece.
Como o dicionário analógico é organizado em categorias, Michelle afirma que foi preciso determinar um modelo de definição que facilitasse a compreensão pelo estrangeiro. “Assim, para cada grupo há um padrão próprio e este foi um dos trabalhos que consegui avançar durante o pós-doutoramento”, diz.
Atualmente, o DAAPB reúne dez grupos temáticos: alimentação, animal, corpo humano, estudo, família, habitação, lazer, trabalho, transporte e vestuário. Ao todo, são disponibilizados dez verbetes da parte analógica que regem a organização da parte alfabética, composta até o momento por 624 verbetes.
Para que a consulta seja facilitada, foi criado o Guia de Consulta. “Nele, constam todas as informações sobre o dicionário, como o significado das abreviaturas e as explicações sobre como a obra foi construída e como chegamos até aqui”, enfatiza.
BANCO DE DADOS – O grande saldo dessa pesquisa, para a professora Michelle Machado, está no corpus utilizado. “Antes a metodologia não era tão empírica, pois a referência empregada tinha como base outros dicionários analógicos.”
“As palavras mudam ao longo da história e as associações precisam ser feitas de acordo com os contextos atuais”, frisa. Em sua percepção, o problema é que a maioria dos dicionários disponíveis não apresentam os critérios adotados para seleção das palavras relacionadas entre si. Além disso, a pesquisadora considera que muitos dicionários analógicos estão desatualizados, com palavras que não são mais empregadas.
O banco de dados foi extraído a partir de programa de linguística computacional – Sketch Engine. “Essa ferramenta possui bases de todas as línguas, a do português do Brasil foi criada pelo professor Tony Berner Sardinha. Esse corpus possui mais de um bilhão de ocorrências.”
Uma das tarefas foi utilizar a ferramenta Thesaurus do programa para verificar a ocorrência de palavras relacionadas entre si. “É claro que nem todas foram inseridas, pois foram selecionadas aquelas que teriam uma correlação para os estrangeiros que estão aprendendo português”, informa.
O projeto conta com estudantes de graduação e pós-graduação, que participam criando os verbetes e fazendo análises específicas relacionadas à definição, marcas de uso, remissivas. Hoje, oito colaboradores integram a equipe, seis graduandos e dois mestrandos. Muitos deles ingressaram à época que cursaram a disciplina Projeto de Elaboração de Multimeios, do curso de Licenciatura em Letras – Português do Brasil com Segunda Língua (PBSL).
Mestranda em Linguística, Iorrane Meneses Linhares é licenciada em Língua Portuguesa como Segunda Língua e atua no projeto desde 2014. Além de criar os verbetes, ela teve a oportunidade de aplicá-los em atividades nas turmas em que atuou como professora. “Foi uma experiência única, pois o aprendizado ocorreu de forma lúdica. Os alunos conseguiram compreender o significado das palavras e ampliar o vocabulário linguístico por meio de contextos de uso”, relata. Ela já ensinou o idioma a missionários estrangeiros de diversas nacionalidades.
Recentemente, Iorrane participou de evento internacional na Finlândia. A mestranda apresentou parte de sua pesquisa sobre a organização de verbos em dicionários de aprendizagem. “Como o encontro reuniu muitos professores que ensinam português, o dicionário analógico foi muito elogiado, pois é um recurso que auxilia o trabalho pedagógico do professor. Além disso, foi sugerida a leitura de outros materiais para aprimorar o referencial teórico”, comenta.
TECNOLOGIA E INOVAÇÃO – O desenvolvimento do site teve início em 2015, quando o projeto foi contemplado em edital de financiamento da Fundação de Apoio à Pesquisa do Distrito Federal (FAP-DF), possibilitando a contratação de profissional da área de tecnologia e programação.
De acordo com Michelle, os verbetes continuam em construção e o dicionário ainda não foi divulgado para o público específico, pois é preciso atingir um número maior de palavras. A ideia, nesse momento, é receber contribuições para que a ferramenta seja aprimorada.
Em geral, dicionários voltados para iniciantes na língua devem ter em torno de dois a cinco mil verbetes. O grupo espera chegar a esse número em um ano e meio. O DAAPB é atualizado anualmente e a cada semestre os colaboradores elaboram novos vocábulos.
Além do site, há expectativa de desenvolver um aplicativo, facilitando ainda mais o acesso ao conteúdo. “Elaborar um dicionário é uma tarefa para uma vida. Trata-se de projeto contínuo e que sempre tem demanda dentro da própria Universidade”, reflete.
Para a professora Enilde Faulstich, o material é muito importante para os estudos lexicais e terminológicos. “É um trabalho de uma pesquisadora jovem que sabe e soube se integrar à tecnologia para inovar em pesquisa linguística e de linguagens”, elogia.