Banco de dados para programas de análise sintática em sentenças do Português Brasileiro

O Projeto de Pesquisa desenvolvido pelo aluno Willian Emerson Afonso Pacheco, do curso de Análise e Desenvolvimento de Sistemas da FATEC Ipiranga, sob a supervisão do Professor Dr. Manoel Francisco Guaranha, está vinculado ao Grupo de Pesquisas em Linguagens, Tecnologia e Ensino que se propõe a estudar, bem como a acolher investigações que contemplem as relações entre as linguagens verbal e matemática, que constituem base do conhecimento científico, e as relações delas com a tecnologia, o mundo do trabalho, os discursos e as práticas educacionais e multidisciplinares voltadas à educação tecnológica.

A pesquisa teve como objetivo construir um modelo de banco de dados léxico e de estruturas sintáticas em português brasileiro para apoiar programas de análise sintática. O estudo foi dividido em três etapas: um estudo referencial sobre as principais estruturas envolvidas na formulação de um parser, a modelagem da estrutura entidade-relacionamento (ER) do banco de dados e a implementação através do gerenciador de banco de dados PostgreSQL administrado pelo Dbeaver.

Ao final obteve-se um modelo ER próprio para a utilização em compiladores e que abrange catorze categorias sintáticas: substantivos, adjetivos, artigos, preposições, conjunções, numerais, pronomes, verbos, advérbios, prefixos, contrações, siglas, abreviaturas ou interjeições. Este recurso será disponibilizado em site do Grupo de Pesquisas para apoiar futuros projetos de desenvolvimento de programas de processamento de linguagem natural.

 

A FATEC Ipiranga apoia a pesquisa acadêmica