Automatic analysis of texts in information systems
Keywords:
Linguística. Análise linguística. Indexação automática. Armazenagem da informação. Aplicações de computador. Recuperação da informação.Abstract
Uma análise linguística completa é um instrumento poderoso para melhorar a capacidade de um sistema automatizado de armazenamento e recuperação de informações. O presente artigo descreve um programa experimental que está sendo desenvolvido na Universidade de Brasília. Os passos da análise linguística são, no presente modelo: segmentação (de um texto em frases e palavras); procura no dicionário e análise morfológica de palavras portuguesas; clareza de homografias sintáticas; construção de uma árvore de dependência; análise de pronomes. Com estes algoritmos, várias contribuições podem ser produzidas para ajudar o indexador humano ou para integrar, junto com processos estatísticos adicionais, um sistema de indexação automática: descritores simples em forma base; descritores compostos (grupos nominais); descritores com peso, baseado nas funções sintáticas dentro da frase; correção estatística com as referências dos pronomes. O programa experimental está sendo testado com várias bases de dados. O desenvolvimento futuro vai se dirigir para a construção de redes semânticas a partir de textos em linguagem natural.
Downloads
Published
Issue
Section
License
Copyright (c) 1983 Revista de Biblioteconomia de Brasília

This work is licensed under a Creative Commons Attribution 4.0 International License.