Indexação automática por atribuição de artigos científi cos em português da área de Ciência da Informação
Resumen
Propõe e avalia um processo de indexação automática por atribuição na representação de artigos escritos em português,
visando a construção de uma base de dados científi ca na área de Ciência da Informação no Brasil. Utiliza como metodologia, a
pesquisa exploratória, bibliográfi ca e empírica. A parte empírica envolve a realização de um experimento na forma de estudo de
caso. O experimento consistiu na aplicação do processo proposto em um corpus formado por 60 artigos científi cos e avaliação
da qualidade na indexação automática por meio dos índices de consistência, precisão, revocação e medida F, tendo como
padrão de referência as palavras-chaves dos autores. No processo proposto foram utilizados o Tesauro Brasileiro em Ciência
da Informação e o software SISA. Foram obtidos resultados satisfatórios quanto a qualidade na indexação automática: índice
de consistência médio de 19%, precisão média de 30%, revocação média de 37% e medida F média de 30%. Os resultados da
pesquisa mostram que o Tesauro tem forte infl uência nos resultados de uma indexação automática por atribuição, apesar das
relações de termo geral terem pouco contribuído para a qualidade na indexação automática. Também, foram apontados fatores
intervenientes na indexação automática
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Transinformação
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.