Utilização do Caminhamento Aleatório na Identificação de Características de Documentos na Língua Portuguesa

Authors

  • Vagner Francisco Le Roy Centro Universitário de Belo Horizonte- UNI-BH
  • Ana Paula Ladeira

DOI:

https://doi.org/10.22456/2175-2745.20816

Abstract

Devido ao grande volume de textos armazenados, a área de mineração de textos vem sendo foco de inúmeras pesquisas que visam a classificação automática de documentos. O presente trabalho tem como objetivo avaliar o método do caminhamento aleatório na definição dos pesos dos termos de textos da língua portuguesa. Esta técnica utiliza a co-ocorrência dos termos como medida de dependência entre as características das palavras. Um grafo não direcionado é utilizado, sendo que a pontuação de cada vértice é calculada em função da probabilidade de ser encontrado. Os resultados obtidos com o caminhamento aleatório foram comparados com os apresentados por técnicas tradicionais, e demonstraram que o método de caminhamento aleatório se mostrou bastante eficaz no processo de classificação de documentos.

Downloads

Download data is not yet available.

Published

2012-06-01

How to Cite

Le Roy, V. F., & Ladeira, A. P. (2012). Utilização do Caminhamento Aleatório na Identificação de Características de Documentos na Língua Portuguesa. Revista De Informática Teórica E Aplicada, 19(1), 13–27. https://doi.org/10.22456/2175-2745.20816

Issue

Section

Regular Papers