Utilização do Caminhamento Aleatório na Identificação de Características de Documentos na Língua Portuguesa
DOI:
https://doi.org/10.22456/2175-2745.20816Abstract
Devido ao grande volume de textos armazenados, a área de mineração de textos vem sendo foco de inúmeras pesquisas que visam a classificação automática de documentos. O presente trabalho tem como objetivo avaliar o método do caminhamento aleatório na definição dos pesos dos termos de textos da língua portuguesa. Esta técnica utiliza a co-ocorrência dos termos como medida de dependência entre as características das palavras. Um grafo não direcionado é utilizado, sendo que a pontuação de cada vértice é calculada em função da probabilidade de ser encontrado. Os resultados obtidos com o caminhamento aleatório foram comparados com os apresentados por técnicas tradicionais, e demonstraram que o método de caminhamento aleatório se mostrou bastante eficaz no processo de classificação de documentos.