Este trabalho aborda o problema de predição de tags (rótulos) em sistemas de tagueamento colaborativo (Social Tagging Systems). É sabido que mecanismos de predição de tags em tais sistemas melhora a usabilidade dos mesmos aumenta a qualidade do vocabulário de tags. Com isso em mente, verificamos a diferença no desempenho de métodos de predição de tags quando aplicados a dois datasets que se diferenciam quanto a número de tags por recurso, quantidade total de tags, quantidade total de recursos, etc. Também analisamos um método específico para predição de tags baseado na quebra de documentos em segmentos. Verificamos se o mesmo generaliza para representações densas de textos. Experimentos são realizados nestes dois conjuntos de dados e os resultados obtidos são relatados.
This work addresses the problem of how to predict tags that will be assigned by users in Social Tagging Systems. It is widely known that tag prediction functionality helps promote system usability and increase the quality of the tag vocabulary in use. With that in mind, we verify the difference in performance of several label ranking techniques on two datasets, which differ from each other in several key metrics such as the average number of tags per resource, tag vocabulary length, total number of resources, etc. We also analyze a specific label ranking technique, namely MIMLSVM.We verify whether it generalizes to dense text representations in addition to traditional sparse ones. Experiments are conducted on the two datasets and results are analyzed.