Summary: | Rotulagem colaborativa (collaborative tagging) permite que usuários assinalem palavras-chave (ou tags) que descrevam o conteúdo de objetos, o que facilita a navegação e me\-lho\-ra algoritmos de busca sem o uso de categorias pré-definidas. Em sistemas de tagging de larga escala, sistemas de recomendação de tags podem ajudar usuários a assinalar rótulos a objetos e ajudar a consolidar o vocabulário entre diferentes usuários. Uma abordagem promissora para recomendação de tags é explorar a co-ocorrência entre elas. Nesse caso, o enorme tamanho do vocabulário de tags é um desafio, porque (1) a complexidade computacional pode crescer exponencialmente com o número de tags e (2) o peso atribuído a cada tag pode ficar distorcido já que diferentes tags operam em diferentes escalas e os seus respectivos pesos podem não ser diretamente comparáveis. Neste trabalho nós propomos um método novo de recomendação de tagsque é baseado em demanda e que faz recomendações a partir de um conjunto inicial de tags previamente associado a um objeto. Ele reduz o espaço de possíveis soluções, e, portanto, sua complexidade aumenta polinomialmente com o tamanho do vocabulário de tags. Além disso, o peso de cada tag é calibrado usando uma abordagem de minimização de entropia que corrige possíveis distorções e provê recomendações mais precisas. Nós conduzimos uma avaliação sistemática de métodos propostos usando três tipos de mídia: áudio, páginas Web e vídeo. Os resultados experimentais mostram que o método proposto é rápido e melhora a qualidade da recomendação em diferentes cenários experimentais. Por exemplo, no caso de um popular site de músicas ele provê melhoras em precisão (p@5)de 6,4% a 46,7% (dependendo do número de tags dadas como entrada), melhorando métodos de recomendação de tags baseados em co-ocorrência recentemente propostos.
|