Título
Usando Permutation Based Indexing na Detecção de Plágio
Mestre
Hugo Diniz Rebelo
Geraldo Bonorino Xexéo
(Orientador)
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Data da defesa
27/9/2019
Resumo
A identificação de plágio Extrínseco é um processo de avaliação de um documento, no qual analisamos o seu conteúdo em busca de um possível plágio comparando de forma direta com possíveis documentos fontes. A identificação de plágio Extrínseco pode ser dividido em três etapas, A Busca Heurística, Analise Detalhada e o Pós-processamento.
Neste trabalho iremos focar na etapa da Busca Heurística, e para isso utilizaremos a abordagem Permutation Based Indexing (PBI), que foi proposta como uma nova abordagem para o cálculo de similaridade entre objetos, tendo como diferencial a redução da quantidade de comparações no dataset, comparando a consulta somente com os objetos pivots, que são objetos do próprio dataset escolhidos na etapa de seleção de pivot, com a ideia de escolher os objetos que melhor representam o dataset como todo. Além da utilização da técnica do PBI, o trabalho terá como uma agregação de valor a criação de variações das técnicas já existentes de pruning, baseada numa “poda”dos pivots, que retira pivots que não tenham muita influência em uma determinada consulta.