Relationship Between Detected Events in Online Media

Título
Relationship Between Detected Events in Online Media

Doutor: Fabrício Raphael Silva Pereira

Geraldo Bonorino Xexéo (Orientador)

Linha de pesquisa
Engenharia de Dados e Conhecimento

Tese de Doutorado

Data da defesa
27/3/2018

Resumo
As mídias sociais permitem que os usuários leiam, publiquem e compartilhem informações sobre eventos do mundo real. Existem várias técnicas para detectar ou descobrir eventos do mundo real a partir de notícias ou publicações online. No entanto, um problema que muitas vezes é ignorado neste contexto corresponde à descoberta de relações entre eventos. Um tipo particular de relacionamento é a semelhança entre dois eventos, que podem ser usada para organizar e filtrar o fluxo de informações fornecidas aos usuários. Esta tese apresenta uma abordagem para identificar relações de similaridade entre eventos previamente detectados em textos curtos das mídias online. Dessa forma, é proposto o Autoencoder Neural Event Model (AutoNEM ), um modelo de rede neural não-supervisionado baseado em autoencoder para descobrir relações de similaridade entre eventos estruturados de acordo com o padrão de representação do 5W1H. Este modelo atende à combinação de um conjunto de requisitos que até então não foram satisfeitos em uma única abordagem na literatura. O AutoNEM pode codificar eventos em um espaço latente, incluindo cada atributo 5W1H separadamente, o que permite a busca de relações de similaridade entre eventos através de suas novas representações. Os experimentos usam dados coletados do corpus de notícias EventRegistry para validar a abordagem proposta. Os resultados experimentais indicam que o modelo neural proposto para a detecção de relações de similaridade é efetivo, e ao comparar com alguns baselines também se demonstra competitivo. E ainda evidencia algum grau de similaridade em outros pares de eventos que não foram evidenciados pelos curadores manuais do EventRegistry.

Abstract
Social media allow users read, post, and share information about real-world events. There are several techniques to detect or discover real-world events from online news or posts. However, a problem that is often overlooked in this context corresponds to discovering relationships between events. A particular kind of relationship is the similarity between two events, which can be used to organize and filter the flow of information provided to users. This thesis presents an approach to identify similarity relationships between events previously detected in short texts from online media. Thus, it proposes the Autoencoder Neural Event Model (AutoNEM ), an autoencoder-based unsupervised neural network model to discover similarity relations between events structured according to the 5W1H representation standard. This model meets the combination of a set of requirements that have not been satisfied in a single approach in the literature. AutoNEM can encode events in latent space, including each 5W1H-attribute separately, which allows the search for similarity relationships between events through their embeddings. The experiments use data collected from the news corpus EventRegistry to validate the proposed approach. The experimental evaluation indicates that proposed neural model for detecting similarity relationships is effective, and by comparing with some baselines is competitive too. The experiments also evidence some degree of similarity in other pairs of events that had not been evidenced by the manual curators of EventRegistry.