Nowadays, User Generated Content is the main source of real time news and opinions on the world happenings. Social Media, which serves as an environment for the creation and spreading of User Generated Content, is, therefore, representative of our culture and constitutes a potential treasury of knowledge. Thus, analyzing the content spread in Social Media can bring unprecedented opportunities to many areas of research and application. This matter was explored from two different angles in the first phase of this PhD thesis. In particular, the first exploratory study has focused on the correlation between the performance of companies as expressed in Social Media posts and the Stock Market values movements of the same companies. Meanwhile, the second exploratory work of the first phase of this thesis analyzed different dimensions and their combinations of the information spread under a Social Media hashtag in time. The insights and conclusions highlighted by these first two studies on Social Media have served as the basis for the development of the main ideas in this PhD. As the core focus of this thesis we propose an approach for modeling, tracking and analyzing the information evolution over time in Social Media. In particular, we propose to model a Social Media stream as a text graph. A graph degeneracy technique is used to identify the temporal sequence of the core units of information streams represented by graphs. Furthermore, as the major novelty of this work, we propose a set of measures to track and evaluate quantitatively and qualitatively the evolution of information in time. An experimental evaluation on the crawled datasets from one of the most popular Social Media platforms proves the validity and applicability of the proposed approach.

Nei tempi attuali, User Generated Content è la principale fonte di notizie e opinioni in tempo reale sugli avvenimenti mondiali. I Social Media, che servono da ambiente per la creazione e la diffusione di contenuti generati dagli utenti, sono, quindi, rappresentativi della nostra cultura e costituiscono un potenziale tesoro di conoscenza. Pertanto, l'analisi del contenuto diffuso nei social media può portare opportunità senza precedenti a molte aree di ricerca e applicazione. Questa questione è stata esplorata da due diversi punti di vista nella prima fase di questa tesi di dottorato. In particolare, il primo studio esplorativo si è concentrato sulla correlazione tra i risultati delle aziende espresse nei post sui social media e l’andamento dei titoli di tali società in borsa. Nel frattempo, il secondo lavoro esplorativo della prima fase di questa tesi ha analizzato diverse dimensioni e le loro combinazioni di informazioni diffuse sotto un hashtag di social media nel tempo. Le intuizioni e le conclusioni evidenziate da questi primi due studi sui social media sono servite come base per lo sviluppo delle idee principali in questo dottorato. Come fulcro di questa tesi proponiamo un approccio per la modellazione, il monitoraggio e l'analisi dell'evoluzione delle informazioni nel tempo nei social media. In particolare, proponiamo di modellare un flusso di social media come un grafico di testo. Una tecnica di degenerazione del grafo è usata per identificare la sequenza temporale delle unità centrali di flussi di informazioni rappresentati da grafici. Inoltre, come principale novità di questo lavoro, proponiamo una serie di misure per tracciare e valutare quantitativamente e qualitativamente l'evoluzione delle informazioni nel tempo. Una valutazione sperimentale sui set di dati sottoposti a scansione da una delle piattaforme di social media più popolari dimostra la validità e l'applicabilità dell'approccio proposto.

(2018). Information Evolution Modeling, Tracking and Analyzing in Social Media Streams.. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2018).

Information Evolution Modeling, Tracking and Analyzing in Social Media Streams.

SHABUNINA, EKATERINA
2018

Abstract

Nowadays, User Generated Content is the main source of real time news and opinions on the world happenings. Social Media, which serves as an environment for the creation and spreading of User Generated Content, is, therefore, representative of our culture and constitutes a potential treasury of knowledge. Thus, analyzing the content spread in Social Media can bring unprecedented opportunities to many areas of research and application. This matter was explored from two different angles in the first phase of this PhD thesis. In particular, the first exploratory study has focused on the correlation between the performance of companies as expressed in Social Media posts and the Stock Market values movements of the same companies. Meanwhile, the second exploratory work of the first phase of this thesis analyzed different dimensions and their combinations of the information spread under a Social Media hashtag in time. The insights and conclusions highlighted by these first two studies on Social Media have served as the basis for the development of the main ideas in this PhD. As the core focus of this thesis we propose an approach for modeling, tracking and analyzing the information evolution over time in Social Media. In particular, we propose to model a Social Media stream as a text graph. A graph degeneracy technique is used to identify the temporal sequence of the core units of information streams represented by graphs. Furthermore, as the major novelty of this work, we propose a set of measures to track and evaluate quantitatively and qualitatively the evolution of information in time. An experimental evaluation on the crawled datasets from one of the most popular Social Media platforms proves the validity and applicability of the proposed approach.
BANDINI, STEFANIA
PASI, GABRIELLA
Information; Evolution,; Information; Propagation,; Ememe
Information; Evolution,; Information; Propagation,; Ememe
INF/01 - INFORMATICA
English
8-mar-2018
INFORMATICA - 87R
30
2016/2017
open
(2018). Information Evolution Modeling, Tracking and Analyzing in Social Media Streams.. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2018).
File in questo prodotto:
File Dimensione Formato  
phd_unimib_798746.pdf

accesso aperto

Descrizione: tesi di dottorato
Tipologia di allegato: Doctoral thesis
Dimensione 1.96 MB
Formato Adobe PDF
1.96 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/199007
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact