Project

Back to overview

Exploratory Visual Analytics for Interaction Graphs

Applicant Soulé Robert
Number 167173
Funding scheme NRP 75 Big Data
Research institution Facoltà di scienze informatiche Università della Svizzera italiana
Institution of higher education Università della Svizzera italiana - USI
Main discipline Information Technology
Start/End 01.09.2017 - 31.08.2021
Approved amount 569'308.00
Show all

Keywords (3)

visual analytics; graph processing; query languages

Lay Summary (German)

Lead
Durch dieses Projekt sollen Menschen in die Lage versetzt werden, Daten zu analysieren, zu verarbeiten und zu "sehen", die aus Interaktionen zwischen Personen, Systemen und der Umwelt stammen. Solche Daten sind zum Beispiel Aufzeichnungen von Telefongesprächen oder Posts in den sozialen Medien.
Lay summary

Der von Menschen, Softwaresystemen und der physischen Welt generierte Datenstrom zeichnet sich vor allem durch drei Merkmale aus: ein enormes Volumen, grosse Vielfalt und rasantes Wachstum. Daten, die sich auf Interaktionen zwischen Menschen, Systemen und der Umwelt beziehen, können heute in vielen Anwendungen (etwa Telefon und soziale Medien) ausgewertet werden. Ziel dieses Projekts ist es, neue Techniken und Ansätze zur Nutzung dieser Daten zu entwerfen, zu entwickeln und zu validieren. Das Projekt richtet sich dabei auf drei Kernfragen: Wie können die Daten gespeichert und verwaltet werden? Welche Art der Datenabfrage liefert nutzbringende Antworten? Wie lassen sich Veränderungen der Daten visualisieren?

Die Forschung hat sich bisher auf Daten konzentriert, die sich auf statische Beziehungen zwischen Menschen, Orte und Dingen beziehen. Da sich Daten im Laufe der Zeit aber verändern, ist es wichtig, auch Trends zu erkennen. Durch die stetige Zunahme der Datenvolumen wird es zudem immer schwieriger, die aufgezeichneten Daten effizient zu speichern und zu verarbeiten.

Unser Projekt stellt sich drei grossen Herausforderungen im Zusammenhang mit der Verarbeitung und Visualisierung von interaktionsbezogenen Daten. Erstens wollen wir die zum Speichern und Verwalten der Daten benötigte IT-System-Infrastruktur entwickeln. Zweitens wollen wir eine spezielle Computersprache entwickeln, die es den Anwendern ermöglicht, Daten abzufragen. Im letzten Schritt werden wir ein Verfahren zur Visualisierung dieser Daten entwickeln, so dass die Anwender erkennen können, wie sich die Daten im Lauf der Zeit verändern.

Angesichts der äusserst vielfältigen Nutzungsmöglichkeiten von interaktionsbezogenen Daten und der Notwendigkeit, diese Daten zu verstehen und Erkenntnisse aus ihnen zu gewinnen, gehen wir davon aus, dass dieses Projekt nach seinem erfolgreichen Abschluss grosse Bedeutung sowohl für die Forschung als auch für die Industrie haben wird.

Direct link to Lay Summary Last update: 26.07.2017

Lay Summary (French)

Lead
L’objectif de ce projet est l’analyse, le traitement et la visualisation de données sur des interactions entre les gens, les systèmes et l’environnement. Les enregistrements d’appels téléphoniques ou de messages sur les médias sociaux sont deux exemples de ce type de données. Ces analyses pourraient fournir de nouvelles perspectives commerciales et améliorer la prise de décision.
Lay summary

Le flux constant de données généré par les gens, les systèmes logiciels et le monde physique a trois caractéristiques distinctes: il est volumineux, varié et grandit rapidement. L’information est aussi plus accessible qu’avant. Dans de nombreuses applications (par ex. les appels téléphoniques et les médias sociaux), les données enregistrant des interactions entre les gens, les systèmes et l’environnement sont disponibles pour l’analyse. L’objectif de ce projet est de concevoir, développer et valider de nouvelles techniques et approches pour les exploiter.

Par le passé, les recherches se sont concentrées sur des données liées à des relations statiques entre diverses entités (gens, lieux, objets). Or elles évoluent au cours du temps et nous avons besoin d’en comprendre les tendances. Le volume des données enregistrées augmente constamment : leur stockage et leur traitement représentent un important défi.

Notre projet s’attaque à trois défis principaux en lien avec le traitement et la visualisation de données sur les interactions. Nous développerons d’abord l’infrastructure du système informatique nécessaire au stockage et à la gestion des données. Nous créerons ensuite un langage informatique spécialisé qui permettra aux utilisateurs de poser des questions sur les données. Enfin, nous élaborerons une méthode de visualisation des données permettant aux utilisateurs de voir comment elles changent au cours du temps.

Compte tenu de la grande variété des applications pour les données qui enregistrent des interactions et de la nécessité de les comprendre et d’en tirer des enseignements, nous nous attendons à ce que le projet, une fois achevé avec succès, ait un large impact sur la recherche et l’industrie.

Direct link to Lay Summary Last update: 26.07.2017

Lay Summary (English)

Lead
The goal of this project is to enable people to analyse, process and “see” data on interactions between people, systems and the environment. Records of phone calls or social media posts are just two examples of such data. This type of analysis could deliver new business insights and improve decision making. The constant stream of data generated by people, software systems and the physical world has three distinguishing characteristics: it is very large, it is very varied and it accumulates very fast.
Lay summary

Information is also more accessible than ever before. For example, in many applications (e.g. phone calls and social media), data that record interactions between people, systems and the environment are available for analysis. The goal of this project is to conceive, develop and validate novel techniques and approaches for exploiting these data. The project tackles three main challenges: how to store and manage the data; how to ask questions about the data that provide useful answers; and how to “see” changes in the data over time.Past research efforts have focused on data related to static relationships between entities (people, places and things). But data change over time, and we need to understand the trends. In addition, the amount of data recorded is constantly growing, which makes efficiently storing and processing it a significant challenge.

Past research efforts have focused on data related to static relationships between entities (people, places and things). But data change over time, and we need to understand the trends. In addition, the amount of data recorded is constantly growing, which makes efficiently storing and processing it a significant challenge.

Our project tackles three main challenges related to processing and visualising data about interactions. First, we will develop the computer system infrastructure needed to store and manage the data. Second, we will create a specialised computer language that allows users to ask questions about the data. Finally, we will design a method of visualising data that allows users to see how the data change over time.

Given the wide variety of applications for data that record interactions, and the need to understand and gain insights from those data, we expect the successful completion of this project to have a broad impact on both research and industry.

Direct link to Lay Summary Last update: 26.07.2017

Responsible applicant and co-applicants

Employees

Publications

Publication
Packet Subscriptions for Programmable ASICs
Jepsen Theo, Moshref Masoud, Carzaniga Antonio, Foster Nate, Soulé Robert (2018), Packet Subscriptions for Programmable ASICs, in the 17th ACM Workshop, Redmond, WA, USAACM, Redmond, WA.
Fast String Searching on PISA
JepsenTheo, AlvarezDaniel, FosterNate, KimChanghoon, LeeJeongkeun, Fast String Searching on PISA, in Symposium on SDN Research (SOSR), ACM SIGCOMM, San Jose, CA.
Life in the Fast Lane: A Line-Rate Linear Road
Jepsen Theo, Moshref Masoud, Carzaniga Antonio, Foster Nate, Soule Robert, Life in the Fast Lane: A Line-Rate Linear Road, in 2018 Symposium on SDN Research, ACM, Symposium on SDN Research (SOSR).
NetChain: Scale-Free Sub-RTT Coordination
Jin Xin, Li Xiaozhou, Zhang Haoyu, Soule Robert, Lee Jeongkeun, Foster Nate, Kim Changhoon, Stoica Ion, NetChain: Scale-Free Sub-RTT Coordination, in 15th USENIX Symposium on Networked Systems Design and Implementation, USENIX, Symposium on Networked Systems Design and Implementation.

Abstract

Our modern world is flooded with data. An incessant amount of data, generated by people, software systems, and the physical world is more accessible than ever before and is much larger in volume, variety, and velocity. In many application domains, live data recording the interactions between people, systems, and the environment is available for analysis. This data often takes the form of an interaction graph, a temporally evolving graph, where entities are the vertices and the interactions between them are the edges. Examples of interaction graphs included phone call-detail records which log data about phone calls, or tweets which record the postings of users over Twitter. Given the massive size of the data sets available, analysts often find themselves drowning in a sea of data. To make sense of it, users typically would like to proceed in an ad-hoc or exploratory fashion. That is, they formulate conjectures about trends in the data, test those conjectures, and then based on the result, rule out hypotheses and generate new ones. This process is roughly analogous to how programmers understand large, complex systems. Unfortunately, while programmers have tools and visual IDEs which help them understand code, they lack the appropriate tools that would allow them to gain insights about very large graph data sets.Interaction graphs have several characteristics that make their processing and analysis challenging. First, the number of edges in an interaction graph can grow to an unbounded size. Thus, analyzing such graphs requires techniques that scale to massively sized data sets. Second, interaction graphs are temporal, i.e., they evolve over time. Understanding how the data changes (again at scale) requires the conception and development of novel processing techniques. Third, the analytics performed on interaction graphs typically involve computations on data stored as edge attributes. Thus, while most graph processing systems focus on the structure of the data, with interaction graphs operations are needed that bear a stronger resemblance to traditional relational database queries. Fourth, understanding interaction graphs, given the vast amounts of evolving information, is truly one of the grand challenges of data science, and requires novel techniques that involve the modeling and interactive visualization the data.The goal of this collaborative project is to conceive, develop, and validate novel techniques and ap- proaches to enable real-time analytics of interaction graphs, by bringing together the skills and know-how of researchers with diverse backgrounds.
-