h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Predictive analytics and protection of massive data = Prädiktive Analyse und Schutz von großen Datenmengen



VerantwortlichkeitsangabeRoland Amba Assam

Ausgabe1. Aufl.

ImpressumAachen : Apprimus-Verl. 2015

ISBN978-3-86359-356-8

ReiheErgebnisse aus der Informatik


Zugl.: Aachen, Techn. Hochsch., Diss., 2015

Druckausgabe: 2015. - Auch veröffentlicht auf dem Publikationsserver der RWTH Aachen University 2016


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
; ;

Tag der mündlichen Prüfung/Habilitation
2015-06-10

Online
URN: urn:nbn:de:hbz:82-rwth-2015-059870
URL: https://publications.rwth-aachen.de/record/540651/files/540651.pdf

Einrichtungen

  1. Lehrstuhl für Informatik 9 (Datenmanagement und -exploration) (122510)
  2. Fachgruppe Informatik (120000)

Inhaltliche Beschreibung (Schlagwörter)
Informatik (frei) ; predictive analytics (frei) ; data mining (frei) ; privacy preserving data mining (frei) ; LBSN (frei) ; prediction (frei) ; location prediction (frei) ; wavelets (frei) ; differential privacy (frei) ; conditional random fields (frei) ; mobility analytics (frei) ; location based social network analytics (frei) ; sensor activity recognition (frei) ; activity prediction (frei)

Thematische Einordnung (Klassifikation)
DDC: 004

Kurzfassung
Täglich wird eine Vielzahl von unterschiedlichen Daten generiert. Tragbare Geräte sind heutzutage auf dem Vormarsch und sogar in den kleinsten solcher Geräte sind meist Sensoren für z. B. Tracking verbaut. Sollte das Internet der Dinge sein volles Potential weiter entfalten, so wird die Datengenerationsrate weiter exponentiell ansteigen. Diese Datenflut erschwert nicht nur die Aufgabe der Datenanalyse sondern bedroht zudem auch den Datenschutz. Als Konsequenz fokussiert sich diese Arbeit sowohl auf Wissensextraktion als auch den Schutz dieses Wissens. Die Herausforderungen der Datenanalyse sind für ein weites Feld von Industriebranchen offenkundig. Ein Beispiel hier ist die Telekommunikationsbranche, in der Organisationen verzweifelt versuchen, Muster für den Verlust von Kunden aufzudecken oder im Bereich der Biowissenschaften, wo Wissenschaftler bestrebt sind entscheidende Muster in der DNA zu erfassen. Ein Ansatz zur Bewältigung dieser Herausforderungen ist die Verwendung von prädiktiven Analysemethoden. In dieser Arbeit wird eine große Bandbreite neuer Data Mining Lösungen zur prädiktiven Analyse vorgestellt, welche von der Positionsvorhersage über Aktivitätserkennung bis zu medizinischen Vorhersagen unter Verwendung probabilistischer, graphischer Modelle wie Markov-Ketten, Hidden Markov Models und Conditional Random Fields reichen. Ferner wird die Nutzung von Wavelets zur Erkennung von Ähnlichkeiten und Korrelationen zwischen Zeitreihen untersucht. Um die Privatsphäre eines Individuums zu schützen, werden zudem neue, verbesserte Privacy Preserving Data Mining Techniken vorgestellt, welche Nutzer und große Netzwerke anonymisieren sowie Positionen verbergen.

Prodigious amount of data is generated daily. Nowadays, wearable devices are on the rise, sensors are engrained even in miniature equipments for tracking. Should the overarching goals of internet of things reach full potential - meaning every device can transmit or receive data, then the rate of data generation will further soar exponentially. This avalanche of data is not only rendering data analytics more complex, but it is also threatening individuals’ privacy. As a result, this thesis focuses on both knowledge discovery and knowledge protection. The data analytics challenges are self-evident across an array of industries such as in telecommunications, where organizations continue to lose customers and are obsessed to identify patterns of such customers, or in life sciences where researchers are striving to capture vital patterns in DNA or better understand the human body using sensors. These challenges connote the demand for new techniques to expose more hidden patterns. One approach to address these challenges is by the use of predictive analytics. This thesis presents a wide range of novel data mining predictive analytics solutions, ranging from location prediction through activity recognition to prediction in the medical domain using probabilistic graphical models such as Markov chains, Hidden Markov Models and Conditional Random Fields. Besides, it explores the usage of Wavelets to determine similarities or correlations between time series.Furthermore, to ensure that the privacy of an individual is not infringed, this thesis provides new enhanced privacy preserving data mining techniques to anonymize users, huge networks and hide locations.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis/Book

Format
online, print

Sprache
English

Externe Identnummern
HBZ: HT018796408

Interne Identnummern
RWTH-2015-05987
Datensatz-ID: 540651

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Document types > Books > Books
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Public records
Publications database
122510
120000

 Record created 2015-10-29, last modified 2023-04-08


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)