h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Learning comprehensible models for analysis and predictions in scientific databases = Lernen von verständlichen Modellen für Analysen und Vorhersagen in wissenschaftlichen Datenbanken



VerantwortlichkeitsangabeAnca Zimmer

Ausgabe1. Aufl.

ImpressumAachen : Apprimus-Verl. 2014

UmfangIII, 193 S. : Ill., graph. Darst.

ReiheErgebnisse aus der Informatik ; 2


Zugl.: Aachen, Techn. Hochsch., Diss., 2013

Zsfassung in dt. u. engl. Sprache


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter


Tag der mündlichen Prüfung/Habilitation
2013-12-03

Online
URN: urn:nbn:de:hbz:82-opus-50240
URL: https://publications.rwth-aachen.de/record/229076/files/5024.pdf

Einrichtungen

  1. Fachgruppe Informatik (120000)
  2. Lehrstuhl für Informatik 9 (Datenmanagement und -exploration) (122510)

Inhaltliche Beschreibung (Schlagwörter)
Klassifikations- und Regressionsbaum (Genormte SW) ; Vorhersage (Genormte SW) ; Datenbank (Genormte SW) ; Informatik (frei) ; data mining, prediction (frei) ; regression trees (frei) ; scientific databases (frei)

Thematische Einordnung (Klassifikation)
DDC: 004

Kurzfassung
Eine effiziente Bearbeitung und Analyse von experimentellen Messungen ist ein wesentlicher Bestandteil der Forschung und Entwicklung in einer Vielzahl von Disziplinen (z.B. Maschinenbau, Chemie, Biologie). Forscher führen Experimente durch und ziehen Schlussfolgerungen basierend auf ihre Beobachtungen. Der aktuelle Stand der Technologie erlaubt es, riesige Datenbestände zu sammeln, die dann ausgewertet werden müssen. In der Umweltforschung werden drahtlose Sensor-Netzwerke verwendet, um Daten an räumlich und zeitlich diskreten Positionen zu sammeln. Im Maschinenbau werden komplexe Prüfstände aufgebaut und Beobachtungen werden aufgezeichnet. Die Forscher streben sowohl nach einer effizienten und effektiven Untersuchung der Ergebnisse, als auch nach der Identifikation von Korrelationen innerhalb der gemessenen Daten. Typischerweise werden analytische Funktionen verwendet, um die experimentellen Daten zu modellieren. Solche Modelle bieten eine kompakte und intuitive Darstellung der zugrunde liegenden Prozesse. Daher können Vorhersagen für Betriebspunkte gemacht werden, für die keine Messungen bereitgestellt wurden. Eine Klasse solcher Modelle sind (stückweise) lineare Funktionen, die üblicherweise in wissenschaftlichen Datenbanken eingesetzt werden, um die Daten darzustellen und Vorhersageanfragen zu beantworten. Diese Arbeit behandelt Techniken zur Identifizierung stückweise linearer Modelle durch den Aufbau von Regressionsbäumen. Neue algorithmische Lösungen für den Aufbau kompakter und gleichzeitig genauer Modelle werden eingeführt und evaluiert. Darüber hinaus wird, bei der Verfügbarkeit solcher Modelle in wissenschaftlichen Datenbanken, das Konzept von inversen Vorhersageanfragen präsentiert und eine vielfalt von Anfragen neu eingeführt.

Efficient handling and analysis of experimental measurements is an essential part of research and development in a multitude of disciplines (e.g., engineering, chemistry, biology), since these contain information about the underlying processes. Researchers investigate processes by running experiments and gathering potentially a huge amount of data which is then to be evaluated. For environmental monitoring wireless sensor networks are used to collect data at spatially and temporally discrete positions. In mechanical engineering and related areas, potentially complex test-benches are set up and observations are recorded. Besides an efficient and effective way of exploring multiple results, researchers strive to discover correlations within the measured data. Moreover, model-based prediction of expected measurements can be highly beneficial for designing further experiments. Typically, analytical functions or distributions are used to model the experimental data. Such models can offer a compact and intuitive representation of the underlying processes. Hence, predictions can be made at operating points for which no measurements were provided. One class of simple yet powerful functions suitable for such models are (piecewise) linear regression functions, which are often used in scientific databases for representing the data and performing prediction queries. This thesis covers techniques for identifying piecewise linear models by building regression trees. New algorithmic solutions for building more compact and in the same time accurate models are developed and evaluated. Finally, with such models available in scientific databases, novel solutions are introduced, which enable a wide range of reverse engineered model-based predictions.

Fulltext:
Download fulltext PDF

Dokumenttyp
Dissertation / PhD Thesis

Format
online, print

Sprache
English

Interne Identnummern
RWTH-CONV-144051
Datensatz-ID: 229076

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Public records
Publications database
122510
120000

 Record created 2014-07-16, last modified 2022-04-22


Fulltext:
Download fulltext PDF
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)