2010
Aachen, Techn. Hochsch., Diss., 2010
Zsfassung in dt. und engl. Sprache
Genehmigende Fakultät
Fak01
Hauptberichter/Gutachter
Tag der mündlichen Prüfung/Habilitation
2010-10-12
Online
URN: urn:nbn:de:hbz:82-opus-34031
URL: https://publications.rwth-aachen.de/record/63253/files/3403.pdf
Einrichtungen
Inhaltliche Beschreibung (Schlagwörter)
Ähnlichkeitssuche (Genormte SW) ; Data Mining (Genormte SW) ; Information Retrieval (Genormte SW) ; Multimedia (Genormte SW) ; Informatik (frei) ; Earth Mover's Distanz (frei) ; Indexstrukturen (frei) ; Multistep-Architekturen (frei) ; earth mover's distance (frei) ; index structures (frei) ; multistep architectures (frei)
Thematische Einordnung (Klassifikation)
DDC: 004
ccs: H.3.7 Digi * H.3.3 Info * H.2.8 Data * H.2.4 Syst
Kurzfassung
Mit dem stetigen Größenzuwachs heutiger Multimedia-Datenbanken laufen diese Gefahr, zu reinen Datenhalden zu verkommen. Um dies zu verhindern, sind Methoden, welche einen effizienten und effektiven Zugriff auf die Daten ermöglichen, für den Benutzer (ob Mensch oder Algorithmus) von hohem Stellenwert. Aus Benutzersicht kommt hierbei anfragebasierten Suchmethoden eine besondere Bedeutung zu. Allerdings können für Multimedia-Datensammlungen nicht alle Suchbedarfe mittels exakten, algebraischen Anfragebeschreibungen abgedeckt werden. So mag dem Benutzer ein prototypisches Bild oder Musikstück bekannt sein, ohne dass es ihm/ihr möglich ist, formal zu beschreiben, welche Eigenschaften den prototypischen Charakter ausmachen. Systeme zur Ähnlichkeitssuche, welche auf dem query-by-example Paradigma beruhen, können dem Benutzer helfen, die Datenbank nach Objekten mit einem hohen Grad an Ähnlichkeit zum Prototyp zu durchsuchen. Hierfür muss das System auf algorithmische Weise entscheiden, welche Objekte zueinander ähnlich sind. Nach einer Einleitung und einem Überblick über die Grundlagen der Arbeit in den Teilen I und II, zeigen die darauf folgenden drei Teile Techniken auf, welche die Effizienz, die Effektivität und die Anwendbarkeit einer besonders flexiblen und intuitiven Klasse von Distanzmaßen betreffen. Die Distanz zweier Objekte wird hier als Maß für die Unähnlichkeit dieser interpretiert und als minimales Pensum an Arbeit modelliert, welches für die Umwandlung der Merkmalsrepräsentation des einen Objekts in die des anderen aufzuwenden ist. Da die Kosten der für die Transformation aufzuwendenden Arbeit den auftretenden Objektmerkmalen entsprechend gewählt werden können, sind transformationsbasierte Distanzmaße in höchstem Maße anpassbar und vermögen es wahrnehmungsbezogene Abhängigkeiten der Merkmale zu berücksichtigen.Efficient and effective methods of making data accessible to its consumers - be they humans or algorithms - are crucial for turning ever-growing data dumps into data mines. Of particular importance to the user are access methods that allow for query-based searching of databases. However, for vast collections of complex data objects such as digital image libraries and music databases, querying methods that necessitate an accurate, algebraic description of what the user is looking for cannot cover all search needs. For instance, a prototypical object might be known to the user and yet he or she may be unable to describe which qualities make the object prototypical. Similarity search systems based on the query-by-example paradigm can help the user in such situations by retrieving objects from the database that exhibit a high degree of similarity to the prototypical query object. For this purpose, the system must decide algorithmically which objects are to be deemed similar to each other. After giving an introduction and reviewing preliminaries in parts I and II, the following three parts of this thesis address novel techniques regarding the efficiency, effectiveness, and applicability of a particularly intuitive and flexible class of distance measures where the distance (i.e., dissimilarity) between two objects is modeled as the minimum amount of work that is required for transforming the feature representation of one object into the feature representation of the other. As the cost of transforming a feature into another can be chosen depending on the features at hand, these transformation-based distance measures are highly adaptable and do not assume that the underlying features are perceptually independent.
Fulltext:
PDF
Dokumenttyp
Dissertation / PhD Thesis
Format
online, print
Sprache
English
Interne Identnummern
RWTH-CONV-124696
Datensatz-ID: 63253
Beteiligte Länder
Germany