Dokument: Ontology Matching based on Combination of Lexical and Structural Techniques in Semantic Web

Titel:Ontology Matching based on Combination of Lexical and Structural Techniques in Semantic Web
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=37265
URN (NBN):urn:nbn:de:hbz:061-20160229-085113-4
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor:M.Sc. Nguyen, Thi Thuy Anh [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]801,7 KB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 22.02.2016 / geändert 22.02.2016
Beitragende:Prof. Dr. Conrad, Stefan [Betreuer/Doktorvater]
PD Dr. Gurski, Frank [Gutachter]
Stichwörter:Ontology matching, Structure, Lexical, Semantic.
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:Nowadays, ontologies become the foundation of Semantic Web. The number of ontologies is increasing day by day. Researching on ontologies and its applications in various fields such as artificial intelligence, computational linguistics, computer science, e-commerce have been spreading and maturing. Actually, ontologies represent the characteristics of a specific domain. They include classes, properties, relationships, and instances. Since being different from background knowledge, languages used for expression, points of view of designers and entities are modeled in different ways, there is not one ontology matched perfectly to another one. This leads to heterogeneity between ontologies. In addition, the management of knowledge based on ontologies is necessary. Therefore, comparing, mapping, and integrating ontologies should be implemented in which the task of matching is to reduce ontology heterogeneity problem and identify the similarities between entities from ontologies. From the issue mentioned above, research communities have developed methods for ontology matching based on several aspects of similarity such as lexical, semantic, structural, and instances.
This thesis focuses on the task of ontology matching which has received many investigations in recent years. Although a lot of individual similarity measures are proposed, no ontology matching system uses only one technique to match. Normally, more than one similarity measure is used and the matching results are then combined to obtain the final alignment. Ontology matching systems give solutions to achieve the best possible matching results by using lexical-based, structure-based, semantic-based, and instances-based techniques together. The proposed methods used in these systems take into account different aspects of the similarity of entities in ontologies. In this work, ontology matching is based on our structural, lexical and semantic methods and use WordNet dictionary. In particular,we present an improvement of the lexical metric by applying information theoretic and edit distance approaches, new structural and semantic measures.
The first contribution of this study is applying information-theoretic and edit distance methods to flexibly measure lexical similarity. Besides of improving the accuracy for string-based similarity degrees, this metric deals with some irrelevant situations. Our second approach is a novel structure-based similarity measure for automatic ontology matching. Being different from existing structural measures, this approach takes into account all of the ancestors of considered concepts. Another contribution of this research is a semantic similarity measure between nouns based on the structure of WordNet. This measure uses the WordNet dictionary as an external resource to take semantics of entities. Besides the positions of two entities relatively to the root in a hierarchy, this approach considers the relationships between these entities. Our ontology matching solution is integrated by using weighted sum method to measures in which both sequential and parallel strategies are executed for computing similarity. After that, we will evaluate the quality of our system. Our approach is implemented on the benchmark dataset of the 2008 OAEI and then compared to the other systems. The experimental results show that our approach reaches good F-measure values and can compete with other automatic systems which do not use instances. The one-to-one or one-to-many alignments are generated in the final phase. The approaches presented in this thesis could also be applied in many application domains.

Ontologien, Systeme von Informationen mit logischen Relationen, bilden immer stärker das Fundament des semantischen Webs. Die Zahl der Ontologien nimmt tagtäglich zu. Die Forschung auf dem Gebiet der Ontologien und ihren Anwendungen in verschiedenen Feldern der Informatik wie künstliche Intelligenz, linguistische Datenverarbeitung, Computerwissenschaften und elektronischer Handel hat sich weit verbreitet. Hier repräsentieren Ontologien die Eigenschaften eines spezifischen Bereiches. Sie schließen Klassen, Eigenschaften, Beziehungen und Beispiele ein. Da sie von unterschiedlichen Hintergrundkenntnissen stammen, verschiedene Sprachen für ihre Umsetzung verwendet werden, Ansichten der Entwickler sich unterscheiden und Entitäten in verschiedenen Arten modelliert werden, passen gewöhnlich verschiedene Ontologien nicht zueinander.
Grund sind Heterogenitäten zwischen den Ontologien. Weiterhin ist es notwendig, das auf der Ontologie basierende Wissen zu verwalten und weiterzuentwickeln. Deshalb müssen Ontologien verglichen, zusammengeführt, und angepasst werden. Wichtige Aufgaben sind,Ontologieheterogenitätsprobleme zu reduzieren und die Ähnlichkeiten zwischen Entitäten zu identifizieren, um die Ontologien verbinden zu können. Vomoben genannten Problem ausgehend haben Forscher Methoden für das Zusammenbringen von Ontologien entwickelt, die sich auf mehreren Aspekten der Ähnlichkeit gestützen, wie z. B. lexikalische, semantische, strukturelle und instanzielle.
Die vorliegende Arbeit konzentriert sich auf die Aufgabe des Ontologie Matchings, das in den letzten Jahren viel erforscht wurde. Obwohl viele individuelle Ähnlichkeitsmaße vorgeschlagenwerden, verwendet kein System zum Verbinden von Ontologien nur eine Technik. Normalerweise wirdmehr als ein Ähnlichkeitsmaß verwendet. Ergebnisse, die gut zusammenpassen, werden dann verbunden, um die Endanordnung zu erhalten. Ontologie-Matching-Systeme geben Lösungen, die bestmöglich zusammenpassenden Ergebnisse durch das Verwenden lexikalischer, strukturbasierter, semantischer und beispielbasierter Techniken zu verbinden. Die vorgeschlagenen Methoden ziehen verschiedene Aspekte der Ähnlichkeit von Entitäten in der Ontologie in Betracht. In dieser Arbeit basiert die zusammengeführte Ontologie auf strukturellen, lexikalischen und semantischen Methoden und dem Wörterbuch von WordNet. Wir präsentieren insbesondere eine Verbesserung der lexikalischen Metrik, indem wir Informationen theoretisch anwenden und Abstandsannahmen bearbeiten, um neue strukturelle und semantische Maße zu erhalten. Der erste Beitrag dieser Studie ist informations theoretisch und behandelt die Bestimmung von Abständen, umlexikalische Ähnlichkeit flexibel messen zu können. Neben der Verbesserung der Genauigkeit für zeichenbasierte Ähnlichkeitsgrade arbeitet diese Metrik mit einigen irrelevanten Situationen, die hier nur erwähnt werden sollen. Unser zweiter Beitrag ist ein neues strukturbasiertes Ähnlichkeitsmaß für das automatische Verbinden von Ontologien. Obwohl die Betrachtungsweise von bisherigen strukturellen Maßen verschieden ist, berücksichtigt die vorliegende Arbeit alle älteren Konzepte, die existieren. Ein weiterer Teil der vorliegenden Arbeit liegt in der Entwicklung eines semantischen Ähnlichkeitsmaßes zwischen Substantiven der Struktur von WordNet. Dieses Maß verwendet das Wörterbuch von WordNet als eine externe Quelle, um die Semantik von Entitäten zu bekommen. Neben den Positionen von zwei Entitäten relativ zur Wurzel in einer Hierarchie berücksichtigt die Arbeit die Beziehungen zwischen diesen Entitäten.
Unsere Lösung nutzt eine gewichtete Summenmethode, in der sowohl sequenzielle als auch parallele Strategien für die Berechnung der Ähnlichkeit durchgeführt werden. Danach wird die Qualität des Systems bewertet. Unsere Arbeit wurde auf einem Benchmark-Datenset des 2008-OAEI implementiert und dann im Vergleich zu den anderen Systemen durchgeführt. Die experimentellen Ergebnisse zeigen, dass unser Ansatz gute F-Measure erreicht und mit anderen automatischen Systemen vergleichbar ist, die keine Instanzen verwenden. Die one-to-
one oder one-to-many Anordnungen werden in der Endphase erzeugt. Die in der Arbeit präsentierten Bertrachtungen konnten auch in viele Anwendungsgebiete übertragen werden.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät
Dokument erstellt am:29.02.2016
Dateien geändert am:29.02.2016
Promotionsantrag am:20.08.2015
Datum der Promotion:29.10.2015
english
Benutzer
Status: Gast
Aktionen