Please use this identifier to cite or link to this item: http://dx.doi.org/10.25673/32468
Title: Generierung synthetischer arabischer Handschrift zur Unterstützung von automatischer Erkennung handschriftlicher Texte
Author(s): Dinges, Laslo
Referee(s): Hamadi, AyoubLook up in the Integrated Authority File of the German National Library
Omar, AbbasLook up in the Integrated Authority File of the German National Library
Granting Institution: Otto-von-Guericke-Universität Magdeburg, Fakultät für Elektrotechnik und Informationstechnik
Issue Date: 2019
Extent: xxii, 229 Seiten
Type: HochschulschriftLook up in the Integrated Authority File of the German National Library
Type: PhDThesis
Exam Date: 2019
Language: German
URN: urn:nbn:de:gbv:ma9:1-1981185920-326475
Subjects: Maschinelles Sehen
Abstract: Digitaler Text bietet viele Vorteile. Er ist kompakt, lässt sich ohne Aufwand vervielfältigen und zudem automatisiert analysieren und bearbeiten. Dennoch liegen auch heutzutage viele Dokumente in physischer Form vor. Zwar existieren robuste Lösungen zur automatischen Erkennung von Druckschrift, doch insbesondere die Erkennung arabischer Handschrift ist immer noch problematisch. Dies gilt insbesondere für zusammenhängende Texte, wie sie etwa in historischen Sammlungen vorkommen. Sowohl zur experimentellen Evaluierung als auch zum Trainieren von entsprechenden automatischen Lösungen zur Handschrifterkennung sind geeignete, umfangreiche Datenbanken von hoher Bedeutung. Aufgrund des mit deren Erstellung verbundenen Aufwandes weisen bestehende Datenbanken jedoch stets Einschränkungen des Umfangs, des verwendeten Vokabulars und des Detailgrades der beigefügten Grundwahrheiten auf. Eine Strategie, diesem Umstand zu begegnen, liegt darin, synthetische Proben zu erzeugen. In dieser Arbeit wird ein neuartiger Ansatz zur Synthese arabischer Handschrift vorgestellt, welcher einen wesentlichen Beitrag zum Stand der Forschung darstellt. Bestehende Ansätze verknüpfen lediglich Bildausschnitte arabischer Buchstaben (was nur wenige unterschiedliche Synthesen ermöglicht) oder erzeugen keine vollständigen Handschriften. Dagegen ermöglicht es der hier vorgestellte Ansatz, eine Vielzahl unterschiedlicher Synthesen zu beliebigen arabischen Wörtern, Sätzen oder einspaltiger Textseiten zu erzeugen. Der Ansatz umfasst sowohl die Generierung neuer Buchstaben für jede Synthese, als auch Modifikationen des kompletten Schriftzuges, z.B. durch Änderung der Schriftneigung.Weiterhin werden zur Simulation von materialabhängigen Pigmentierungsschwankungen entwickelte Methoden vorgestellt. Das Synthesesystem wird erfolgreich genutzt, um die IESK-arDB – eine während der Promotion entstandene, frei verfügbare Datenbank – zu ergänzen. Darüber hinaus werden in dieser Arbeit segmentierungsbasierte Verfahren zur automatischen Erkennung arabischer Handschrift anhand realer und synthetischer Proben evaluiert und weiterentwickelt. Insbesondere die Klassifizierung von Buchstaben – durch optimierte Merkmale und einen auf Active-Shape-Models basierenden Klassifikator sowie eine kontextbasierte Fehlererkennung und -korrektur – stellt diesbezüglich einen zweiten wesentlichen Forschungsbeitrag dieser Dissertation dar. Außerdem wird ein verbesserter Ansatz zur Zeilensegmentierung mittels lokaler Gruppen vorgestellt, welcher auch die Detektion gekrümmter Textzeilen ermöglicht.
Digital text provides a lot of advantages. It is compact and can automatically be duplicated, processed or analyzed. Nevertheless, even today many documents are given in physical form. Although there are robust solutions for recognizing machine printed text, the automatic recognition of handwritings is still challenging. This is especially true in case cohesive texts of historical collections. For both, the experimental evaluation and training of automatic solutions for handwriting recognition, comprehensive and suitable databases are crucial. Due to the accompanied costs, existing databases are limited in size, vocabulary and level of details of the added ground truth. One strategy to face this problem is to generate synthetic samples. In this work, a novel approach of synthesizing Arabic handwritings is proposed, which is a major contribution to the state of the art.Existing approaches just concatenate images of Arabic characters (which just enables few different syntheses) or do not create complete handwritings. In contrast, the proposed approach enables to synthesize many variations of any Arabic words, sentences or one column text pages. The approach covers generation of new characters for each synthesis as well as modifications of the complete writing, as changing slant or skew. Furthermore, methods to simulate material depending variations in pigmentation are developed. The synthesis system is successfully used to augment the IESK-arDB, a database created during the PhD. Additionally, segmentation based procedures of automatic recognition of Arabic handwritings are refined and evaluated on real and synthetic data. Especially the classification of characters using optimized features and an approach based on Active Shape Modells as well as error detection and correction is a second major contribution of this thesis. Moreover, an improved approach of line segmentation using locale groups is proposed, which enables detection of curved text lines.
URI: https://opendata.uni-halle.de//handle/1981185920/32647
http://dx.doi.org/10.25673/32468
Open Access: Open access publication
License: (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0(CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0
Appears in Collections:Fakultät für Elektrotechnik und Informationstechnik

Files in This Item:
File Description SizeFormat 
Dinges_Laslo_Dissertation_2019.pdfDissertation40.88 MBAdobe PDFThumbnail
View/Open