- AutorIn
- Dipl.-Inf. Monique Krübel
- Titel
- Analyse und Vergleich von Extraktionsalgorithmen für die Automatische Textzusammenfassung
- Zitierfähige Url:
- https://nbn-resolving.org/urn:nbn:de:swb:ch1-200601180
- Datum der Einreichung
- 18.05.2006
- Abstract (DE)
- Obwohl schon seit den 50er Jahren auf dem Gebiet der Automatischen Textzusammenfassung Forschung betrieben wird, wurden der Nutzen und die Notwendigkeit dieser Systeme erst mit dem Boom des Internets richtig erkannt. Das World Wide Web stellt eine täglich wachsende Menge an Informationen zu nahezu jedem Thema zur Verfügung. Um den Zeitaufwand zum Finden und auch zum Wiederfinden der richtigen Informationen zu minimieren, traten Suchmaschinen ihren Siegeszug an. Doch um einen Überblick zu einem ausgewählten Thema zu erhalten, ist eine einfache Auflistung aller in Frage kommenden Seiten nicht mehr adäquat. Zusätzliche Mechanismen wie Extraktionsalgorithmen für die automatische Generierung von Zusammenfassungen können hier helfen, Suchmaschinen oder Webkataloge zu optimieren, um so den Zeitaufwand bei der Recherche zu verringern und die Suche einfacher und komfortabler zu gestalten. In dieser Diplomarbeit wurde eine Analyse von Extraktionsalgorithmen durchgeführt, welche für die automatische Textzusammenfassung genutzt werden können. Auf Basis dieser Analyse als viel versprechend eingestufte Algorithmen wurden in Java implementiert und die mit diesen Algorithmen erstellten Zusammenfassungen in einer Evaluation verglichen.
- Freie Schlagwörter
- Automatische Textzusammenfassung
- Genetischer Algorithmus
- Sentence Rank
- Summarization
- Klassifikation (DDC)
- 004
- Normschlagwörter (GND)
- Information Retrieval
- Zusammenfassung
- GutachterIn
- Prof. Dr. Maximilian Eibl
- Dr. Johannes Steinmüller
- BetreuerIn
- Prof. Dr. Maximilian Eibl
- Den akademischen Grad verleihende / prüfende Institution
- Technische Universität Chemnitz, Chemnitz
- URN Qucosa
- urn:nbn:de:swb:ch1-200601180
- Veröffentlichungsdatum Qucosa
- 27.07.2006
- Dokumenttyp
- Diplomarbeit
- Sprache des Dokumentes
- Deutsch