Eliminating fuzzy duplicates in crowdsourced lexical resources


Kiselev, Yuri ; Ustalov, Dmitry ; Porshnev, Sergey


[img]
Vorschau
PDF
Kiselev-GWC2016.pdf - Veröffentlichte Version

Download (215kB)

URL: https://ub-madoc.bib.uni-mannheim.de/43369
URN: urn:nbn:de:bsz:180-madoc-433699
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2016
Buchtitel: Proceedings of the Eighth Global WordNet Conference (GWC-16) : January 27-30, Bucharest, Romania
Seitenbereich: 161-167
Veranstaltungstitel: Global WordNet Conference 2016
Veranstaltungsort: Bucharest, Romania
Veranstaltungsdatum: January 27-30, 2016
Herausgeber: Barbu Mititelu, Verginica
Ort der Veröffentlichung: Bucarest
Verlag: Global WordNet Association
ISBN: 978-606-714-239-6 , 978-973-0-20728-6
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems III: Enterprise Data Analysis (Ponzetto 2016-)
Fachgebiet: 004 Informatik
Abstract: Collaboratively created lexical resources is a trending approach to creating high quality thesauri in a short time span at a remarkably low price. The key idea is to invite non-expert participants to express and share their knowledge with the aim of constructing a resource. However, this approach tends to be noisy and error-prone, thus making data cleansing a highly topical task to perform. In this paper, we study different techniques for synset deduplication including machine- and crowd-based ones. Eventually, we put forward an approach that can solve the deduplication problem fully automatically, with the quality comparable to the expert-based approach.




Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.

Dieser Datensatz wurde nicht während einer Tätigkeit an der Universität Mannheim veröffentlicht, dies ist eine Externe Publikation.




Metadaten-Export


Zitation


+ Suche Autoren in

BASE: Kiselev, Yuri ; Ustalov, Dmitry ; Porshnev, Sergey

Google Scholar: Kiselev, Yuri ; Ustalov, Dmitry ; Porshnev, Sergey

ORCID: Kiselev, Yuri ; Ustalov, Dmitry ORCID: 0000-0002-9979-2188 ; Porshnev, Sergey

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen