h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Discovery of usage based item similarities to support recommender systems in dealing with rarely used items = Ermittlung nutzungsbasierter Objektähnlichkeiten zur Unterstützung von Empfehlungssystemen im Umgang mit selten genutzen Objekten



Verantwortlichkeitsangabevorgelegt von Katja Kristina Niemann

ImpressumAachen : Publikationsserver der RWTH Aachen University 2015

UmfangXXII, 194 S. : graph. Darst.


Aachen, Techn. Hochsch., Diss., 2015


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
; ;

Tag der mündlichen Prüfung/Habilitation
2015-03-09

Online
URN: urn:nbn:de:hbz:82-rwth-2015-019351
URL: https://publications.rwth-aachen.de/record/466133/files/466133.pdf

Einrichtungen

  1. Lehr- und Forschungsgebiet Kooperationssysteme (123220)
  2. Fachgruppe Informatik (120000)

Inhaltliche Beschreibung (Schlagwörter)
Informatik (frei) ; recommender systems (frei) ; usage data (frei)

Thematische Einordnung (Klassifikation)
DDC: 004

Kurzfassung
Für die meisten Internetnutzer sind Empfehlungssysteme allgegenwärtig geworden. Sie bekommen Empfehlungen, wenn sie bei Amazon.de einkaufen, wenn sie sich Videoclips auf Youtube.de ansehen oder wenn sie sich auf Spotify.de Musik anhören. Es gibt jedoch immer noch viele Herausforderungen, mit welchen sich die Entwickler von Empfehlungssystemen konfrontiert sehen. In vielen Anwendungen sind beispielsweise nur spärliche Informationen über die Nutzer und die zu empfehlenden Objekte vorhanden. In Anwendungen, in welchen sehr wenige Informationen vorliegen, kann es vorkommen, dass kaum Empfehlungen generiert werden können. Bei Anwendungen, die sowohl vielfach als auch selten genutzte Objekte anbieten, werden die beliebten Objekte überproportional häufig empfohlen. Im Gegensatz dazu werden die weniger oft genutzten Objekte, welche für die meisten Nutzer aufgrund ihres niedrigeren Bekannheitsgrades schwerer zu finden sind, kaum empfohlen. Das Ziel dieser Arbeit ist es daher, Möglichkeiten aufzuzeigen, mit welchen auch spärliche Informationen über die Nutzung von Objekten so ausgewertet werden können, dass geeignete Empfehlungen für diese Objekte erstellt werden können. Dies bedeutet außerdem, dass zusätzlich zur Nutzung, keine weiteren Informationen über die Objekte, wie beispielsweise Angaben zum Inhalt oder Genre eines Films, zur Empfehlungserstellung benötigt werden. Die Arbeit stützt sich dabei auf die Annahme aus dem Context Aware Computing dass die Aktivitäten eines Nutzers sowohl durch sein vorhandenes Wissen als auch durch seinen aktuellen Kontext beeinflusst werden und diese somit implizit in den Nutzungsinformationen der Objekte enthalten sind. Dieser Annahme folgend werden Techniken, welche erfolgreich in der Korpuslinguistik angewendet werden, um verwandte Begriffe basierend auf ihrer Nutzung in der Sprache zu finden, adaptiert und auf Objekte und ihre Nutzung angewendet. Die nutzungsbasierten Objektbeziehungen werden daraufhin für die Erstellung von Empfehlungen eingesetzt. Die diskutierten Techniken werden anhand von vier Datensätzen, welche Informationen über die Nutzung und Bewertung von Objekten enthalten und in Lern- bzw. Filmportalen gesammelt wurden, evaluiert. Die Evaluationsergebnisse zeigen, dass durch das Auswerten der Nutzungsdaten tatsächlich nutzungsbasierte Beziehungen zwischen Objekten aufgedeckt werden können, welche einen Hinweis auf ihre inhaltliche oder qualitative Ähnlichkeit geben. Weiterhin sind die nutzungsbasierten Empfehlungssysteme dazu in der Lage, in Anwendungen, in welchen wenige Informationen über die Nutzung der Objekte vorliegen, mehr Empfehlungen zu generieren als die zum Vergleich vorgestellten, aktuellen Empfehlungssysteme. In Anwendungen, in welchen die häufig genutzten Objekte überproportional häufig empfohlen werden, können die nutzungsbasierten Empfehlungssysteme mehr Nischenobjekte empfehlen ohne dabei die Präzision der Empfehlungen zu verringern. Das bedeutet, dass die nutzungsbasierten Ansätze geeigneter dafür sind, Empfehlungen für Nischenobjekte zu erstellen, als bisher vorgestellte Empfehlungssysteme, welche ebenfalls keine zusätzlichen Metadaten benötigen.

Recommender systems already are a consistent part in the life of most people regularly using the internet. They get recommendations when they shop at Amazon.com, when they watch video clips on Youtube.com, or when they listen to music on Spotify.com etc. There are still many challenges in recommender systems research, though. One challenge that is present in almost all application domains is data sparsity, i.e.\ missing information about items or users. In very sparse application domains, data sparsity can completely hinder the creation of recommendations. In more diverse application domains, where few items are heavily used while most items are rarely used, the popular items tend to be recommended over-proportionally often. In contrast, the niche items tend to be excluded from the recommendation lists. This thesis therefore aims to contribute to the state-of-the-art in handling data sparsity in recommender systems. Therefore, it investigates techniques to find similarities between the items solely by analysing their usage. This approach is based on the assumption stemming from context-aware computing that the users' contexts and knowledge influence their activities and, thus, are inherent in the items' usage. Hence, no additional information like content or social metadata are required to find relations between the items. For this purpose, techniques that are successfully applied in corpus linguistics to detect relations between words by analysing their usage in language are adapted to items and their usage. This way, pair-wise item relations as well as item clusters are created based on the items' usage. These usage-based item relations are then utilised in standalone and hybrid recommender systems with the goal to create suitable recommendations for as many items as possible including the rarely used ones. The discussed techniques are evaluated on four data sets, two of them were collected in web portals that support learners in finding suitable learning materials while the other two data sets were collected in web portals that recommend movies to users. The evaluation results show that by exploiting the items' usage, usage-based relations between the items can be discovered that indeed give a hint at their similarity. Furthermore, the usage-based recommender systems are able to create more recommendations in application domains holding predominantly rarely used items than the presented state-of-the-art recommendation approaches. In application domains holding heavily used items that are recommended over-proportionally often in addition to many rarely used items, the usage-based recommender systems are able to recommend more niche items than the presented state-of-the-art recommendation approaches without lowering the accuracy of the recommendations. Thus, the usage-based approaches are better suited to provide users with accurate recommendations for idiosyncratic items than the recommendation approaches presented in literature so far that do not require additional metadata either.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis

Format
online, print

Sprache
English

Externe Identnummern
HBZ: HT018630017

Interne Identnummern
RWTH-2015-01935
Datensatz-ID: 466133

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Public records
Publications database
120000
123220

 Record created 2015-04-30, last modified 2023-04-08


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)