Entscheidungsbäume zur Imputation kategorialer Daten

Rockel, Tobias; Bankhofer, Udo; Joenssen, Dieter W.

Veröffentlicht

Entscheidungsbäume zur Imputation kategorialer Daten

Rockel, Tobias; Bankhofer, Udo ; Joenssen, Dieter W.

Entscheidungsbäume sind als Prognoseverfahren im Bereich des maschinellen Lernens verbreitet. Jedoch fehlt bisher eine Untersuchung, in wieweit sich die Algorithmen auch zur Imputation eignen. Dies ist insbesonders vor dem Hintergrund der verschiedenen Zielstellungen einer Imputation und einer Klassifikation relevant. So liegt bei einer Imputation häufig ein stärkerer Fokus auf der Struktur des Gesamtdatensatzes, wohingegen eine Klassifikation auf eine möglichst genaue Vorhersage einzelner Objekte abzielt. Neben den klassischen deterministischen Entscheidungsbäumen mit Majority Rule werden daher auch Entscheidungsbäume mit Class Probability Rule mit einer Zufallskomponente in die Untersuchung mit einbezogen. In einer Simulationsstudie, in der als Vergleichsverfahren zusätzlich eine Modus-Imputation und ein Random Hot Deck eingesetzt werden, zeigt sich, dass kein Verfahren in allen Fällen zum besten Ergebnis führt. So führt die Imputation mittels Entscheidungsbaum und Class Probability Rule meist zur geringsten Verzerrung der Häufigkeitsverteilung, jedoch stellt der Entscheidungsbaum mit Majority Rule meist die ursprünglichen Werte am besten wieder her. Welches Verfahren zur Imputation verwendet werden sollte, ist also abhängig vom Ziel der Imputation.

Vorschau

Einordnung

alternativ:: Arbeitsbericht Nr. 2015-02, August 2015
In Serie:: Ilmenauer Beiträge zur Wirtschaftsinformatik
Bd. 02, 2015 (02.08.2015)
Datum der Erstellung:: 02.08.2015
Datum der Veröffentlichung:: 02.08.2015
PPN:: 83335888X
URN:: urn:nbn:de:gbv:ilm1-2015200187
ISBN:: 978-3-938940-57-0
Sprache:: Deutsch
Ressourcentyp:: Text
Umfang:: 17 Seiten
Erscheinungsort:: Ilmenau
Schlagwörter:: Entscheidungsbäume; fehlende Daten; Imputation; Simulationsstudie
Klassifikation:: Klasse A
Klassifikation:: für Harvesting bereitgestellt
Klassifikation:: Thüringer Pflichtexemplare
DDC-Sachgruppe der DNB:: 510 Mathematik
Einrichtung:: Technische Universität Ilmenau, Fakultät für Wirtschaftswissenschaften und Medien (ab 2014)

auf die Merkliste

Zitieren

Zitierform:

Zitier-Link kopieren

Rechte

Export

BibTeX, Endnote, MODS, MARCXML, RIS, ISI, PICA, DC, CSV