Handling missing data in multichannel life course analysis

Details

Ressource 1Download: thèse-EK-OK.pdf (4107.52 [Ko])
State: Public
Version: After imprimatur
License: Not specified
Serval ID
serval:BIB_E98F6322C6BD
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Handling missing data in multichannel life course analysis
Author(s)
Emery Kevin
Director(s)
Berchtold André
Institution details
Université de Lausanne, Faculté des sciences sociales et politiques
Publication state
Accepted
Issued date
2023
Language
english
Abstract
This thesis addresses the challenge of dealing with missing data, which is an inevitable issue in quantitative studies. The appropriate treatment of missing data is complex and can significantly impact statistical results and conclusions. A particular emphasis is placed on data for life course analysis. Life course data have characteristics that require specific treatment of missing data. First, the longitudinal structure is crucial since life courses are often considered as a whole. Then, due to their longitudinal nature, there are generally several missing observations in a row. This behaviour happens in a survey when individuals miss several waves of data collection or drop out of the survey. Next, they are generally coded as categorical data. Therefore, standard methods, that were generally developed for numerical variables, are difficult to apply. Finally, such data are subject to few transitions.
One of the major challenges encountered in life course methodology is the absence of a commonly accepted solution for handling missing data (Piccarreta and Studer, 2019; Liao et al., 2022). The main aim of this thesis is to fill this gap. Furthermore, this thesis proposes novel methods to enhance existing approaches and address gaps in the imputation of longitudinal categorical data.
--
This thesis addresses the challenge of dealing with missing data, which is an inevitable issue in quantitative studies. The appropriate treatment of missing data is complex and can significantly impact statistical results and conclusions. A particular emphasis is placed on data for life course analysis. Life course data have characteristics that require specific treatment of missing data. First, the longitudinal structure is crucial since life courses are often considered as a whole. Then, due to their longitudinal nature, there are generally several missing observations in a row. This behaviour happens in a survey when individuals miss several waves of data collection or drop out of the survey. Next, they are generally coded as categorical data. Therefore, standard methods, that were generally developed for numerical variables, are difficult to apply. Finally, such data are subject to few transitions.
One of the major challenges encountered in life course methodology is the absence of a commonly accepted solution for handling missing data (Piccarreta and Studer, 2019; Liao et al., 2022). The main aim of this thesis is to fill this gap. Furthermore, this thesis proposes novel methods to enhance existing approaches and address gaps in the imputation of longitudinal categorical data.
--
Cette thèse aborde le défi de la gestion des données manquantes, qui constitue un problème inévitable dans les études quantitatives. Le traitement approprié des données manquantes est complexe et peut avoir un impact significatif sur les résultats statistiques et les conclusions. Un accent particulier est mis sur les données de parcours de vie. Les données de parcours de vie présentent des caractéristiques qui nécessitent un traitement spécifique des données manquantes. Premièrement, la structure longitudinale est cruciale, car les parcours de vie sont souvent considérés dans leur intégralité. De plus, en raison de leur nature longitudinale, il y a généralement plusieurs observations manquantes consécutives. Ce phénomène se produit lorsqu’il y a des vagues de collecte de données manquées par les individus ou lorsqu’ils abandonnent l’enquête. Ensuite, ces données sont généralement codées comme des données catégorielles. Par conséquent, les méthodes standard, généralement développées pour les variables numériques, sont difficiles à appliquer. Enfin, de telles données sont caractérisées par peu de transitions.
L’un des principaux défis de la méthodologie du parcours de vie réside dans l’absence d’une solution communément acceptée pour traiter les données manquantes (Piccarreta et Studer, 2019; Liao et al., 2022). L’objectif principal de cette thèse est de combler cette lacune. De plus, cette thèse propose des méthodes novatrices pour améliorer les approches existantes et combler les lacunes dans l’imputation des données catégorielles longitudinales.
Create date
12/07/2023 10:08
Last modification date
12/09/2023 10:43
Usage data