Exploring the transferability of flood loss models across flood types

  • The estimation of financial losses is an integral part of flood risk assessment. The application of existing flood loss models on locations or events different from the ones used to train the models has led to low performance, showing that characteristics of the flood damaging process have not been sufficiently well represented yet. To improve flood loss model transferability, I explore various model structures aiming at incorporating different (inland water) flood types and pathways. That is based on a large survey dataset of approximately 6000 flood-affected households which addresses several aspects of the flood event, not only the hazard characteristics but also information on the affected building, socioeconomic factors, the household's preparedness level, early warning, and impacts. Moreover, the dataset reports the coincidence of different flood pathways. Whilst flood types are a classification of flood events reflecting their generating process (e.g. fluvial, pluvial), flood pathways represent the route the water takes toThe estimation of financial losses is an integral part of flood risk assessment. The application of existing flood loss models on locations or events different from the ones used to train the models has led to low performance, showing that characteristics of the flood damaging process have not been sufficiently well represented yet. To improve flood loss model transferability, I explore various model structures aiming at incorporating different (inland water) flood types and pathways. That is based on a large survey dataset of approximately 6000 flood-affected households which addresses several aspects of the flood event, not only the hazard characteristics but also information on the affected building, socioeconomic factors, the household's preparedness level, early warning, and impacts. Moreover, the dataset reports the coincidence of different flood pathways. Whilst flood types are a classification of flood events reflecting their generating process (e.g. fluvial, pluvial), flood pathways represent the route the water takes to reach the receptors (e.g. buildings). In this work, the following flood pathways are considered: levee breaches, river floods, surface water floods, and groundwater floods. The coincidence of several hazard processes at the same time and place characterises a compound event. In fact, many flood events develop through several pathways, such as the ones addressed in the survey dataset used. Earlier loss models, although developed with one or multiple predictor variables, commonly use loss data from a single flood event which is attributed to a single flood type, disregarding specific flood pathways or the coincidence of multiple pathways. This gap is addressed by this thesis through the following research questions: 1. In which aspects do flood pathways of the same (compound inland) flood event differ? 2. How much do factors which contribute to the overall flood loss in a building differ in various settings, specifically across different flood pathways? 3. How well can Bayesian loss models learn from different settings? 4. Do compound, that is, coinciding flood pathways result in higher losses than a single pathway, and what does the outcome imply for future loss modelling? Statistical analysis has found that households affected by different flood pathways also show, in general, differing characteristics of the affected building, preparedness, and early warning, besides the hazard characteristics. Forecasting and early warning capabilities and the preparedness of the population are dominated by the general flood type, but characteristics of the hazard at the object-level, the impacts, and the recovery are more related to specific flood pathways, indicating that risk communication and loss models could benefit from the inclusion of flood-pathway-specific information. For the development of the loss model, several potentially relevant predictors are analysed: water depth, duration, velocity, contamination, early warning lead time, perceived knowledge about self-protection, warning information, warning source, gap between warning and action, emergency measures, implementation of property-level precautionary measures (PLPMs), perceived efficacy of PLPMs, previous flood experience, awareness of flood risk, ownership, building type, number of flats, building quality, building value, house/flat area, building area, cellar, age, household size, number of children, number of elderly residents, income class, socioeconomic status, and insurance against floods. After a variable selection, descriptors of the hazard, building, and preparedness were deemed significant, namely: water depth, contamination, duration, velocity, building area, building quality, cellar, PLPMs, perceived efficacy of PLPMs, emergency measures, insurance, and previous flood experience. The inclusion of the indicators of preparedness is relevant, as they are rarely involved in loss datasets and in loss modelling, although previous studies have shown their potential in reducing losses. In addition, the linear model fit indicates that the explanatory factors are, in several cases, differently relevant across flood pathways. Next, Bayesian multilevel models were trained, which intrinsically incorporate uncertainties and allow for partial pooling (i.e. different groups of data, such as households affected by different flood pathways, can learn from each other), increasing the statistical power of the model. A new variable selection was performed for this new model approach, reducing the number of predictors from twelve to seven variables but keeping factors of the hazard, building, and preparedness, namely: water depth, contamination, duration, building area, PLPMs, insurance, and previous flood experience. The new model was trained not only across flood pathways but also across regions of Germany, divided according to general socioeconomic factors and insurance policies, and across flood events. The distinction across regions and flood events did not improve loss modelling and led to a large overlap of regression coefficients, with no clear trend or pattern. The distinction of flood pathways showed credibly distinct regression coefficients, leading to a better understanding of flood loss modelling and indicating one potential reason why model transferability has been challenging. Finally, new model structures were trained to include the possibility of compound inland floods (i.e. when multiple flood pathways coincide on the same affected asset). The dataset does not allow for verifying in which sequence the flood pathway waves occurred and predictor variables reflect only their mixed or combined outcome. Thus, two Bayesian models were trained: 1. a multi-membership model, a structure which learns the regression coefficients for multiple flood pathways at the same time, and 2. a multilevel model wherein the combination of coinciding flood pathways makes individual categories. The multi-membership model resulted in credibly different coefficients across flood pathways but did not improve model performance in comparison to the model assuming only a single dominant flood pathway. The model with combined categories signals an increase in impacts after compound floods, but due to the uncertainty in model coefficients and estimates, it is not possible to ascertain such an increase as credible. That is, with the current level of uncertainty in differentiating the flood pathways, the loss estimates are not credibly distinct from individual flood pathways. To overcome the challenges faced, non-linear or mixed models could be explored in the future. Interactions, moderation, and mediation effects, as well as non-linear effects, should also be further studied. Loss data collection should regularly include preparedness indicators, and either data collection or hydraulic modelling should focus on the distinction of coinciding flood pathways, which could inform loss models and further improve estimates. Flood pathways show distinct (financial) impacts, and their inclusion in loss modelling proves relevant, for it helps in clarifying the different contribution of influencing factors to the final loss, improving understanding of the damaging process, and indicating future lines of research.show moreshow less
  • Die Schätzung finanzieller Schäden ist ein wesentlicher Bestandteil der Hochwasserrisikoanalyse. Die Anwendung bestehender Hochwasserschadensmodelle auf anderen Orten oder Ereignisse als jene, die zur Kalibrierung der Modelle verwendet wurden, hat zu einer geringen Modellgüte geführt. Dies zeigt, dass die Merkmale des Hochwasserschadensprozesses in den Modellen noch nicht hinreichend repräsentiert sind. Um die Übertragbarkeit von Hochwasserschadensmodellen zu verbessern, habe ich verschiedene Modellstrukturen untersucht, die darauf abzielen, unterschiedliche Hochwassertypen und wirkungspfade einzubeziehen. Dies geschieht auf der Grundlage eines großen Datensatzes von ca. 6000 Fällen überschwemmungsgeschädigter Haushalte, der mehrere Aspekte des Hochwasserereignisses berücksichtigt. Diese sind nicht nur die Gefährdungsmerkmale, sondern auch Informationen über das betroffene Gebäude, sozioökonomische Faktoren, die Vorsorge des Haushalts, die Frühwarnung und die Auswirkungen. Darüber hinaus enthält der Datensatz Informationen über dasDie Schätzung finanzieller Schäden ist ein wesentlicher Bestandteil der Hochwasserrisikoanalyse. Die Anwendung bestehender Hochwasserschadensmodelle auf anderen Orten oder Ereignisse als jene, die zur Kalibrierung der Modelle verwendet wurden, hat zu einer geringen Modellgüte geführt. Dies zeigt, dass die Merkmale des Hochwasserschadensprozesses in den Modellen noch nicht hinreichend repräsentiert sind. Um die Übertragbarkeit von Hochwasserschadensmodellen zu verbessern, habe ich verschiedene Modellstrukturen untersucht, die darauf abzielen, unterschiedliche Hochwassertypen und wirkungspfade einzubeziehen. Dies geschieht auf der Grundlage eines großen Datensatzes von ca. 6000 Fällen überschwemmungsgeschädigter Haushalte, der mehrere Aspekte des Hochwasserereignisses berücksichtigt. Diese sind nicht nur die Gefährdungsmerkmale, sondern auch Informationen über das betroffene Gebäude, sozioökonomische Faktoren, die Vorsorge des Haushalts, die Frühwarnung und die Auswirkungen. Darüber hinaus enthält der Datensatz Informationen über das Vorkommen verschiedener Hochwasserwirkungspfade. Im Gegensatz zu den Hochwassertypen, die eine Klassifizierung von Hochwasserereignissen darstellen und deren Entstehungsprozess widerspiegeln (z. B. Fluss- oder Regenhochwasser), repräsentieren die Hochwasserwirkungspfade den Weg, den das Wasser nimmt, um die Rezeptoren (z. B. die Gebäude) zu erreichen. In dieser Arbeit werden folgende Hochwasserwirkungspfade betrachtet: Deichbrüche, Flusshochwasser, Überflutung durch oberflächlich abfließendes Wasser und Grundwasserhochwasser. Das Zusammentreffen mehrerer Gefahrenprozesse zur selben Zeit und am selben Ort kennzeichnet ein Verbundereignis (compound event). Tatsächlich entwickeln sich viele Hochwasserereignisse über mehrere Wirkungspfade, z. B. die vorher erwähnten. Frühere Schadensmodelle, die zwar mit einer oder mehreren Prädiktorvariablen entwickelt wurden, verwenden in der Regel Schadensdaten eines einzelnen Hochwasserereignisses, das einem bestimmten Hochwassertyp zugeordnet wird. Spezifische Hochwasserwirkungspfade oder das Zusammentreffen mehrerer Wirkungspfade werden dabei vernachlässigt. An dieser Forschungslücke setzt die vorliegende Arbeit mit folgenden Forschungsfragen an: 1) Inwiefern unterscheiden sich die Hochwasserwirkungspfade desselben (zusammengesetzten) Hochwasserereignisses? 2) Inwieweit unterscheiden sich die Faktoren, die zum gesamten Hochwasserschaden an einem Gebäude beitragen, in verschiedenen Situationen, insbesondere bei verschiedenen Hochwasserwirkungspfaden? 3) Wie gut können Bayes'sche Schadensmodelle aus verschiedenen Situationen lernen? 4) Führen gemischte, d. h. mehrere zusammentreffende Hochwasserwirkungspfade, zu höheren Schäden als ein einzelner Pfad und was bedeuten die Ergebnisse für die künftige Schadensmodellierung? Die statistische Analyse zeigt, dass Haushalte, die von verschiedenen Hochwasserwirkungspfaden betroffen sind, im Allgemeinen neben den Gefahrenmerkmalen auch unterschiedliche Eigenschaften des betroffenen Gebäudes sowie der Vorsorge und der Frühwarnung aufweisen. Die Variablen des Frühwarnsystems und die Vorsorge der Bevölkerung werden von dem allgemeinen Hochwassertyp dominiert, wohingegen die Merkmale der Gefahr auf Objektebene, die Auswirkungen und die Wiederherstellung von den spezifischeren Hochwasserwirkungspfaden dominiert. Dies deutet darauf hin, dass Risikokommunikation und Schadensmodelle von der Einbeziehung hochwasserwirkungspfad-spezifischer Informationen profitieren könnten. Für die Entwicklung des Schadensmodells wurden mehrere potenziell relevante Prädiktoren analysiert: Wassertiefe, Dauer, Geschwindigkeit, Verschmutzung, Vorwarnzeit, wahrgenommenes Wissen über Selbstschutz, Warninformation, Warnquelle, Zeitspanne zwischen Warnung und Handlung, Notfallmaßnahmen, Umsetzung von Vorsorgemaßnahmen auf Grundstücksebene (PLPMs), wahrgenommene Wirksamkeit von PLPMs, frühere Hochwassererfahrungen, Bewusstsein für das Hochwasserrisiko, Eigentumsverhältnisse, Gebäudetyp, Anzahl der Wohnungen, Gebäudequalität, Gebäudewert, Haus-/Wohnungsfläche, Gebäudefläche, Keller, Alter der befragten Person, Haushaltsgröße, Anzahl der Kinder, Anzahl der älteren Menschen, monatliches Einkommen sowie sozioökonomischer Status und Versicherung gegen Hochwasser. Nach einer Variablenauswahl wurden folgende Deskriptoren der Gefahr, des Gebäudes und der Vorbereitung als signifikant eingestuft: Wassertiefe, Verschmutzung, Überflutungsdauer, Geschwindigkeit, Gebäudefläche, Gebäudequalität, Keller, PLPMs, wahrgenommene Wirksamkeit von PLPMs, Notfallmaßnahmen, Versicherung und frühere Hochwassererfahrung. Die Einbeziehung der letztgenannten Gruppe von Faktoren ist von Bedeutung, da Indikatoren für die Vorsorge nur selten in Schadensdatensätze und Schadensmodellierung integriert werden, obwohl frühere Studien gezeigt haben, dass sie zur Verringerung von Schäden beitragen können. Die lineare Modellanpassung zeigte, dass die erklärenden Faktoren in mehreren Fällen je nach Hochwasserpfad unterschiedlich relevant sind. Als Nächstes wurden Bayes'sche Mehrebenenmodelle trainiert, die Unsicherheiten immanent einbeziehen und ein partielles Pooling ermöglichen. Das heißt, verschiedene Datengruppen (Haushalte, die von verschiedenen Hochwasserwirkungspfaden betroffen sind) können voneinander lernen, was die statistische Aussagekraft des Modells erhöht. Für diesen neuen Modellansatz wurde eine aktualisierte Variablenauswahl getroffen, bei der die Anzahl der Prädiktoren von zwölf auf sieben reduziert wurde, aber Faktoren der Gefahr, des Gebäudes und der Vorbereitung beibehalten wurden. Diese sind Wassertiefe, Verschmutzung, Dauer, Gebäudefläche, PLPMs, Versicherung und frühere Hochwassererfahrung. Das neue Modell wurde nicht nur über Hochwasserwirkungspfade, sondern auch über Regionen in Deutschland – unterteilt nach allgemeinen sozioökonomischen Faktoren und Versicherungspolicen – sowie über Hochwasserereignisse trainiert. Die Unterscheidung nach Regionen und Hochwasserereignissen verbesserte die Schadensmodellierung nicht und führte zu einer großen Überlappung der Regressionskoeffizienten ohne klaren Trend oder eindeutiges Muster. Die Unterscheidung nach Hochwasserwirkungspfaden ergab glaubhaft unterschiedliche Regressionskoeffizienten, was zu einem besseren Verständnis der Modellierung von Hochwasserschäden führte und einen möglichen Grund für die schwierige Übertragbarkeit der Modelle auf andere Situationen darstellt. Schließlich wurden neue Modellstrukturen trainiert, um die Möglichkeit gemischter (Binnen)überschwemmungen, d. h. das Zusammentreffen mehrerer Hochwasserwirkungspfade auf demselben Objekt, zu berücksichtigen. Anhand des Datensatzes lässt sich nicht überprüfen, in welcher Reihenfolge die Hochwasserpfadwellen auftraten, und die Prädiktorvariablen zeigen nur deren gemischtes oder kombiniertes Ergebnis. Daher wurden zwei Bayes'sche Modelle trainiert: 1) ein Multi-Membership-Modell als Struktur, die die Regressionskoeffizienten für mehrere Hochwasserwirkungspfade gleichzeitig lernt, und 2) ein Mehrebenenmodell, bei dem die Kombination zusammentreffender Hochwasserwirkungspfade einzelne Kategorien bildet. Ersteres führte zu glaubhaft unterschiedlichen Koeffizienten für die verschiedenen Hochwasserwirkungspfade, verbesserte aber nicht die Modellleistung im Vergleich zu dem Modell, das nur einen einzigen, dominanten Hochwasserpfad annimmt. Das Modell mit kombinierten Wirkungspfadkategorien deutet auf eine Zunahme der Auswirkungen nach gemischten Überschwemmungen hin. Aufgrund der Unsicherheit der Modellkoeffizienten und -schätzungen ist es jedoch nicht möglich, eine solche Zunahme als glaubwürdig plausibel zu bewerten. Das heißt, bei dem derzeitigen Grad an Unsicherheit hinsichtlich der Differenzierung der Hochwasserwirkungspfade sind die Schadensschätzungen nicht glaubwürdig von den einzelnen Hochwasserwirkungspfaden zu unterscheiden. Zur Überwindung der bestehenden Probleme könnten nichtlineare oder gemischte Modelle untersucht werden. Zudem sollten Interaktionseffekte, Moderations- und Mediationseffekte sowie nichtlineare Effekte weiter erforscht werden. Bei der Schadensdaten\-erhebung sollten außerdem regelmäßig Indikatoren für die Vorsorge einbezogen werden, und entweder bei der Datenerhebung oder bei der hydraulischen Modellierung sollte der Schwerpunkt auf der Unterscheidung kombinierter Hochwasserwirkungspfade liegen, was die Schadensmodelle bereichern und die Schätzungen weiter verbessern könnte. Hochwasserwirkungspfade zeigen differente (finanzielle) Auswirkungen und ihre Einbeziehung in die Schadensmodellierung hat sich als relevant erwiesen, da sie dazu beitragen, den unterschiedlichen Beitrag der Einflussfaktoren zum endgültigen Schaden zu klären, das Verständnis des Schadensprozesses zu verbessern und künftige Forschungslinien aufzuzeigen.show moreshow less

Download full text files

  • SHA-512:48e5245d05d6df1b062c6713c84288ae27c0068a6a43ccfd70165abfd529c1c28449490ab167389984db48490b5fe6bb7f32ca81c272a7dea8a4d275dd72acc1

Export metadata

Metadaten
Author details:Guilherme Samprogna MohorORCiDGND
URN:urn:nbn:de:kobv:517-opus4-557141
DOI:https://doi.org/10.25932/publishup-55714
translated title (German):Untersuchung der Übertragbarkeit von Hochwasserschadensmodellen über Hochwassertypen
Reviewer(s):Annegret ThiekenORCiDGND, Kai SchröterORCiDGND, Benjamin DewalsORCiD
Supervisor(s):Annegret Thieken, Oliver Korup
Publication type:Doctoral Thesis
Language:English
Publication year:2022
Publishing institution:Universität Potsdam
Granting institution:Universität Potsdam
Date of final exam:2022/07/05
Release date:2022/08/09
Tag:Bayes'sche Modelle; Hochwasser; Hochwasserwirkungspfad; Mehrebenenmodelle; Schätzung finanzieller Schäden; finanzielle Schäden
Bayesian model; financial loss; flood; flood loss modelling; flood pathway; multilevel modelling
Number of pages:XXIV, 182
RVK - Regensburg classification:RB 10357, AR 22840, ZH 9316
Funding institution:German Academic Exchange Service (DAAD)
Organizational units:Mathematisch-Naturwissenschaftliche Fakultät / Institut für Umweltwissenschaften und Geographie
DDC classification:5 Naturwissenschaften und Mathematik / 55 Geowissenschaften, Geologie / 550 Geowissenschaften
License (German):License LogoCC-BY - Namensnennung 4.0 International
Accept ✔
This website uses technically necessary session cookies. By continuing to use the website, you agree to this. You can find our privacy policy here.