h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Statistical modeling of non-metallic inclusions in steels and extreme value analysis = Statistische Modellierung von nichtmetallischen Einschlüssen in Stählen und Extremwertanalyse



Verantwortlichkeitsangabevorgelegt von Anja Bettina Schmiedt

ImpressumAachen : Publikationsserver der RWTH Aachen University 2012

Umfang197 S. : graph. Darst.


Aachen, Techn. Hochsch., Diss., 2012

Prüfungsjahr: 2012. - Publikationsjahr: 2013


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter


Tag der mündlichen Prüfung/Habilitation
2012-11-19

Online
URN: urn:nbn:de:hbz:82-opus-43530
URL: https://publications.rwth-aachen.de/record/229492/files/4353.pdf

Einrichtungen

  1. Fachgruppe Mathematik (110000)
  2. Lehrstuhl für Statistik und Institut für Statistik u. Wirtschaftsmathematik (116410)

Inhaltliche Beschreibung (Schlagwörter)
Extremwertstatistik (Genormte SW) ; Inferenzstatistik (Genormte SW) ; Ordnungsstatistik (Genormte SW) ; Statistisches Modell (Genormte SW) ; Mathematik (frei) ; Verallgemeinerte Ordnungsstatistik (frei) ; extreme value theory (frei) ; generalized order statistics (frei) ; inferential statistics (frei) ; order statistics (frei) ; statistical model (frei)

Thematische Einordnung (Klassifikation)
DDC: 510

Kurzfassung
Diese Dissertation ist motiviert durch das metallurgische Problem nichtmetallischer Einschlüsse, die unvermeidbar in Stahlherstellungsprozessen entstehen und als ein Hauptgrund für Materialschäden gelten, wobei die Einschlussgröße der kritische Parameter ist. Daher besteht Interesse an der Anpassung eines geeigneten statistischen Modells an nichtmetallische Einschlussgrößen sowie an der Prognose extremer Einschlussgrößen zu Zwecken der Qualitätssicherung. Um Daten für statistische Analysen zu gewinnen, werden in der Metallographie planare Schliffe verwendet: Auf polierten Flächen werden mehrere Kontrollflächen gleicher Größe mikroskopisch auf geschnittene Einschlüsse untersucht. Dabei werden alle Einschlussschnitte oberhalb einer unteren Nachweisgrenze vermessen und deren Größe (typischerweise in Form der Quadratwurzel ihrer Fläche) gespeichert. Ein entsprechender realer Datensatz wurde vom Institut für Eisenhüttenkunde der RWTH Aachen zur Verfügung gestellt. In der Metallographie wurde bisher die Annahme getroffen, dass die geordneten Einschlussgrößen einer Kontrollfläche als Realisationen gewöhnlicher Ordnungsstatistiken (gOS) verstanden werden können, und es wurden maximale Einschlussgrößen durch die Anwendung klassischer Extremwertstatistik prognostiziert. Eingang in Handlungsanweisungen hat die "Control Area Maxima"-Methode gefunden: Die maximalen Einschlussgrößen der Kontrollflächen werden an eine Gumbel-Verteilung angepasst, die als geeignete Extremwertverteilung verstanden wird, und Schätzungen derer Quantile dienen als Prognosen für Einschlussgrößen. Aus statistischer Sicht ist es sinnvoll, dass mehr als nur die maximalen Einschlussgrößen in die Extremwertanalyse eingehen. Ein Hauptkapitel dieser Dissertation ist daher der multivariaten Extremwerttheorie für gOS gewidmet. Sie erlaubt eine Schätzung der Verteilungsparameter der verallgemeinerten Extremwertverteilung auf Basis der r > 1 größten Beobachtungen einer jeden Kontrollfläche, anstatt lediglich maximale Einschlussgrößen zuzulassen. Eine Simulationsstudie zeigt, dass die wahre Extremwertverteilung oftmals fehlspezifiziert wird, wenn die Schätzung ihrer Verteilungsparameter einzig auf den maximalen Beobachtungen beruht; erfolgt die Anpassung hingegen auf Basis der jeweils r > 1 größten Beobachtungen für hinreichend großes r, wird die statistische Analyse wesentlich verbessert. Die Ergebnisse der Simulationsstudie werden durch die multivariate Extremwertanalyse des realen Datensatzes nichtmetallischer Einschlussgrößen verdeutlicht. Die Anwendung der klassischen (multivariaten) Extremwerttheorie beruht auf der Annahme, dass die geordneten Einschlussgrößen einer Kontrollfläche Realisationen von gOS sind. In dem untersuchten Datensatz treten große Einschlüsse jedoch erheblich seltener auf als kleine: Werden die Einschlussgrößen einer Kontrollfläche aufsteigend sortiert, so ist i. A. zu beobachten, dass der Abstand benachbarter Einschlussgrößen mit der Einschlussgröße wächst. Daher wäre es möglich, dass gOS nicht immer zur Modellierung von Einschlussgrößen geeignet sind. In dieser Dissertation wird daher ein flexibles Modell geordneter Zufallsvariablen diskutiert, das "Generalized Model of Ordered Inclusion Sizes", wobei gewisse Modellparameter eine Anpassung der Hazardrate an die Anzahl beobachteter kleinerer Einschlussgrößen ermöglichen. Unter der Annahme von unbekannten Modellparametern werden Verfahren der statistischen Inferenz behandelt und auf den realen Datensatz angewendet. Die Durchführung bestimmter Hypothesentests lässt darauf schließen, dass gOS nicht immer zur Modellierung von Einschlussgrößen geeignet sind. Da die Anzahl unbekannter Modellparameter relativ hoch sein kann, wird ferner deren Reduktion durch die Annahme eines funktionalen Zusammenhangs diskutiert, wobei sich eine log-lineare Link-Funktion als adäquat erweist. Zudem stimmt das "Generalized Model of Ordered Inclusion Sizes" verteilungstheoretisch mit dem Modell verallgemeinerter Ordnungsstatistiken (vOS) überein. Die eingeführte log-lineare Link-Funktion erweist sich schließlich als zweckdienlich, um nicht-degenerierte Grenzverteilungen für extreme vOS zu identifizieren. Im Sinne einer Extrapolation dienen wiederum Schätzungen der Quantile einer geeigneten Grenzverteilung als Prognosen für Einschlussgrößen. Letztlich wird die Extremwerttheorie für vOS weiterentwickelt. In einer Habilitationsschrift (Cramer 2003, Universität Oldenburg) wurden nicht-degenerierte Grenzverteilungen für extreme vOS hergeleitet. In dieser Dissertation werden die Anziehungsbereiche solcher nicht-degenerierten Grenzverteilungen untersucht: Diverse Bedingungen an die den vOS zugrunde liegende Verteilungsfunktion werden aufgestellt, die notwendig und/oder hinreichend für die schwache Konvergenz extremer vOS gegen eine nicht-degenerierte Grenzverteilung sind. Dabei wird gezeigt, dass viele Verteilungsfunktionen im Anziehungsbereich einer Normalverteilung liegen.

This doctoral thesis is motivated by the metallurgical problem of non-metallic inclusions, which arise unavoidably in the course of steel-making processes. Those inclusions are known to be a main reason for material defects, where the inclusion size is the most crucial geometrical parameter. Therefore, one is strongly interested in fitting an appropriate statistical model to non-metallic inclusion sizes and, as a key issue of quality engineering, in predicting large inclusion sizes. In order to collect data for statistical analyses, on a polished plane surface several control areas of same size are successively scanned by optical microscopy to detect those inclusions that intersect the surface. The sizes of the respective two-dimensional cross-sections are measured and stored, typically in terms of the square root of the projected area. A corresponding real data set has been provided by the Department of Ferrous Metallurgy of RWTH Aachen University. In metallography, so far, there has been the basic assumption that the ordered inclusion sizes within each control area are realizations of ordinary order statistics (oOS), leading to the application of classical extreme value analysis in order to predict large inclusion sizes. More precisely, extreme value theory has been applied in terms of the control area maxima method: observed control area maxima are fitted to a Gumbel distribution, the latter being assumed to be the appropriate extreme value distribution, and quantile estimates are calculated that serve (as an issue of prediction or rather extrapolation) as inclusion size estimates. From the statistical point of view, it seems reasonable to incorporate a wider range of extreme data into the statistical analysis than just control area maxima. Therefore, in this thesis it is dealt with multivariate extreme value (MEV) theory for oOS. The MEV method permits to estimate the distribution parameters of the generalized extreme value (GEV) distribution on the basis of the r > 1 largest observations of each control area, instead of just allowing for observed maxima. By carrying out a simulation study, it is shown that if estimation of the parameters of the GEV distribution is just based on single observed maxima, the true extreme value family is frequently miss-specified; in particular, the statistical analysis is considerably improved when being based on the respective r > 1 largest observations of each control area for sufficiently large values of r. These simulation results are illustrated by the respective MEV analysis of the real data set of inclusion sizes. By applying the MEV (or the control area maxima) approach, the ordered inclusion sizes within each control area are supposed to be realizations of oOS. However, in the real data set large inclusions appear with a significantly lower incidence than smaller ones, i.e., assuming the inclusion sizes of one control area to be in ascending order of magnitude, it holds in general, the larger the inclusions, the larger the difference between any two adjacent sizes. Hence, it might be possible that oOS are not always appropriate for modeling ordered inclusion sizes. On that account, in this thesis a more flexible model of ordered random variables is discussed, that is named generalized model of ordered inclusion sizes. It coincides with the model of generalized order statistics (gOS) in the distributional theoretical sense, and certain model parameters permit that the ordered inclusion sizes within one control area arise from parametrically adjusted hazard rates. Supposing that these model parameters are unknown, methods of statistical inference are discussed and applied to the real data set. Among others, statistical tests on the model parameters are carried out that indicate that oOS are not always appropriate for modeling inclusion sizes. Further, a link function approach is discussed to reduce the number of unknown parameters; in the analysis of the real data, it turns out to be appropriate to fit a log-linear one. Besides, by making use of the link function approach on the one hand and of extreme value theory for models of gOS on the other hand, the prediction of large inclusion sizes by means of extrapolation is addressed. Finally, research on extreme value theory for models of gOS is carried on. In a habilitation dissertation (Cramer 2003, University of Oldenburg) possible non-degenerate limit distributions for extreme gOS have been derived. In this doctoral thesis domains of attraction of those non-degenerate limit distributions are investigated, i.e., conditions on the underlying distribution function are established that are necessary and/or sufficient for extreme gOS to converge weakly to a non-degenerate limit distribution. Thereby, it turns out that many underlying distribution functions are attracted to a non-degenerate limit distribution function that is of the same type as the standard normal distribution function.

Fulltext:
Download fulltext PDF

Dokumenttyp
Dissertation / PhD Thesis

Format
online, print

Sprache
English

Interne Identnummern
RWTH-CONV-144462
Datensatz-ID: 229492

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Mathematics
Publication server / Open Access
Public records
Publications database
110000
116410

 Record created 2014-07-16, last modified 2022-04-22


Fulltext:
Download fulltext PDF
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)