Improving network inference by overcoming statistical limitations

Verbesserung der Netzwerkrekonstruktion durch überwinden statistischer Limits

  • A reliable inference of networks from data is of key interest in many scientific fields. Several methods have been suggested in the literature to reliably determine links in a network. These techniques rely on statistical methods, typically controlling the number of false positive links, but not considering false negative links. In this thesis new methodologies to improve network inference are suggested. Initial analyses demonstrate the impact of falsepositive and false negative conclusions about the presence or absence of links on the resulting inferred network. Consequently, revealing the importance of making well-considered choices leads to suggest new approaches to enhance existing network reconstruction methods. A simulation study, presented in Chapter 3, shows that different values to balance false positive and false negative conclusions about links should be used in order to reliably estimate network characteristics. The existence of type I and type II errors in the reconstructed network, also called biased network, isA reliable inference of networks from data is of key interest in many scientific fields. Several methods have been suggested in the literature to reliably determine links in a network. These techniques rely on statistical methods, typically controlling the number of false positive links, but not considering false negative links. In this thesis new methodologies to improve network inference are suggested. Initial analyses demonstrate the impact of falsepositive and false negative conclusions about the presence or absence of links on the resulting inferred network. Consequently, revealing the importance of making well-considered choices leads to suggest new approaches to enhance existing network reconstruction methods. A simulation study, presented in Chapter 3, shows that different values to balance false positive and false negative conclusions about links should be used in order to reliably estimate network characteristics. The existence of type I and type II errors in the reconstructed network, also called biased network, is accepted. Consequently, an analytic method that describes the influence of these two errors on the network structure is explored. As a result of this analysis, an analytic formula of the density of the biased vertex degree distribution is found (Chapter 4). In the inverse problem, the vertex degree distribution of the true underlying network is analytically reconstructed, assuming the probabilities of type I and type II errors. Chapters 4-5 show that the method is robust to incorrect estimates of α and β within reasonable limits. In Chapter 6, an iterative procedure to enhance this method is presented in the case of large errors on the estimates of α and β. The investigations presented so far focus on the influence of false positive and false negative links on the network characteristics. In Chapter 7, the analysis is reversed - the study focuses on the influence of network characteristics on the probability of type I and type II errors, in the case of networks of coupled oscillators. The probabilities of α and β are influenced by the shortest path length and the detour degree, respectively. These results have been used to improve the network reconstruction, when the true underlying network is not known a priori, introducing a novel and advanced concept of threshold.show moreshow less
  • Eine zuverlässige Rekonstruktion eines Netzwerks aus Daten ist von entscheidender Bedeutung in der Wissenschaft. Einige Methoden werden in der Literatur vorgeschlagen um Verbindungen in einem Netzwerk akkurat zu bestimmen. Diese Methoden vertrauen auf die Anwendung der Statistik, indem sie falsch positive Verbindungen berücksichtigen, allerdings positiv falsche Verbindungen ignoriert. In dieser Arbeit werden neue Methoden vorgeschlagen, um die Rekonstruktion zu verbessern. Erste Analysen veranschaulichen den Einfluss falsch positiver und positiv falscher Verbindungen auf das resultierende Netzwerk. Daraus wird die Bedeutsamkeit ersichtlich, die eine gut gewählte Entscheidung hinsichtlich der Faktoren auf die Qualität der Rekonstruktion hat, wodurch sich neu Methoden ableiten lassen. Eine Simulation, welche in Kapitel 3 zu finden ist, veranschaulicht, dass verschiedene Werte für falsch postive und positiv falsche Verbindungen zu verwenden sind, um genaue Vorhersagen bezüglich des Netzwerkverhaltens zu treffen. Die Existenz FehlerEine zuverlässige Rekonstruktion eines Netzwerks aus Daten ist von entscheidender Bedeutung in der Wissenschaft. Einige Methoden werden in der Literatur vorgeschlagen um Verbindungen in einem Netzwerk akkurat zu bestimmen. Diese Methoden vertrauen auf die Anwendung der Statistik, indem sie falsch positive Verbindungen berücksichtigen, allerdings positiv falsche Verbindungen ignoriert. In dieser Arbeit werden neue Methoden vorgeschlagen, um die Rekonstruktion zu verbessern. Erste Analysen veranschaulichen den Einfluss falsch positiver und positiv falscher Verbindungen auf das resultierende Netzwerk. Daraus wird die Bedeutsamkeit ersichtlich, die eine gut gewählte Entscheidung hinsichtlich der Faktoren auf die Qualität der Rekonstruktion hat, wodurch sich neu Methoden ableiten lassen. Eine Simulation, welche in Kapitel 3 zu finden ist, veranschaulicht, dass verschiedene Werte für falsch postive und positiv falsche Verbindungen zu verwenden sind, um genaue Vorhersagen bezüglich des Netzwerkverhaltens zu treffen. Die Existenz Fehler erster und zweiter Art in der Rekonstruktion sind unvermeidbar und werden akzeptiert. Ein analytischer Ansatz, der den Einfluss dieser beiden Fehler beschreibt wird gesucht. Aus dieser Analyse in Kapitel 4 folgt eine Formel welche die Verteilung der Quantität der Knotenverbindungen beschreibt. Bei dem inversen Problem wird die Knotengrad-Verteilung des originalen Netzwerkes, mit Berücksichtigung der Wahrscheinlichkeit von Fehlern erster und zweiter Art, analytisch berechnet. Kapitel 4-5 zeigen, dass die Methode auch bei einigermaßen falschen Schätzungen von α und β Resultate innerhalb vertretbarer Grenzen liefert. In Kapitel 6 wird ein iteratives Verfahren vorgestellt, welches diese Methode bei außerordentlich falschen Schätzungen von α und β verbessert. Die bis jetzt vorgestellte Recherche fokussiert sich auf den Einfluss falsch positiver und positiv falscher Verbindungen auf die Netzwerkscharakteristik. Im Kapitel 7 wird der Prozess umgedreht. Die Arbeit fokussiert sich auf den Einfluss auf die Netzwerkkarakteristik durch die Fehler erster und zweiter Art im Falle eines Netzwerkes mit gekoppelten Oszillatoren. Die Wahrscheinlichkeit von α und β wird beeinflusst durch den kürzesten Verbindungsweg und dem Detour Grad. Diese Ergebnisse wurden genutzt um die Netzwerk Rekonstruktion zu verbessern, wenn das originale Netzwerk nicht zuvor bekannt war. Dies beschreibt einen neuen fortgeschritten Weg der Grenzwertbestimmung.show moreshow less

Download full text files

Export metadata

Metadaten
Author details:Gloria CecchiniORCiDGND
URN:urn:nbn:de:kobv:517-opus4-426705
DOI:https://doi.org/10.25932/publishup-42670
Supervisor(s):Michael Rosenblum, Björn Schelter
Publication type:Doctoral Thesis
Language:English
Publication year:2019
Publishing institution:Universität Potsdam
Granting institution:Universität Potsdam
Date of final exam:2018/12/17
Contributing corporation:University of Aberdeen
Release date:2019/04/02
Tag:Netzwerk Inferenz; Netzwerk Rekonstruktion; statistische Methoden
network inference; network reconstruction; statistical methods
Number of pages:124
RVK - Regensburg classification:SK 840
Funding institution:Marie Skłodowska-Curie
Funding number:642563
Organizational units:Mathematisch-Naturwissenschaftliche Fakultät / Institut für Physik und Astronomie
DDC classification:5 Naturwissenschaften und Mathematik / 53 Physik / 530 Physik
License (German):License LogoKeine öffentliche Lizenz: Unter Urheberrechtsschutz
Accept ✔
This website uses technically necessary session cookies. By continuing to use the website, you agree to this. You can find our privacy policy here.