Corpus-based empirical research in software engineering

Pek, Ekaterina

Corpus-based empirical research in software engineering

Korpusbasierte empirische Forschung in Softwaretechnik

In the recent years, Software Engineering research has shown the rise of interest in the empirical studies. Such studies are often based on empirical evidence derived from corpora - collections of software artifacts. While there are established forms of carrying out empirical research (experiments, case studies, surveys, etc.), the common task of preparing the underlying collection of software artifacts is typically addressed in ad hoc manner. In this thesis, by means of a literature survey we show how frequently software engineering research employs software corpora and using a developed classification scheme we discuss their characteristics. Addressing the lack of methodology, we suggest a method of corpus (re-)engineering and apply it to an existing collection of Java projects. We report two extensive empirical studies, where we perform a broad and diverse range of analyses on the language for privacy preferences (P3P) and on object-oriented application programming interfaces (APIs). In both cases, we are driven by the data at hand, by the corpus itself, discovering the actual usage of the languages.
In den letzten Jahren gibt es im Bereich Software Engineering ein steigendes Interesse an empirischen Studien. Solche Studien stützen sich häufig auf empirische Daten aus Corpora-Sammlungen von Software-Artefakten. Während es etablierte Formen der Durchführung solcher Studien gibt, wie z.B. Experimente, Fallstudien und Umfragen, geschieht die Vorbereitung der zugrunde liegenden Sammlung von Software-Artefakten in der Regel ad hoc. In der vorliegenden Arbeit wird mittels einer Literaturrecherche gezeigt, wie haÌˆufig die Forschung im Bereich Software Engineering Software Corpora benutzt. Es wird ein Klassifikationsschema entwickelt, um Eigenschaften von Corpora zu beschreiben und zu diskutieren. Es wird auch erstmals eine Methode des Corpus (Re-)Engineering entwickelt und auf eine bestehende Sammlung von Java-Projekten angewendet. Die Arbeit legt zwei umfassende empirische Studien vor, in denen eine umfangreiche und breit angelegte Analysenreihe zu den Sprachen Privacy Preferences (P3P) und objektorientierte Programmierschnittstellen (APIs) durchgeführt wird. Beide Studien stützen sich allein auf die vorliegenden Daten der Corpora und decken dadurch die tatsächliche Nutzung der Sprachen auf.

Metadaten
Verfasserangaben:	Ekaterina Pek
URN:	urn:nbn:de:hbz:kob7-10647
Betreuer:	Ralf Lämmel
Dokumentart:	Dissertation
Sprache:	Englisch
Datum der Fertigstellung:	08.12.2014
Datum der Veröffentlichung:	08.12.2014
Veröffentlichende Institution:	Universität Koblenz-Landau, Campus Koblenz, Universitätsbibliothek
Titel verleihende Institution:	Universität Koblenz, Fachbereich 4
Datum der Abschlussprüfung:	21.05.2014
Datum der Freischaltung:	08.12.2014
Freies Schlagwort / Tag:	Empirical Studies; Grounded Theory; Software Engineering
Seitenzahl:	XVI, 246 seiten
Institute:	Fachbereich 4 / Institut für Informatik
DDC-Klassifikation:	0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
Lizenz (Deutsch):	Es gilt das deutsche Urheberrecht: § 53 UrhG

Corpus-based empirical research in software engineering

Korpusbasierte empirische Forschung in Softwaretechnik

Volltext Dateien herunterladen

Metadaten exportieren

Weitere Dienste